2017-05-27

僕の見た情報系の研究室Webデータ利用(例の論文に対する反応)

PixivR-18小説データとして使った論文炎上している

現在議論収束してきて倫理的問題があった可能性があるという話になっている雰囲気がある

二次創作小説を研究目的で引用することは研究倫理に反するか

立命館大学の研究者による「pixiv論文」の論点とは──“晒し上げ”批判はどれほど妥当なのか(松谷創一郎) - 個人 - Yahoo!ニュース

この論文の件で著作権的に「引用するとき許可を求めろ」「データ分析に使うとき許可を求めろ」という話がたくさんTwitterに書かれているのを見かけた.通常の研究データ利用でそうなるのか?と疑問に思ったので,過去学生として情報系の研究室所属していた時の自分経験理解について書く.法律について詳しいわけではないのでこういう雰囲気でやられているのか程度のものだと思ってもらいたい.法的な誤りが含まれていたら指摘していただけると嬉しい.

研究利用するとき許可を求めるか

データマイニング等の分野ではWeb上のデータをあつめ研究目的で使うのが普通になっている.

個人経験の話になってしまうが,Web上に公開されている情報研究に利用するとき許可を取っている機会を見たことはほとんどないし,Web上のテキストクロールして使っている論文データセットの作成に関してそういったことに言及しているものもあまり見たことがない.英語論文でも論文自体にそういったことが書かれているのを見ない.つまりWebサービス上のユーザー投稿研究に利用する場合でも,Webサービスユーザーどちらから許可を取らないのが日常的だった.

もちろんデータセットを作ることが目的である研究,作ったデータを再配布する場合においては許可を求めているのを見かける.

通常はユーザー情報匿名化したりするものではあるが.

僕の理解では,公開情報を使ってデータ分析をする場合データを再配布しない限り著作権的に問題はなく当然著者の許可はいらないものだと考えている.

伝わらないたとえ話をすると,データ研究に使うのは本の感想を書くようなもので本の中身を転載・再配布したら問題になるがその本について感想意見分析を述べるだけなら著作権的には問題にならないと認識している.

今回問題になったPixivのような会員登録必要Webサービス場合公開情報にふくまれるのかはグレーゾーンかとも思われるが,自分意見としては誰でも登録できる会員数2000万人以上のサービスの会員全員が見ることができるデータなので公開情報に準ずるものだと考えている.

規約によって引用制限されるのか?

規約転載禁止されているか引用禁止である」という話もTwitterで見かけたが,規約中で引用が禁じられていない以上引用可能であるはずだと思われる.

仮に引用規約禁止されていた場合には話が多少変わってきて,規約法律でどちらが優先されるかは議論余地がありそう.究極的な結論を出すには司法判断必要になる可能性がある(法律に詳しい人の意見を聞きたい)

今回の場合にはR-18コンテンツを全年齢の場で引用していたのでその点がどうかという意見はわかる.

もちろん引用する場合は出典を明示して無断で行う.ただしデータセットとして使ったWebテキストからの用例としてごく短い抜粋などについて出典を明示するのはほとんどみない.

倫理委員会研究ときに通すのか?

ちなみに「人間対象とした研究の時は倫理委員会を通せ」という話も見かけたが情報系でそういったものを通すので自分が見かけたことがあるのは,被験者に何か作業をしてもらいその人間状態を計測するような研究ぐらいで,Webテキストを使った研究については見たことがない.

終わりに

もちろん僕が経験した研究室大学,分野の話なので場所が変わればルールも変わるだろう.

今回の論文の件で法律に詳しい方が詳細な解説をしてくださったり,研究利用する側に法的な問題があるのであればそれが周知されると嬉しい.

追記 機械学習モデルの配布はどうなのか?

ブックマークコメントにPaintsChainerはどうなの?という話があったので追記します.

私見では機械学習学習されたモデルの配布は元のデータを過剰に再現するようなものでない限り問題ないと思われます

以下の法律事務所ブログにいくつか記事があるので参考になるかもしれません.

http://storialaw.jp/blog/2718:title

http://storialaw.jp/blog/2761:title

記事への反応 -
  • http://anond.hatelabo.jp/20170525145352 の記事を見ながら考えたこと。 今回の分野がどうだったか知らないけど、私が見てきた分野だと使ったものは閲覧日も添えてURL載せるべきだと思う。今回...

    • 結論:場合による https://togetter.com/li/1113766 https://matome.naver.jp/odai/2149564479015738601 この辺見てると、「そうだよね」というものと「いやいやおかしいでしょ」というものがどちらもある。...

      • PixivのR-18小説をデータとして使った論文が炎上している 現在は議論が収束してきて倫理的に問題があった可能性があるという話になっている雰囲気がある 二次創作小説を研究目的で引用...

      • ある意味、一昔前にあった「研究者は異民族の神聖な儀式を見てもいいか」問題の現代版なのかも。 ほらあるじゃん、余所者には見せられないと言われてる神聖な儀式だけど、研究のた...

      • 単に女性を相手にしたのが悪いっていつもの話なだけだと思う。男性向けのエロなら炎上もしなかったであろう。 女性はデリケートなのでアンタッチャブルな存在であることをいい加減...

        • 男性向けのエロなら炎上もしなかったであろう。 この点は否定しないが、理由は少し違う。 女性はデリケートなのでアンタッチャブルな存在である という理由ではない。 二次創...

        • それはない むしろいつも下らないことでもオタクが迫害された!オタク叩きだ!って暴れ回るのは男

          • だからこそ、またいつものバカが喚いてるよwってなるだけで正義の人たちも立ち上がって炎上したりはしないんじゃない?

      • 研究対象に敬意を払わないのならこちらも研究者を蛆虫として扱いますよというそれだけの話

        • そういう話でいいと思うよ。法的にやっていいか悪いかって問われたら法的には許容されてるとしか言いようがないけど、オタクとしてどう思うって聞かれたら死ね一択でしょ。

      • 理屈としてはいちいちごもっともなんだろうけど、バカが焼き畑しちゃったことに関してはもう取り返しつかんよね。 あの辺のフィールドワークしたい研究者は対象に最初から警戒心持...

      • >当該団体の許可は要りません(その団体の会員にしか配られなかったので、その団体が所有する図書館でしか読めません、というなら別だけど)。 Pixivの会員にしか配られていなかっ...

        • 論文の著者はpixiv垢持ってるだろうから(持ってなかったらあんなふうに抽出できないでしょ)、pixiv会員としてpixiv図書館で読んだんじゃね? それは全然オッケーだしそこを問題にし...

      • 子供がネットアクセスしてうっかりアダルトなサイトを見なくて済むように機械学習で予めブロック出来るようなシステム構築のための論文ですよね。それなら普通にGoogle検索などから...

      • >>文系では文献リストは必ずしも必須ではないのよね(この辺、理系からすると何それかもしれないけど)。<< そうなんだ。出さないと駄目だろって思ってたけど、そういう分野も...

      • この問題ってネットで閲覧可能って事実と自分が作品を提出する際に そこまで考えてるのかってポイントでは 引用された作品もそんな論文で出されるなんて想定していなかった。 論文...

      • おおむね異論ないが、オタクがバカゆえに抱く不快感と不信にまで責任を負うべきか。 http://anond.hatelabo.jp/20170525145352

      • 二次創作小説を研究目的で引用することは研究倫理に反するか http://anond.hatelabo.jp/20170525145352 どちらかというと大学側に同情している情報系の院生なので,以下の内容はそのようなバイ...

      • この問題は「学会や引用の仕組についてまったく知らないひとがここまでいるのか!」という点で興味深い話だよね。 大学全入時代とか大学進学率が半数とか言うくらいなのに、引用と...

      • よっす、AI分野のひとです。 今回の分野がどうだったか知らないけど、私が見てきた分野だと使ったものは閲覧日も添えてURL載せるべきだと思う。閲覧日は今回みたいに作者が引っ...

      • 女性だって堂々とポルノを楽しんで良いじゃないか。 これはまさに女性に対する抑圧じゃないか。 http://anond.hatelabo.jp/20170525145352

        • 彼女たちがそう思い込んでるだけだよ。 腐女子達は、検索避け(笑)とかいう無駄な技術を編み出し、 「二次創作だから隠れなきゃ(使命感)」って思い込んでる。 パスワード制の会員サイ...

      • ありがとう、わかりやすい。 消される前のPDFを読んだところ、テキストを句点や記号で区切って1文ずつバラバラにして、それぞれを分類していくという手法を取っていた。 作品を全...

      • 今回の分野がどうだったか知らないけど云々を書いた人です。反応してくれてありがとう。 人工知能も文学もどちらも専門ではない工学世界の片隅にいた人間としての考えでは、「個別...

      • これの件について、倫理的な問題がどうとか法的にはどうだったのかという話については個人的に話が出尽くしてるのでいまさら何か言うこともないけど、個人的に論文そのものについ...

        • 研究の質がウンコで有用性がないのと法的な話はまた別じゃねぇかな 納得の行く説明とやらはサンプリング対象(の権利者)に交渉を持ちかけるときに意味を持つけどそもそも今回事前...

        • ピクシブにも論文内容にも今後深く関わらないから どっちでもいっか~くらいに思ってんだけど それよりこの関連のついてのまとめ?のコメントから見る まとめの内容読む気もないだ...

      • 法律だの倫理だの言えば賢い気分になるってのが騒ぎになってる一端じゃない 明らかに雑な奴が思いつきで書いたような、公開されたところで誰も読むわけねーだろ 発表さえ乗り切れ...

      • なんかけっこうな数の人に勘違いされてるようで驚く。そんなおかしなことじゃないでしょ。ということで補足。 言っとくけど、これは剽窃や無断転載をしていいって意味じゃないです...

        • シカゴマニュアル読んで出直してこい、あほが

        • 人文系からすると、この方式を知らない方がガラパゴスですよ。だって、文系は理系の人はこの方式使わないで別の方式使うよね、って知ってるもん。なんで理系は、文系では別の方式...

        • そもそも今回のやつは、pixiv掲載作品を研究素材として使ったので参考文献じゃないし

        • で、シカゴ・マニュアルが何ですって? 脚注だろうと末尾の文献リストだろうとそこに書く情報は変わらないってのと、以下のような文献の書誌情報を書くスタイルは確立されている...

      • 人工知能学会から返って来た人工知能研究者。例の論文の著者の1人とも知合で今回もご挨拶した。家族に文系研究者あり。 多分理解されていないところをいくつか書く。 小説は分析...

        • 情報系の習俗は知らないけど、物理学会とかだと予稿集は大会参加者自身がオンラインアクセス権を購入しないと見れないよね 学会の年会費も大会参加費も払ってない人たちが予稿集は...

          • 情報系でも、その辺の慣習は分野によってまちまち。情報処理学会だと、おっしゃるような物理学会の仕組みと同じように、会員だけが論文が見られる仕組みになっている。 ただ、情報...

      • アカデミアの人たちも腐女子を見習って検索避けしたほうがいいよ 内容を変えず、できるだけ露骨に書くのを避ける。 ユーザの情報を扱うときは、よりわかりにくい出典の方法は無いか...

      • 長すぎたようなのでこっちで増田に応答。 http://anond.hatelabo.jp/20170527122912 人工知能学会全国大会論文は査読なしだ。これは、人工知能学会だけが問題なのではなく、情報系の大部分の国...

        • 「どうなんでしょう」と聞かれているので答える。長さについての感覚が知りたいなら、人工知能系はトップ国際会議の査読付き論文がPDFで転がっているので、ホンモノ見て下さい。 htt...

          • わわわ、ますます丁寧な応答ありがとうございます。わたしも「理系」と一括りにしてよく知らないままに済ませていたんだなぁ、と思うとお恥ずかしいです。門外漢に詳しく教えてく...

            • 通りすがりですが、理系でも、数学に分野が近くなると単著はごく普通にありますよ〜 おっしゃる通り、「自分で書いたものだから自分しか挙げてないだけ」 なので、文系の人が単著に...

              • 「こだわる」って書いた元増田ですが、自分も、実は、隣の研究室が数学系だったりする学科の卒業者なので、数学に単著が多いことは知ってます。 「論文を書いた人だけが著者になる...

            • 准教授の先生はテニュアだと思います…たぶん。テニュアですか?と伺ったことはないですが、もう、5年以上在籍されていらっしゃるはずなので…。

          • ごめんなさい、ちょっと飲みに行ってて遅くなりました 論文にアクセスできなかったので、「猥褻ドメイン」っていう言葉の意味が良く分かってなかったっぽいです 前文の段階で、...

      • 以下の棘 https://togetter.com/li/1114406 むっちゃ増田を「引用」してるじゃないですかやだー! 増田の文章をひたすらコピペして、自分の見解を何一つ付け加えていない そういうのは著作権法...

      • 公表された(と見なすべき)作品を自由に利用できるかどうか、そして作者に不快な感情を抱かせる利用形態についてどう対処すべきか、実用的な面から考えてみたい。 【pixiv論文】日...

      •  1ヶ月が経とうとしているpixiv論文問題ですが、皆様もそろそろ忘れてきた頃合いでしょうか。  備忘録として、書きたい。  問題の経緯や、研究上の・法的な問題、および女性オタ...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん