https://togetter.com/li/1113766
https://matome.naver.jp/odai/2149564479015738601
この問題、確かに出典を明記するべきではなかったし配慮が足りなかったとは思うけど、
それぞれの論点については疑問な点も多い。各論点についてどこが問題でどこが問題でないのか個人的な整理をしておく。
・「未成年が見れないようにしてあるのに、引っ張り出してきて有害呼ばわりする」について
ここで言う「有害」あるいは「有害情報」というのは一種の専門用語で、
「主に青少年がその情報に接することによって健全な発達・育成を阻害する恐れが有ると考えられているコンテンツの総称」とある。
Wikipediaが信用ならないなら、「有害情報」「有害表現」で検索すれば、その意味で用いられている文章がたくさん見つかる。
つまり、「有害な」=「未成年に見せるのには不健全な」という意味が、特に情報フィルタリングの研究においては比較的一般に用いられてる。
そしてこの定義によれば、pixivに投稿されているR-18の小説やイラストは全て「有害表現」ということになるし、
別にこの文章は酷い、害だ、と揶揄する意味で有害だと言っているわけではない。
「ログインしなければ見れないような場所に置いてあるものを引っ張り出してきて有害呼ばわりする」ではなくて、
「"有害表現"だからログインしなければ見れないような場所に置いてある」。順序が逆。
誤解。
論文中にある通り、ランキングのTOP10を拾ったら8件がBLだったというだけで、残り2件はヘテロカプ。
BLを排除すべきだったとも思わないし、BLから選ぶべきだったとも思わない。
(じゃあなんでわざわざ「8件がBLで2件がNL」だなんて書いたのかという話ではあるが)
少しズレている。
たとえば文化人類学や民俗学のような研究であれば、研究対象の文化を破壊してしまうのは「鯨を研究していたら鯨を絶滅させてしまった」ようなもので、
ただ、この論文においてpixiv小説文化は「研究対象」というよりは「データセット」でしかない。
その場合でも倫理的に問題はあるだろうけど、民俗学のような特別な慎重さが求められるような分野と一緒にして考えるべきではない。
このように目立たせることがタブーな界隈であることが想定できた/すべきだった、とまで言うのは難しいように思う。
・「二次創作はグレーゾーンだから隠れてるのに、わざわざ目立たせるようなことをしたのは問題」について
これって「お前がチクんなかったらバレなかったのによー」って言ってるのと何が違うんですか。
一応公共の場に置かれている以上、十分に匿名化されていれば許諾は必要ないと思う。
たとえばchainerでイラストを自動着色するシステムがあるけど、あれの学習に使うデータ全部に許諾が必要かというとそうは思わない。
それは言い過ぎ。
その理屈で言えば肖像権なんてものはない。「仮面付けないで街を歩いている方が悪い」みたいな話になる。
いくらネットに投稿していると言っても、それが朝の全国ニュースで勝手に紹介されることまで想定しているわけではない。
・「再現性のために出典を明示するのは当然」について
そんなことはない。
これは別に素材Aに触媒Bを反応させたら素材Cができた、というような話ではない。
たとえば100人にアンケートを取ったとして、その100人の個人情報全部を載せる必要があるかと言えば、「必要はない」し「プライバシーの観点からも止めるべき」。