24日の夜には一部で騒ぎになっていたしその頃はあの論文も普通に見られた。そのときにダウンロードしといた人ってどのくらいいるんだろう。あれよあれよと大騒ぎになっていて、今日ようやく読んでみた。こういう分野はまったくの門外漢なのでただの感想。
今は非公表になってるらしいけど、内容の書き写しをするつもりはないので問題はないですよね?
無学なものでいまいち理解できている自信がないんですが、つまりは従来の猥褻な単語そのものをフィルタリングするのではなく、なんら猥褻な意味を含まない単語がある文脈において猥褻な暗喩表現として用いられたとしても猥褻表現として判断できるAIによるフィルタリングの実現を検討するために、巷の猥褻な文章を持ってきて考察しました、ってことでいいでしょうか。
意義は理解できます。悪用されて文章の検閲として利用されるところまで妄想できました。さすがAI。
で、これがpixivのある時期のR18ランキングからトップテン持ってきて公表して考察していて炎上したと。トップテンの8割がBLという特殊な状況下で学習させたら、AIはどんなフィルタリングするんだろうなあというのはたしかに気になります。気にはなるんですが、まずそこなのか?とも思います。
猥褻な表現のあるドメインとして、なんでまずpixivを選択したんでしょうか?いっぱいあると思うんだ、猥褻ドメイン。なんでpixiv狙い撃ち。
そもそもこの論文の時点では結局猥褻表現の分類と考察しかしてない。AIに学習させる以前の段階。そこで8割BL、しかも素人小説というサンプルははたして適当なのか。
BLを含む女性向けの猥褻表現を扱うドメインもたしかに巷にはだいぶ多いことでしょう。でも、それは男性向けを大きく凌駕するほどのものなのか。そして、女性向けにおける猥褻表現と男性向けとでは大きく差があると思う。
BLを含む女性向けはとにかく婉曲表現が多い。下品は嫌い、雰囲気重視。男性向けは直接表現が多い。わかりやすさが第一、伏字になっても淫語は使いたい。おおまかにこういうイメージです。間違ってますかね?
実際、前文では特定のドメインにおける猥褻表現の例としてハピメでの「*交」とかも上げていて、伏字による淫語表現を研究者は認識しているはずなんですが、これらのサンプルではそんな表現出てこないでしょう。考察すべき対象の足りていない考察ってなんの意味があるのだろうか。
関係者じゃないけど、これ多分、学部生が卒論でやった研究の発表だから、ツッコミどころ満載なのはご指摘の通りだと思う なんでpixivの文章をデータとして採用したのかっていうのは...
そもそもこの論文はネット上での猥褻表現のフィルタリングが主題なので、出版物についてははじめから考慮に入っていないと思います。猥褻ドメインのフィルタリングにAIの学習能力を...
ごめんなさい、ちょっと飲みに行ってて遅くなりました 論文にアクセスできなかったので、「猥褻ドメイン」っていう言葉の意味が良く分かってなかったっぽいです 前文の段階で、...
今回の論文というのは査読を経たものではなく、渋にクソ小説をアップしたのと大差ない。 論文だって創作物なので「君の小説はクソなので非公開です」とは普通ならないし。 したがっ...