2017-05-27

24日の夜には一部で騒ぎになっていたしその頃はあの論文普通に見られた。そのときダウンロードしといた人ってどのくらいいるんだろう。あれよあれよと大騒ぎになっていて、今日ようやく読んでみた。こういう分野はまったくの門外漢なのでただの感想

今は非公表になってるらしいけど、内容の書き写しをするつもりはないので問題はないですよね?

無学なものいまいち理解できている自信がないんですが、つまりは従来の猥褻単語のものフィルタリングするのではなく、なんら猥褻意味を含まない単語がある文脈において猥褻暗喩表現として用いられたとしても猥褻表現として判断できるAIによるフィルタリングの実現を検討するために、巷の猥褻文章を持ってきて考察しました、ってことでいいでしょうか。

意義は理解できます悪用されて文章検閲として利用されるところまで妄想できました。さすがAI

で、これがpixivのある時期のR18ランキングからトップテン持ってきて公表して考察していて炎上したと。トップテンの8割がBLという特殊な状況下で学習させたら、AIはどんなフィルタリングするんだろうなあというのはたしかに気になります。気にはなるんですが、まずそこなのか?とも思います

猥褻表現のあるドメインとして、なんでまずpixiv選択したんでしょうか?いっぱいあると思うんだ、猥褻ドメイン。なんでpixiv狙い撃ち。

そもそもこの論文の時点では結局猥褻表現の分類と考察しかしてない。AI学習させる以前の段階。そこで8割BLしか素人小説というサンプルははたして適当なのか。

BLを含む女性向けの猥褻表現を扱うドメインもたしかに巷にはだいぶ多いことでしょう。でも、それは男性向けを大きく凌駕するほどのものなのか。そして、女性向けにおける猥褻表現男性向けとでは大きく差があると思う。

BLを含む女性向けはとにかく婉曲表現が多い。下品は嫌い、雰囲気重視。男性向けは直接表現が多い。わかりやすさが第一伏字になっても淫語は使いたい。おおまかにこういうイメージです。間違ってますかね?

実際、前文では特定ドメインにおける猥褻表現の例としてハピメでの「*交」とかも上げていて、伏字による淫語表現研究者認識しているはずなんですが、これらのサンプルではそんな表現出てこないでしょう。考察すべき対象の足りていない考察ってなんの意味があるのだろうか。

目的方法がとっちらかってる気がする。これ本当に査読を経ての発表なの?関係者の方こっそり教えてくれませんか?

  • 関係者じゃないけど、これ多分、学部生が卒論でやった研究の発表だから、ツッコミどころ満載なのはご指摘の通りだと思う なんでpixivの文章をデータとして採用したのかっていうのは...

    • そもそもこの論文はネット上での猥褻表現のフィルタリングが主題なので、出版物についてははじめから考慮に入っていないと思います。猥褻ドメインのフィルタリングにAIの学習能力を...

      • ごめんなさい、ちょっと飲みに行ってて遅くなりました 論文にアクセスできなかったので、「猥褻ドメイン」っていう言葉の意味が良く分かってなかったっぽいです 前文の段階で、...

  • 今回の論文というのは査読を経たものではなく、渋にクソ小説をアップしたのと大差ない。 論文だって創作物なので「君の小説はクソなので非公開です」とは普通ならないし。 したがっ...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん