立命館pixiv論文問題で的外れな批判

人工知能研究者。人工知能学会にも参加したし、件の論文の著者の１人ともご挨拶した。倫理的な問題はあるとは思っているが、色々な批判の中で、次の的外れな批判をよくみる。根本的に、機械学習が理解されていないのだなぁ、と感じる。機械学習は、平たく言えば、人間の判断を機械に真似させる手法の総称だ。まず、人間が判断の模範を示してやって、どれだけ正確に人間の真似が出来たか、が性能評価になる。これだけわかっていれば、下記の２つが的外れであると分かるはず。

ゾーニングは人力でなされている。つまり、そこに、人の判断が入っている。誰かが判断して、これはR-18だね、青少年にはみせちゃいけないね、と判断している。ゾーニングされている小説だからこそ、人間の判断が反映されていると言える。機械にゾーニングすべきかゾーニングするべきでないか判断させるために、人間の真似を機械にさせるのが最終目的なのだから、既にゾーニングすべきと人間が判断した小説を対象にするのは、むしろ当然。

これも、的外れな批判。問題は、「直接的に性的とわからないような表現を機械が識別する事ができるか？」ということ。単位は表現であって、小説の数ではない。10 サンプルでも、小説であれば、多数の表現を含む。今回の研究では、表現の例の数が問題であるし、ほとんどの表現について、表現が性的かどうかは、小説の内容にかかわらずに表現だけから判断できる。なので、極端に言えば、表現の多様性さえ確保できれば、1サンプルだって構わない。たとえ1小説の中に含まれる表現の例であったとしても、青少年が見られる場にそうした表現が出てきたら不適切なことにはかわりはない。つまり、この論文は、小説を「性的表現集」として使っているわけだ。小説の内容自体について論じているわけではない。直接的に性的とわからないような表現には、どのような表現があるのかを知り、そうした表現を識別できるかどうかに関心があるわけだ。

問題が、「小説の著者を当てよ」とか、「当該分野の小説の表現の傾向を調べよ」であれば、10 サンプルでは少なすぎるという批判は妥当だと思う。けれども、今回の研究は、「表現をうまく識別できたか」だけがポイントなので、多様な、非直接的性的表現が含まれている例として納得できれば、別にサンプル小説数はどうでもいい。

もっとも、サンプル数を増やせば、より多様な表現が得られることは容易に推察できる。より多様な表現を真似させた方が、機械学習の性能は一般的には向上する。しかし、結局、どの表現も検知・除外することが求められるのであれば、10 サンプルに含まれる表現も検知・除外できなければならないことにはかわりない。