Hatenaってuser generatedなテキストデータを大量に持ってるイメージだから、自然言語系の機械学習の技術力高そうだと思っていたんだけど、こういうの見ると「えっ」てなる。
機械と人間を識別したいのであれば、知識ベースの問題ではなくて、指示代名詞が何を指しているのかを当てさせる照応解析とか、人間が生得的にもつテキスト処理能力を測る問題にした方がいいと思う。
Permalink | 記事への反応(0) | 11:18
ツイートシェア