2018-07-14

話題AIを使って増田おっさん率を判定してみた。

増田を見ていると女の投稿結構あるように思えるが

文章検証していくと明らかにおっさん投稿が多い。

よく見る男女論だけでも明らかにおっさん投稿してると思われる。

そこで増田にどれくらいおっさんがいるのか。

これを判定するためにAIを使って判定して見た。


  • ここからはやり方を説明するだけなので結論に飛んでもらっていい

まず知人25人を用意する。25人の内訳は男20人女5人。

女があまりまらなかったのは私の不徳の致すところ。勘弁していただきたい。

ここで男のうちでネカマ文章を書けるかどうか質問をし

そのうち書けると答えた7人はネカマ文章を書いてもらうことにした。

文章は500文字以上とし一人当たり4文章作成してもらった。

それをMECAB形態素解析し、単語使用率等を解析する。

Train Data 男 10 ネカマ 5 女 3

Test Data 男 3 ネカマ 2 女 2

Trainデータを使って機械学習をする。

ぶち込むNNは入り口は要素100、出口は1の五層のNN。単語数100を超える部分はカットした。

まり最初の100以外はすべてカットした。

Train Dataでの判定結果は91.2%、Test Dataでの成功率86.3%になった。

このNNをつかって増田ブクマ10以上の投稿

ランダムに300件検出しテストしたたところ以下の結果になった。

男63.2%

女4.3%

ネカマ32.5%

私のNNができが悪いだけかもしれないので、皆さんも試して欲しい。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん