いまRでできること見まくっててベイズ分類ってのがあって直感で調べてたら
単純ベイズ分類器を文書分類問題に適用した例を示す。(https://ja.wikipedia.org/wiki/%E5%8D%98%E7%B4%94%E3%83%99%E3%82%A4%E3%82%BA%E5%88%86%E9%A1%9E%E5%99%A8#.E4.BE.8B:_.E6.96.87.E6.9B.B8.E5.88.86.E9.A1.9E)
ってのがあったから多分これでいける
あとはこれかな
http://fujit33.hatenablog.com/entry/2015/05/14/022624
追記
http://qiita.com/icoxfog417/items/7c944cb29dd7cdf5e2b1
fastText
https://deepage.net/bigdata/machine_learning/2016/08/28/fast_text_facebook.html
URLに時間含まれてるから時間帯別の投稿者の属性を割り出せそう
https://anond.hatelabo.jp/20170918004847 続き テキストマイニング勉強して増田に頻出する人間の種類をパターン化しようとしてるんだけど、方法が思いつかない スクレイピングでデータを取る→m...
mecabで形態素解析して頻出名詞をデータ化する ところは上手くできてるん? 増田に対応した mecab辞書を作らないと難しそうな気もするけど。
いつもは何も考えずにまず実装してるんですけど 今回はまずひたすらリサーチしてます 「mecab ruby 名詞」で検索してヒットしたページみてとりあえずmecab組み込んだrubyプログラムにテキ...
いまRでできること見まくっててベイズ分類ってのがあって直感で調べてたら 単純ベイズ分類器を文書分類問題に適用した例を示す。(https://ja.wikipedia.org/wiki/%E5%8D%98%E7%B4%94%E3%83%99%E3%82%A4%E3%...
逆にそれくらいしか推測値がないのか
もちろん文言を解析して時間帯とか曜日とか天気情報と絡めてその日の状態によってヘイトスピーチが増えるとか経済の話題が増えるとか言及が増えるとかそういう話で時間帯は例の1つ