事情はこんな感じ。
今日以降MeCabの辞書をmecab-ipadic-NEologd辞書に切り替える。昨日までのはNAIST辞書だった。メリットは週2回新語が追加されるので、2011年に更新が止まったNAIST辞書に比べて時事ネタに強い。デメリットは固有名詞じゃないものまで固有名詞に分類しようとすること。一長一短あるけれど、メンテナンスが止まった辞書を使い続けるよりは良さそうなので変える。はてなキーワードから新語を探しているそうなので、はてなキーワードを整備すれば精度が上がるかもしれない。
はてなが増田のキーワードページ https://anond.hatelabo.jp/keyword/ を改善してくれればこんなことしないのにと思う。いま久しぶりにキーワードページ見たら表示される単語の数が減ってる気がする。改善しようと手を付け始めたのだろうか?
時間 記事数 文字数 文字数平均 文字数中央値 00 63 9839 156.2 41 01 48 5207 108.5 39 02 44 5027 114.3 59.5 03 41 8862 216.1 171 04 25 3455 138.2 119 ...
事情はこんな感じ。 今日以降MeCabの辞書をmecab-ipadic-NEologd辞書に切り替える。昨日までのはNAIST辞書だった。メリットは週2回新語が追加されるので、2011年に更新が止まったNAIST辞書に比...
Twitterの#neologdハッシュタグを覗いてみたら、かわいそうに開発者さん開発機材をまるごと置き引きにあったんだな。オープンソース界隈で何年かに1度、定期的に聞く話のような気がする...