増田の新全文検索、
ひらがなカタカナ両方引っ掛けてくれたり
漢字をひらがな表記にしても引っ掛けてくれたり して賢いんだけど
同音の別の漢字もひっかける のは不便な時の方が多そうに感じた
それはさておき、これ実現するの結構めんどくない?簡単にできるライブラリとかあるの?
Permalink | 記事への反応(2) | 08:50
ツイートシェア
昨日、ルー大柴とバトルしてた近似最近傍法に聞いてみ
ルー大柴だけど多分MLじゃないよ k-means clusteringでもない 日本語やったことないから知らんけど
ICTのことはよく知らないけど、テキストマイニングだとmecabなどを使って「全部ひらがなにする」