2007-12-13

http://anond.hatelabo.jp/20071213062012

うーん、いったいどの検索サービスのことを言っているのかなあ。

インデキシングに形態素解析は使わないよ。基本的にはn-gramだから繋がった”意味のある”文字列がぶった切られることはないよ。

ただ、クエリーが”意味の無い”文字列だったので検索結果が見つからず、検索結果を増やすためにクエリーに入力したキーワード形態素解析してクエリーを作り直すってことはよく使われる手法だね。googleなら”意味のある”と増田が思っている範囲の文字列をダブルクオーテーションでくくればいいと思うよ。

記事への反応 -
  • 特定の繋がった文字列にこそ検索意義があるのに形態素解析で強制的にぶった切られて敢えてノイズ拾う検索式にされるともう怒髪天をつくというかね。いや自分のワガママだって知って...

    • うーん、いったいどの検索サービスのことを言っているのかなあ。 インデキシングに形態素解析は使わないよ。基本的にはn-gramだから繋がった”意味のある”文字列がぶった切られるこ...

    • インデクシングの問題があるのでぶった切るのは仕方ない。 問題なのはノイズが上位に来るレーティングだろう。 あと、関連検索はもっと進化してほしいな。除外指定とかをもっと反映...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん