2007-10-23

検索結果が微妙にずれる理由の一つの単純例

ネガティブスコアリング。検索ワードに対してフィルタが直接かかるなんて訳ではない。画像検索がページ検索の結果を処理する場合特に顕著になるはず。

ページ検索自体までは普通に使われる。次にページからリンクされる画像ファイルに対して「一般的な類似・関連度評価」(実際にはいろいろあるけどね)を行うんだけど、そこで一番高い評価のリンクネガティブスコアリングして、二番目のものを結果として返す。適切と思われるページの適切と思われない画像が結果としてかえることになる。画像スパムに対するフィルタでこういう動作を実装することもある。


       けどまあそんな単純な方法取ってるとも思えないんだけどね。

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん