2024-04-01

anond:20240401161211

精一杯わかりやすくしたんだがなぁ

要は「コンテンツ検索する」のが目的で、「関連性」の順番にソートしたいわけよ

最初の段階で転置インデックスとか近似最近傍法とかを使ってざっくり抽出するんだよ

近似最近傍法を使う場合は、コンテンツベクトルに変換したものを使って検索できるので、キーワードだけではなく、概念検索したりも可能

で、そこでざっと抽出したのが1万件だとしても、ユーザーが最終的に見るのはせいぜいTop100件だろう

そこでLTRという「クエリドキュメントの特徴量からスコア計算する仕組み」を使ってTop100件を抽出して並べ替え

というのが一連の流れ

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん