自分が機械学習に詳しいかどうかはわかりませんが,わかる範囲で書きます.
を実現する事が目的だと考えて話を進めましょう.
一般的にこのタスクは類似文書検索と呼ばれています.ブックマークコメントでは「ElasticSearchを使え」と言われています.ElasticSearch の More Like This Query 機能を使うことで類似文書検索が実現できるようです.あとはパラメータを調整することで思い通りの結果が得られるのではないでしょうか.
より高度なアプローチを取るのであれば,BERT と呼ばれるニューラルネットワークモデルを活用した類似文書検索も可能です.こちらのブログ (ElasticsearchとBERTを組み合わせて類似文書検索 - Ahogrammer) が参考になるでしょう.
しかしこれだけで終わると悲しいのでもう少し機械学習の話をすることにします.
機械学習的にこの問題に取り組むには順序学習 Learning to Rank という問題を解く必要があります.順序学習は google 検索にも使われている機能です.
これは,「入力 x に対して N 個の候補 y_1, y_2, ..., y_N を類似している順に並び替えるようなスコアを出力する関数 f(x, y_i) を学習する」というものです.
More Like This Query 機能よりもこちらのアプローチが優れているのは,前者はどうパラメータをチューニングしようと「類似している文書」しか得られないのに対して,後者は(先程引用したような)「見合った」を明示的にデータとして与えてランキングを学習できる,という点です.
学習データとして「この質問のに対してこの FAQ ページがもっとも見合っている」「この質問に対して A と B ふたつの FAQ ページがあるが,B より A の方が見合っている」「この質問に対して見合った順に全ての FAQ ページを並び替えたもの」といったデータを大量に準備することで,「見合った」を学習することが可能です.
しかしこちらも ElasticSearch の機能に搭載されているようです.ありがとう ElasticSearch.お疲れ様でした.
もしあなたが ElasticSearch を使うのではなく, Python を使って再実装したいと考えているのであれば,目印として必要なライブラリや概念を書いておきます.
こういうのを実装したいと思ってるだがどんな言語とライブラリ使って どのくらいの勉強期間と実装期間を費やせば作れるかな? 質問のテキストを投げるとそれに一番見合ったFAQペ...
自分が機械学習に詳しいかどうかはわかりませんが,わかる範囲で書きます. 質問のテキストを投げるとそれに一番見合ったFAQページのリンクとタイトルを表示してくれるチャットボ...
自動生成した学習データを用いた文書分類器に基づく FAQ 検索システム 牧野 拓哉, 野呂 智哉, 岩倉 友哉 自然言語処理 2017 年 24 巻 1 号 p. 117-134 https://www.jstage.jst.go.jp/article/jnlp/24/1/24_117/_art...
マスターの件数が決まってるなら典型定的な分類器やから作るのは楽やで。 mnistのソース読んで適当に頑張りやー
そもそも機械学習じゃないのに、なぜ機械学習に詳しい人に聞いたの?
機械学習必要なしって言う人多いけど「解決しましたかorしませんでいしたか」ボタンが押されたとか、さらに別の質問を入力して答えを見つけようとした(提示されたQ&Aが良くなか...
AIとか機械学習に詳しくないけど、「Prolog」に1票 Prolog実践入門 - AIに特化した老舗言語 - Qiita https://qiita.com/ShunIchikawa/items/6449f492dc38a7201162
まず『初めてのパターン認識』でも読んでみてはどうか。 学習データを手で作るという時点で学習データのボリュームがだいぶ限られる。 「適切な」クローズしたFAQページを選ぶ際に統...
作るだけなら機械学習を用いない方法も用いる方法もあるが、箇条書きの下に書かれた「習得メイン」というのが一番のポイント。おそらく機械学習の習得を指していて、要するに、機...
数学は要らん この計算式はどういう機能かが分かっていれば良い
向いてないからやめた方がエエよ
AIや機械学習を一切使わず古典的エキスパートシステムとして実装されるのがよいと思います ほぼ全く完全にAIに関係なくて笑う
こういうのを問う場がはてぶという、日本のIT後進国っぷりよ。。。
これと同じ増田? https://anond.hatelabo.jp/20191019183452