一般的にこのタスクは類似文書検索と呼ばれています．ブックマークコメントでは「ElasticSearchを使え」と言われています．ElasticSearch の More Like This Query 機能を使うことで類似文書検索が実現できるようです．あとはパラメータを調整することで思い通りの結果が得られるのではないでしょうか．

より高度なアプローチを取るのであれば，BERT と呼ばれるニューラルネットワークモデルを活用した類似文書検索も可能です．こちらのブログ (ElasticsearchとBERTを組み合わせて類似文書検索 - Ahogrammer) が参考になるでしょう．

しかしこれだけで終わると悲しいのでもう少し機械学習の話をすることにします．

機械学習的にこの問題に取り組むには順序学習 Learning to Rank という問題を解く必要があります．順序学習は google 検索にも使われている機能です．

これは，「入力 x に対して N 個の候補 y_1, y_2, ..., y_N を類似している順に並び替えるようなスコアを出力する関数 f(x, y_i) を学習する」というものです．

More Like This Query 機能よりもこちらのアプローチが優れているのは，前者はどうパラメータをチューニングしようと「類似している文書」しか得られないのに対して，後者は(先程引用したような)「見合った」を明示的にデータとして与えてランキングを学習できる，という点です．

学習データとして「この質問のに対してこの FAQ ページがもっとも見合っている」「この質問に対して A と B ふたつの FAQ ページがあるが，B より A の方が見合っている」「この質問に対して見合った順に全ての FAQ ページを並び替えたもの」といったデータを大量に準備することで，「見合った」を学習することが可能です．

しかしこちらも ElasticSearch の機能に搭載されているようです．ありがとう ElasticSearch．お疲れ様でした．

もしあなたが ElasticSearch を使うのではなく， Python を使って再実装したいと考えているのであれば，目印として必要なライブラリや概念を書いておきます．

類似文書検索について
- 入力および出力候補であるテキストは何らかの形で特徴量に変換する必要があります．これは MeCab を使った分かち書きによる単語集合 bag-of-words でも良いですし，単語集合に対して word2vec などの潜在表現を組み合わせて文章を潜在表現の集合として表現し， pooling 処理を行うのも良いでしょう．先程言及したよう BERT も利用可能です．
- 類似文書検索を行うには，特徴量同士の類似度を計算する必要があります．コサイン類似度を自ら実装するもよし，Numpy や Scipy や scikit-learn などのライブラリを用いるのも良いでしょう．
- そもそも類似度を愚直に計算せずとも，scikit-learn には近傍検索を行う NearestNeighbors が実装されています．これを使いましょう．
- 検索対象である FAQ ページの量が膨大である場合，近似近傍検索 Appropriate Nearest Neighbors (ANN) を検討するのも良いでしょう．ANN を行うライブラリは複数あり，ベンチマークも行われている(erikbern/ann-benchmarks: Benchmarks of approximate nearest neighbor libraries in Python)ので好きなものを選んでください．私の好みは FLANN です．
順序学習については詳しくないので IR の専門家にお願いします．検索した感じ LightGBM で実装するのが一番楽そうです．

Permalink | 記事への反応(0) | 23:07

2019-10-04

■anond:20191004150709

facebookの人は何故かコンセント抜いて解決したらしいけど、

現実問題作成したニューラルネットワークモデールは揮発性のモノじゃないから

インターナショナルネットワークを通して世界中に拡散される可能性もゼロじゃないんだよなあ。

Permalink | 記事への反応(0) | 15:14

2019-08-30

■anond:20190830071035

関係ないけど、ニューラルネットワークに向いてるGPUをくれ。

CPUじゃ脳のような処理してたらトロいだろ。

Permalink | 記事への反応(0) | 07:17

2019-08-15

■anond:20190814115041

しかし実際の機械学習はそういうもんじゃないだろ、１トライはニューラルネットワークの各パスを太く（細く）する１回の刺激に過ぎない。

多少のランダムを混ぜつつ１００万のトライを経て疑似脳みそを鍛えたら、ある範囲ついては人間に似た判断ができる、というのが機械学習だと思うが？

※実際には、そういう１００万トライを出来がいいＡＩが生まれるまでさらに何度も繰り返すわけだが。

Permalink | 記事への反応(0) | 18:37

2019-07-14

■ＡＩの民主化

最近話題になってるこういうの見かけたんだけど

https://ai-scholar.tech/deep-learning/matrixflow-191/

この人は文系でも使えるＡＩ製品を売り出してデータサイエンティストを全部失業させたいとか言ってる。

で１年くらい昔の話で申し訳ないんだけど、この人こんなことも言ってる

https://twitter.com/tdualdir/status/964134918266605568

この人の言ってる「DNNが任意の関数を表現できる」ってのはディープニューラルネットワークの層を深くすればするほど複雑な表現に対応できて任意の関数に近づけるってことだよね。

関数をテイラー展開して項を増やせば元の関数に近づくみたいな話。万能近似定理とか普遍性定理とかいう名前のやつ。たしかに昔から言われてる。

でもどれくらい深くすればうまく近づけられるかってことは何も言ってなくて、既存の手法よりもうまく行く理由もわかってない。

無限に深いDNNならどんな関数も表現できる、なんて言っても実際にできなかったら使えないじゃん。

だからこそ研究者が現在進行形でいろんなニューラルネットワークを試してうまく行く条件を探してるわけ。

で、何が違うのって言ってるリンク先のスライド

https://www.slideshare.net/masaakiimaizumi1/ss-87972719

は目的の関数が一定の条件下ならDNNが他のどの手法（最小二乗法とか）よりも一番うまく近づけられることを証明したって言ってる。

つまりこれまで分かってなかったことを部分的に解明している。全然違う話。

書いてある数式が難しくて理解できなくても日本語のとこだけ読むだけでも全然違う話をしてることがわかると思うんだけど。文系ならともかく理系ならわかるでしょ。

数学ができるかよりも機械学習で何ができるのか理解してそれを活用できることが重要ってインタビューの中で言ってるけど、本人が理解してないじゃん。

何ていうかさ、知ったかぶってＡＩに強いですよってアピールしたかったのかなって感じ。最近ＡＩブームで目立ってるＡＩ人材ってみんなこんな感じ。

数学に強い理系って経歴をこういうハッタリにしか利用できないのは悲しいよね。

ＡＩ理解の解像度がこの程度の人間がソフト作ってＡＩを全くわからない人間に「はいあなたみたいな文系でもＡＩ使えますよ！」って売りつける構図なんだけど、

最近良く聞くＡＩの民主化って結局こういうことなの？

作る側も使う側も何も分かってなかったら成果出るわけないしすぐ飽きられそうなんだけど。

それともまだグーグルのAutoMLでも実現してない全自動で最適なニューラルネットを学習してくれるＡＩプラットフォームを自分でゼロから作る予定なのかな？

無限に複雑なDNNなら任意の関数を表現できるって話とどういう条件でDNNが他の方法よりうまく行くって話の違いが分かってない状態じゃ厳しそうだけど。

これもゴールドラッシュのときにツルハシを売る奴が一番儲けるってやつなのかな。

でもよく考えたらこの手のソフトって昔からあるよね。結局使いこなせずに「コンサルタント」とか雇って月単価いくら万円で常駐させてしまうのはいいほうで、たいてい飽きられる。

手を変え品を買え同じことの繰り返しってことか。なんだ。

まあデータサイエンティスト全部失業させたいってのは同意。こういうハッタリが増えればすぐＡＩ幻滅期が来てブーム終わるし。

早く役に立たないＡＩ人材もデータサイエンティストもツルハシを売る奴も共倒れしないかな。

まあツルハシを売るやつは目ざとく次のブームに乗り換えて同じことを繰り返しそうだけど。

Permalink | 記事への反応(2) | 12:59

2019-06-06

■anond:20190606002521

何かこう、ニューラルネットワークと記号論理のお化けみたいな奴で、

ブコメとスターの過去履歴からダブルスタンダード言動を抽出判定できる機能とか付けられないのかね。

Permalink | 記事への反応(0) | 00:37

2019-04-22

■anond:20190422162635

直球でマジレスすると、人類はもう実時間に自動モザイクできるところまで来ている。

セマンティックセグメンテーションを調べろ。これは今流行のAIの中のディープラーニングのなかのCNN（コンボリューショナルニューラルネットワーク）の一種だ。

AIに「ここはモザイクかける場所ですか？モザイクかけない場所ですか？」とピクセル単位で教え込む。学習が終わった暁にはエロ画像入れるとモザイクするべき場所とするべきでない場所を分けてくれるはずだ。

分けてしまえばその周辺だけモザイクかけるのは簡単だ。

実現するには、モザイク前のエロ動画を準備し、動画全てのコマに対して全てのピクセルをモザイクにするべきかそうでないか分類したデータを用意してくれ。そいつをもりもりAIに見せるんだ。

ものすごい演算時間と計算量を食うと思うが、多分できる。だって、セマンティックセグメンテーションは自動運転に使えるぐらい、人と車と道路と空を実時間で見分けられるぐらいすごいんだから。

でも寡聞にしてこの研究をやったという報告を見つけられないんだ。データさえ用意できればできるはずなんだけどなあ。

あ、認識率は9割とか9割9分とかしかないんで、捕まりたくなかったらモザイク領域は時系列で平滑化というか多数決とっておいた方が良いと思う。

Permalink | 記事への反応(4) | 19:38

2019-03-29

■anond:20190325155543

deep learning は基本的には、入力と正解のセットをたくさん用意して疑似ニューラルネットワークを教育するものだから、入力に対する正解をあらかじめ決めているわけ。

だから、教育用データセットを作成する時点でフレーミングに関する基準は含まれるよね。

Permalink | 記事への反応(0) | 11:47

2019-03-04

■制服姿の女子高校生が体育館の床で揃って土下座させられてる画像に

「ニューラルネットワークによる自動色付け」って引用レスしてる奴はセンスあるなと思った

Permalink | 記事への反応(0) | 16:56

2019-02-06

■テスラのアーキテクチャ

テスラの車は、トヨタとメルセデスの古いプラットフォームから派生した純電気自動車だ。まあ、旧型カムリだ。各ECUとインパネ(IC)間がCANバスで結ばれ、ゲートウェイを通して車内インフォテインメント(カーナビ)が接続できる。そして、ゲートウェイにはセンターコンソール(MCU)、自動運転モジュール(APE)が接続されている。まあマツコネみたいなものだ。ただし、通常のカーナビと違い、このMCUはTegra 3(旧世代)または超高速なIntel Atom プロセッサ(現行)が採用されている(マジ)。そして、海賊版のUbuntu GNU/Linuxを実行している(マジ)。そしてLTE回線に直結し、テスラ本社のサーバ(mothership.tesla.com)にOpenVPN 接続している。

機能

ICはダッシュボード表示を司る。ドライブモード、車速、消費電力、APEが報告する周囲環境などを表示する。
MCUはドアロック、オートエアコン、Webブラウザ機能、オーディオ、ナビ、アタリゲームのエミュ機能などを扱う。無断で集める運転データセットはここに集積される。LTEモジュールはここに接続される。
APEは自動運転関連機能を提供する。2個のTegra X2と1個のGP106に全周カメラ画像を入力し、ニューラルネットワークを使って確か9fpsくらいで処理する。処理結果を元に自律して経路計画を立て運転する。

古いモデルは3G、新しいモデルはLTEモジュールを標準搭載している。明示的に特別注文しない限り無効化や取り外しは行われない。本社Mothershipは各車の動作状況を監視・操作するほか、オートパイロット起動通知を受け取り、またssh 接続のためのパスワードを保持する。これによりファームウェアのrootが取られた場合にオーナーを蹴り出したり、あるいは事故発生時に「オートパイロットは(直前でエラーを吐いて運転をぶん投げたため)使用されておりませんでした」と発表するなどいち早くメディア対策を行うことができる。

アップデート

更新パッケージは前述のOpenVPN経由でダウンロードされ、その中にAPE ファームウェアのほかにもドアハンドル、ブレーキ、インバータ ECUなどのファームウェアが含まれていれば、MCUが更新処理を行う。これまでに配信されたアップデートには、Linux Kernelを含むMCUのOS 更新、インバータ出力アップ(設計の三倍程度)、緊急制動距離の延長と短縮、自動緊急ブレーキの追加、自動運転の警告間隔延長・短縮(事故報道の頻度に応じて調整)、自動運転機能そのものの搭載や根本的な入れ替えなどがある。現在の仕様ではファームウェアバージョン表記はYYYY.WW.x.y.zで、Gitのコミット IDが末尾に付き、平均して月2回程度のローリングリリースが行われる。つまりリポジトリのheadがざっと社内検証を通るとLTEで降ってくる。非常にまれなケースでは社長(@elonmusk)の「やりましょう」ツイートから数時間でバージョンが上がる。

駆動系

純電気自動車なので、エンジンは搭載しない。代わりに車体下面にリチウムイオン電池パック(ノミナル電圧480Vまたは400V)を搭載する。パックは火薬式ヒューズを含む高電圧コンタクタ(リレー)を介してモータおよびインバータと接続され、インバータはモータ進角を監視しながらスロットル指示に合わせて三相交流電源を供給する。この辺りはCPU ファンと変わりない。

https://anond.hatelabo.jp/20190206135710

Permalink | 記事への反応(0) | 13:57

2018-12-18

■ニューラルネットワーク

人間の脳神経細胞を模したものを作ったら人間の脳っぽいことができた。これってすごくないか？鳥の真似をしたら空が飛べたというのと同じノリだと思う。科学というのは案外単純なものかもしれない。

Permalink | 記事への反応(1) | 20:39

2018-11-25

■anond:20181125133952

そうそう、それに近い

分散ネットワークとかニューラルネットワークとか注目されている現代らしい設計だと言えると思う

Permalink | 記事への反応(0) | 13:41

2018-09-20

■anond:20180920184911

３次元空間上で物体を回転させたり、衝突させたり、自由落下させたりしたいときに使うとか。

あとは、簡易なニューラルネットワークを手作業で構築する場合とかだね。

Permalink | 記事への反応(1) | 18:53

2018-09-18

■anond:20180918141224

機械翻訳は困難とされてきましたが、昨今話題のDeep learningで状況は一変してます。

Google翻訳もニューラルネット使って大幅に精度が向上してますし。

Googleが開発したPixel BudsやGoogle レンズは端末性能の制約上まともなニューラルネットワークを駆動できずに精度はイマイチでしたが、新型iPhoneやNVIDIA RTX2080のようにニューラルネットに特化したチップを搭載する機器が登場し始めており、かつ5Gのようにリアルタイムで大量データを送受信可能な通信規格が普及すれば携帯端末で大規模なニューラルネットを活用可能な未来は数年の内に来ます。

特に難しいとされてきた意訳についても、Deep learningによって実現可能性が見えてます。

キャプションから写真、写真からキャプションを生成するようなニューラルネットが既に実用化されていますが、「英語キャプション⇒写真⇒日本語キャプション」というように生成すると、写真を説明する英語の文章から日本語文章を生成でき、かつ単語単位で変換しただけでは得られない同一概念を表す英語と日本語の文章が得られます。これは意訳とほぼ同義の結果が得られており、さらに一歩推し進めて「英語⇒抽象概念、抽象概念⇒英語、日本⇒抽象概念、抽象概念⇒日本語」と学習すると、写真を介さなくても直訳ではない翻訳文章を得る事ができるようになります。

また「日本語⇒英語」「英語⇒中国語」というふうに学習させたモデルを使うと「日本語⇒中国語」についての翻訳も（学習していないのに）できてしまうという研究結果もあります。

上記のような現状を鑑みると、実用的なリアルタイム翻訳端末の登場はもうすぐだと思います。

Permalink | 記事への反応(1) | 23:24

■anond:20180918103227

　Int8(整数8-bit)のドット積は、ディープラーニングのインファレンス(推論)向けだ。ニューラルネットワークでは、トレーニング(Training:学習)にはFP16(16-bit 浮動小数点)など相対的に高いビット精度が必要だ。しかし、端末側での認識のための推論ではデータ精度を落としても認識精度はそれほど落ちないため、8-bit 整数程度の精度が使われることも多い。現在のGPUでは、推論向けでは8-bit 整数(Int8)のサポートがカギとなっている。
https://pc.watch.impress.co.jp/docs/column/kaigai/1111755.html