NLP系ってどういうこと? フレームワークは? データパイプラインは? どういうプロセッシングなの?
ルー大柴か? まず情報検索は転置インデックス、LTR、近似最近傍法などの社内ライブラリを書いてる。 推薦システムはCTR最適化のためにクリックデータから訓練データを作成して、特徴...
いやだからライブラリとパイプラインは?レポはどこに?ビルドはどうしてるの?
ライブラリなんて使ってないよ。フルスクラッチ。
言語は?
主にpython。バックエンドはphp、java、perlも使われているけど、マイクロサービスで切り分けてる。
あのな、GPUのコードフルスクラッチで書くのはPythonとかJavaでは無理なのよ
なにいってんだこいつ GPUなんて使ってないぞ
え?トレーニングどうしてるの?
CPUで足りる 問題のドメイン的にはCPUで十分
CPUだってフルスクラッチで書くならPythonでNLPとか話にならんぞ
情報検索はNLPであるというのはわかるよね?
cythonの存在も知らない低能
パイプラインはどうしてるの?フルスクラッチ?
例えばLTRを実行するにはランダムフォレストのようなアルゴリズムを使えると良いのだけど、ランダムフォレストはC++でスクラッチで書いてて、そのラッパーをpythonで書いてる。
あのな?パイプラインというのはデータを取ってくる部分のことでそれはフルスクラッチではやらないしデータベースの知識が必要なわけよ ランダムフォレストとか出てこないの
お前の中ではそうなんだろう 俺は事実を述べているだけだ
俺の中というかMLやってる全員がパイプラインといったらデータとってくる部分だと認識してるしランダムフォレストなんか関係ないよ 言わなかったけどNLPとNNにxgboostあたりのフォレス...
パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ で、じゃあデータはどうしているのかというと、クロールしてる あるコンテンツの検索エンジンを作っているの...
訓練はパイプラインと言わないしそもそもランダムフォレストがとか全く頓珍漢なこと言ってるんだから話にならないよ 君はやったことなくて知ってる言葉並べてるだけ
NLPで近似最近傍法というのは例えば何のグループを出してるの?近似最近傍法自体は単にMLだけどなぜそれがNLPなの?
亀レスだが、こいつもANNをknnと勘違いしてるな
こいつもっていうか同一人物だからな