2024-04-01

  • NLP系ってどういうこと? フレームワークは? データパイプラインは? どういうプロセッシングなの?

    • ルー大柴か? まず情報検索は転置インデックス、LTR、近似最近傍法などの社内ライブラリを書いてる。 推薦システムはCTR最適化のためにクリックデータから訓練データを作成して、特徴...

      • いやだからライブラリとパイプラインは?レポはどこに?ビルドはどうしてるの?

        • ライブラリなんて使ってないよ。フルスクラッチ。

          • 言語は?

          • パイプラインはどうしてるの?フルスクラッチ?

            • 例えばLTRを実行するにはランダムフォレストのようなアルゴリズムを使えると良いのだけど、ランダムフォレストはC++でスクラッチで書いてて、そのラッパーをpythonで書いてる。

              • あのな?パイプラインというのはデータを取ってくる部分のことでそれはフルスクラッチではやらないしデータベースの知識が必要なわけよ ランダムフォレストとか出てこないの

                • お前の中ではそうなんだろう 俺は事実を述べているだけだ

                  • 俺の中というかMLやってる全員がパイプラインといったらデータとってくる部分だと認識してるしランダムフォレストなんか関係ないよ 言わなかったけどNLPとNNにxgboostあたりのフォレス...

                    • パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ で、じゃあデータはどうしているのかというと、クロールしてる あるコンテンツの検索エンジンを作っているの...

                      • 訓練はパイプラインと言わないしそもそもランダムフォレストがとか全く頓珍漢なこと言ってるんだから話にならないよ 君はやったことなくて知ってる言葉並べてるだけ

      • NLPで近似最近傍法というのは例えば何のグループを出してるの?近似最近傍法自体は単にMLだけどなぜそれがNLPなの?

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん