2024-04-01

anond:20240401155117

パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ

で、じゃあデータはどうしているのかというと、クロールしてる

あるコンテンツ検索エンジンを作っているのだけど、基本的にはデータクロールで確保

機械学習教師データは?というのは、distant supervisionでラベルづけしてるよ

記事への反応 -
  • パイプラインはどうしてるの?フルスクラッチ?

    • 例えばLTRを実行するにはランダムフォレストのようなアルゴリズムを使えると良いのだけど、ランダムフォレストはC++でスクラッチで書いてて、そのラッパーをpythonで書いてる。

      • あのな?パイプラインというのはデータを取ってくる部分のことでそれはフルスクラッチではやらないしデータベースの知識が必要なわけよ ランダムフォレストとか出てこないの

        • お前の中ではそうなんだろう 俺は事実を述べているだけだ

          • 俺の中というかMLやってる全員がパイプラインといったらデータとってくる部分だと認識してるしランダムフォレストなんか関係ないよ 言わなかったけどNLPとNNにxgboostあたりのフォレス...

            • パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ で、じゃあデータはどうしているのかというと、クロールしてる あるコンテンツの検索エンジンを作っているの...

              • 訓練はパイプラインと言わないしそもそもランダムフォレストがとか全く頓珍漢なこと言ってるんだから話にならないよ 君はやったことなくて知ってる言葉並べてるだけ

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん