2024-04-01

anond:20240401153545

ルー大柴か?

まず情報検索転置インデックスLTR、近似最近傍法などの社内ライブラリを書いてる。

推薦システムCTR最適化のためにクリックデータから訓練データ作成して、特徴量からクリック確率予測し、最大化するコンテンツを出力してる。

文書分類は「セーフサーチ」と同じ手法を使っているが、特定の条件に合致する文書スコアリングするモデルを作ってる。

  • (なんで俺はろくにソフト書いたことないど素人に罵倒されているんだろう...)

    • 自己紹介乙

      • じゃあ何書いたの? 俺はカスタムCI/CDをJava/Cメインで書いたことあるし(j Developer,NetBeans, Eclipceの全部盛り)社内の開発者に環境提供するRest/jQueryベースのを別のライブラリに置き換えた...

        • 俺が書いたことがあるのは以下 NLP系のタスク。情報検索、推薦システム、文書分類等。 社内のセールス系連中の仕事の自動化 Webシステムのバックエンド (php, python, java, perl)

          • NLP系ってどういうこと? フレームワークは? データパイプラインは? どういうプロセッシングなの?

            • ルー大柴か? まず情報検索は転置インデックス、LTR、近似最近傍法などの社内ライブラリを書いてる。 推薦システムはCTR最適化のためにクリックデータから訓練データを作成して、特徴...

              • いやだからライブラリとパイプラインは?レポはどこに?ビルドはどうしてるの?

                • ライブラリなんて使ってないよ。フルスクラッチ。

                  • 言語は?

                  • パイプラインはどうしてるの?フルスクラッチ?

                    • 例えばLTRを実行するにはランダムフォレストのようなアルゴリズムを使えると良いのだけど、ランダムフォレストはC++でスクラッチで書いてて、そのラッパーをpythonで書いてる。

                      • あのな?パイプラインというのはデータを取ってくる部分のことでそれはフルスクラッチではやらないしデータベースの知識が必要なわけよ ランダムフォレストとか出てこないの

                        • お前の中ではそうなんだろう 俺は事実を述べているだけだ

                          • 俺の中というかMLやってる全員がパイプラインといったらデータとってくる部分だと認識してるしランダムフォレストなんか関係ないよ 言わなかったけどNLPとNNにxgboostあたりのフォレス...

                            • パイプラインと言ったらデータ収集から訓練までの一通りのことを言うよ で、じゃあデータはどうしているのかというと、クロールしてる あるコンテンツの検索エンジンを作っているの...

                              • 訓練はパイプラインと言わないしそもそもランダムフォレストがとか全く頓珍漢なこと言ってるんだから話にならないよ 君はやったことなくて知ってる言葉並べてるだけ

                                • お前はなんで「どうせやったことがない」と言って精神を保とうと必死なのw

              • NLPで近似最近傍法というのは例えば何のグループを出してるの?近似最近傍法自体は単にMLだけどなぜそれがNLPなの?

          • Webシステムのバックエンドもとっ散らかってるけどどういうフレームワーク?Rest? RPC?どのようなAPIでどんなアーキテクチャなの?

          • あまりエンジニアの仕事としてセールス連中の仕事の自動化とかしないと思うけどまあ俺も駆け出しの頃少しはやったことあるけど どのようなテクノロジーを使ってどのような自動化を...

            • 例えばセールスの連中が「こういうアイテムを広告出稿したい」と言うわけだが、「こういう」の部分のプロトタイプを作って試行錯誤してGOサインが出た段階で自動化される

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん