「協調フィルタリング」を含む日記 RSS

はてなキーワード: 協調フィルタリングとは

2023-12-12

https://b.hatena.ne.jp/entry/s/amass.jp/171757/

ブクバカが今更協調フィルタリングに驚いてるw

自分の見たいものばっか見てると本当見識狭まるんだな

こいつらIMDBとか見せたら失神しちゃうんじゃないか?

2023-11-06

協調フィルタリングアルゴリズム的に面白そうなところがあるとすれば、行列分解をひたすら高速化する的なやつ

2023-01-10

anond:20230110114407

協調フィルタリングって相当単純な仕組みなんですが、その行列操作が「知能」なんですかね?

知能だと思ってるならmovielensデータセットを使って如何に簡単実装できるかご自身確認してみたらいいか

もしそれを「知能」と思うなら、あなたがそう思うんならそうなんだろうとしか

anond:20230110112231

協調フィルタリングは似たような人間に似たものを出すようになってる

AIなんて仰々しいものではない

2022-07-09

なぜ一回買った商品おすすめで出すのか?

リターゲティングとは

 

インターネット広告におけるターゲティング手法の1つで、「1回以上、自社のサイトを訪れたことがある人に自社の広告配信する」ことを意味します。 通販サイトなどで自分が見ていた商品に関する情報を載せた広告が後日、別のサイト上で表示される・・・皆さんもこんな経験はないでしょうか。これはその広告が「リターゲティング」によって配信されていることによるものです。

引用元https://www.videor.co.jp/digestplus/market/2019/02/12957.html

 

これ、なんでリターゲティングするのか?っていうのは誰しも考えたことがあると思う

大抵出るのは「既に買ったもの」か「一回検討して買わなかったもの」だ

もうちょい自分趣味趣向を察して提案してくれよと思うだろうが

それよりリタゲの方が圧倒的に多い

 

これって結局、リタゲが一番効率が良かったってことなんだよね

コメンドシステムの敗北とも言える

例えば協調フィルタリングというジャンルがあって、好きな映画リストからおすすめ映画提案するみたいな研究

全然精度が良くないんだよ

結局ランキング作ったりリタゲした方がすこあがよくなっちゃ

残念ながら

2018-04-26

データサイエンティストが働いて嫌だったなと思う人たち

コンサルにてアナリストをやった後、データサイエンティストを名乗りながら仕事をしています。そんな中で嫌だったなと思った人たちとプロジェクト

1.医療統計の周りの人

最近アウトカムでの評価の流れにはなってきたが、まだまだモデル評価をする事は少ない。

でも何故か相変わらずロジステックとCox回帰をやれればおっけーであり、モデルの精度が当たらなくてもオッズ比と説明変数

有意差だけでていれば上手く行く分野。 本当に心が痛む上、まだまだ「医者でなければ人であらず」が通ってしまい、モデル説明よりもお医者様のお言葉が1stにきてしまう。また分析プロジェクト

設計らしい設計があまり出来ないのもつらいところ(モデルの精度が出ていないのにそのオッズ比・有意差に何の意味があるんだと思う)。後日本の製薬企業から「何とか工夫で有意差がでないのか!!」

という謎おしかりを受ける・・・いやそんなん無理ですやんと切実に思う。やる気でこの世界数字は変わりません。

後は何だかんだ製薬企業日本の古いしきたりが多いので面倒。

2.Google Analyticsアナリスト関連

割と良いBIみたいなんが良くも悪くもあるためアナリストの人たちがやった気になっているやつ。Web関係アナリストは、アナリストを名乗って欲しくない人の方が多いイメージ(勿論しっかりWebアナリストやっている方々は知っている)。広告内容を分類し、CV予測、そしてマルチチャネル予算からCV最適化案件をしていたらWebアナリストから「私の作るLPは最適です。なので予算4000万です」という謎の最適の主張を受けたのはいい思い出(何故かデザイナー様がWebアナリストもやっていた)。広告内容のuser2vecでのレコメンド実装チャレンジして評価して、協調フィルタリングよりも精度はよさげだな喜んでいたら、どっかのよくわからないレコメンドツールというのが汎用性もあるし、既存ツールに1万ぐらい払えば追加できるとそして何故か「最適化」されているという言葉役員が騙されて決済がおりていたのを聞いたとき殺意が沸いた。どうせ既存マーケティングオートメーションレコメンドエンジンなんて協調フィルタリング・ロジぐらいだろうと思っている。本気で分析やっている人がそうそ最適化なんて言葉を使わないと思うんだ・・・まぁここの反省Web業界といってもみんなコーディングがりがりではなくてGUIでいいならそれでが割と多いという事を学んだ (注意)。

3.データベース関連

どっかの人のにもあったが、「あっ、データ分析分かるんだよね?」という事でVB6Accessの改修をやらされそうになったときは全力で拒否った。

後は何故かPHP+MySQLあん(ry

VB6見た後でPythonコードを見ると心が癒された。

4.やる気を説いて来る人達

やる気で数字が変わったら誰も苦労なんてしないんだよ・・・。半教師有り等で精度向上見込めるといってもいくらなんでもこのデータでは

運用目標には到達しないとしか思えないんだ。

5.ホワイトボックステスト要求されたとき

モデルホワイトボックステストってどうやってやるんだ?精度を検証データでやっていれば良いじゃないかと思っていた。ただそこの金融系でITプロジェクトは、基本的に「ホワイトボックステスト」やらが必須らしく・・・おいおい・・。とりあえずカテゴリー目的変数がそれぞれの値を取ることを客先で見せてかつレポートで「こうこうこうゆうときカテゴリー変数が変わりますよ」という彼らがいう境界線確認を全てやることになった。カバレッジ100%も言われたが、流石に無さ過ぎるので諦めてもらった。

6.KGIとKPIしっかり切り分けてBI作成していたら集計屋かといって来られる時

どこかの人にもあったが、私はビジネスが動けばよいと思っているので難しい分析をしなくても上手く行く時は、集計で上手く切り分けて、要因分析をやる(裏で決定木とかで境界値とかは見ていたりする)。ただ何故かそれで集計ばかりしかしていないと怒られる。別に研究者ではないし、難しい分析をしてクライアントへの説明時間を取られたり、展開が難しくなるぐらいならば皆と合意した上で、KPIとKGIを切り分けてダッシュボード作成をしっかり出来る方が実はビジネス上上手く行くだ。むしろ自分への戒めでいつも難しい分析が本当に必要なのかと思ってるぐらいである。

注意 因みに私の別部署インフラ基盤周りのWordpress関係炎上していた。そこそこの大規模でWordpress使うって大変らしいのに・・・

勿論これの逆、評価した上で、分析ビジネスにしっかりと生かしていける人は大好きです。

2017-07-03

ビッグデータ」の各所での認識の違い

  1. アカデミックディープラーニング学習ができるレベル画像数万枚とか。テキストデータGB分とか
  2. 企業の開発部署データベースに1日数十万単位で蓄えられるレコードをほぼリアルタイムで処理したい。金融とか自動車とか物流とか
  3. 企業一般職ECサイトで因子分析とかバスケット分析とか協調フィルタリングをしたい。最悪1000レコードくらいあればできる
  4. 世間認識… なんかすごいやつ、すーぱーこんぴゅーたーとか使うんでしょ?
 
ログイン ユーザー登録
ようこそ ゲスト さん