はてなキーワード: スコアリングとは
推薦システムを開発しているが、テクが色々あるので匿名ダイアリーに公開しておく。
要点としては、一般的な仕組みを作って設定UIを作っておき、あとはUIから権力者にいじらせるということ。
まず、レコメンドの際に「フィルタリング」と「スコアリング」を分けて考える必要がある。
フィルタリングの段階では、除外するアイテムを指定して絞り込みを行う。「このユーザーは過去にこのアイテムを嫌いと言っているから、これに似ているアイテムは除外」とかそんな具合だ。
フィルタリングを行って残った集合Xに対して、スコアリング関数f1, f2, ..., fnを用意しておく。スコアはy_i = f_i(X)で出せる。
ここからが肝なんだが、「誰もが納得するソート基準」なんてものは基本的にないと考えて良い。
ステークホルダーの中で「俺が推薦システムのソート順を操るのだ」と権力を持つ人がいたら、そいつにソート順を操れるようにUIを作っておく。
社内では「台」と読んでいるものがあるが、台にはどのfを使うかを指定しておく。台j1,...,jmを用意しておき、対応するスコアリング関数f_I(j)が存在する。
z = Σ_{i∈I(j)}(α_i y_i)というようにαをいじれるようにする。
権力者の脳内基準こそが推薦システムの要である。社会的要件など様々なフィードバックが来るだろう。そうしたらひたすら忖度するのである。
合理的であることは道徳的要請である。知能指数(IQ)と合理性指数(RQ)は別物である。IQはエンジンの馬力で、RQはエネルギー効率だと考えて良い。幸いにも、合理的になるように自分自身を訓練することができるかもしれない。ここにいくつかのアイデアがある。
1. スコアをつける
Brierスコアはもともと、気象予報士の天気予報に対するフィードバックを得るために開発されたものである。気象モデリング技術の向上と、より鋭いフィードバックにより、今日の気象学者は、1、2世代前よりもはるかに正確になっている。このスコアリングを応用できるだろう。
2. 同じ状況に陥った他人を探す
あなたが投資家で、ある会社の経営陣と面接し、その株を買おうと考えているとする。経営陣には楽観主義バイアスがかかっているはずなので、彼らの言うことは大目に見なければならない。しかし、他社に対する彼らの見方は、正確である可能性が高い。つまり、自分のことを聞くのではなく、他の人のことを聞くのである。皆、自分のことをユニークだと思いたいものだが、他の人が同じ状況に置かれたときにどうなったかを尋ねることは役に立つ。
3. クリティカルパスよりも余裕を持つ
あるタスクがどのぐらいかかるのか、と問われた時、「2時間」を「4日」と訳す。
現実の世界では、確率は常に変化している。合理的な思考をするための重要な課題の1つは、新しい情報が入ってきたときに、確率を正確に更新することである。最も優れた予測家はこれを非常にうまく行い、非常に細かい確率の刻みを使っている。(ただし、多くの人は確証バイアスに陥り、新しい情報を適切に評価に取り入れるよりも、無視したり、割り引いたりすることを好む。つまり、目的に対して間違った信念を補強し続け、コミュニケーションを無視し続けたり、間違った人とコミュニケーションをする。)
ジョブチューン見てイライラして行ったこともない店のレビューを書き込むやつと真面目なレビューが同等であるというのが意味わからんよな。
結局は食べログみたいな恣意的なスコアリングの方が優秀なわけだけど、それもプラットフォーマーの嗜好が出るから完璧ではないし、炎上の仕方を見ると世の中の人は単純平均の方が嬉しいみたい。
Apple Watchで心拍数の変化からその個人がどれだけ旨いと思ったかを読み取る、といった無意識からの点数づけができない限りはダメだろうけど、しばらくは実現は無理そうなので詰んでいる。
食事という単純な欲求に対してですらこうなのだから、さらに複雑な政治における一票も、平等であることで多くの弊害がある。
多くの無知な民衆はコントロールされやすく、この情報化時代にはそいつらをどれだけ上手くコントロールしたかだけが選挙の結果に反映される。
まとめ(含む推測・未確認事項)
ヤフーが好きなわけでもないし AI と呼ばれるアレなものも多いが、今回に限ってはひどい濡れ衣
そしてプレスリリースで明言したものと無関係の処理をこっそり入れることは、他にも恣意的な除外をしていると思われかねないことを自覚しているのだろうか
以下原文
問題が無さそうなのに人気コメントから除外されるのは「34 文字未満または同じ単語の繰り返し」でほぼ確定っぽい(訂正 : 33 文字らしい)
繰り返し扱いにならない文字種や文字数はまだ不明確ではある。スラッシュまじか
条件に当てはまらず、十分なスターを獲得しているが、人気コメントから除外されているものがなかなか見つからない。一目でマズいと分かる単語が使われていると、そもそもスターが集まらないからだ
実験場にある程度コメントが集まると、新規の検証コメントが既存の人気コメントを超えるのは難しい。新規の実験場に人が集まるかは不明で、人が来ないとスターがつかない
コメント数がまだ伸びていないページをいくつか見てまわったところ、ハッシュタグをいくつも並べているコメントが除外されているのは見かけた
機能していないからそのうち外すんだろうが、早く戻してくれないかなあ
(追記 2)(22 日 1:30 頃)
あまりに機械的だから、いくつか見れば傾向が分かるかと思ったが、 AI がおかしいのではなくはてなが文字数の処理を入れているようだ(未確認)
文字数の問題を除けば、納得いかない感じも込みでそれっぽい挙動に見えた
スコアリングしてスターの重み付けをしているのか、ランキングは今まで通りでスターに関わらず除外しているのかはちょっと気になるがこのへんで
少し前に入った、特定の人によくスターを送る人のスターをカウントしないやつ(?)は有効っぽい
すぐ消されたブコメのリンクも偶然見ました。中立的で良いコメントだったので、悲しんだ人の目に触れる機会が奪われたことにやるせない気持ちになる。誰かの心が救われたかもしれないし、それはスターをつけたひとりひとりの意思によるものでもあったのに
ユーザーでテストすんなよ本当に昔からさあ…誰かに届けようとした生きている言葉なんだよ…
初期は 50 字未満だと外されてたけど、アップデートでボーダーが 33 文字未満になったってコメントを見たよ。1/2 から 1/3 にしたってことかね
えっまじで
深層学習のモデルにそんな手の入れ方はできないので、ヤフー株式会社の AI とは別に、はてなが文字数の足切り処理を入れているのだろうか
だとしたら風評被害に遭わせているよなあ。これが入らないのはおかしいって指摘は主に文字数に関係するものだから、完全に濡れ衣じゃん
短文コメントを歓迎しない姿勢の表明ということか、食わせるデータとして短いと困るとかか
いっそ項目ごと消してくれてもいいのに
信用情報機関は自己破産、割賦払いやクレジットカードの滞納をしたりすると記録される訳で、基本的には「こいつヤベェやつかどうか」を参照する目的に使われていると思う。
一応、クレジットカードの請求があってしっかり収めましたみたいな記録もあるみたいだけどそれが評価されることはない気がする。
家賃も(保証会社によっては)滞納すると記録されるわけだけどもしっかり収めても何も記録されない。
これを、家賃もクレジットカードも割賦払いも基本的には請求があって問題なくと収めましたという記録を基本的に記録し審査のときにはこれを活用してほしい。
個人的には金額まではいらないと思う。金額をいれてしまうと強い信用スコアリングの要素ができてしまう気がするから。
イメージとしては自動車保険のノンフリート等級のように問題のない人はリスクが低いとみなして審査や保証料の割引をしやすい構造になってほしい。
なぜこれを書こうかと思ったかというと職種上移動が多いので移動する度に審査で職場に電話されたり、家賃1ヶ月分〜0.5ヶ月分の保証料を収める必要があり
これって個人の信用リスクがある程度鮮明になればクリアできるのではないかと思ったからだ。先日の連帯保証人がいないから家を借りれないという状況も改善するだろう。
とはいえ、個人の信用スコアリングは過剰にやると中国のような事になってしまいかねないしその線引が難しいと思っている。そこで既存の信用情報機関の活用はどうかと思ったわけだ。
他にいいアイディアはないだろうか。
ツイッターは「今現在どういう趣味クラスタに属しているのか」程度しか分からず、遡る性能が乏しい上、遡ってどういう発言をしてきたかが完全にトレーサブルであったとしても、それがどういう現実にぶち当たってきたかを示すことにはならない。なぜならtwitterは発信することを自分の意思で選べるからだ。我々が必要とするのは、相手が何を見聞きしてどのように育ってきたかを瞬時に理解できるように提示するものであり、強いて既存のものから近い概念のものを挙げるなら、信用スコアサービスに近い。これは経済的信用度を示すだけだが、これを学術知識やスキル等、多角的スコアリングを可能にしたものが登場することにより、匿名であろうと実質プライバシーを失う代わりに建設的な議論が可能になるかもしれない。例えば自分のブログのbioに長々と読んできた漫画を書き綴らなくとも、ひと目で「ああこの人はこういう漫画を読んできたからこのへんのジャンルを前提としてこの発言が出てきたんだな」と分かるようになるのが理想だ。
夫として妻を助けるにはどうしたら良いかな、アドバイス、書籍、そう言ったものないかなと思ってGoogle検索する。
そうすると、どうすれば母親が少ないストレスで育児ができて最後に「たまには旦那さんに甘えちゃいましょう!」みたいなサイトばかりヒットする。
「父親の育児における役割」と言う言葉、おそらくあちらのAIでは
くらいにスコアリングされてるんだろうな。
ここから予想されるのが、育児とかの検索をしてるのは母親が圧倒的に多いって事だ。
だけどだからって父親という単語を無視してるようにしか見えない挙動ってどうなんだよ。
例えば男性が本屋さんで店員に「すいません、父親にオススメな育児の本ありますか?」って聞いて、「新人ママの子育てレッスン」とかそんな本を勧める店員いないだろ。
ここまでならAIのシンギュラリティとか当面無理だろ、と言うくらいで済むんだが、問題はGoogleがお勧めするサイトはどこも「お母さんが頑張る育児、父親は使えないし手伝わない、どうやればコントロールできるか、お母さんには子供にだけでなく夫にも寛容でなくてはならない、ところであなたのキャリア大丈夫?」とかそんなんばかりになってしまう。
つまりAIによって女性は「将来が不安、子育てが不安、旦那が信用できない」と洗脳されていき、そこにふわっとフェミニズムが入り込むと言う図式になってないか。
https://blueingod.blogspot.com/2019/06/lineline.html
もう投稿は消されているんだけど。
「頭の善し悪し以前に、そんな人がいると、それだけで周りの人は10倍疲れてしまうから、絶対に排除する」
「人を見下すクセがついてしまっている人」を、とにかく排除するように努めています】
https://twitter.com/mabou77/status/1144257997524406273
っていう投稿を見たわけね。
まぁ正直するぎるというか。
LINE株式会社でLINE NEWSやアカウントメディアの特集・アライアンスなどを担当している人としては軽率だよなと思います。
こういうのがTwitterに投稿してしまうってことは。普段から日常会話レベルで自然に口から出ているんだろうなと思う。
しかし、スコアリングビジネスに参入するというニュースが報道されたばかりで、こういうTweetをしてしまう人も所属している
というのはどういうもんなんだろう。