はてなキーワード: スコアリングとは
政党を評価する際に、イメージや感覚に頼ることで迷いや不一致が生じる問題を解決するためには、以下の方法が有効です。
評価の基準を明確に設定することで、個々人が同じ尺度で政党を評価できるようにすることが重要です。評価基準を明文化し、チェックシートやスコアカードの形で具体化することで、客観的な比較が可能になります。以下のステップを推奨します:
• 項目の設定:経済政策、社会福祉政策、人権・多様性、透明性など、具体的な評価項目を設定。
• 重みづけの設定:自分にとって重要な項目に高い重みをつける。
• スコアリング:各政党に対して1〜5のスコアを付け、数値化する。
政党の公約や政策を、信頼できるデータベースにまとめることが有効です。このようなデータベースを利用することで、具体的な政策や過去の行動をもとに比較でき、イメージではなく実際のデータを基に判断できます。たとえば、「マニフェスト・ポリス」や「選挙ドットコム」などの政治情報サイトを利用することが推奨されます。
評価基準に基づいた政党の評価結果を共有し、他者とディスカッションを行うことで、客観的な視点を取り入れることができます。異なる観点を持つ人と議論することで、視野が広がり、自分の評価基準を再確認したり、修正したりすることが可能です。
4. メディア・リテラシーの向上
イメージや感情に流されないために、メディア・リテラシーを向上させることも重要です。ニュースやSNSで流れる情報を鵜呑みにせず、複数の情報源からの情報を比較し、バイアスや誤報を見極める訓練をすることで、より冷静な判断ができるようになります。
政党や候補者が過去にどのような発言や行動を取ってきたかを記録しておくことで、実際に行動と公約が一致しているかを確認できます。このようなトラッキングを行うことで、イメージではなく、事実に基づいた評価が可能になります。
自分の価値観や重要視する政策についてのチェックリストを事前に作成しておくと、各政党が自分の価値観にどの程度一致しているかを明確に比較できます。これにより、議論する際にも基準が共有されやすくなり、他人と噛み合わない問題を軽減できます。
まとめ
• 評価基準を明確化することで、イメージに頼らず具体的な事実に基づいた比較ができる。
• データベース化した情報を用いて、客観的に政党を評価する。
• ディスカッションとフィードバックで視野を広げ、他人の意見も取り入れる。
• メディア・リテラシーを高めて、情報の真偽を見極める力を養う。
• 価値観チェックリストを使い、自分の価値観に合った政党を明確に把握する。
これらの方法を組み合わせることで、政党の評価基準を明確化し、より理性的かつ客観的に政党を比較しやすくなります。また、他人と政党について議論する際にも、共通の基準があるため噛み合いやすくなります。
格闘ゲーム、特に MARVEL vs. CAPCOM のようなコラボ作品のストーリーモードとか、バトルの合間のキャラ同士の掛け合いというものが好きだ。
異なるキャラの細かい類似点を掘り下げたり、世界観が見えてくるような気の利いた掛け合いを見ると制作者の愛を感じて嬉しくなる。
一方で、登場キャラ数が増えていくと、キャラ同士の組み合わせパターンが爆発してしまうため、掛け合いが薄くなってしまうアンビバレンツな悩みがある。
そうなると、生成AIがキャラのバックエンドを学習したうえで、リアルタイムに掛け合いの台本を考えてくれる、という展開がある。どんなにマイナーなキャラでも的確に面白い掛け合いが見れるし、人間が作るパターンではなし得ないボリュームも望めそうだ。
これで問題解決か、というとそうでもない。「このキャラとこのキャラの掛け合いが面白い」と話題になって見に行く、とか「全部の掛け合いのパターンをコンプリートしたい」という行動があったりするのだ。AIが無数に生成する、となった途端に、全部のパターンを見ることは不可能となり、また特定の面白いものというものがなくなる。自分と他人が違うものを見ているということは共通の話題にしづらくなる。結果、色褪せて見えてしまうかもしれない。
単純に考えるとそうなるのだが、生成AIはまだまだこれからの技術だ。今の常識の延長ではなくもっと先を想像してみたい。
特定パターンの面白さといった既存の魅力を、学習と生成で生まれる新しい魅力が上回る未来もあるのではないか。例えば、キャラクターの関係性以外の複雑なパラメータ(プレイ回数、プレイ時間、ステージ種、キャラごとの対戦数、プレイスタイル、使用した技などなど)を考慮することでこれまでにできなかったような掛け合いやストーリーを生み出すこともできそうだ。
また、プレイを重ねるうちに、プレイヤーごとに、ゲーム内の関係性やストーリーが変化していくというようなこともできるだろう。敵・味方といった関係性や友情・恋愛などの感情が変化していくことで、新たな体験が生まれるかもしれない。
Googleのようなインターネットの検索エンジンのアルゴリズムは、日々変化している。初期は被リンクをスコアリングするというものだったが、コンテンツの内容を考慮したり、近年はユーザー行動を重視していると言われている。検索結果から実際にユーザーがアクセスした、といった行動が表示順のアルゴリズムに影響するというものだ。これによって「ユーザーの目を惹くページタイトル」といったものの重要性が増しているらしい。
AIにより生成されたコンテンツの質の向上にも、ユーザー行動が積極的に取り入れられていくだろう。「いいね」のようなシンプルなフィードバックから、ユーザーがテキストを読んだかといった精読率や、微妙なコントローラーの操作からユーザーの評価や感情を読み取るといった、能動的な行為を伴わないフィードバック取得もあり得る。
ユーザー行動からのフィードバックが重要であるなら、ひょっとしたら今以上にコントローラーにセンサーが搭載され、脈拍や汗といったユーザーフィードバックすらコンテンツに影響するようになるかもしれない。
突然話は変わるが、1990年代に米国West End Games社がリリースしたテーブルトークRPGに TORG というタイトルがある。 https://en.wikipedia.org/wiki/Torg
マルチバースによる、ポシビリティ・ウォー(Possibility Wars)という地球侵略戦争を扱った世界観なのだが、野心的な試みとして、Infiniverse というキャンペーンが行われていた。世界各国の TORG プレイヤーはWEG社の TORG 公式機関誌 Infiniverse Magazine の回答フォームを経て、自分たちのキャンペーン進行状況をWEG社に報告した。WEG社はそれらを集計することで世界全体への影響を与え、 Infiniverse Magazine 誌上でそれをプレイヤーに伝える、そうやって世界を巻き込んで TORG の世界観が構築され、地球侵略戦争のストーリーが進行する、というものだ。野心的な試みであったが、これは1年足らずで頓挫した。
90年代当時、プレイバイメールなど多数のプレイヤーの行動がストーリーを進行させ、世界を構築する、といった試みは他にも幾つもあったが、限られた人数よる運営ではスケールが難しかった。しかし、現代において生成AIは、ユーザーフィードバックをより精緻に取り込んだ新たなコンテンツや世界・ストーリーを作っていくことを可能にしているだろう。ポシビリティ・ウォーは今まさに起きているのだ。
このように想像を巡らして駄文を書いているだけで、ちょっとワクワクする気持ちになっている自分がいる。生成AIの未来に期待している。
推薦システムを開発しているが、テクが色々あるので匿名ダイアリーに公開しておく。
要点としては、一般的な仕組みを作って設定UIを作っておき、あとはUIから権力者にいじらせるということ。
まず、レコメンドの際に「フィルタリング」と「スコアリング」を分けて考える必要がある。
フィルタリングの段階では、除外するアイテムを指定して絞り込みを行う。「このユーザーは過去にこのアイテムを嫌いと言っているから、これに似ているアイテムは除外」とかそんな具合だ。
フィルタリングを行って残った集合Xに対して、スコアリング関数f1, f2, ..., fnを用意しておく。スコアはy_i = f_i(X)で出せる。
ここからが肝なんだが、「誰もが納得するソート基準」なんてものは基本的にないと考えて良い。
ステークホルダーの中で「俺が推薦システムのソート順を操るのだ」と権力を持つ人がいたら、そいつにソート順を操れるようにUIを作っておく。
社内では「台」と読んでいるものがあるが、台にはどのfを使うかを指定しておく。台j1,...,jmを用意しておき、対応するスコアリング関数f_I(j)が存在する。
z = Σ_{i∈I(j)}(α_i y_i)というようにαをいじれるようにする。
権力者の脳内基準こそが推薦システムの要である。社会的要件など様々なフィードバックが来るだろう。そうしたらひたすら忖度するのである。
合理的であることは道徳的要請である。知能指数(IQ)と合理性指数(RQ)は別物である。IQはエンジンの馬力で、RQはエネルギー効率だと考えて良い。幸いにも、合理的になるように自分自身を訓練することができるかもしれない。ここにいくつかのアイデアがある。
1. スコアをつける
Brierスコアはもともと、気象予報士の天気予報に対するフィードバックを得るために開発されたものである。気象モデリング技術の向上と、より鋭いフィードバックにより、今日の気象学者は、1、2世代前よりもはるかに正確になっている。このスコアリングを応用できるだろう。
2. 同じ状況に陥った他人を探す
あなたが投資家で、ある会社の経営陣と面接し、その株を買おうと考えているとする。経営陣には楽観主義バイアスがかかっているはずなので、彼らの言うことは大目に見なければならない。しかし、他社に対する彼らの見方は、正確である可能性が高い。つまり、自分のことを聞くのではなく、他の人のことを聞くのである。皆、自分のことをユニークだと思いたいものだが、他の人が同じ状況に置かれたときにどうなったかを尋ねることは役に立つ。
3. クリティカルパスよりも余裕を持つ
あるタスクがどのぐらいかかるのか、と問われた時、「2時間」を「4日」と訳す。
現実の世界では、確率は常に変化している。合理的な思考をするための重要な課題の1つは、新しい情報が入ってきたときに、確率を正確に更新することである。最も優れた予測家はこれを非常にうまく行い、非常に細かい確率の刻みを使っている。(ただし、多くの人は確証バイアスに陥り、新しい情報を適切に評価に取り入れるよりも、無視したり、割り引いたりすることを好む。つまり、目的に対して間違った信念を補強し続け、コミュニケーションを無視し続けたり、間違った人とコミュニケーションをする。)
ジョブチューン見てイライラして行ったこともない店のレビューを書き込むやつと真面目なレビューが同等であるというのが意味わからんよな。
結局は食べログみたいな恣意的なスコアリングの方が優秀なわけだけど、それもプラットフォーマーの嗜好が出るから完璧ではないし、炎上の仕方を見ると世の中の人は単純平均の方が嬉しいみたい。
Apple Watchで心拍数の変化からその個人がどれだけ旨いと思ったかを読み取る、といった無意識からの点数づけができない限りはダメだろうけど、しばらくは実現は無理そうなので詰んでいる。
食事という単純な欲求に対してですらこうなのだから、さらに複雑な政治における一票も、平等であることで多くの弊害がある。
多くの無知な民衆はコントロールされやすく、この情報化時代にはそいつらをどれだけ上手くコントロールしたかだけが選挙の結果に反映される。
まとめ(含む推測・未確認事項)
ヤフーが好きなわけでもないし AI と呼ばれるアレなものも多いが、今回に限ってはひどい濡れ衣
そしてプレスリリースで明言したものと無関係の処理をこっそり入れることは、他にも恣意的な除外をしていると思われかねないことを自覚しているのだろうか
以下原文
問題が無さそうなのに人気コメントから除外されるのは「34 文字未満または同じ単語の繰り返し」でほぼ確定っぽい(訂正 : 33 文字らしい)
繰り返し扱いにならない文字種や文字数はまだ不明確ではある。スラッシュまじか
条件に当てはまらず、十分なスターを獲得しているが、人気コメントから除外されているものがなかなか見つからない。一目でマズいと分かる単語が使われていると、そもそもスターが集まらないからだ
実験場にある程度コメントが集まると、新規の検証コメントが既存の人気コメントを超えるのは難しい。新規の実験場に人が集まるかは不明で、人が来ないとスターがつかない
コメント数がまだ伸びていないページをいくつか見てまわったところ、ハッシュタグをいくつも並べているコメントが除外されているのは見かけた
機能していないからそのうち外すんだろうが、早く戻してくれないかなあ
(追記 2)(22 日 1:30 頃)
あまりに機械的だから、いくつか見れば傾向が分かるかと思ったが、 AI がおかしいのではなくはてなが文字数の処理を入れているようだ(未確認)
文字数の問題を除けば、納得いかない感じも込みでそれっぽい挙動に見えた
スコアリングしてスターの重み付けをしているのか、ランキングは今まで通りでスターに関わらず除外しているのかはちょっと気になるがこのへんで
少し前に入った、特定の人によくスターを送る人のスターをカウントしないやつ(?)は有効っぽい
すぐ消されたブコメのリンクも偶然見ました。中立的で良いコメントだったので、悲しんだ人の目に触れる機会が奪われたことにやるせない気持ちになる。誰かの心が救われたかもしれないし、それはスターをつけたひとりひとりの意思によるものでもあったのに
ユーザーでテストすんなよ本当に昔からさあ…誰かに届けようとした生きている言葉なんだよ…
初期は 50 字未満だと外されてたけど、アップデートでボーダーが 33 文字未満になったってコメントを見たよ。1/2 から 1/3 にしたってことかね
えっまじで
深層学習のモデルにそんな手の入れ方はできないので、ヤフー株式会社の AI とは別に、はてなが文字数の足切り処理を入れているのだろうか
だとしたら風評被害に遭わせているよなあ。これが入らないのはおかしいって指摘は主に文字数に関係するものだから、完全に濡れ衣じゃん
短文コメントを歓迎しない姿勢の表明ということか、食わせるデータとして短いと困るとかか
いっそ項目ごと消してくれてもいいのに
ツイッターは「今現在どういう趣味クラスタに属しているのか」程度しか分からず、遡る性能が乏しい上、遡ってどういう発言をしてきたかが完全にトレーサブルであったとしても、それがどういう現実にぶち当たってきたかを示すことにはならない。なぜならtwitterは発信することを自分の意思で選べるからだ。我々が必要とするのは、相手が何を見聞きしてどのように育ってきたかを瞬時に理解できるように提示するものであり、強いて既存のものから近い概念のものを挙げるなら、信用スコアサービスに近い。これは経済的信用度を示すだけだが、これを学術知識やスキル等、多角的スコアリングを可能にしたものが登場することにより、匿名であろうと実質プライバシーを失う代わりに建設的な議論が可能になるかもしれない。例えば自分のブログのbioに長々と読んできた漫画を書き綴らなくとも、ひと目で「ああこの人はこういう漫画を読んできたからこのへんのジャンルを前提としてこの発言が出てきたんだな」と分かるようになるのが理想だ。
夫として妻を助けるにはどうしたら良いかな、アドバイス、書籍、そう言ったものないかなと思ってGoogle検索する。
そうすると、どうすれば母親が少ないストレスで育児ができて最後に「たまには旦那さんに甘えちゃいましょう!」みたいなサイトばかりヒットする。
「父親の育児における役割」と言う言葉、おそらくあちらのAIでは
くらいにスコアリングされてるんだろうな。
ここから予想されるのが、育児とかの検索をしてるのは母親が圧倒的に多いって事だ。
だけどだからって父親という単語を無視してるようにしか見えない挙動ってどうなんだよ。
例えば男性が本屋さんで店員に「すいません、父親にオススメな育児の本ありますか?」って聞いて、「新人ママの子育てレッスン」とかそんな本を勧める店員いないだろ。
ここまでならAIのシンギュラリティとか当面無理だろ、と言うくらいで済むんだが、問題はGoogleがお勧めするサイトはどこも「お母さんが頑張る育児、父親は使えないし手伝わない、どうやればコントロールできるか、お母さんには子供にだけでなく夫にも寛容でなくてはならない、ところであなたのキャリア大丈夫?」とかそんなんばかりになってしまう。
つまりAIによって女性は「将来が不安、子育てが不安、旦那が信用できない」と洗脳されていき、そこにふわっとフェミニズムが入り込むと言う図式になってないか。