はてなキーワード: ゲーム理論とは
1. 完備性: ∀x,y ∈ X, x ≿ y ∨ y ≿ x
2. 推移性: ∀x,y,z ∈ X, (x ≿ y ∧ y ≿ z) ⇒ x ≿ z
3. 連続性: ∀x ∈ X, {y ∈ X | y ≿ x} と {y ∈ X | x ≿ y} は閉集合
定理: 上記の公理を満たす選好関係 ≿ に対して、連続効用関数 u: X → ℝ が存在し、∀x,y ∈ X, x ≿ y ⇔ u(x) ≥ u(y)
ワルラス需要対応 x: ℝ_++^n × ℝ_+ ⇒ ℝ_+^n を以下で定義:
x(p,w) = {x ∈ X | p·x ≤ w ∧ ∀y ∈ X, p·y ≤ w ⇒ x ≿ y}
選好関係が連続かつ局所非飽和であれば、ワルラス需要対応は上半連続
1. 閉凸性: Y は閉凸集合
3. 非reversibility: Y ∩ (-Y) ⊆ {0} (無償の生産は不可能)
4. 無限の利潤機会の不在: Y ∩ ℝ_+^n = {0}
多重生産技術を表現する変換関数 T: ℝ_+^m × ℝ_+^n → ℝ を導入:
T(y,x) ≤ 0 ⇔ 投入 x で産出 y が技術的に可能
仮定:
証明の概略:
1. 超過需要関数 z: Δ → ℝ^n を定義 (Δは価格単体)
2. z の連続性を示す
3. Walras' law: p·z(p) = 0 を証明
4. Kakutani の不動点定理を適用: ∃p* ∈ Δ s.t. z(p*) ≤ 0
von Neumann-Morgenstern 効用関数の公理:
1. 完備性
2. 推移性
3. 連続性
4. 独立性: ∀L,M,N ∈ L, ∀α ∈ (0,1], L ≿ M ⇔ αL + (1-α)N ≿ αM + (1-α)N
定理: 上記の公理を満たす選好関係に対して、期待効用表現 V(L) = ∑_s π_s u(x_s) が存在
Choquet 期待効用:
V(f) = ∫ u(f(s)) dν(s)
定義 (相関均衡):
確率分布 μ ∈ Δ(A) が相関均衡であるとは、∀i, ∀a_i, a'_i ∈ A_i,
∑_{a_{-i}} μ(a_i, a_{-i})[u_i(a_i, a_{-i}) - u_i(a'_i, a_{-i})] ≥ 0
という交換レートだとしてみる。
すると①と②と③からA1個→B2個→C4個→A1個とC1個という交換が成立してしまう。
更にこの交換を回すことで無限に増やしていくことができる。
3商品間で交換レートにこのような歪みがある全ての場合において、この無限ループによる無限増殖は可能になる。
ここから交換レートの変動を考える。
それぞれが交換レートを変えることでそれ以上得をすることがない状態で均衡するというゲーム理論的な仮定をすると、
①はA2個 = C6個 = B3個(元々はA2個 = B4個)
②はB2個 = A1個 = C3個(元々はB2個 = C4個)
③はC4個 = B2個 = A1個(元々はC3個 = A1個)
という風にそれぞれが修正され得る。右方向に交換していて有利だったのがそれぞれ修正されている。
どの修正をされても良いという意味で、AとBとCの価値はそれぞれ絶対的ではない。しかしにも関わらずどの修正でも相場が発生している。
4商品目を加える場合も、例えば③を採用した場合A1個 = B2個 = C4個 = Dx個と交換レートを定めるのが所謂ナッシュ均衡となる。
一方にA1個 = B2個 = C4個がある状態で、A2個 = Dx個、Dx個 = B2個と定めてしまうと、A1個→B2個→Dx個→A2個という風になり、無限に損をしたり得をしたりして合意に至らない。
もうすでに同じ考えがあったりするんだろうか。
ChatGPTに聞いてみた。
https://www.jstage.jst.go.jp/article/ojjams/10/2/10_147/_article/-char/ja/
投票者の影響力を評価するための方法として、ゲーム理論が有用であることが示されています。特に、「シャープレイ・シュービック指数(SS指数)」や「バンザフ指数」といった数学的手法を用いて、一人の票が最終的な政治的意思決定にどの程度影響するかを分析することが可能です。
シャープレイ・シュービック指数は、特定の投票者が「ピボット(鍵となる一票)」になりうる確率を計算し、その期待値として影響力を評価します。これは、投票の順番が変わったとき、それぞれの投票者が決定的な役割を果たす頻度を測る方法です【5】【6】。
また、代議員制の選挙においては、選挙区ごとの代議員数や投票者数が、各投票者の影響力に大きく関わります。例えば、選挙区ごとに投票者の影響力を考慮する場合、「投票者の影響力はその選挙区の議席数と投票者数の比率に依存する」という分析もあります。
こうした分析により、単純な「一票の格差」だけでなく、投票結果に対する一票の実質的な影響力を捉えることができます。これにより、どの程度一人の投票が選挙結果や政策に寄与しうるかを精密に理解することが可能になります。
テキサスホールデムは最初に確率の勉強をして(オッズの概念とかアウツの枚数とか4倍・2倍の法則とか)、
次にハンドレンジの概念を覚えて(相手がどのくらいの頻度でゲームに参加しているか、その頻度に含まれるカードの組み合わせはどれだけあるか、自分のハンドはそれらの組み合わせに対して有利か)、
さらに強くなりたければゲーム理論にまで手を出して(GTOとかエクスプロイトとか)、それでも最後は運なので勝てるかどうかわからない恐ろしいゲームなのです。
自分が参加してない間暇だ……というなら対戦相手の情報を逐一チェックすべし。
『ポーカーチェイス』でも『エムホールデム』でも各プレイヤーのVPIP(プリフロップ時点でチップを払ってゲームに参加した率)は公開情報としてプレイヤーをタッチすると見られるし、どのくらいの頻度でゲームに参加しているか、そして自分がどのくらいの頻度でゲームに参加する"と思われている"かはテキサスホールデムで戦う上で非常に重要な情報なんよ。
法経済学が専門で、ゲーム理論使って「慰安婦は性奴隷ではなく契約書に基づく契約労働者だった」って論文書いて、日本の保守界隈からはチヤホヤされ、日米のリベラル寄り研究者(経済学者・ゲーム理論研究者含む)からは猛批判されてた人。
主張の核となる募集契約書や労働契約書を示せなかったこともあり、掲載誌では「内容・結論に誤りがある可能性あり」とのタグが付けられ、その後に被差別部落や関東大震災の朝鮮人虐殺関連の論文でも強火の政治的主張をやったり、アカデミアでは少々居心地悪そうな立場になってしまったのだけど、そのまま存在を忘れてしまっていた。
きょう自分がフォローしてる研究者に論争吹っかけてるのがxで観察されたので「お懐かしや」と思ってアカウントを見に行ったら、戦闘的ツイッタラーとしてだいぶ仕上がってた。
もともと高校生まで宮崎県育ちで日本語も堪能なので、xでの罵倒も流暢だなあと感心した。なお御年60歳(見た目よりお若い)。
import numpy as np import matplotlib.pyplot as plt # パラメータ設定 num_agents = 100 # エージェント数 time_steps = 100 # シミュレーションの時間ステップ alpha = 0.1 # 情報共有の効果 beta = 0.05 # 情報拡散の効果 # エージェントの初期状態をランダムに設定 states = np.random.rand(num_agents) # 平均場の初期化 mean_field = np.mean(states) # 状態の履歴を保存 state_history = np.zeros((time_steps, num_agents)) mean_field_history = np.zeros(time_steps) # シミュレーション開始 for t in range(time_steps): # 各エージェントの行動を決定(情報を共有するかどうか) actions = np.random.rand(num_agents) < alpha # 状態の更新 states += beta * (mean_field - states) * actions # 平均場の更新 mean_field = np.mean(states) # 履歴の保存 state_history[t] = states mean_field_history[t] = mean_field # 結果のプロット plt.figure(figsize=(12, 6)) plt.plot(mean_field_history, label='Mean Field') plt.xlabel('Time Step') plt.ylabel('Mean Field Value') plt.title('Mean Field Dynamics in Social Media Model') plt.legend() plt.show()
効用関数 U: X → ℝ が消費者の選好を定義し、効用空間 X 上のレベルセットが無差別曲線を形成する。無差別曲線 U⁻¹(c) は効用関数 U のレベルセットとして定義される。
無差別曲線は効用空間内でのプレーンに対応し、その勾配 ∇U は無差別曲線に直交する。
ゲーム理論では、プレイヤー i の戦略空間を多様体 S_i とし、全プレイヤーの戦略空間を S = ∏_i S_i とする。プレイヤーの利得関数 π_i: S → ℝ はゲームの結果として得られる。
プレイヤーの戦略の選択は戦略空間 S 上の点で表現され、ゲームの均衡は戦略空間上での最大化問題としてモデル化される。
完全ベイズ均衡では、情報の不完全性を考慮し、プレイヤーの信念と戦略を統合する。プレイヤー i のタイプ空間を Θ_i とし、信念空間を Δ(Θ_i) とする。信念 μ_i はプレイヤー i のタイプ θ_i に対する確率分布を示す。
情報理論の要素をゲーム理論に統合するために、以下のように対応させる:
1. エントロピーと不確実性:
ゲーム理論と情報理論を統合するために、以下の枠組みを考える:
1. 共通の多様体: 効用空間 X、戦略空間 S、信念空間 Δ(Θ)、情報空間 ℙ を統一的な多様体としてモデル化する。
2. ファイバーバンドル: 各理論の構造をファイバーバンドルとして表現し、効用、戦略、信念、情報を抽象的に結びつける。
3. リーマン計量: 各多様体上のリーマン計量を用いて、効用、戦略、信念、情報の変化を統一的に扱う。
digraph G { // グラフの設定 rankdir=LR; node [shape=box, color=lightgrey]; // ノードの定義 UtilitySpace [label="効用空間\n(X, U)", shape=ellipse]; StrategySpace [label="戦略空間\n(S, π)", shape=ellipse]; BeliefSpace [label="信念空間\n(Δ(Θ), μ)", shape=ellipsel]; InformationSpace [label="情報空間\n(ℙ, H)", shape=ellipse]; // ノード間の関係 UtilitySpace -> StrategySpace [label="効用関数\nU(x)"]; StrategySpace -> BeliefSpace [label="戦略の期待値\nE[π_i | θ_i]"]; BeliefSpace -> InformationSpace [label="エントロピー\nH(μ)"]; InformationSpace -> UtilitySpace [label="情報の多様体\nℙ"]; // フォーマット設定 edge [color=black, arrowhead=normal]; }
digraph G { rankdir=LR; node [shape=ellipse, style=filled, color=white, fontcolor=black, penwidth=2, fillcolor=white, color=black]; // Nodes UtilitySpace [label="Utility Space (X)"]; StrategySpace [label="Strategy Space (S)"]; BeliefSpace [label="Belief Space (Δ(Θ))"]; InformationSpace [label="Information Space (ℙ)"]; FiberBundle [label="Fiber Bundle"]; RiemannMetric [label="Riemannian Metric"]; KL_Divergence [label="Minimize D_{KL}(μ_i || ν_i)"]; ParetoOptimality [label="Pareto Optimality"]; Constraints [label="Constraints"]; Optimization [label="Optimization"]; // Edges UtilitySpace -> FiberBundle; StrategySpace -> FiberBundle; BeliefSpace -> FiberBundle; InformationSpace -> FiberBundle; FiberBundle -> RiemannMetric; RiemannMetric -> KL_Divergence [label="Measure Change"]; KL_Divergence -> Optimization; Constraints -> Optimization; Optimization -> ParetoOptimality [label="Achieve"]; // Subgraph for constraints subgraph cluster_constraints { label="Constraints"; node [style=filled, color=white, fontcolor=black, penwidth=2]; StrategyChoice [label="Strategy Choice"]; BeliefUpdate [label="Belief Update"]; StrategyChoice -> BeliefUpdate; BeliefUpdate -> Constraints; } }
1. プレイヤー集合: N = {P₁, P₂, ..., Pₙ}
2. 行動集合: 各プレイヤー Pᵢ の行動の集合を Aᵢ とする
3. 情報集合: 各プレイヤー Pᵢ の情報集合を Hᵢ とする
4. 選好関係: 各プレイヤー Pᵢ の選好関係を ≽ᵢ とする
1. 履歴: H = ∪ Hᵢ
各プレイヤー Pᵢ に対して、効用関数 uᵢ: Z → ℝ を定義する
1. 完備性と推移性:
2. 期待効用仮説:
p ≽ᵢ q ⇔ 𝔼ₚ[uᵢ] ≥ 𝔼ᵩ[uᵢ]
σᵢ: Hᵢ → Δ(Aᵢ), ここで Δ(Aᵢ) は Aᵢ 上の確率分布の集合
μ を各情報集合 h ∈ H に対する確率測度 μₕ ∈ Δ(h) の集合と定義
(σ*, μ*) が完全ベイズ均衡であるとは、以下を満たすとき:
それだとゲーム理論を受け入れられないじゃん、やべえ
関係あるだろう。
相互確証破壊のゲーム理論について理解していたら、すぐに「核を持っていることにより、一方の攻撃が双方の壊滅につながる、とコミットメントできる」ということがわかるだろう。
君は低能だね。
核の相互確証破壊は2つの超大国が互いに十分な核兵器を保有している状況を指す。
互いに攻撃を開始すれば、双方が壊滅的な被害を受けることが確定するため、結果的に平和が維持される。
これはゲーム理論の一部であり、ナッシュ均衡の概念を用いて数学的に表現することができる。
それぞれのプレイヤーは攻撃するかしないかの2つの選択肢がある。
攻撃しない | 攻撃する | |
攻撃しない | (0, 0) | (-1, 1) |
攻撃する | (1, -1) | (-1, -1) |
この場合、-1は核戦争による壊滅的な損失を、0は平和(つまり損失も利益もない状態)を、1は一方的な勝利(他国を攻撃して自国が被害を受けない状態)を表している。
ナッシュ均衡とは、どちらのプレイヤーも他方が自分の戦略を変えない限り、自分の戦略を変える動機がない状態を指す。
このゲームでは、どちらのプレイヤーも「攻撃しない」を選ぶとき、つまり(0, 0)のときにナッシュ均衡が達成される。
経済とは、オペレーションズ・リサーチの手法で分析されることが多い。
つまり消費者は効用最大化、企業は利潤最大化に基づいて行動する。
均衡分析では、財i=1,...,kが存在するもとでD_i(p) = S_i(p)を考える。
このとき、消費者や企業が何を最適化しようとしているのかがわかるだろう。
つまり企業の視点から見れば、どの財をどういう価格でどのくらい売ろうとしているのかによって。
消費者の視点から見れば、どの財をどの価格でどのぐらい買おうとしているのかによって分析できる。
ここで「均衡」とは何かということについて、厚生経済学の基本定理では「パレート効率性」が焦点になる。
なぜこれが「厚生」なのかというと、国民全体の幸福を考える上では「犠牲の元での効率性向上」では困るからである。
誰かが損をした場合、厚生を考える上で補償原理の話に自然に向かうことになるだろう。
ここで経済学では「事実」と「価値」の判断を区別するということが行われてきた。
パレート効率性は「価値」の話であり、均衡分析は「事実」の話である。
価値とは、この場合「なにをすべきか」という論理のことを意味し、事実とは「なんであるか」という論理を意味する。
もし功利主義者が現れれば、パレート効率性とは別の「効率性」を持ち出してくるだろう。
典型的には「ハンコ業界を滅ぼして、電子化を進めよう」といった論調がそれに属する。
経済において、特定の集団が損を被る場合はまず「パレート効率性」について考えなければならないだろう。
「障害者に障害年金を配るのは非効率だ!」と功利主義者が言い始めた場合、厚生経済学者は「障害者の年金を無に帰すことはパレート改善ではない」と言うだろう。
このようにして、「べき論」にも根拠が必要であることがわかる。
一般市民がべき論を語り始めると、それは「自分の利益になるかどうか」という視点になりやすい。
しかし経済は特定の誰かの利になるよう調整されるものではなく、国民全体にとって調整されなければならないだろう。
解像度が低いねぇ君は。わかるかわからないかの1bitでしょ、君の脳みそは。
経済といっても、さまざまな分野があって、効用、無差別曲線、ゲーム理論の話をするのはミクロ経済学。これはもう数学的には厳密なので100年後も教科書の内容に間違いはないだろう。
マクロ経済学はメトリクスを基準とした統計で国家経済を扱う。GDPはその例だが、「労働時間あたりのGDP」といった指標が国家の労働生産性を測る一つの方法となることはよく知られる。因果推論を行うのも基本的には統計の話なのでマクロ経済学の範疇になる。
これらの経済学は、現象を部分的に見てみれば推測の能力は高く、正しく理解していれば経済現象を説明できる。
ではなぜ「経済」の話をすると、経済危機とかが生まれるかというと、外部性などがあるから。
サブプライムローンの破綻は基本的に「債務能力を超える貸付」を行なうことが可能であるという負の外部性によって説明できる。
経済学は「説明」をすることはできるが、「コントロール」をするのは政治の話で、政治家や官僚が教科書レベルのことを理解していないこともあり得る。あるいは「マルクス」などを信奉しているどうしようもないのもいるだろう。
政治家や官僚が対処しなければ負の外部性による市場の失敗を規制することができない。
結果的に経済を「コントロール」できないのは、経済の中に潜む負の外部性をすべて扱う方法がまだ判明していないからであり、予測や説明が可能なレベルにある事象は多い。
Youtubeで外国人が「日本で財布を落としたらどうなるか」を検証していた。
想像通り、検証対象となった市民50人全員が落とし主の外国人に財布を返したのである。
これを見て「日本人は素晴らしいなぁ」と思ったわけだが、少し気になることがあった。
例えば「単に賃上げするだけでは名目値しか上がらず、実質賃金はむしろ低下するかもしれない」といった問題に対し「物価に追いつく賃上げを」などと無意味なことをやっているのは、「労働者に高い賃金を払うのが善だ」という単純な発想に基づいているからでは?
あるいはウクライナロシア問題で、「ウクライナに武器を供与して反転攻勢を!」などと言うのは、ロシアが悪でウクライナが善だから、善に勝って欲しいという単純な発想に基づいているからでは?
経済や政治、法律の問題は、残念ながら「共感」に基づくほど間違った判断を下しやすいと言われることがある。
誰かが殺人犯と言われた時、論理的に証拠を提出するべき時に「私は家族が殺されたのが憎い!だから被疑者は死ぬべきだ!」と言って、被疑者の冤罪の可能性を考慮に入れずに報道され、その結果、報道への共感によって取り返しのつかない冤罪に容易に繋がったとしたら?袴田事件だってそうだろう。
経済はもっと複雑だ。経済には事実判断と価値判断の区別が必要だが、ミクロ経済学が取り扱っているのは概ね事実判断と言われる。無差別曲線やゲーム理論は事実判断である。
それに対し価値判断とは「なにをすべきであるか」という問題のことだ。日本が国として何をすべきか、という話をしているときに、特定の集団だけを贔屓にするわけにはいかない。
例えばパレート最適性について考慮し、誰かが損をする場合は補償を与える方法を考えなければならない。
それを「私たちの税金を一体何に使っているんだ!」という感情論で補償原理を無に帰することは、典型的日本人がまさに陥りがちなことだろう。
補償は税金の正しい使い方であるから、自分の利益にならないという理由だけでは正しいことは言えない。
ひろゆき氏が「政治家にはサイコパスが必要なんですよ」と言っていたが、それは「共感能力ではなく、論理によって判断することのできる人間が必要である」という意味だと私は思う。
まあ、こいつもこいつで、補償のことを話さずに「ハンコ業界を滅ぼして効率化を!」などと言いそうな雰囲気だから感情論であることに違いはないが、論理には前提知識がある程度必要であるということでもある。
基礎知識のある人であれば、貨幣供給量が増えれば貨幣価値が低下すると考えるだろう。しかし知識のない感情派は、「お金が多いほどいい」「通貨発行権を駆使すればいい」と言い始め、貨幣価値が低下しないという前提のもとで国家経済を悪化させようとする。
経済の名目値ではなく、実質値を向上させるにはどうするか。その議論のためには確かな情報や知識が必要であるはずだが、短絡的な善悪を持ち出すことによって「物価高に追いつく賃上げを」などと、スタグフレーションがなんであるかも知らずに言い始めるわけである。
確かに、小学生でもわかるような善悪の問題において正しい行動をするのは日本人の良い点だと言える。外国では「見られていなければ悪事を行ってもいい」と言わんばかりの連中が巣食っているからだ。
しかし経済、政治、法律。そういった「高度な知識を伴わなければ善悪の判断を間違えるだろう」というシナリオで、日本人は落第点を取る可能性が高い。
経済であればミクロ経済学やマクロ経済学の教科書知識ぐらいは必要であるが、日本人は哲学にも疎く、相対主義が蔓延るので、「経済論はたくさんあるし、どれもが正しいことを言っているに違いない」と言う相対主義的な認識を持っている可能性が高い。
結局、短絡的な善悪観でミツバチの巣をつついたような行動しかしないのが、他の国の人にもバレているだろう。
たしかにそれはそれで社会秩序の維持にはなっているから、良いことかもしれない。
しかし経済や政治などにおいては別だ。正しい知識に基づいた善というのは、正しい内容を選んで勉強をする努力が必要なのである。どの論も平等だと相対主義的に考えている連中が、パヨク理論に陶酔し、発狂しているのを見たか。
ジョン・フォン・ノイマンのミニマックス定理は、ゲーム理論の数学的な領域で、最大-最小不等式が等式でもあることを保証する条件を提供する定理。
この定理は、1928年に発表されたゼロサムゲームに関するフォン・ノイマンのミニマックス定理が最初であり、ゲーム理論の出発点と考えられている。
具体的には、フォン・ノイマンのミニマックス定理は次のように述べられる:
$$
\text{Let } X \text{ and } Y \text{ be compact convex sets. If } f \text{ is a continuous function that is concave-convex, i.e. } f \text{ is concave for fixed } y, \text{ and } f \text{ is convex for fixed } x. \text{ Then we have that }
$$
$$
\sup_{y \in Y} \inf_{x \in X} f(x, y) = \inf_{x \in X} \sup_{y \in Y} f(x, y)
$$
特に、fがその両方の引数に対して線形関数(したがって双曲線)である場合、定理は成り立つ。したがって、有限行列Aに対して、次のようになる:
$$
\sup_{y \in Y} \inf_{x \in X} x^T A y = \inf_{x \in X} \sup_{y \in Y} x^T A y
$$
上記の形式では、Aはペイオフ行列。この特殊なケースは、各プレイヤーの戦略セットが行動(混合戦略)のロッタリーであり、ペイオフが期待値によって誘導されるゼロサムゲームに特に重要。
SNSをやるのは寂しいからなんだけど、かといってやってみても反応も少ないし私に対して興味を持つ人っていないよなぁと言う感じ
ゲーム理論では「しっぺ返し戦略」といって、利益のために相手のやっていることを模倣するらしいのだけど、
SNSでも「フォローバック」とか「ふだんいいねしてくれる人にいいねを返す」とか言う形でしっぺ返しをしているっぽい
これがめんどくさいんだよね
見ず知らずのひとをなんでフォローバック狙いでフォローしに行くの?なんでつまらんポストに社交辞令でいいねするの?って感じ
このしっぺ返しについても、誰かが誰かに興味があってやっているわけではないと思う
コンテンツを増やせば増やすほど検索される可能性が高まるんだけど、「あ、またあの人だ」という認知が生まれると徐々に好感を持つようになる
これもまためんどくさい
Youtubeで毎日投稿して何年もそれを続けている人がいるけど、なぜそんなに忍耐力があるのかがわからない
根本的に言って、閲覧者の増加率はコンテンツの面白さによってある程度決まってくるから、私のようなつまらない人間なんて何年投稿しても知られることのない存在なんだよね
そうなるとSNSに求めるのは有名度とかじゃなく、知人との交流とかそっち方面になるけど、知人はSNSを積極的にやっていない
私は地方のとある場所にいるんだけど、その地域名でツイートを検索しても大したものが出てこない
つまり東京にいる一部のノイジーマイノリティが発狂しているのがSNSの正体
そんで、そういう人たちはADHD傾向を持ちがちだったりする
私も「インターネットで何か有意義なことはできないか」といって何年も徘徊しているから、もしかしたらノイジーマイノリティの側かもしれない