2010年03月09日

ナッシュ均衡


出典:フリー百科事典
ナッシュ均衡
ゲームの解概念の理論
関係
サブRationalizability、イプシロンの均衡、相関均衡
スーパー進化的に安定な戦略、部分ゲーム完全均衡、完全ベイジアン均衡、震える手完璧な均衡の
意義
ジョンフォーブスナッシュの候補
以外のすべてに使用される非協力ゲーム
たとえばじゃんけん
ゲーム理論では、ナッシュ均衡(ジョンフォーブスナッシュの後、誰が提案)は、ゲームの解概念は、それぞれのプレーヤーは、他のプレイヤーの均衡戦略を知っていると想定される2つ以上の選手は、との選手を含むているという何か一方のみを彼または彼女自身の戦略を変更することによって得るために。場合は、各選手の選手ながら、他の選手たち彼らの変更を維持し、戦略の選択肢とは、対応する利益供与の現在の設定、自分の戦略を変更することによって利益を得られる戦略を選択してナッシュ均衡を構成します。
場合、エイミー彼女ができる最善の意思決定が示されただけで、エイミーとビルナッシュ均衡では、アカウントにビルの決定をしている、ビル、アカウントにエイミーの決定を撮影彼のできる最善の意思決定されます。場合は、それぞれ1つの最高意思決定は、彼または彼女は、アカウントに他の人の決定を撮影することができますことは同様に、選手たちのグループがナッシュ均衡している。しかし、ナッシュ均衡が必ずしもすべての選手参加のための最高の累積的な報酬を意味しない場合は、何らかの戦略のナッシュ均衡とは異なる上(競合企業のカルテル例えば、同意することが多くのケースで、すべての選手たちの利益供与を向上させる可能性があります注文するには、 )を自分の利益を増やします。
目次[非表示]
1アプリケーション
2歴史
3定義
3.1非公式の定義
3.2形式的定義
4例
4.1調整ゲーム
4.2囚人のジレンマ
4.3ネットワークトラフィック
4.4コンテストゲーム
利得行列では4.5ナッシュ均衡
5安定性
6発生
6.1はどこに条件が満たされていない
6.2はどこに条件が満たされている
7 NEと非信頼性の脅威
存在の8プルーフ
8.1代替証明ブラウワーの不動点定理を使用して
9コンピューティングナッシュ均衡
9.1例
10も参照してください
11注意事項
12参考文献
12.1ゲーム理論の教科書
12.2オリジナルナッシュ論文
12.3その他の参考文献
13外部リンク
[編集]アプリケーション

ナッシュ均衡の概念、いくつかの意思決定者の戦略的な相互作用の結果を分析するために使用されます。言い換えれば、その場合は、いくつかの人々や、いくつかの機関が、同じ時間での決定を作っているか、そしてどうなるの場合、それぞれ1つの決定は、他の人の意思決定に依存し予測する方法です。単純な洞察ジョンナッシュの考えを基にすれば分離してそれらの決定を分析し、複数の意思決定者の選択の結果を予測することはできません。その代わりに、各プレイヤーはどうなるのか、アカウントに決定撮影依頼する必要があります他人のこと。
ナッシュ均衡は、戦争と軍拡競争のような敵対的な状況[1]を分析する()囚人のジレンマを見ると、使用されても、どのように競合を繰り返し相互作用によって緩和される可能性があります(パイズリ参照してくださいに買い言葉)。また、別の条件でどの程度の人々に協力できるかを検討するために使用されている()の戦いは、男女のを見ると、どうか協力結果を達成するためにリスクを取るだろう)(シカ狩りしてください。これは技術上の基準の採用を検討し、銀行を実行し、通貨危機も発生()コーディネーションゲームを参照してください使われています。他のアプリケーショントラフィックフローをinclude()、どのようにオークションを整理する()オークションの理論を見ると、ウォードロップの原理を参照してもペナルティサッカーのキック(ペニーマッチングを参照)[2]。
[編集]歴史

ナッシュ均衡の概念のバージョンを最初にアントワーヌオーギュスタンクールノーの寡占化(1838年の彼の理論的に)使用された。クールノーの理論では、企業が自社の利益を最大限に生成するにはどのくらいの出力を選択します。ただし、1つの会社のための最高の出力を他の人の出力に依存します。クールノー均衡するとき、各企業の出力は、純粋戦略ナッシュ均衡されている他の企業の出力を与え、その利益を最大化します。
近代的なゲームナッシュ均衡の理論的概念ではなく、プレイヤーが可能なアクション以上の確率分布を選択する混合戦略の面で定義されています。ナッシュ均衡ジョンフォンノイマンとオスカーモルゲンシュテルンによっては1944本の理論ゲームと経済行動で導入された混合戦略の概念。しかし、彼らの分析は、ゼロの特殊なケースサムゲームに限られていた。彼らは、混合戦略ナッシュ均衡はゼロサムゲームのためのアクションの有限集合に存在することを示した。彼の1951年の記事でジョンフォーブスナッシュの貢献を非協力ゲームの操作を有限集合と任意のゲームの混合戦略ナッシュ均衡を定義し、証明されたが少なくとも1つの)ナッシュ均衡が存在する必要があります(混合戦略。
ナッシュ均衡の概念の開発以来、ゲーム理論は、誤解を招く予測を発見した(または特定の状況で独自の予測)を作ることに失敗します。したがって、彼らは多くの関連ソリューションの概念を提案している(また、'改良'ナッシュ均衡)は、ナッシュの概念の欠陥を認識克服するために設計されたという。 1つは特に重要な問題は、いくつかのナッシュ均衡はない'ている脅威に基づいている可能性があります'信頼できる。したがって、1965年ラインハルトゼルテンは、非信頼性の脅威に依存して均衡を排除する洗練されたとしてサブゲーム完全均衡を提案した。ナッシュ均衡の概念の他の拡張機能の場合、ゲームが繰り返される場合、またはゲームの完璧な情報がない場合で演奏される何が起こるか何が起こるかに対処している。ただし、その後の改良とナッシュ均衡の概念を共有してメインの洞察力は、上の拡張ナッシュのコンセプトかかっ:すべての均衡の概念の選択肢何を行われるとき、各プレイヤーのアカウントに、意思決定などの制作時間を分析します。
[編集]定義

[編集]非公式の定義
非公式には、戦略の設定ナッシュ均衡がない場合はプレーヤーより一方的に彼または彼女の戦略を変更することによって行うことができます。この意味は、各プレイヤーは他の戦略と言われるものを想像してください。その仮定は、各プレイヤーは自分自身または自分自身を要求:"他のプレイヤーの戦略を知ることは、石で設定された他のプレイヤーの戦略の治療、私は戦略を変更することによってメリットがありますか"
いずれかの選手"はい"は、その戦略の設定と答えるでしょうナッシュ均衡ではありません。場合、全てのプレイヤーのスイッチをしないことを好むしかし、(もしくは、しないの切り替えの間)を戦略の設定無関心なナッシュ均衡である。したがって、ナッシュ均衡の各戦略は、平衡状態にある他のすべての戦略に最適な応答です。[3]
ナッシュ均衡も非表示される可能性があります三人称視点で、合理的。これは、ナッシュ均衡パレート最適化されていないが起こるかもしれないからです。
ナッシュ均衡にも非がある順次ゲームで、合理的な結果のための選手""それぞれの非合理的な動きで他を脅かす可能性があります。そのようなゲームの部分ゲーム完全ナッシュ均衡の分析ツールとしての意味があることがあります。
[編集]形式的定義
聞かせの(S、メス)ム選手との試合ではシリコンの戦略選手私は、業S = S1 XのS2の設定ですが... Xの種の戦略のプロファイルを設定するとf =(F1の(x)は、...は、fn(x)の)ペイオフ関数です。てみよう - 私は一選手を除いて、すべてのプレイヤーの戦略プロファイルxが、とき、各プレイヤーの(1、...、n)の戦略十戦略のプロファイルをX =(× 1、...、xNの)してプレーヤーで取得ペイオフFiの(x)の結果を選択します。は、ペイオフの戦略プロファイルを選択すると、戦略はプレイヤーiで同様の戦略を、他のプレイヤーによって選択された選択さすなわちに依存します。戦略Xを* S通常があれば1つのプレーヤーが戦略には一方的な偏差を、そのプレイヤーに利益をもたらすことがナッシュ均衡(ネブラスカ州)は、

ゲームのいずれかで、後者は、純粋な戦略(の確率的に固定周波数で選択されます)は、純粋な戦略や、混合ナッシュ均衡することができます。ナッシュを立証している場合は許可混合戦略は、内のすべてのプレーヤー有限多くの戦略から、少なくとも1つのナッシュ均衡を認めて選択することができますしてすべてのnプレイヤーゲーム。
ときに、上記の不均衡は、すべてのプレイヤーとすべての実行可能な代替戦略を厳密に(と"の代わりに)、その後の平衡の厳密なナッシュ均衡として分類されて保持します。集合Sで、いくつかの戦略の間の場合は、代わりにいくつかのプレーヤーのため、そこにある正確な平等、そして均衡が弱いナッシュ均衡として分類される。
[編集]例

[編集]コーディネーションゲーム
主な記事:コーディネーションゲーム
サンプルの調整試合player1の相対利得を示す/ player2、それぞれの組み合わせで
プレイヤー2の戦略プレーヤー2を採用してBの戦略を採用して
プレイヤー1の戦略4、4 1、3を採用
プレイヤー1の戦略Bの3、1 3、3を採用
協調ゲームです()例では利得行列を右に示すように2つのプレーヤー、2つの戦略ゲームは、対称クラシック。選手たちはそのため、両方の、最高の報酬、すなわち、4を受けるための戦略を採用する座標系があります。もし両方のプレイヤーも戦略のBを選んだが、まだナッシュ均衡である。ただし、各プレイヤーの最適な報酬未満授与され、どちらのプレーヤー)のインセンティブ3(から1までの戦略は、すぐに報酬の削減のために変更する必要があります。協調ゲームの例では、設定は、2つのテクノロジ互換性のある製品を持つ2つの企業にご利用いただけますが、彼らは、市場標準になるための戦略を選ぶ必要があります。両方の企業は、選択した技術に同意すると、高い販売の両方の企業に期待される。場合は、企業の標準的な技術で、いくつかの販売実績が一致しません。両方の戦略は、ゲームのナッシュ均衡されます。
道路で、運転のどちらかの左またはドライブへの道の右側にあるドライブを選択することも、協調ゲームです。たとえば、わいろ100のクラッシュを意味し、0にクラッシュするという意味で、調整のゲームは、次の利得行列を定義することができます:
ドライブゲーム
ドライブには、左のドライブ上の右上
ドライブには、左100、100 0、0に
ドライブの上で右0、0、100、100
この例では、2つの純粋戦略ナッシュ均衡、両方の左または右上のドライブのいずれかを選択されます。もし我々混合戦略を認める(ここでは、純粋な戦略をランダムにいくつかの固定確率件名)、そこと同じケースの3つのナッシュ均衡:が選択されます2つの我々は確率されている純粋な戦略の形(0から見ている%、プレイヤー1の100%)、(0%、プレイヤー2の100%)、および(100%で、選手の1人は0%)、(100%、プレイヤーは2人はそれぞれ0%)。私たちは、別の場所、各プレーヤーのための確率が追加(50%、50%)。
[編集]囚人のジレンマ
主な記事:囚人のジレンマ
ペイオフ行列の方向で(注差)
囚人のジレンマが、今はCの調整ゲームに示すように、同じ利得行列ている""開発"Bのこれは、C"とD"のB、各プレーヤーの戦略から#1に戦略#2を切り替えることは彼の現状が向上し、他のプレーヤーが決定に関係なく。囚人のジレンマため、単一のナッシュ均衡があります:両方のプレイヤーの戦略を選択する#2("裏切る")。どのような長期の研究は、この興味深いケースをしたという事実はD"(つまり、グローバル"の両方のまま忠実に劣る"の両方を裏切る"です")です。グローバルに最適な戦略が不安定であり、平衡状態ではありません。
[編集]ネットワークトラフィックは、
も参照してください:Braessのパラドックス

サンプルネットワークのグラフです。エッジの値が所要時間は、その端を'車'旅が経験されます。 Xの車がエッジを介して旅行者の数です。
ナッシュ均衡のアプリケーションは、ネットワークのトラフィックの予想の流れを決定している。右のグラフを考えます。もし我々がn個"車"AからDに旅行していると仮定、どのようなネットワークでのトラフィックの期待分布ですか?
このような状況ですべての旅行者の3戦略の選択肢が"ゲーム"として、それぞれの戦略をDからのルートはモデル化することができます(どちらかアブド、ABCDのか、またはACD)に。各戦略の"ペイオフ"の各ルートの所要時間はです。右、アブド経験を経由して車の走行上のグラフでは)(1 +のx / 100の時間旅行+ 2、ここでxは車端にアブ旅行の数です。したがって、任意の戦略は、他のプレイヤーの選択肢に依存するための利益供与は、通常どおりです。ただし、この場合には、目標は、旅行時間を最小限にして最大化されていません。平衡時に、すべてのパス上の時間はまったく同じですが発生します。ときは、以降だけ彼/彼女の旅行の時に追加できる単一のドライバは、任意のインセンティブのルートスイッチに発生する。右側の場合、例えば、100台AからDに旅行している上のグラフは、その均衡が発生するときにABCDの経由アブド、50を介して25のドライバ旅行、25 acdの経由で。すべてのドライバは、現在3.75の所要時間はしています。
通知は、このディストリビューションではありませんが、実際には、社会的に最適。場合は、100台は、acdのを介してアブドを介して50の旅行や、他の50、その後は3.75未満の場合は1台の車が、実際には3.5のための時間旅行に合意した。
[編集]コンテストゲーム
競争ゲーム
プレーヤー2 '1'プレイヤー2を選択'2'プレーヤー2を選択する選択'3''0'プレーヤー2を選択する
プレイヤー1の'0'0、0 2、-2 2 -2 2、-2選択
プレーヤー1 '1'-2、2 1、1 3、-1 3、-1を選択する
プレーヤー1 '2'-2、2 -1、3 2、2 4、0を選択する
プレーヤー1 '3'-2、2 -1、3 0、4 3、3を選択する
この2つは、両方のプレイヤーが同時に0から3までの整数を選択し、それらの両方の点で2つの数字の小さい方勝つプレイヤーゲームで示すことができます。加えて、もし1つのプレーヤーは、他の場合、彼/彼女は他に2つのポイントを提供するよりも大きい番号を選択します。このゲームは、一意の純粋戦略ナッシュ均衡があります:両方のプレイヤー(光赤で強調表示)0を選択します。戦略の任意の他の選択肢の1つが選手の改良することができます1、他のプレイヤーの数より少ない場合に彼の電話番号を下げます。左側にあるテーブルでは、例えば、ときにプレーヤーの一の関心は、紫色の広場には小さい数字を選択して移動されている緑の広場で出発し、そのプレイヤーに2の関心は、青い正方形を選択して移動することです小さい数です。場合は、ゲームのように2人の選手と、名前の量の場合は両方とも同じ番号を選択勝つ以外は何も勝ち、その後は4ナッシュ均衡(0,0 ... 1,1 ... 2,2が変更されます。 ..と3,3)。
[編集]ナッシュ均衡利得行列に
ようこそペイオフマトリクスにナッシュ平衡を識別するための簡単な数値計算の方法です。特に2つの場合に便利です人のゲームプレイヤーが2つの戦略以上にしている。この例では、フォーマル解析あまりにも長くなることがあります。このルールの場合にはwhere()戦略の確率的混合関心は適用されません。原則として次のようだ:もし、最初のペイオフ番号、セルの二連音符で、セルの列の最大値である場合、および2番目の数は、セルの行番号の最大値です - して、セルには、ナッシュ均衡を表して。
我々は3x3の行列には、このルールを適用することができます:
ペイオフマトリックス
オプションAオプションBオプションC
オプション0、0 25、40 5、10
オプションB 40、25 0、0、5、15
オプションC 10、5 15、5 10、10
ルールを使用して、我々ができる非常に迅速に(はるかに速く、フォーマル解析ではなく)には、ナッシュEqulibria細胞(のB、A)は、アール参照してください(、B)、および(CやC)。実際に、セルの(のB、A)の40は、最初のカラムの最大値と25は、2番目の行の最大値です。 (、B)は25日については、2番目のカラムの最大値と40されている最初の行の最大値です。セルに(CやC)と同じです。他の細胞については、いずれかまたは両方が二連音符のメンバーは、対応する行と列の最大値ではありません。
これは、平衡状態の細胞を見つけることの実際の仕組みを明らかにされている:場合は、ペアの2番目のメンバは、行の最大値である列のチェックの最大値を見つける。これらの条件が満たされているセルには、ナッシュ均衡を表します。すべての北東細胞を見つけるには、この方法は、すべての列を確認します。 NXNソフトウェア行列0 NXNソフトウェア純粋戦略ナッシュ均衡の間の可能性があります。



Posted by ざくろんぼ at 09:29│Comments(0)
上の画像に書かれている文字を入力して下さい
 
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。