博弈論

博弈論（英語：Game Theory），又譯為對策論或賽局理論，是經濟學的一個分支，1944年馮·諾伊曼與奧斯卡·摩根斯特恩合著《博弈論與經濟行為》，標誌着現代系統博弈理論的初步形成，因此他們被稱為「博弈論之父」。博弈論被認為是20世紀經濟學最偉大的成果之一。目前可以應用在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略，研究遊戲或者博弈內的相互作用，是研究具有鬥爭或敵對性質現象的數學理論和方法。也是運籌學的一個重要學科。現代的博弈論的源頭是約翰·馮·諾伊曼對於雙人零和博弈的混合策略均衡點的發想和證明。

概述

博弈論考慮遊戲中的個體的預測行為和實際行為，並研究它們的最佳化策略。表面上不同的相互作用可能表現出相似的激勵結構（incentive structure），所以它們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境。

具有競爭或對抗性質的行為稱為博弈行為。在這類行為中，參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益，各方必須考慮對手的各種可能的行動方案，並力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋，打牌等。博弈論就是研究博弈行為中鬥爭各方是否存在着最合理的行為方案，以及如何找到這個合理的行為方案的數學理論和方法。

生物學家使用博弈理論來理解和預測進化（論）的某些結果。例如，John Maynard Smith和George R. Price在1973年發表於《自然》雜誌上的論文中提出的「進化穩定對策」的這個概念就是使用了博弈理論。還可以參見進化博弈理論和行為生態學（behavioral ecology）。

博弈論也應用於數學的其他分支，如概率、統計和線性規劃等。

數學定義

對於「博弈」有不少可以互換的定義。這裏給出簡短的介紹和相互關係的說明。

範式博弈

範式博弈又被譯為正則形式的博弈、策略型博弈或標準型博弈。

設定 $\mathrm {N}$ 是一個「參與者」（players）的集合。對於每一個「參與者」 $i\in \mathrm {N}$ 都有一個給定的「策略」集合 $\Sigma \ ^{i}$ 博弈（遊戲）是一個函數，定義為：

\pi \ :\prod _{i\in \mathrm {N} }\Sigma \ ^{i}\to \mathbb {R} ^{\mathrm {N} }

也就是說，如果我們知道了參與者的策略集合是什麼，那麼就可以有一個實數值與之對應。我們可以把上面的方程拆成兩個方程來進一步把它一般化。一個方程是正則形式（Normal form game）的參與者方程，描述策略規定結果的方式。另外一個方程描寫參與者對於結果（outcome）集合的偏好（preference）。也就是：

\pi \ :\prod _{i\in \mathrm {N} }\Sigma \ ^{i}\to \Gamma \

這裏 $\Gamma \$ 是遊戲（博弈）的結果集合（outcome set）。對於每一個參與者 $i\in \mathrm {N}$ 都有一個偏好函數（preference function）

\nu \ ^{i}:\Gamma \ \to \mathbb {R}

。

展開形式的博弈

展開形式的博弈又可譯為擴展形式的博弈、擴展式博弈或擴展型博弈。

正則形式的定義為數學家們提供了「均衡」（equilibria）問題的研究一個容易使用的表達式。因為它避免了怎麼計算「策略」的問題，也就是說遊戲是怎麼進行的問題。

若要考慮遊戲是如何進行的，展開形式的博弈是一個比較方便的表達式。這個形式與組合博弈論關係密切。這個定義通過一個樹的形式給定。在樹的每一個節點（vertex），不同的參與者選擇一個邊（edge）。

博弈論簡史

對於博弈論的研究開始於恩斯特·策梅洛（1913）、埃米爾·博雷爾（1921）及馮·諾伊曼（1928），後來由馮·諾伊曼和奧斯卡·摩根斯坦（1944，1947）首次將其系統化和形式化（參照Myerson, 1991）。隨後約翰·福布斯·納殊（1950，1951）利用不動點定理證明了均衡點的存在，為博弈論的一般化奠定了堅實的基礎。

約翰·福布斯·納殊、約翰·海薩尼及萊因哈德·澤爾騰因為他們對博弈論的突出貢獻而獲得1994年的瑞典銀行經濟學獎。羅伯特·約翰·奧曼、肯·賓摩爾、戴維·克瑞普斯（英語：David M. Kreps）及阿里爾·魯賓斯坦對於博弈論也做出重大貢獻。

博弈分類

博弈的分類根據不同的基準也有不同的分類。一般認為，博弈主要可以分為合作博弈和非合作博弈。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議，如果有，就是合作博弈，如果沒有，就是非合作博弈。

從行為的時間序列性，博弈論進一步分為兩類：靜態博弈是指在博弈中，參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動；動態博弈是指在博弈中，參與人的行動有先後順序，且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解：「囚徒困境」就是同時決策的，屬於靜態博弈；而棋牌類遊戲等決策或行動有先後次序的，屬於動態博弈。

按照參與人對其他參與人的了解程度分為完全訊息博弈和不完全訊息博弈。完全博弈是指在博弈過程中，每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的資訊。如果參與人對其他參與人的特徵、策略空間及收益函數資訊了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的資訊，在這種情況下進行的博弈就是不完全訊息博弈。

目前經濟學家們現在所談的博弈論一般是指非合作博弈，由於合作博弈論比非合作博弈論複雜，在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為：完全訊息靜態博弈，完全訊息動態博弈，不完全訊息靜態博弈，不完全訊息動態博弈。與上述四種博弈相對應的均衡概念為：納殊均衡、子博弈精煉納殊均衡（英語：subgame perfect Nash equilibrium）、貝葉斯納殊均衡、精煉貝葉斯納殊均衡（perfect Bayesian Nash equilibrium）。

博弈論還有很多分類，比如：以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈；以表現形式也可以分為一般型（戰略型）或者展開型，等等。

博弈論相關概念

參考書目

Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0-691-01193-1
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
Osborne, M. and A. Rubinstein，1994，A Course in Game Theory, Cambridge and London: The MIT Press.
岡田章,1996,『ゲーム理論』東京：有斐閣 ISBN 4-641-06794-5
金子守『ゲーム理論と蒟蒻問答』日本評論社、2003年4月。 ISBN 4-535-55288-6
川西諭『ゲーム理論の思考法』中経出版、2009年9月。 ISBN 978-4-8061-3470-1
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0-465-02121-2
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0-691-01567-8
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0-393-97421-9
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3-492-02151-4
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0-415-25095-1
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0-521-81462-6
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3-528-03214-6

外部連結

聯盟博弈論在通信系統中的應用（頁面存檔備份，存於互聯網檔案館）（英文）- Tutorial written by Prof. Debbah, head of the Alcatel-Lucent Chair on flexible radio
Economics and Language （頁面存檔備份，存於互聯網檔案館）, by Ariel Rubinstein（頁面存檔備份，存於互聯網檔案館）
Bargaining and Markets, by Osborne, M. （頁面存檔備份，存於互聯網檔案館） and A. Rubinstein（頁面存檔備份，存於互聯網檔案館）

閱論編主要的數學領域
歷史綱要（英語：Outline of mathematics）列表（英語：Lists of mathematics topics）符號表
數學基礎	範疇論集合論數理邏輯數學哲學
代數	抽象交換群論初等代數線性代數多重線性代數泛代數
數學分析	微積分實變函數複變函數微分方程泛函分析調和分析傅立葉分析幾何分析
離散數學	組合數學圖論序理論博弈論
幾何學	代數幾何解析幾何微分幾何離散幾何學歐幾里得幾何非歐幾里得幾何有限幾何學
數論	算術代數數論解析數論幾何數論算術幾何丟番圖幾何
拓撲學	點集拓撲代數拓撲微分拓撲幾何拓撲
統計學	測度與概率數理統計學數據科學統計推論迴歸分析統計學習理論機器學習人工智能數據結構與算法
計算數學	計算機科學計算理論數值分析最佳化計算機代數
應用數學	控制論資訊論計算化學數理生物學數理經濟學計量經濟學數理金融學數學心理學數學物理學生物統計學
其它	娛樂數學數學與藝術（英語：Mathematics and art）數學教育
註釋	數學的領域也可根據「MSC分類標準」或「中國學科分類國家標準」進行分類。
分類主題共享資源專題

閱論編博弈論專題
定義	正則形式的博弈 · 擴展形式的博弈 · 圖博弈論 · 合作博弈 · 資訊集合 · 偏好
均衡概念（英語：Solution concept）	納殊均衡 · 強納殊均衡（英語：Strong Nash equilibrium） · 子博弈均衡（英語：Subgame perfect equilibrium） · 貝葉斯-納殊均衡 · 貝葉斯完美均衡（英語：Perfect Bayesian equilibrium） · 顫抖手完美均衡 · 恰當均衡（英語：Proper equilibrium） · ε-均衡 · 相關均衡 · 序貫均衡 · 准完美均衡（英語：Quasi-perfect equilibrium） · 進化穩定策略（英語：Evolutionarily stable strategy） · 風險佔優（英語：Risk dominance） · 柏拉圖最適 · 自我應驗均衡（英語：Self-confirming equilibrium） · 馬可夫完美均衡（英語：Markov perfect equilibrium） · 默滕斯穩定均衡（英語：Mertens-stable equilibrium） · 核（英語：Core (game theory)） · 夏普利值（英語：Shapley value） · 吉布斯均衡（英語：Potentialg ame） · 量子響應均衡（英語：Quantal response equilibrium） · 謝林點
策略	優勢策略 · 純策略 · 混合策略 · 以牙還牙 · 冷酷觸發策略（英語：Grim trigger） · 策略複製論證（英語：Strategy-stealing argument） · 逆向歸納法（英語：Backward induction） · 前向歸納法（英語：Forward induction） · 馬可夫策略（英語：Markov strategy）
博弈類型	對稱博弈 · 完美資訊 · 序列博弈 · 重複博弈 · 信號博弈 · 廉價磋商（英語：Cheap talk） · 零和博弈 · 機制設計 · 隨機博弈 · 非遞移博弈 · 全局博弈（英語：Global game） · 甄別博弈（英語：screening game） · 討價還價問題（英語：Bargaining problem） · 多人博弈（英語：n-player game） · 大型泊松博弈（英語：Large Poisson game） · 嚴格決定博弈 · 潛博弈（英語：Potential game） · 位勢博弈
博弈模型	圍棋 · 國際象棋 · 無限棋（英語：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可選擇的囚徒博弈（英語：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 協調博弈（英語：Coordination game） · 蜈蚣博弈 · 志願者困境 · 搭便車問題 · 拍賣美元 · 膽小鬼博弈 · 智豬博弈 · 性別戰 · 獵鹿博弈 · 賭便士（英語：Matching pennies） · 最後通牒博弈（海盜博弈） · 包、剪、揼 · 獨裁者博弈（信任遊戲） · 共用品博弈（英語：Public goods game） · 納殊討價還價問題（英語：Nash Bargaining Game） · 上校博弈 · 消耗戰 · 少數派博弈（El Farol酒吧問題） · 公平分配博弈（切蛋糕問題（英語：Fair cake-cutting）） · 古諾競爭 · 死結 · 庫恩撲克遊戲（英語：Kuhn poker） · 甄別博弈（英語：Screening Game） · 公主與怪獸遊戲（英語：Princess and monster game） · 約會問題（英語：Rendezvous problem） · 囚徒帽子謎題（英語：Prisoners and hats puzzle）
定理	極值定理 · 純化定理（英語：Purification theorem） · 無名氏定理 · 顯示定理（英語：Revelation principle） · 阿羅不可能定理 · 極小化極大算法 · 納殊均衡 · 策梅洛定理
關鍵人物（英語：List of game theorists）	阿爾伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·魯賓斯坦 · 克勞德·香農 · 丹尼爾·卡內曼 · 戴維·K·萊文（英語：David K. Levine） · 戴維·M·克雷普斯（英語：David M. Kreps） · 唐納德·B·吉利斯（英語：Donald B. Gillies） · 朱·弗登博格（英語：Drew Fudenberg） · 埃里克·馬斯金 · 哈羅德·W·庫恩（英語：Harold W. Kuhn） · 赫伯特·亞歷山大·西蒙（司馬賀） · 埃爾維·穆蘭（英語：Hervé Moulin） · 讓·梯若爾 · 讓-弗朗索瓦·默滕斯（英語：Jean-François Mertens） · 珍妮弗·圖爾·蔡司（英語：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 約翰·梅納德·史密斯 · 安托萬·奧古斯丁·庫爾諾 · 約翰·福布斯·納殊 · 約翰·馮·諾伊曼 · 肯尼斯·阿羅 · 肯尼思·賓默爾 · 里奧尼德·赫維克茲 · 勞埃德·沙普利 · 梅爾文·德雷希爾（英語：Melvin Dresher） · 梅里爾·M·弗勒德 · 奧嘉·邦達雷娃（英語：Olga Bondareva） · 奧斯卡·莫根施特恩（英語：Oskar Morgenstern） · 保羅·米爾格龍 · 佩頓·楊（英語：Peyton Young） · 賴因哈德·澤爾騰 · 羅伯特·阿克塞爾羅 · 羅伯特·約翰·奧曼 · 羅伯特·B·威爾遜 · 羅傑·梅爾森 · 塞繆爾·鮑爾斯（英語：Samuel Bowles (economist)） · 蘇珊娜·斯科奇姆 · 托馬斯·克羅姆比·謝林 · 威廉·維克里
參見	全支付拍賣 · Alpha-beta剪枝 · 柏氏悖論（英語：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 對抗分析（英語：Confrontation analysis） · 合作性競爭 · 棋局中的先手優勢（英語：First-move advantage in chess） · 博弈機制（英語：Game mechanics） · 博弈論詞彙表（英語：Glossary of game theory） · 博弈理論家列表（英語：List of game theorists） · 特殊博弈列表 · 雙輸 · 國際象棋的解局策略（英語：Solving chess） · 拓撲博弈（英語：Topological game） · 公地悲劇 · 小決定暴政

閱論編微觀經濟學
基本概念	稀缺性財貨經濟物品免費物品私用品共用品商品及服務（英語：Goods and services）商品服務約束最大化經濟成本（英語：Economic cost）平均成本（英語：Average cost）邊際成本機會成本社會成本沉沒成本交易成本利息跨期選擇需求與供應供應曲線需求曲線彈性經濟均衡一般均衡超額需求超額供應
消費者理論	偏好功用等優曲線預算線收入–消費曲線（英語：Income–consumption curve）不確定性風險厭惡損失規避功用預期功用假說邊際功用需求的價格彈性
企業理論	生產要素分工回報遞減生產成本固定成本變動成本利潤等成本曲線等產量曲線利潤最大化規模經濟與規模不經濟範圍經濟（英語：Economies of scope）集聚經濟
市場分析	市場市場形式市場競爭（英語：Competition (economics)）獨佔性競爭完全競爭雙佔獨佔雙邊寡佔獨買寡頭壟斷買方寡佔市場失靈價格經濟剩餘消費者剩餘生產者剩餘無謂損失外部性經濟效率經濟公平（英語：Equity (economics)）社會抉擇（英語：Social choice）
研究分支	行為經濟學商業經濟學計算經濟學決策論應用經濟學計量經濟學工程經濟土木工程經濟學（英語：Engineering economics (civil engineering)）進化經濟學實驗經濟學博弈論產業組織理論制度經濟學勞動經濟學法律經濟學管理經濟學數理經濟學宏觀經濟學的微觀基礎（英語：Microfoundations）運籌學最佳化福利經濟學
分類相關主題列表經濟學宏觀經濟學政治經濟學

權威控制資料庫
國際	FAST
各地	西班牙法國 BnF data 德國以色列美國日本捷克
其他	IdRef 2