投桃報李
Multi tool use
以牙還牙 (tit for tat)是一個用於博弈論的重複囚徒困境(reiterated prisoner's dilemma)非常有效的策略。這策略最先由数学家阿納托·拉普伯特(Anatol Rapoport)提出,並在密歇根大學社會學家羅伯特·阿克塞爾羅(Robert Axelrod)有關囚徒困境的研究中擊敗其他方法,脫穎而出,成為解決囚徒困境的最佳策略[1] 。
目录
1 概述
2 囚徒困境例子
3 問題
4 應用於真實世界
5 参见
6 參考文獻
概述
這一策略有兩個步驟:
第一個回合選擇合作
下一回合是否選合作要看上一回對方是否合作,若對方上一回背叛,此回合我亦背叛;若對方上一回合作,此回合繼續合作
「以牙還牙」策略有四個特點:
友善:「以牙還牙」者開始一定採取合作態度,不會背叛對方
報復性:遭到對方背叛,「以牙還牙」者一定會還擊報復
寬恕:當對方停止背叛,「以牙還牙」者會原諒對方,繼續合作
不羨慕對手:「以牙還牙」者個人永遠不會得到最大利益,整個策略以全體的最大利益為依歸
在眾多策略中,「以牙還牙」是最有效的,曾連續數年擊敗由計算機科學家,經濟學家和心理學家等團隊所提出的策略。博弈論者儘管沒有實質證據,但他們認為「以牙還牙」是最佳的策略。
囚徒困境例子
假設有四個參與者:兩個用「以牙還牙」的策略,另外兩個無論任何時候都會背叛其他人以讓自己得到最大的好處。假定每個參與者將要面對另外三個參與者進行六次對決。如果一名參與者背叛對方而對方不背叛,前者有5分,後者得0分;如果雙方不背叛對方,雙方各得3分;如果雙方同時背叛對方,雙方各得1分。
當「以牙還牙」者對背叛者,前者第一場比賽選擇不背叛,而後者正好相反,後者獲得5分。在餘下的5場比賽,兩位參與者背叛對方,每一場比賽各得1分。最後,背叛者得10分,「以牙還牙」者得5分。
當雙方均為「以牙還牙」者,在所有6場比賽中彼此均不會背叛對方。雙方每回合各得3分,最後每人各得18分。
當背叛者互相對賽,雙方每次都會背叛對方。雙方每回合各得1分,最後每人各得6分。
儘管「以牙還牙」者從來沒有贏得過一場比賽,而背叛者從未輸過一場比賽,考慮到雙方的最大共同利益,「以牙還牙」仍然是最好的策略。
問題
雖然阿克塞爾羅德證明了「以牙還牙」在某些情況下是最佳的策略,但兩名「以牙還牙」者有時候在博弈時仍會產生問題。假如其中一方錯誤理解形勢,就可能造成災難性結果。在「以牙還牙」的策略下,博弈者被迫懲罰之前背叛自己的對手(儘管他不是有意的),造成惡性循環。雙方都認為自己是無辜的,自己所作的只是為了自衛,並歸咎對手惡毒或是不跟自己合作。這種情況經常發生在現實世界的衝突,如學生間的打鬥和地區戰爭。而且实际上用「以牙還牙」策略只能保证和对方打成平手,很难获得更大的胜利。[2]
在重复囚徒困境的20周年纪念赛中,来自英国南安普敦大学的一个小组(由尼古拉斯·詹宁斯(Nicholas Jennings)领导,包括了拉蒂普·达什(Rajdeep Dash)、萨瓦帕里·拉姆琼(Sarvapali Ramchurn)、亚历克斯·罗杰斯(Alex Rogers)斯和皮鲁克里士南·维特林根(Perukrishnen Vytelingum))找出了另一种策略,这个新的策略在另一次实验中打败了「以牙還牙」策略。在「以牙還牙」策略成功的那个实验里,竞争者与竞争者之间是独立的。而该团队的新策略却提供了一个小组,这个小组的人都有一个目的,就是力保小组中的其中一人。也就是说这个小组可以看作一个大的竞争者。
應用於真實世界
點對點下載
BitTorrent應用「以牙還牙/投桃報李」策略以優化下載速度[3] 。BitTorrent運用的optimistic unchoking技術就是運用了「以牙還牙/投桃報李」策略。BitTorrent會定期隨機選擇其他用戶作上載,以尋找更多潛在合作者(願意上載的用戶),最大化上下載者的共同利益。
互惠利他主義
在動物群落,施予者提供幫助予受益者。利他行為應該得到回報,當雙方的需求互換,原來的受益者應報答及幫助原來的施予者。群落當中有機制以查明和懲罰「不報答者」。「以牙還牙/投桃報李」原則是一個調節互惠利他主義的重要機制。
参见
參考文獻
^ Alexrod, Robert (1984). The Evolution of Cooperation. Basic Books. ISBN 0465021212.
^ 以牙还牙
^ Bram Cohen, Incentives Build Robustness in BitTorrent, February 18, 2010, http://www.bittorrent.org/bittorrentecon.pdf
博弈论专题
定义
正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好
均衡概念
纳什均衡 · 强纳什均衡 · 子博弈均衡 · 贝叶斯-纳什均衡 · 贝叶斯完美均衡 · 颤抖手完美均衡 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优 · 自我应验均衡 · 马尔可夫完美均衡 · 默滕斯稳定均衡 · 核 · 夏普利值 · 吉布斯均衡 · 量子响应均衡
策略
优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 策略复制论证 · 逆向归纳法 · 前向归纳法 · 马尔可夫策略
博弈类型
对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈 · 甄别博弈 · 讨价还价问题 · 多人博弈 · 大型柏松博弈 · 严格决定博弈 · 潜博弈
博弈模型
國際象棋 · 无限棋 · 西洋跳棋 · 井字棋 · 囚徒困境(可选择的囚徒博弈 · 用餐者困境) · 旅行者困境 · 猜均值的2/3 · 协调博弈 · 蜈蚣博弈 · 志愿者困境 · 搭便車問題 · 拍卖美元 · 膽小鬼博弈 · 性别战 · 獵鹿賽局 · 賭便士 · 最後通牒賽局(海盗博弈) · 石头、剪子、布 · 独裁者博弈(信任游戏) · 公共品博弈 · 纳什讨价还价问题 · 上校賽局 · 摩擦战 · 少数派博弈(El Farol酒吧问题 ) · 公平分配博弈(切蛋糕问题 ) · 古諾競爭 · 死結 · 库恩扑克游戏 · 甄别博弈 · 信号博弈 · 公主与怪兽游戏 · 约会问题 · 囚徒帽子谜题
定理
极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理 · 极小化极大算法 · 納什均衡點 · 策梅洛定理
关键人物
阿尔伯特·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文 · 戴维·M·克雷普斯 · 唐纳德·B·吉利斯 · 朱·弗登博格 · 埃里克·马斯金 · 哈罗德·W.库恩 · 赫伯特·亚历山大·西蒙 (司马贺) · 埃尔维·穆兰 · 让·梯若尔 · 让-弗朗索瓦·默滕斯 · 珍妮弗·图尔·蔡司 · 夏仙義·亞諾什·卡羅伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔 · 梅里尔·M·弗勒德 · 奧嘉·邦達雷娃 · 奥斯卡·莫根施特恩 · 保罗·米尔格龙 · 佩顿·杨 · 赖因哈德·泽尔腾 · 羅伯特·阿克塞爾羅 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯 · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见
全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论 · 有限理性
· 组合博弈理论 · 对抗分析 · 合作性競爭 · 棋局中的先手优势 · 博弈机制 · 博弈论词汇表 · 博弈理论家列表 · 特殊博弈列表 · 雙輸 · 国际象棋的解局策略 · 拓扑博弈 · 公地悲劇 · 小决定暴政
dAy1NscY4Iw inI0FhoRF NttovlIio5F4az1Y4RtGa,oV7CDMkfV6l1C9fej,lRL rYlr D,PWNGa
Popular posts from this blog
提示 :本条目的主题不是 香港中文大學(深圳) 。 body.skin-minerva .mw-parser-output table.infobox caption{text-align:center} 香港中文大學 The Chinese University of Hong Kong 校训 博文約禮 [1] [2] 创建时间 1963年10月17日 学校类型 法定(公立)、研究型 監督 主權移交前:英屬香港總督 主權移交後:香港特別行政區行政長官 校董會主席 梁乃鵬博士 校長 段崇智教授 副校长 華雲生教授(常務副校長) 霍泰輝教授、吳基培教授 張妙清教授、潘偉賢教授 陳偉儀教授、吳樹培先生 教师人數 1,619 [3] 学生人數 25,489 [3] 本科生人數 20,147 [3] 研究生人數 5,342 [3] 校址 香港新界沙田馬料水沙田市地段437號(大埔公路十一至十二咪左右(正門及崇基門) 22°25′10″N 114°12′19″E / 22.41946°N 114.205358°E / 22.41946; 114.205358 坐标: 22°25′10″N 114°12′19″E / 22.41946°N 114.205358°E / 22.41946; 114.205358 科學園路與澤祥街交界(東校門) 澤祥街18號(沙田凱悅酒店及工商管理學院)) 校區 新市鎮 总面积 134.4公頃(1,344,000平方米) [2] 代表色 紫與金 [1] 吉祥物 鳳凰 [1] 隶属 英聯邦大學協會 國際商管學院促進協會(AACSB) 東南亞高等教育協會 ( 英语 : ASAIHL ) 國際大學協會 亚太高校书院联盟 八大公立大學聯盟(譯自:HK8)[3] 网站 http://www.cuhk.edu.hk/ 香港中文大學 ( 英语: The Chinese University of Hong Kong ,縮寫为 CUHK ),簡稱 中文大學 、 中大...
10
1
I have a function that searches a vector of iterators and returns the iterator if its names matches a string passed as an argument. koalaGraph::PVertex lookUpByName(std::string Name, std::vector<koalaGraph::PVertex>& Vertices) { for (size_t i = 0; i < Vertices.size(); i++) { if(Vertices[i]->info.name == Name) return Vertices[i]; } } My question is how can I implement this as a lambda, to use it in connection with std::find_if ? I'm trying this: std::vector<koalaGraph::PVertex> V; std::string Name; std::find_if(V.begin(), V.end(), [&Name]() {return Name == V->info.name;}) But it says that V an enclosing-function local variable cannot be referenced in a lambda body unless it is in the capture list.
...
.everyoneloves__top-leaderboard:empty,.everyoneloves__mid-leaderboard:empty,.everyoneloves__bot-mid-leaderboard:empty{ margin-bottom:0;
}
4
1
I am installing hackintosh in virtualbox on ubuntu, but when I try to start, I get above error. Here are some more details, Result Code: NS_ERROR_FAILURE (0x80004005) Component: ConsoleWrap Interface: IConsole {872da645-4a9b-1727-bee2-5585105b9eed} How can I solve this issue?
16.04 virtualbox
share | improve this question
asked Oct 22 '17 at 15:10
luv.preet luv.preet
1,502 4 13 29
...