投桃報李
Multi tool use
以牙還牙 (tit for tat)是一個用於博弈論的重複囚徒困境(reiterated prisoner's dilemma)非常有效的策略。這策略最先由数学家阿納托·拉普伯特(Anatol Rapoport)提出,並在密歇根大學社會學家羅伯特·阿克塞爾羅(Robert Axelrod)有關囚徒困境的研究中擊敗其他方法,脫穎而出,成為解決囚徒困境的最佳策略[1] 。
目录
1 概述
2 囚徒困境例子
3 問題
4 應用於真實世界
5 参见
6 參考文獻
概述
這一策略有兩個步驟:
第一個回合選擇合作
下一回合是否選合作要看上一回對方是否合作,若對方上一回背叛,此回合我亦背叛;若對方上一回合作,此回合繼續合作
「以牙還牙」策略有四個特點:
友善:「以牙還牙」者開始一定採取合作態度,不會背叛對方
報復性:遭到對方背叛,「以牙還牙」者一定會還擊報復
寬恕:當對方停止背叛,「以牙還牙」者會原諒對方,繼續合作
不羨慕對手:「以牙還牙」者個人永遠不會得到最大利益,整個策略以全體的最大利益為依歸
在眾多策略中,「以牙還牙」是最有效的,曾連續數年擊敗由計算機科學家,經濟學家和心理學家等團隊所提出的策略。博弈論者儘管沒有實質證據,但他們認為「以牙還牙」是最佳的策略。
囚徒困境例子
假設有四個參與者:兩個用「以牙還牙」的策略,另外兩個無論任何時候都會背叛其他人以讓自己得到最大的好處。假定每個參與者將要面對另外三個參與者進行六次對決。如果一名參與者背叛對方而對方不背叛,前者有5分,後者得0分;如果雙方不背叛對方,雙方各得3分;如果雙方同時背叛對方,雙方各得1分。
當「以牙還牙」者對背叛者,前者第一場比賽選擇不背叛,而後者正好相反,後者獲得5分。在餘下的5場比賽,兩位參與者背叛對方,每一場比賽各得1分。最後,背叛者得10分,「以牙還牙」者得5分。
當雙方均為「以牙還牙」者,在所有6場比賽中彼此均不會背叛對方。雙方每回合各得3分,最後每人各得18分。
當背叛者互相對賽,雙方每次都會背叛對方。雙方每回合各得1分,最後每人各得6分。
儘管「以牙還牙」者從來沒有贏得過一場比賽,而背叛者從未輸過一場比賽,考慮到雙方的最大共同利益,「以牙還牙」仍然是最好的策略。
問題
雖然阿克塞爾羅德證明了「以牙還牙」在某些情況下是最佳的策略,但兩名「以牙還牙」者有時候在博弈時仍會產生問題。假如其中一方錯誤理解形勢,就可能造成災難性結果。在「以牙還牙」的策略下,博弈者被迫懲罰之前背叛自己的對手(儘管他不是有意的),造成惡性循環。雙方都認為自己是無辜的,自己所作的只是為了自衛,並歸咎對手惡毒或是不跟自己合作。這種情況經常發生在現實世界的衝突,如學生間的打鬥和地區戰爭。而且实际上用「以牙還牙」策略只能保证和对方打成平手,很难获得更大的胜利。[2]
在重复囚徒困境的20周年纪念赛中,来自英国南安普敦大学的一个小组(由尼古拉斯·詹宁斯(Nicholas Jennings)领导,包括了拉蒂普·达什(Rajdeep Dash)、萨瓦帕里·拉姆琼(Sarvapali Ramchurn)、亚历克斯·罗杰斯(Alex Rogers)斯和皮鲁克里士南·维特林根(Perukrishnen Vytelingum))找出了另一种策略,这个新的策略在另一次实验中打败了「以牙還牙」策略。在「以牙還牙」策略成功的那个实验里,竞争者与竞争者之间是独立的。而该团队的新策略却提供了一个小组,这个小组的人都有一个目的,就是力保小组中的其中一人。也就是说这个小组可以看作一个大的竞争者。
應用於真實世界
點對點下載
BitTorrent應用「以牙還牙/投桃報李」策略以優化下載速度[3] 。BitTorrent運用的optimistic unchoking技術就是運用了「以牙還牙/投桃報李」策略。BitTorrent會定期隨機選擇其他用戶作上載,以尋找更多潛在合作者(願意上載的用戶),最大化上下載者的共同利益。
互惠利他主義
在動物群落,施予者提供幫助予受益者。利他行為應該得到回報,當雙方的需求互換,原來的受益者應報答及幫助原來的施予者。群落當中有機制以查明和懲罰「不報答者」。「以牙還牙/投桃報李」原則是一個調節互惠利他主義的重要機制。
参见
參考文獻
^ Alexrod, Robert (1984). The Evolution of Cooperation. Basic Books. ISBN 0465021212.
^ 以牙还牙
^ Bram Cohen, Incentives Build Robustness in BitTorrent, February 18, 2010, http://www.bittorrent.org/bittorrentecon.pdf
博弈论专题
定义
正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好
均衡概念
纳什均衡 · 强纳什均衡 · 子博弈均衡 · 贝叶斯-纳什均衡 · 贝叶斯完美均衡 · 颤抖手完美均衡 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优 · 自我应验均衡 · 马尔可夫完美均衡 · 默滕斯稳定均衡 · 核 · 夏普利值 · 吉布斯均衡 · 量子响应均衡
策略
优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 策略复制论证 · 逆向归纳法 · 前向归纳法 · 马尔可夫策略
博弈类型
对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈 · 甄别博弈 · 讨价还价问题 · 多人博弈 · 大型柏松博弈 · 严格决定博弈 · 潜博弈
博弈模型
國際象棋 · 无限棋 · 西洋跳棋 · 井字棋 · 囚徒困境(可选择的囚徒博弈 · 用餐者困境) · 旅行者困境 · 猜均值的2/3 · 协调博弈 · 蜈蚣博弈 · 志愿者困境 · 搭便車問題 · 拍卖美元 · 膽小鬼博弈 · 性别战 · 獵鹿賽局 · 賭便士 · 最後通牒賽局(海盗博弈) · 石头、剪子、布 · 独裁者博弈(信任游戏) · 公共品博弈 · 纳什讨价还价问题 · 上校賽局 · 摩擦战 · 少数派博弈(El Farol酒吧问题 ) · 公平分配博弈(切蛋糕问题 ) · 古諾競爭 · 死結 · 库恩扑克游戏 · 甄别博弈 · 信号博弈 · 公主与怪兽游戏 · 约会问题 · 囚徒帽子谜题
定理
极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理 · 极小化极大算法 · 納什均衡點 · 策梅洛定理
关键人物
阿尔伯特·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文 · 戴维·M·克雷普斯 · 唐纳德·B·吉利斯 · 朱·弗登博格 · 埃里克·马斯金 · 哈罗德·W.库恩 · 赫伯特·亚历山大·西蒙 (司马贺) · 埃尔维·穆兰 · 让·梯若尔 · 让-弗朗索瓦·默滕斯 · 珍妮弗·图尔·蔡司 · 夏仙義·亞諾什·卡羅伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔 · 梅里尔·M·弗勒德 · 奧嘉·邦達雷娃 · 奥斯卡·莫根施特恩 · 保罗·米尔格龙 · 佩顿·杨 · 赖因哈德·泽尔腾 · 羅伯特·阿克塞爾羅 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯 · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见
全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论 · 有限理性
· 组合博弈理论 · 对抗分析 · 合作性競爭 · 棋局中的先手优势 · 博弈机制 · 博弈论词汇表 · 博弈理论家列表 · 特殊博弈列表 · 雙輸 · 国际象棋的解局策略 · 拓扑博弈 · 公地悲劇 · 小决定暴政
If4ueq00N
Popular posts from this blog
數位音樂下載 為非以「實體」方式來販賣音樂的相關產品,而使用數位格式如mp3、AAC等文件格式來進行銷售販賣的一种音乐产业形式。著名的數位音樂下載服務商有iTunes Store、RecoChoku、Google Play音乐和微软Zune等。数字音乐下载在二十一世纪初一度风靡全球, [1] [2] 使得传统唱片产业走向衰落,但其自身也在2010年代流媒体音乐服务如Apple Music、Spotify等的挤压下迅速失去市场份额。 [3] [4] 数字音乐下载有便于携带、传播迅速、制作简单成本低等优点,与流媒体音乐相比也能更好保障音乐人权益; [5] 但它同时很可能带来侵犯版权和滥用的情形, [6] 也给音乐产业带来了诸多不利影响。数字音乐下载为音乐人和乐迷提供了更加便捷直接的交流渠道,也一定程度上推动了网络音乐人的出现和独立音乐的迅速发展。 [7] 目录 1 历史 1.1 技术积淀(1987-2000) 1.2 出现与兴起(2000-2004) 1.3 唱片市场的颠覆者(2004-2007) 1.4 巅峰和衰落(2005-2013) 1.5 摇摇欲坠的现状与不可预知的明天(2014至今) 2 主要文件格式 2.1 PCM编码格式 2.1.1 WAV 2.1.2 APE 2.1.3 FLAC 2.2 苹果推出的无损文件格式 2.2.1 AIFF 2.2.2 ALAC 2.3 有损压缩格式 2.3.1 MP3 2.3.2 AAC 3 主要市场 3.1 iTunes Store 3.2 Google Play音乐商店 3.3 亚马逊音乐商店 3.4 部分其他音乐商店 4 影响与评价 4.1 对音乐产业的影响 4.2 对科技行业的影响 4.3 正面评价 4.4 负面评价 4.4.1 侵权问题 4.4.2 经营模式不明晰 4.4.3 不适应移动时代 4.5 文化现象 5 延伸阅读 6 参考资料 历史 苹果iTunes+iPod的软硬件搭配让数字音...
2
I don't know why balance of the address is 0. when can this situation?
etherscan balances
share | improve this question
asked yesterday
Ru Hi Ru Hi
11 1
New contributor
Ru Hi is a new contributor to this site. Take care in asking for clarification, commenting, and answering.
Check out our Code of Conduct.
add a comment |
...
格利泽436b 太陽系外行星 太陽系外行星列表 艺术家笔下的格利泽436b 母恆星 母恆星 Gliese 436 星座 獅子座 赤經 ( α ) 11 h 42 m 11.0941 s [1] 赤緯 ( δ ) +26° 42′ 23.652″ [1] 距離 33.4 ly (10.2 pc) 光譜類型 M2.5 V [1] 軌道參數 半长轴 ( a ) 0.0291±0.0004 [2] AU 軌道離心率 ( e ) 0.150±0.012 [2] 公轉週期 ( P ) 2.643904±0.000005 [3] d (0.00723849 y) 軌道傾角 ( i ) 85.8 +0.21 −0.25 [3] ° 角距 ( θ ) 2.794 mas 近星點時間 ( T 0 ) 2,451,551.716 ±0.01 JD 半振幅 ( K ) 18.68±0.8 m/s 物理性质 质量 ( m ) 22.2±1.0 [2] M ⊕ 半徑 ( r ) 4.327±0.183 [2] [4] R ⊕ 密度 ( ρ ) 1.51 g cm -3 表面重力 ( g ) 1.18 g 溫度 ( T ) 712±36 [2] K 發現 發現時間 2004 發現者 巴特勒、沃格特、 馬西 et al. 發現方法 徑向速度、凌日法 發現地點 美國加利福尼亞州 發表論文 出版 其他名稱 Ross 905 b, GJ 436 b, [5] LTT 13213 b, GCTP 2704.10 b, LHS 310, AC+27:28217 b, Vyssotsky 616 b, HIP 57087 b, GEN# +9.80120068 b, LP 319-75 b, G 121-7 b, LSPM J1142+2642 b, 1RXS J114211.9+264328 b, ASCC 683818 b, G 147-68 b, UCAC2 41198281 b, BP...