什么是博弈论?

什么是博弈?字面描述中,博弈由两个字构成:博 和 弈。博弈是一种双方(多方)的对抗(比赛),对抗总是在一定的规则下进行,参与者必然会考虑应用相应的策略(计谋),并尽可能让自己获胜。

博弈论设计甚广,后续发展基本上沿着以下4个方面展开:

  1. 对 纳什均衡 的弱化(或一般化)研究

  2. 对 纳什均衡 的精炼(或筛选)研究

  3. 对 博弈论 的基本假设的深入研究

  4. 对 博弈论 的应用研究

事实上,博弈论早已从单纯对经济问题的研究发展成为对社会问题的研究,并且在经济学以外的政治学、社会学、管理学等众多领域都得到了广泛应用。

基于博弈论的重要性,针对 《博弈论》 一书进行了笔记摘要,相信博弈论将成为解释冲突、建立合作、增进信任、促进社会经济发展的重要理论。

文中讲述了多种博弈模型,贴近生活也耐人寻味。

一、概览

1)博弈类型和结构化思维

科学的起点是分类,只有通过分类才能区分事物之间的不同。

衣服会进行分类,书籍会进行分类,甚至身高、收入、智商等都能够进行分类。有了分类,事物才会变得有序。

博弈的分类有两种:

  1. 静态博弈 和 动态博弈

  2. 完全信息博弈 和 不完全信息博弈

静态博弈和动态博弈

  • 静态博弈是指在博弈中,参与者同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动(虽然在物理时间上不是同时的,但是在逻辑时间上是同时的)

  • 动态博弈是指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动

以上推演到实际生活中:

石头剪刀布、投标活动就是 静态博弈

棋牌游戏、拍卖就是 动态博弈

有个实实在在的例子:

每个学校在课程结束后,都会要求学生给老师的课程评分,老师也需要对学生的成绩评分,如果学生先评分,那么可能会影响到老师做出成绩评分,如果老师先评分,那么可能也会影响到学生做出课程评分。那么这样一来,老师和学生之间就会相互牵制,难以确保评分真实有效。因此就会采取保密的方式,学生先评分,但是对老师保密,老师在进行学生成绩评分后的一段时间才能看到学生对自己的评分。而这就是一种 静态博弈 。

两者区别

静态博弈 的参与者只能依据对对手策略或行动的想象做决策,比如 "石头剪刀布" 的游戏,你只能想象着对方会出"石头",然后你决定出"步"。

动态博弈 的参与者则是依据对手的实际选择做决策。

完全信息博弈与不完全信息博弈

  • 完全信息博弈 是指在博弈过程中,每个参与者对其他参与者的类型、策略空间以及损益函数的信息都有准确的了解。

  • 不完全信息博弈 就是与完全信息博弈相反,总有一些信息不是所有参与者都知道的。

以上推演到实际生活中:

教育、医疗和金融就是 不完全信息博弈

相比之下,完全信息博弈 少之又少,真实反映:生活本来就是不公平的

结构化思维

当某样东西可以从两个及以上不同的维度进行分类的时候,如果把两个维度组合在一个平面上,就可以构建出一种结构化的组合方式。

将上面说到4种博弈类型进行组合,我们可以得到:

 

2)扩展认知 

纳什均衡

均衡是指所有博弈参与者的最优策略组合。

纳什均衡的释义就是:给定你的策略,我的策略就是对我而言最好的策略(或之一);给定我的策略,你的策略也是对你的来说最好的策略(或之一),双方在对方给定的策略下已经没有积极性调整自己已选的策略。

简言之:双方到了冷热化的底部,没有人愿意偏离自己给定的策略状态

  

策略探究

策略的三大属性:

1、策略的完整性

策略必须是完整的,意味着参与者把所有可能的情况都加以充分考虑,没有任何遗落(需善于利用分类,穷尽法)

2、策略的多样性

策略总是多样的,意味着你其实有很多个策略可以选择(A、B计划,留有一手,有备无患)

3、策略的不可观察性

策略不同于行动,行动是具体的做法,策略是对行动的预想。根据一个人的行为来推测一个人的策略有可能是错的(你以为的总是你以为的)

共同知识

什么是共同知识呢?

皇帝的新装 是一个家喻户晓的故事,但是皇帝没穿衣服,这是每个人都知道的 共有知识,但不是 共同知识共同知识是每个人不但都知道(共有),而且也知道其他人都知道,而且都知道其他人知道每个人都知道...

我们平常所说的 共识 其实就是 共同知识 ,两者概念我们要加以区分。(不由想到互联网中著名的 两将军问题,TCP 为什么要进行 三次握手,而不是两次握手?就是为了达成共识)

二、经典模型 

1)懦夫博弈

狭路相逢勇者胜 就是一种博弈,双方都在赌对方先退一步。

说起这种博弈,《速度与激情》中太多场景就是 懦夫博弈 的映照。

在懦夫博弈中,有两个参与者A和B,每个参与者有两种策略(行动):进和退。双方面临四种结果:都进、都退、A进B退、A退B进。

懦夫博弈存在先动优势,一旦有一方选择了进,另一方的选择只能是退,否则会遭到更大的损失,所谓的 **"先下手为强后下手遭殃"**。

从理论上来说,懦夫博弈的制胜策略是:抢先选择进,并抢先告诉对方已经选择了进,同时让对方知道自己的选择已经无法更改了

一句话中,体现了三要素:

  • 抢先选择进

  • 让对方知道自己选择了进

  • 让对方知道自己没有退路

因此,懦夫博弈中的先动优势既是基于 行动的先动优势,又是基于信息传递的先动优势

赢者通吃会导致过度竞争,在这种博弈中,需要反复估量自己胜出的可能性,一般情况下选择不参与博弈是理性的。

2)夫妻博弈

夫妻间的博弈可谓不断,明年过年去谁家也成为了世纪难题。

这个问题的背景下,存在双方的共同利益。在夫妻博弈中,我们可以找到两个纯策略的纳什均衡:都去男方家过年或都去女方家过年。

从现实生活中分析,一般有三种情况:

  1. 与懦夫博弈一样存在先动优势,家庭地位决定纳什均衡的偏好

  2. 轮流去对方家

  3. 随机选择,这种解决方案比纳什均衡还有效,双方基于共同认可的规则。

提前商定合作收益的分配机制 :在所有的合作关系中,都会涉及合作收益的分配问题。不同的分配模式都有其存在的合理性,关键是合作之前先自愿约定,这样可以极大地降低合作成本。

夫妻博弈是一种共赢的合作博弈,但在合作的收益分配上存在差异。提前约定合作收益的分配是避免矛盾冲突的有效手段。

3)囚犯困境

囚犯困境又称“囚徒困境”,是博弈论中最为经典的理论模型之一。

囚犯困境在现在电视剧中屡见不鲜,大致场景为:两个罪犯进行分开审讯,如果两人都保持沉默,那么只能以犯罪事实定罪,可能判处的罪行就比较轻。但如果有一个人可以先坦白,那么这个人就可以当场释放,另一个人承受加重罪罚,如果两个人都坦白,不但不会被释放,还会加重处罚。

这个时候 囚犯困境 就出现了,对于两人来说最佳结果便是双方都选择抗拒,但对于个人来说便是先坦白,这才是占优策略

占优策略:采用该策略的结果都优于其他策略,由博弈中的所有参与者的占优策略组合所构成的均衡便是占优策略均衡

上述情境是在双方不能沟通的情况下,条件放宽后,允许两人呆上10分钟,再决定是否坦白。

那么此时博弈的方向就会变成双方是否遵守约定,当然,最好的选择依然是不遵守约定,最终的结果也取决于是否某一方能够具备在心理上不会有单独背叛对方的。

囚犯困境在现实中是无处不在的。对于囚犯困境的原因,人们一般理解为参与人对于自身利益的追求,因此有利益冲突的地方,往往就是一种囚犯困境。那么如何走出囚犯困境?

  1. 努力修改游戏规则。努力寻找每个人的占优策略,做不到让利于人,也要做到共利与人

  2. 寻求道德的力量。如果没有某种道德准则来约束人类的行为,那么人类社会与动物世界并无区别

  3. 借助历史的记忆。把对历史的记忆转为对未来的想象

囚犯困境的究极原因在于:每个人让自己利益增加,是以他人利益的更大损失为代价

囚犯困境带来的启示:博弈的均衡结果和事实的真相无关,只取决于博弈的规则

4)万元陷阱

这个博弈带来了一个十分有意思的案例:

有个《美元拍卖游戏》,在游戏中,苏必克把1美元纸币作为拍品,当众拍卖,拍卖的规则是:出价最高的人获得拍品,出价第二高的人也要付出所出价格的款项。

什么意思呢?现将10000元钱拍卖给大家,请大家互相竞价,以100元为加价单位,直到没有人再加价为止。出价最高者以其所出价格获得10000元钱,同时,出价第二高者也得将其所出价格的金钱数量付给我。

如果在场的人都没人参与竞拍,那么你只要以 100 元就可以获取到 10000元,净赚 9900 元。

当然以上是最佳的理想结果,如果有两人在不断加价,当你出到 1000 时,另一人出了 1100 ,你是否愿意放弃,如果你此时放弃就会损失 1000 元,那唯一的方法便是继续加价,冷热化持续中,当你已经加到 9900 元时,对方已经出价到了 10000 元,这个时候双方都不愿放弃,因此双方又在不断加价,甚至直到破产。

这就是著名的 万元陷阱 ,这些陷阱通常有三个特征:

  1. 一个明显的诱饵

  2. 通往诱饵之路是单向的,可进不可出

  3. 参与者越想挣脱就会陷得越深,变得不能自拔,最后为此付出惨痛的代价

那么如何避免 万元陷阱

  1. 确立你投入的极限及预先的约定

  2. 极限一经确立,就要坚持到底,一定不要轻易改变

  3. 自己打定主意,尽量不受他人影响,避免出现 从众心理

  4. 不断提醒自己继续投入的代价

有趣的竞价方式:不要想着天上掉馅饼,直接开9900的价钱,只有100元的利润,一般情况下也不会有人继续加价,除非捣乱,但如果真的有人加价到 10000元,如果你决定继续加价,那就拿出 破釜沉舟 的行动,直接从 9900 加价到 19900 元,让对方意识到,如果再次加价到 20000 元,也是损失 10000 元,如果放弃也是损失 10000 元,而加价到 20000 元可能还会面临着你继续加价,增加损失。

避免万元陷阱最有效的策略就是及时止损,不要深陷其中,二是不要相信天上会掉馅饼,利小才不至于引起对方的强烈嫉妒和垂涎,如果血很多,会把狼招来的

5)智猪博弈

什么是智猪博弈呢?经典模型如下:

假设猪圈里有两头猪,一头大,一头小。猪圈的一侧放有食槽,另外一侧安装着控制猪食供应的按钮,按一下会有10个单位的猪食进槽,但是按动按钮的成本是2个单位的猪食。

情况1:如果两头猪一起按按钮,再一起跑过去吃,那么大猪会吃到 7 个单位,小猪吃到 3 个单位。减去成本,大猪:5,小猪:1

情况2:如果大猪去按按钮,小猪在食槽旁等着吃,那么大猪会吃到 6 个单位,小猪吃到 4 个单位。减去成本,大猪:4,小猪:4

情况3:如果小猪去按按钮,大猪在食槽旁等着吃,那么大猪会吃到 9 个单位,小猪吃到 1 个单位。减去成本,大猪:9,小猪:-1

3种情况很明显,对于小猪来说  是占优策略,那么在小猪一定等的情况下,想要吃到猪食,大猪只能按,那么这种情况的纳什均衡便是 (大猪按,小猪等)

但是这种均衡对大猪来说并不是占优策略,毕竟多劳并不能多得,最终的收益是(大猪:4,小猪:4)。在这个博弈模型中,对于小猪而言,无论如何都不会按按钮,大猪去不去按只影响小猪的损益,不会影响小猪的策略或行为选择。

因此这种模型也可以称为 搭便车博弈,一方付出了相应的代价,双方共享了所得到的收益。通过这种模型我们可以得到以下启示:

  1. 个体理性与集体理性是相互冲突,还是相一致,取决于制度安排本身。

  2. 收入分配的不均将有助于个体理性与集体理性的冲突。也就是让一部分人先富起来有助于帮助未富的人。

  3. 富人愿意行善,离不开穷人的点赞。想让大猪去按按钮,小猪可以选择少吃一点,让大猪觉得不会过于不平衡

  4. 能力越大,责任越大

在猜谜博弈中有两个非常重要的概念:纯策略 和 混合策略

纯策略: 参与者在每一个给定信息情况下只选择一种特定的行动

混合策略:参与者在给定信息情况下,以某种概率分布随机地选择不同的行动

比如“人不犯我,我不犯人;人若犯我,我必犯人”是一个纯策略。“人不犯我,我80%的可能性不犯人;人若犯我,我90%的可能性会犯人”就是一个混合策略

6)猎鹿博弈

又是一个有趣的博弈模型

两个人出去打猎,猎物为鹿和兔。

情况1:如果两个人独自去打兔子,一天下来可以打到2只兔子

情况2:如果要打鹿,则需要两个人一起去,缺一不可。(一只鹿的价值相当于8只兔子,每个人相当于4只兔子)当然如果只有一个人去打鹿,另一个没去,那么去打鹿的那个人收益为 0

分析发现,该模型下存在两种纳什均衡,便是要么一起去打鹿,要么一起去打兔子。

但是去打鹿就需要承担有一方未去打鹿的风险。那么这种情况下就需要 提前沟通

如果沟通成本小于最终获利成本,那么就要提前沟通,相互合作使利益最大化。沟通和协调成本越低,人与人之间就越容易建立合作关系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/146404.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

YOLOv5-PTQ量化部署

目录 前言一、PTQ量化浅析二、YOLOv5模型训练1. 项目的克隆和必要的环境依赖1.1 项目克隆1.2 项目代码结构整体介绍1.3 环境安装 2. 数据集和预训练权重的准备2.1 数据集2.2 预训练权重准备 3. 训练模型3.1 修改数据配置文件3.2 修改模型配置文件3.3 训练模型3.4 mAP测试 三、Y…

ElementUI之增删改及表单验证

⭐⭐本文章收录与ElementUI原创专栏:ElementUI专栏 ⭐⭐ ElementUI的官网:ElementUI官网 目录 一.前言 二.使用ElementUI完成增删改 2.1 后台代码 2.2 前端代码 三.使用ElementUI完成表单验证 一.前言 本章是继上一篇的基础之上在做完善&#xff0…

java Spring Boot按日期 限制大小分文件记录日志

上文 java Spring Boot 将日志写入文件中记录 中 我们实现另一个将控制台日志写入到 项目本地文件的效果 但是 这里有个问题 比如 我项目是个大体量的企业项目 每天会有一百万用户访问 那我每天的日志都记载同一个文件上 那不跟没记没什么区别吗? 东西怎么找&#x…

Windows 安装CMake

CMake 简介 CMake是一个开源的、跨平台的自动化构建系統,用來管理软件构建的过程。 其用途主要包括: 1. 跨平台编译:CMake支援Windows,Mac OS,Linux等多种操作系統,且支援多数主流编译器如GCC&#xff0…

雷达编程实战之功耗优化技术(低功耗)

本篇文章以xWRL6432为例,首先介绍了芯片内部的电源管理框架,在产品业务处理流程的不同阶段,我们可以对不同电源域进行相应的开/关来降低功耗。然后介绍了不同的硬件电源参考设计对芯片功耗的影响,又着重介绍了线性调频脉冲相关参数…

mysql面试题5:索引、主键、唯一索引、联合索引的区别?什么情况下设置了索引但无法使用?并且举例说明

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:说一说索引、主键、唯一索引、联合索引的区别? 索引、主键、唯一索引和联合索引是数据库中常用的索引类型,它们有以下区别: 索引:索引是一种数…

一文带你搞懂Redis持久化

Redis持久化 Redis的数据是存储在内存的,当程序崩溃或者服务器宕机,那么内存里的数据就会丢失。所以避免数据丢失的情况,需要将数据保存到其他的存储设备中。 Redis提供两种方式来持久化,分别是 RDB(Redis Database)&#xff1a…

字符串函数(二)—— 长度受限制的字符串函数

✨博客主页:小钱编程成长记 🎈博客专栏:进阶C语言 🎈相关博文:字符串函数(一) 字符串函数(二)—— 长度受限制的字符串函数 3.长度受限制的字符串函数3.1 strncpy&#x…

Redis配置和优化

Redis配置和优化 一 、Redis介绍二、关系数据库和非关系数据库2.1、关系型数据库2.2、 非关系型数据库2.3、 非关系型数据库的产生背景2.4、 关系型数据库和非关系型数据库区别2.5、 总结 三、缓存概念3.1、系统缓存3.2、 缓存保存位置及分层结构3.2.1、DNS缓存3.2.2、 应用层缓…

MySql进阶篇---006:存储引擎,索引,SQL优化,视图、存储过程、变量、流程控制、游标、存储函数、触发器

1. 存储引擎 1.1 MySQL体系结构 1).连接层 最上层是一些客户端和链接服务,包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证…

Java大数 -- BigInteger类

在java语言中,每一种整数类型都有自己的上限和下限,如果要想对非常大的整数做运算,就需要使用BigInteger类。特别在做算法题传入一个数值型的字符串时。 1.包 import java.math.*; 2.构造方法 public BigInteger(String str){...} BigInte…

10.1select并发服务器以及客户端

服务器&#xff1a; #include<myhead.h>//do-while只是为了不让花括号单独存在&#xff0c;并不循环 #define ERR_MSG(msg) do{\fprintf(stderr,"%d:",__LINE__);\perror(msg);\ }while(0);#define PORT 8888//端口号1024-49151 #define IP "192.168.2.5…

三等分功分器[波导]设计详细教程

想必大家通过阅读相关文献可以发现三等分实现可以有很多不同的方法&#xff0c;这里采用的是先不等分再等分的方式&#xff0c;仅供参考。 主要指标 中心频率为280GHz&#xff0c;采用WR-3频段的标准波导&#xff0c;将2:1不等功率分配耦合器与3dB等功率分配耦合器级联&#…

动态规划:两个数组的dp问题(C++)

动态规划&#xff1a;两个数组的dp问题 前言两个数组的dp问题1.最长公共子序列&#xff08;中等&#xff09;2.不同的子序列&#xff08;困难&#xff09;3.通配符匹配&#xff08;困难&#xff09;4.正则表达式&#xff08;困难&#xff09;5.交错字符串&#xff08;中等&…

【NLP的python库(03/4) 】: 全面概述

一、说明 Python 对自然语言处理库有丰富的支持。从文本处理、标记化文本并确定其引理开始&#xff0c;到句法分析、解析文本并分配句法角色&#xff0c;再到语义处理&#xff0c;例如识别命名实体、情感分析和文档分类&#xff0c;一切都由至少一个库提供。那么&#xff0c;你…

加入PreAuthorize注解鉴权之后NullPointerException报错

记录一次很坑的bug&#xff0c;加入PreAuthorize注解鉴权之后NullPointerException报错&#xff0c;按理来说没有权限应该403报错&#xff0c;但是这个是500报错&#xff0c;原因是因为controller层的service注入失败&#xff0c;然而我去掉注解后service注入成功&#xff0c;并…

初级篇—第三章多表查询

文章目录 为什么需要多表查询一个案例引发的多表连接初代查询笛卡尔积&#xff08;或交叉连接&#xff09;的理解 多表查询分类等值连接 vs 非等值连接自连接 vs 非自连接内连接VS外连接 SQL99语法实现多表查询内连接的实现外连接的实现左外连接右外连接满外连接 UNION的使用7种…

Mysql高手养成——第一章:索引知识,浅尝性能分析

&#x1f4e3; &#x1f4e3; &#x1f4e3; &#x1f4e2;&#x1f4e2;&#x1f4e2; 我是小冷 侧重后端的全栈工程师&#xff0c;有关技术问题需要讨论交流的直接私信即可 ⏩当前专栏&#xff1a;mysql高手养成系列- 第一章 索引与浅尝性能分析 ✏️高质量技术专栏专栏链接:…

解决前端二进制流下载的文件(例如:excel)打不开的问题

1. 现在后端请求数据后&#xff0c;返回了一个二进制的数据&#xff0c;我们要把它下载下来。 这是响应的数据&#xff1a; 2. 这是调用接口的地方&#xff1a; uploadOk(){if(this.files.length 0){return this.$Message.warning("请选择上传文件&#xff01;&#xff…

vite跨域proxy设置与开发、生产环境的接口配置,接口在生产环境下,还能使用proxy代理地址吗

文章目录 vite的proxy开发环境设置如果后端没有提供可以替换的/mis等可替换的后缀的处理办法接口如何区分.env.development开发和.env.production生产环境接口在生产环境下&#xff0c;还能使用proxy代理地址吗&#xff1f; vite的proxy开发环境设置 环境&#xff1a; vite 4…