大数据机器学习算法和计算机视觉应用01:博弈论基础

Game Theory

  • 2-player Zero Sum Game
  • Minimax Optimal Strategies
  • Von Neumann’s Minimax Theorem
  • Lower Bounds for Randomized Algorithms
  • General sum games, Nash quilibria

(p.s:该系列是国际交流学术公开课的笔记,主讲人是Carnegie Melon University的终身教授David P. Woodruff.

2-Player Zero sum Game 二人零和博弈

一个博弈包括以下要素:

  • 参与者,称为玩家
  • 每个玩家都有一组选择,称为动作。
  • 不同玩家的联合动作会给每个玩家带来反馈

Example: shooter goalie game 射手门将博弈

对于射手来说,他可以选择向左或者向右射门;对于门将来说,它可以向左或者向右扑救。

收益:如果二者选择了相同的方向,门将完成了一次扑救获得1分,射手丢失1分;否则射手获得1分,门将丢失1分。

收益矩阵

(-1,1)(1,-1)
(1,-1)(-1,1)

矩阵中的每一个元组对应一组反馈,其中第一个数 R i j R_{ij} Rij对应行玩家行动的反馈,第二个数 C i j C_{ij} Cij对应列玩家。

如果在零和博弈中, R + C = 0 R+C=0 R+C=0

期望收益

每个玩家的期望收益为两位玩家执行某行动的概率和该行动对应的玩家收益乘积的总和,也就是:
V ( p , q ) = p i q j P i j V(p,q) = p_i q_j P_{ij} V(p,q)=piqjPij
其中p是行玩家执行对应动作的概率,q是列玩家对应动作的概率,假设两位玩家行动相互独立。

在零和博弈中, V R + V C = 0 V_R + V_C = 0 VR+VC=0

Minimax Optimal Strategies 最优策略

任何一个玩家都希望最大化其期望收益,而在零和博弈中,一个玩家的收益增加代表另一个减少等量增益。因此一个玩家会尽量减少另一位玩家的期望收益。那么行玩家的策略期望最小收益可以表示如下:
l b = max ⁡ p min ⁡ q V R ( p , q ) lb = \max_p \min_q V_R(p,q) lb=pmaxqminVR(p,q)
下面我们证明一个规律:
max ⁡ q min ⁡ p V C ( p , q ) = − min ⁡ q max ⁡ p V R ( p , q ) \max_q \min_p V_C(p,q) = -\min_q \max_p V_R(p,q) qmaxpminVC(p,q)=qminpmaxVR(p,q)
证明如下:
max ⁡ q min ⁡ p V C ( p , q ) = − max ⁡ q min ⁡ p V R ( p , q ) = max ⁡ q ( − max ⁡ p V R ( p , q ) ) = − min ⁡ q m a x p V R ( p , q ) \max_q \min_p V_C(p,q) = -\max_q \min_p V_R(p,q) = \max_q (-\max_p V_R(p,q)) = -\min_q max_p V_R(p,q) qmaxpminVC(p,q)=qmaxpminVR(p,q)=qmax(pmaxVR(p,q))=qminmaxpVR(p,q)
这个规律说明最大化本人最小收益就相当于最小化对手最大收益的相反值。

由此可见,你要最小化你的对手的最大收益,同理你的对手也要最小化你的最小收益。也就是说,你决定你的最小收益,你的对手决定你的最大收益。那么这两个值如何对应呢?

Von Neumann’s Minimax Theorem 冯·纽曼定理

在一个有限操作的双方零和博弈中,某玩家的期望收益下界等于期望收益上界。而这个值被称为value of the game

Lower Bounds for Randomized Algorithms 随机算法的下界

随机算法可以看作一个零和博弈,我们可以建立一个行收益矩阵:

  • 每一行对应不同的输入
  • 列对应不同的算法
  • R i , j R_{i,j} Ri,j对应不同的开销(比如,时间复杂度)

一个有最坏情况最优的确定算法是某一个所有对应值都最小的列。

一个有最优期望的随机算法是指一个对应列的分布q使得每行的期望开销都是最小的。

我们刚才提到我们要使得最坏情况最优,也就是
min ⁡ r a n d o m i z e d max ⁡ i n p u t V R ( i , q ) \min_{randomized} \max_{input} V_R(i,q) randomizedmininputmaxVR(i,q)

对此有一个定理陈述如下:假设 A A A是一个基于比较的随机的排序算法,总存在一个输出 I I I使得 A A A的期望比较次数是 Ω ( lg ⁡ n ! ) \Omega(\lg n!) Ω(lgn!)

其证明如下:

  • 假设n个不同数字的排列情况服从均匀分布,我们用一棵树来表示对应不同情况的比较对应的排列:如下图:

randomized sorting

  • 那么假设n足够大,在深度 l g ( n ! ) − 10 lg(n!)-10 lg(n!)10之上的叶子有多少个呢?

≤ 1 + 2 + 4 + ⋯ + 2 lg ⁡ ( n ! ) − 1 ≤ n ! 512 \leq 1+2+4+\cdots + 2^{\lg(n!)-1} \leq \frac{n!}{512} 1+2+4++2lg(n!)1512n!

期望深度就是 > . 99 ( lg ⁡ ( n ! ) − 10 ) >.99(\lg(n!)-10) >.99(lg(n!)10),因此期望深度就是 Ω ( lg ⁡ ( n ! ) ) \Omega(\lg(n!)) Ω(lg(n!))

General sum games, Nash quilibria

许多博弈不是零和博弈,存在双赢策略。这种就是非零和博弈

另外,如果在博弈中的参与者都没有动机去单独改变自己的策略(给定其他人的行动),也就是说(p,q)一定是稳定的(为了保证最大期望收益下界),那么这样的一组 ( ( p , 1 − p ) , ( q , 1 − q ) ) ((p,1-p),(q,1-q)) ((p,1p),(q,1q))就被称作纳什均衡
纳什定理对纳什均衡的存在做了肯定。纳什定理的内容是:

对于给定有限行动的博弈,总存在一个纳什均衡。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/10982.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

如何安装和配置JDK17

教程目录 零、引言1、新特性概览2、性能优化3、安全性增强4、其他改进5、总结 一、下载安装二、环境配置三、测试验证 零、引言 JDK 17(Java Development Kit 17)是Java平台的一个重要版本,它带来了许多新特性和改进,进一步提升了…

【C++进阶】智能指针的使用及原理(1)

1. 智能指针的使用场景分析 下面程序中我们可以看到,new了以后,我们也delete了,但是因为抛异常导,后面的delete没有得到执行,所以就内存泄漏了,所以我们需要new以后捕获异常,捕获到异常后delete…

计算机课程管理:Spring Boot实现的工程认证路径

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了基于工程教育认证的计算机课程管理平台的开发全过程。通过分析基于工程教育认证的计算机课程管理平台管理的不足,创建了一个计算机管理基于工程教育认…

【人工智能训练师】综合案例 HBase与Hive的集成

9.1 HBase与Hive 任务目的 简单回顾了解hive 了解hive与hbase的区别 任务清单 任务1:hive简介 任务2:hbase与hive的区别 任务步骤 任务1:hive简介   什么是Hive呢? Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。 构…

基于STM32的图像处理监控系统

1. 引言 随着物联网和智能家居的普及,图像处理和监控系统在安全防范、家庭监控等方面应用越来越广泛。本项目旨在使用STM32开发板和OV7670摄像头模块搭建一个简单的图像处理监控系统。系统能够捕获图像并进行基本的处理与展示。 2. 环境准备2.1 硬件需求 - STM32开…

QML-简单项目实战一

一、简介 使用QML创建一个简单的登录界面,代码内容来源于bilibili中的视频。 实现效果图如下: 二、实现步骤 1. 核心控件和布局管理和登录事件处理 import QtQuick 2.12 import QtQuick.Controls 2.12 import QtQuick.Window 2.12 /*1. 核心控件和布局…

字节青训-小F的永久代币卡回本计划、

目录 一、小F的永久代币卡回本计划 问题描述 测试样例 解题思路: 问题理解: 数学公式: 代码实现: 最终代码: 运行结果: 二、构造特定数组的逆序拼接 问题描述 测试样例 解题思路:…

[ Linux 命令基础 4 ] Linux 命令详解-文本处理命令

🍬 博主介绍 👨‍🎓 博主介绍:大家好,我是 _PowerShell ,很高兴认识大家~ ✨主攻领域:【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 🎉点赞➕评论➕收藏 养成习…

06:(寄存器开发)对上电/复位的SystemInit函数进行分析

SystemInit函数分析 通过第5章的时钟树的学习,基本了解了SystemClock总线,AHB总线,APB1总线,APB2总线的时钟频率。那么单片机一上电或者按下复位时,这些总线的时钟频率是如何变化的喃? 这和STM32的启动文件…

C++ : STL容器(适配器)之stack、queue剖析

STL容器适配器之stack、queue剖析 一、stack、queue的接口(一)stack 接口说明(二)queue 接口说明 二、stack、queue的模拟实现(一)stack、queue是容器适配器stack、queue底层默认容器--deque1、deque概念及…

三菱QD77MS定位模块外部信号选择功能

“外部信号选择功能” 是在使用上/下限限位信号和近点狗信号的情况下,从以下信号中选择的功能。 "QD77MS的外部输入信号 "伺服放大器的外部输入信号 "经由 CPU 的外部输入信号(QD77MS 的缓冲存储器) 经由 CPU 的外部输入信号(QD77MS 的缓冲存储器)的…

Vue3-06_路由

路由 后台路由是根据请求url,匹配请求处理的后台模块(路径) 前台根据访问路径,决定显示的内容。 路由就是: 访问hash 与内容的对应关系 路由的工作方式 用户点击页面的路由链接导致url地址栏中的Hash值发生了变化前…

【知识科普】TCP与UDP这两者之间的对比

TCP与UDP这两者之间的对比 概述TCP 协议的基本概念TCP 协议的工作原理TCP 协议的报文结构TCP 协议的流量控制TCP 协议的可靠性TCP 与 UDP 的比较TCP 协议的应用TCP 协议的优缺点优点缺点 概述 TCP(传输控制协议)是一种面向连接的、可靠的、基于字节流的…

初次体验Tauri和Sycamore(1)

原创作者:庄晓立(LIIGO) 原创时间:2024年11月10日 原创链接:https://blog.csdn.net/liigo/article/details/143666827 版权所有,转载请注明出处。 前言 Tauri 2.0发布于2024年10月2日,Sycamore…

基于Spring Boot+Vue的学院食材采供管理系统

一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端: 技术:框架Vue.js;UI库:ElementUI; 开发工具&…

【C++】vector模拟实现、迭代器失效问题(超详解)

vector会使用之后我们来模拟实现一下,通过对vector的模拟实现,我们来说一下迭代器失效问题。 1.准备工作 在头文件vector.h里声明和实现函数,然后在test.cpp里测试代码的正确性。 在vector.h中用命名空间分隔一下,因为c库里面也有…

基于SpringBoot的渔具管理系统【附源码】

基于SpringBoot的渔具管理系统 效果如下: 系统主页面 系统登陆页面 管理员主页面 用户管理页面 渔具信息管理页面 租赁信息管理页面 归还信息管理页面 渔具信息页面 用户登陆页面 个人中心页面 研究背景 随着社会的发展,渔具销售企业之间的竞争与合作…

string

文章目录 一. STL1.概念2.版本 二. string类2.1 为什么学习string类2. 标准库中的string类2.2.1 构造(7个)2.2.2 对string类对象进行访问和修改(1)operator[](2)迭代器1.迭代器的使用2.迭代器的价值&#x…

B2B订货系统功能设计与代码开发(PHP + MySQL)

在B2B(Business to Business)电子商务中,企业之间的商品订购、交易和供应链管理是核心功能。一个高效的B2B订货系统可以帮助企业管理库存、订单、采购等业务流程。本文将介绍一个基于PHP与MySQL技术栈的B2B订货系统的功能设计与开发流程。 一…

【2024】前端学习笔记17-Vue初体验

学习笔记 1.什么是vue2.vue初体验3.代码拆分释义4.本文新内容1.什么是vue Vue是一个用于构建用户界面的渐进式JavaScript框架。 它专注于视图层,易于集成或与现有项目结合使用,也可以通过其生态系统实现更复杂的单页应用(SPA)。 Vue的核心特点包括响应式数据绑定、组件化开…