当前位置: 首页 > article >正文

【博弈论 学习】Chapter1. 策略式博弈与Nash均衡

【博弈论 学习】Chapte1. 策略式博弈与Nash均衡

  • 前言
  • 1.1策略式博弈和重复严格优势
    • 1.1.1 策略式博弈
    • 1.1.2 劣势策略
      • 劣势策略的定义1.1:
    • 1.1.3剔除劣势策略的应用
      • 囚徒困境
      • 二级价格拍卖
  • 1.2 纳什均衡
    • 1.2.1 定义
    • 1.2.2纯策略均衡的例子
      • 古诺垄断竞争模型
      • 霍特林竞争模型
      • 多数投票
    • 1.2.3 纯策略均衡不存在的例子
      • 硬币配对
      • 观察博弈
    • 1.2.4 多重nash均衡/聚点/帕累托最优
      • 聚点
      • 帕累托优势
      • 帕累托均衡/帕累托均衡/帕累托有效性
    • 1.2.5 作为学习和进化结果的Nash均衡
      • 古诺-nash均衡调整
  • 1.3 Nash均衡的存在性和性质
    • 1.3.1混合均衡策略的存在性
    • 1.3.3具有连续收益的无限博弈的Nash均衡的存在性

前言

电子书链接
可能需要科学上网。

在博弈论和概率论中,支撑集(support set)是指在混合策略中被赋予正概率的纯策略的集合。换句话说,支撑集包含了所有在混合策略中实际可能被选择的纯策略。

混合策略是指玩家在决策时不选择单一的纯策略,而是根据某种概率分布在多个纯策略之间进行选择。混合策略引入了随机性,使得玩家的选择不再是确定的。

符号标记

  • 混合策略 σ i \sigma_i σi,混合策略空间 Σ i \Sigma_i Σi
  • 纯策略 s i s_i si,纯策略空间 S i S_i Si
    紧集的性质
  1. 闭性:在 R n R^n Rn中紧集是闭集。
  2. 有界性:在 R n R^n Rn中,紧集是有界的。
  3. 连续函数上的性质:在紧集上,连续函数达到其最大值和最小值(极值定理)。
  4. 有限交性质:在拓扑空间中,紧集的任意有限个闭集的交集是非空的。

在这里插入图片描述

1.1策略式博弈和重复严格优势

1.1.1 策略式博弈

定义:一个策略式博弈由三种元素构成 { [ N ] , ( S i ) i ∈ [ N ] , ( u i ) i ∈ [ N ] } \{[N], (\mathcal{S}_i)_{i\in [N]}, (u_i )_{i\in [N]}\} {[N],(Si)i[N],(ui)i[N]},其中 N N N表示参与人集合,纯策略空间(pure strategy space) ( S i ) i ∈ [ N ] (\mathcal{S}_i)_{i\in [N]} (Si)i[N]和收益函数 ( u i ) i ∈ [ N ] (u_i )_{i\in [N]} (ui)i[N]。对于每一个策略组合 s s s,每个参与人都可以给出其对应的效用。我们通常标记 i i i的所有竞争对手为 − i -i i

双人零和博弈:效用总和为常数,常数设为0只是为了标准化。

混合策略是纯策略的一种概率分布。

一种混合策略下,参与人的收益是参与人 i i i的混合概率 σ i \sigma_i σi的线性函数。

1.1.2 劣势策略

在这里插入图片描述
在某一个博弈过程中,当玩家 i i i采取某一策略获得的收益严格小于采取另一策略获得的收益,则称该策略为劣势策略。可以不断剔除劣势策略,该过程称为重复优势。
在这里插入图片描述
在以上博弈过程中,策略M不劣于U和D,但是混合策略 { 0.5 , 0 , 0.5 } \{0.5, 0, 0.5\} {0.5,0,0.5}优于只选择M的纯策略。一个纯策略可能劣于一个混合策略,即使该策略不劣于任何其他的纯策略

劣势策略的定义1.1:

∃ σ i ′ ∈ Σ i u i ( σ i ′ , s − i ) > u i ( s i , s − i ) , s − i ∈ S − i \exist \sigma_i'\in\Sigma_i\\ u_i(\sigma_i', s_{-i})>u_i(s_i,s_{-i}), s_{-i}\in S_{-i} σiΣiui(σi,si)>ui(si,si),siSi
则称纯策略 s i s_i si对玩家 i i i是严格劣势的。
若上述的不等式是弱不等式,且对至少一个 s − i s_{-i} si成立,则称纯策略是弱劣势的。

注:即只要存在一个混合策略在某一条件下大于一个纯策略,则该纯策略就是劣势策略。

注意:对手采取混合策略实际上是对手采取纯策略的凸组合。因此
在这里插入图片描述

1.1.3剔除劣势策略的应用

囚徒困境

在这里插入图片描述

二级价格拍卖

1.2 纳什均衡

1.2.1 定义

在这里插入图片描述
每个人的混合策略都弱强于某一纯策略。纯策略的Nash均衡是上式的纯策略组合版本。
在这里插入图片描述
需要说明的是,严格均衡并不一定存在,在某些博弈问题中,仅存在混合策略均衡。同时纯策略均衡也不一定是严格的。
在这里插入图片描述
如果某个单个策略组合在重复剔除严格劣势策略后遗留下来,则该策略一定是该博弈中唯一的Nash均衡。

1.2.2纯策略均衡的例子

古诺垄断竞争模型

在这里插入图片描述
在这里插入图片描述

霍特林竞争模型

在这里插入图片描述

多数投票

在这里插入图片描述

1.2.3 纯策略均衡不存在的例子

硬币配对

在这里插入图片描述
在这里插入图片描述

观察博弈

在这里插入图片描述

1.2.4 多重nash均衡/聚点/帕累托最优

性别战争和过桥(斗鸡)问题的博弈:
在这里插入图片描述
以上问题均存在两个纯策略Nash均衡和一个混合策略Nash均衡,其中混合策略的概率求解通过求解参与者两种策略无差别的条件来确定。

聚点

在这里插入图片描述

帕累托优势

帕累托优势(Pareto Improvement)
帕累托优势指的是一种资源配置的改变,使得至少有一个人变得更好,而没有任何人变得更差。在这种情况下,资源的重新分配提高了整体福利。

帕累托均衡/帕累托均衡/帕累托有效性

帕累托均衡(或帕累托最优)是一种资源配置状态,在这种状态下,不可能通过重新分配资源来使任何一个人变得更好而不使其他人变得更差。换句话说,任何进一步的帕累托改进都是不可能的。

在这里插入图片描述

1.2.5 作为学习和进化结果的Nash均衡

古诺-nash均衡调整

在这里插入图片描述
在这里插入图片描述

该过程只有一个Nash均衡点,因此其收敛是稳定的。
在这里插入图片描述
有BCD三个均衡点,但是C的不稳定的。
在这里插入图片描述

1.3 Nash均衡的存在性和性质

1.3.1混合均衡策略的存在性

定理1.1. 每个有限策略式博弈存在混合策略均衡
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.3.3具有连续收益的无限博弈的Nash均衡的存在性

在这里插入图片描述
在这里插入图片描述


http://www.kler.cn/a/528881.html

相关文章:

  • 如何使用SliverList组件
  • 14-9-1C++STL的set容器
  • Bash 基础与进阶实践指南
  • 【gRPC-gateway】option定义规则及HttpBody响应
  • Oracle Primavera P6自动进行进度计算
  • SQLAlchemy 2.0的简单使用教程
  • sqli-labs靶场通关
  • 深入理解Java中的String
  • 2025年1月个人工作生活总结
  • 86.(2)攻防世界 WEB PHP2
  • 14-9-1C++STL的set容器
  • Android --- CameraX讲解
  • AI开发之 ——Anaconda 介绍
  • Easy系列PLC尺寸测量功能块ST代码(激光微距仪应用)
  • 动态规划DP 背包问题 完全背包问题(题目分析+C++完整代码)
  • 算法【有依赖的背包】
  • 第26节课:内容安全策略(CSP)—构建安全网页的防御盾
  • 【MyDB】4-VersionManager 之 3-死锁及超时检测
  • 3D 对象的属性
  • plot(rrt_path(:, 1), rrt_path(:, 2), ‘b-‘, ‘LineWidth‘, 2); % 蓝色线条表示RRT路径
  • PDCA 循环法
  • 苍穹外卖第一天
  • 【股票数据API接口45】如何获取股票指历史分时MACD数据之Python、Java等多种主流语言实例代码演示通过股票数据接口获取数据
  • (9) 上:学习与验证 linux 里的 epoll 对象里的 EPOLLIN、 EPOLLHUP 与 EPOLLRDHUP 的不同
  • 深入剖析C语言字符串操作函数:my_strlen与my_strcpy
  • 【问题记录】DeepSeek本地部署遇到问题