数学物理学报, 2023, 43(3): 913-920

群体博弈与多目标群体博弈的逼近定理

王春, 杨辉,*, 杨光惠, 王国玲

贵州大学数学与统计学院 贵阳 550025; 贵州省博弈决策与控制系统重点实验室 贵阳 550025

Approximation Theorem of Population Games and Multi-objective Population Games

Wang Chun, Yang Hui,*, Yang Guanghui, Wang Guoling

College of Mathematics and Statistics, Guizhou University, Guiyang 550025; Guizhou Provincial Key Laboratory for Games Decision-Making and Control Systems, Guiyang 550025

通讯作者: *杨辉,E-mail: huiyang@gzu.edu.cn

收稿日期: 2022-04-25   修回日期: 2023-02-12  

基金资助: 国家自然科学基金(11271098)
贵州省科技计划项目(黔科合基础)([2019]1067)
贵州省教学改革项目(201908)
贵州省科技计划项目(黔科合基础)(ZK[2022]General168)

Received: 2022-04-25   Revised: 2023-02-12  

Fund supported: NSFC(11271098)
Guizhou Provincial Science and Technology Foundation([2019]1067)
Educational Reform Foundation of Guizhou Procince(201908)
Guizhou Provincial Science and Technology Projects(ZK[2022]General168)

摘要

在群体博弈和多目标群体博弈模型下, 通过策略扰动, 代理人的理性程度被进一步减弱了. 由此定义了相应的近似解, 并证明了其逼近定理. 这不仅使得其逼近过程更符合实际, 而且还完善了其 Nash 平衡状态和弱 Pareto-Nash 平衡状态求解算法的理论支撑.

关键词: 群体博弈; 有限理性; 逼近定理

Abstract

In population games and multi-objective population games, by perturbation of strategies, we relax rationality of agents further, which is represented by an approximate solution called approximate Nash equilibria and approximate weakly Pareto-Nash equilibria. And we prove their approximation theorem. They not only realistically weaken the condition of approximation theorem, but they also improve the theoretical support for the algorithm of population games.

Keywords: Population games; Bounded rationality; Approximation theorem

PDF (405KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

王春, 杨辉, 杨光惠, 王国玲. 群体博弈与多目标群体博弈的逼近定理[J]. 数学物理学报, 2023, 43(3): 913-920

Wang Chun, Yang Hui, Yang Guanghui, Wang Guoling. Approximation Theorem of Population Games and Multi-objective Population Games[J]. Acta Mathematica Scientia, 2023, 43(3): 913-920

1 引言

二十一世纪以来, 随着科学技术的飞跃发展, 人与人之间的距离越来越小, 互动越来越频繁, 作为研究群体行为和社会现象最有力工具之一的群体博弈理论, 自然而然地成为了国内外学者关注和研究的重点. 群体博弈的思想最早可追溯到 Nash 的博士论文[1], Nash 首次用其解释非合作博弈的混合策略. 1982 年, Smith 在其专著《演化与博弈论》[2]中提到, "在许多情形下, 博弈的参与者往往不只是与单一的参与者进行博弈, 而是与一个由很多参与者构成的群体或者其中的一部分进行博弈." Sandholm 在 2011 年出版的专著《群体博弈与演化动力学》[3]中系统地给出了群体博弈(群体数量庞大, 但是固定且有限的)的基本模型和演化动力学的各种形式, 并着重阐述了在这些演化动力学下群体博弈平衡状态的稳定性结果. 2017 年, 杨光惠和杨辉[4]将单目标群体博弈扩展成多目标群体博弈, 并证明了其弱 Pareto-Nash 平衡状态的存在性和稳定性. 2016 年, 杨光惠等[5]研究了多目标群体博弈加权 Nash 平衡的存在性和稳定性. 2019 年, 杨哲等[6]在群体博弈中引入了合作平衡概率, 并证明了其存在性和通有稳定性.

很多现实生活中的博弈问题都可以抽象为群体博弈模型, 其实用价值很高. 那么在这个计算机科学普及的时代, 是否可以通过设计可行且高效的算法来求解群体博弈的平衡状态呢? 逼近定理在一定程度上给出了肯定的回答. 逼近定理论证了, 一个优化问题, 在满足一定条件下, 可以通过一系列近似的优化问题来逼近, 并且在决策者本身不是完全理性的条件下, 其对应的近似解最终会收敛到原优化问题的最优解. 这为优化问题算法设计的可行性提供了系统的理论支撑, 其主要思想是有限理性思想. 1955 年, Simon[7] 首先给出了有限理性的思想, 其核心是" 满意"原则, 也就是使决策者感到满意的原则. 他认为问题本身就是近似的, 其求解方法也是近似的, 只能寻求到某种近似的解, 虽然这并不是最优解, 但这已经足够使决策者感到满意和放心. 根据 Simon 的有限理性思想, 影响决策者的决策主要有三个因素: 首先, 决策者的决策方案策略集是近似的; 其次, 选择的目标函数是近似的; 最后, 求解的计算方法也是近似的. 俞建在其专著《有限理性与博弈论中平衡点集的稳定性》[8]中首次给出了逼近定理, 证明了 $n$ 人非合作博弈问题和最优化问题的逼近定理, 为有限理性逼近完全理性的可行性提供了理论依据, 回应了 Simon 有限理性的质疑. 从实际应用的角度看, 其反映了有限理性是以完全理性作为终极目标的, 这搭起了有限理性通往完全理性的一座理论桥梁. 随后, 2018 年, 丘小玲等[9]证明了平衡问题在有限理性思想下的逼近定理, 并得到了单调平衡问题解在 Baire 分类意义下的通有唯一性和通有收敛性. 2019 年, 丘小玲和贾文生[10]证明了有限理性下变分不等式问题的逼近定理, 为变分不等式问题的算法提供了一个理论支撑. 2020 年, 丘小玲等[11]证明了在更一般的假设条件下向量平衡问题的一个逼近定理, 并得到了严格拟单调向量平衡问题解的一个通有收敛性定理. 2021 年, 陈华鑫和贾文生[12]在群体博弈模型下, 证明了相应的逼近定理, 并得到了支付函数扰动情况下群体博弈解的通有收敛性结果. 其为群体博弈平衡状态求解算法可行性提供了很好的理论支撑. 2022 年, 牟玉霜和贾文生[13]在一类不连续多目标模型下, 给出了相应的逼近定理.

值得注意的是, 逼近定理不只是为算法设计提供可行性依据, 而且还是现实生活中决策者面对各种优化问题特别贴切的缩影. 现实生活中, 由于决策能力有限或者信息不对称等诸多因素, 决策者对一个优化问题的认识和处理往往是不够完美的. 优化问题的可行策略集和支付函数可能会有偏差, 决策者对决策过程和结果的要求和执行也不是完美的, 特别是在初期面对该优化问题的时候, 尤为明显. 这些局限性正好符合逼近定理所描述的条件. 然而, 对于现有的定义的" 满意解", 我们认为还可以通过决策者选择策略的扰动偏差上得到进一步完善, 这将使得决策者的有限理性得到更充分的体现. 这样的改进思路是较为合理的. 一方面, 从计算机算法角度看, 不仅其最优值是近似的, 而且最优解也是近似的. 另一方面, 现实生活中, 面对经典的优化问题, 决策者本身在执行最优决策时也是可能会犯错误的. 尤其是, 在群体博弈中, 代理人数量特别大, 一小部分代理人在选择最优策略时犯错误是完全可能的. 在犯错误情况充分小的情况下, 这被认为是" 满意解"也应该是比较合理的.

本文在陈华鑫和贾文生[12]研究成果的基础上, 分别在群体博弈和多目标群体博弈下, 考虑其代理人在选择策略时可能会发生偶然偏移, 对代理人的有限理性再次进行减弱, 证明了其相应的逼近定理. 本文第2节是必要的基本定义和定理; 第3节在群体博弈模型下, 给出了新的近似 Nash 平衡状态的定义, 并证明了相应减弱版本的逼近定理; 第4节在多目标群体博弈模型下, 给出了新的近似弱 Pareto-Nash 平衡状态的定义, 并证明了相应的逼近定理; 第5节是简要的总结与展望.

2 基本定义与预备知识

首先引入群体博弈模型[2].

$P=\{1,2,\cdots,N\}$ 是由 $N$ 个群体组成的群体, $N\geq1$, 整个群体的代理人数量为 $m$, 其是充分大但有限的, 每个群体 $p\in P$ 的代理人个体总量份额为 $m^{p}>0,$$\forall p\in P,$$ m=\sum\limits_{p\in P}m^{p}$. 在群体 $p\in P$ 中, 每个代理人的纯策略集合为 $S^{p}=\{1,2,\cdots,s^{p}\}$, 相应的群体状态集为$X^{p}=\{x^{p}=(x^{p}_{1},\cdots,x^{p}_{s^{p}})\in{\bf R}^{s^{p}}_{+}:\ \sum\limits_{i=1}^{s^{p}}x^{p}_{i}=m^{p}\}$, 其中 $x^{p}_{i}$ 表示群体 $p$ 中选择策略 $i\in S^{p}$ 的个体份额. 令 $s=\sum\limits_{p\in P}s^{p}$, 是指所有群体全部纯策略的总数. $X=\prod\limits_{p\in P}X^{p}=\{x=(x^{1},\cdots,x^{p})\in{\bf R}^{s}_{+}:\ x^{p}\in X^{p},\forall p\in P\}$ 代表整个群体社会 $P$ 的群体状态集合, $x=(x_{1},\cdots,x_{s})\in X$ 表示一种群体状态. $F:\ X\rightarrow {\bf R}^{s}$ 是这个群体的支付函数, $\forall x\in X,\ F(x)=(F^{1}(x),\cdots,F^{p}(x))$, 其中 $\forall p\in P$, $F^{p}:\ X\rightarrow {\bf R}^{s^{p}}$ 是群体 $p$ 对于于策略集 $S^{p}$ 的支付向量, 即 $ F^{p}(x)=(F^{p}_{1}(x),\cdots,F^{p}_{s^{p}}(x)),\nonumber $ 其中 $F_{i}^{p}(x)$ 是指群体 $p$ 中代理人选择策略 $i\in S^{p}$ 的支付. 记这样的一个群体博弈为 $PG=(P,S,X,F)$.

$N=1$ 时表示单群体博弈模型, 即, 此时博弈策略集为 $S=\{1,\cdots,s\}$, 状态空间为 $X=\{x\in{\bf R}_{+}^{s}:\ \sum\limits_{i\in S}x_{i}=1\}$, 它是 ${\bf R}^{s}$ 上的单纯形.

${\bf定义2.1}$[2] 在群体博弈 $PG$ 中, 如果群体状态 $\overline{x}=(\overline{x}^{1},\cdots,\overline{x}^{N})\in X$ 满足: 对 $\forall p\in P,$ 任意 $i\in S^{p}$

$ \overline{x}_{i}^{p}>0\Rightarrow F_{i}^{p}(\overline{x})=\max\limits_{j\in S^{p}}F_{j}^{p}(\overline{x}),\nonumber $

则称 $\overline{x}\in X$ 是群体博弈 $PG$ 的 Nash 平衡状态.

${\bf定理2.1}$[2] 如果 $F:\ X\rightarrow{\bf R}^{n}$ 是连续的, 则群体博弈 $PG$$X$ 上至少存在一个 Nash 平衡状态.

其次引入多目标群体博弈[4].

$P=\{1,2,\cdots,N\}$ 是由 $N$ 个群体组成的群体, $N\geq1$, 整个群体的代理人数量为 $m$, 其是充分大但有限的, 每个群体 $p\in P$ 的代理人个体总量份额为 $m^{p}>0,\ \forall p\in P,\ m=\sum\limits_{p\in P}m^{p}$, 其每个代理人的纯策略集合为 $S^{p}=\{1,2,\cdots,s^{p}\}$, 相应的群体状态集为$X^{p}=\{x^{p}=(x^{p}_{1},\cdots,x^{p}_{s^{p}})\in{\bf R}^{s^{p}}_{+}:\ \sum\limits_{i=1}^{s^{p}}x^{p}_{i}=m^{p}\}$, 其中 $x^{p}_{i}$ 表示群体 $p$ 中选择策略 $i\in S^{p}$ 的个体份额. 令 $s=\sum\limits_{p\in P}s^{p}$, 是指所有群体全部纯策略的总数. $X=\prod\limits_{p\in P}X^{p}=\{x=(x^{1},\cdots,x^{p})\in{\bf R}^{s}_{+}:$$ x^{p}\in X^{p},\forall p\in P\}$ 代表整个群体社会 $P$ 的群体状态集合, $x=(x_{1},\cdots,x_{s})\in X$ 表示一种群体状态. 该群体中的代理人的支付目标有 $k^{p}\in {\bf N}_{+}$ 个. $F_{i}^{p}:X\rightarrow {\bf R}^{k^{p}}$ 代表的是该群体选择策略$l\in S^{p}$的一个向量值支付函数, 其中$F_{i}^{jp}\in {\bf R}$ 代表的第$j$个目标的函数, 其中 $j=1,2,\ldots,k^{p}$. $F^{p}=(F_{1}^{p},F_{2}^{p},\cdots,F_{s^{p}}^{p})':X\rightarrow {\bf R}^{s^{p}k^{p}}$ 则是该群体的向量值支付函数. 令 ${\cal N}=\sum\limits_{p\in P}s^{p}k^{p}\in {\bf N}_{+}$, 支付函数$F:X\rightarrow {\bf R}^{{\cal N}}$ 则为多目标群体博弈的支付函数. 令该多目标群体博弈为 $MPG=\{P,S,X,F,{\cal N}\}$.

${\bf定义2.2}$[4] 在多目标群体博弈 $MPG$ 中,

(1) 一个社会状态 $\overline{x}=(\overline{x}^{1},\cdots,\overline{x}^{N})\in X$ 被称为弱 Pareto-Nash 均衡状态, 如果对于每一个 $p\in P$, 任意 $i\in S^{p}$

$ \overline{x}_{i}^{p}>0 \Rightarrow F_{i}^{p}(\overline{x})-F_{l}^{p}(\overline{x})\notin -int{\bf R}_{+}^{k^{p}}, \forall l\in S^{p}.\nonumber $

(2) 一个社会状态 $\overline{x}=(\overline{x}^{1},\cdots,\overline{x}^{N})\in X$ 被称为 Pareto-Nash 均衡状态, 如果对于每一个 $p\in P$, 任意 $i\in S^{p}$

$ \overline{x}_{i}^{p}>0 \Rightarrow F_{i}^{p}(\overline{x})-F_{l}^{p}(\overline{x})\notin -{\bf R}_{+}^{k^{p}}\setminus\{0\}, \forall l\in S^{p}.\nonumber $

${\bf定理2.2}$[4] 在多目标群体博弈 $MPG$ 中,如果 $F$$X$ 是连续的, 则至少存在一个弱 Pareto-Nash 均衡状态.

${\bf引理2.1}$[8]$A_{n}$ 是度量空间 $X$ 中的一列非空有界子集, $h(A_{n},A)\rightarrow0\ (n\rightarrow\infty)$, 其中 $A$$X$ 中的一个非空紧子集, $h$$X$ 上的 Hausdorff 距离. $x_{n}\in A_{n},\ n=1,2,\cdots,$ 则存在 $\{x_{n}\}$ 的子序列 $\{x_{n_{k}}\}$, 使得 $x_{n_{k}}\rightarrow x\in A$.

以下定义和定理来自于文献[12].

${\bf定义2.3}$ 在群体博弈 $PG$ 中, 给定一个实数 $\epsilon>0$, 对于任意 $p\in P$, 任意 $i\in S^{p}$ 满足

$ \overline{x}_{i}^{p}>0\Rightarrow F_{i}^{p}(\overline{x})\geq\max\limits_{j\in S^{p}}F_{j}^{p}(\overline{x})-\epsilon,\nonumber $

则称 $\overline{x}\in X$ 是群体博弈 $PG$$\epsilon$ -近似 Nash 平衡状态.

${\bf定理2.3}$ 在群体博弈 $PG$ 中, 设 $(X,d)$ 是度量空间, 对于任意 $p\in P$, 假设下列条件成立

(i) $\forall n=1,2,\cdots,$ 任意 $j\in S^{p}$, 函数 $F_{j}^{(n)p}:\ X\rightarrow {\bf R}$ 满足 $n\rightarrow\infty$ 时有

$ \sup\limits_{x\in X}|F_{j}^{(n)p}(x)-F_{j}^{p}(x)|\rightarrow0,\nonumber $

其中, $F_{j}^{p}:\ X\rightarrow {\bf R}$ 是连续的;

(ii) $\forall n=1,2,\cdots,\ A_{n}$$X$ 中的非空子集, 且 $h(A_{n},A)\rightarrow0(n\rightarrow\infty)$, 其中 $h$$X$ 上的 Hausdorff 距离, $A$$X$ 中的一个非空紧集;

(iii) $\forall n=1,2,\cdots,\ x_{n}\in X$, 且 $d(x_{n},A_{n})\rightarrow0,$ 对于任意 $i\in S^{p}$ 满足

$ \overline{x}_{i(n)}^{p}>0\Rightarrow F_{i}^{(n)p}(x_{n})\geq\sup\limits_{j\in S^{p}}F_{j}^{(n)p}(x_{n})-\epsilon_{n},\nonumber $

其中, $\epsilon_{n}>0,$$n\rightarrow\infty$$\epsilon_{n}\rightarrow0$.

(1) 存在 $\{x_{n}\}$ 的一个收敛子列 $\{x_{n_{k}}\}$, 使得 $x_{n_{k}}\rightarrow\overline{x}\in A$;

(2) 对于任意 $p\in P$, 任意 $i\in S^{p}$$ \overline{x}_{i}^{p}>0\Rightarrow F_{i}^{p}(\overline{x})=\max\limits_{j\in S^{p}}F_{j}^{p}(\overline{x});\nonumber $

(3) 若群体博弈的 Nash 平衡状态集是单点集, 必有 $x_{n}\rightarrow\overline{x}\in A$.

3 群体博弈的逼近定理

下面我们给出近似 Nash 平衡状态(定义 2.3 )的扩展定义.

${\bf定义3.1}$ 在群体博弈 $PG$ 中, 若群体状态 $\overline{x}\in X$, 给定两个实数 $\delta\in[0,\frac{m}{s}),\ \epsilon>0$, 对于任意 $p\in P$, 任意 $i\in S^{p}$ 满足

$\begin{matrix}\label{eqnarray 3.1} \overline{x}_{i}^{p}>\delta\Rightarrow F_{i}^{p}(\overline{x})\geq\max\limits_{j\in S^{p}}F_{j}^{p}(\overline{x})-\epsilon, \end{matrix}$

则称 $\overline{x}\in X$ 是群体博弈 $PG$$(\delta,\epsilon)$ -近似 Nash 平衡状态.

${\bf注3.1}$ (1) 当 $\delta={\bf 0}$ 时, 定义 3.1 还原为定义 2.3; 当 $\delta=0,\ \epsilon=0$ 时, 定义 3.1 还原为定义 2.1.

(2) 条件 (3.1) 代表, 当 $\delta>0$ 时, 在 $(\delta,\epsilon)$ -近似 Nash 平衡状态中, 虽不少于 $m-s\delta$ 的代理人所选择的策略对应的支付都是比较接近最优支付的, 但仍存在少于 $s\delta$ 的一些代理人因为犯错误或者其他原因, 其选择的策略对应的支付偏离了最优支付. 从整个群体博弈来看, $(\delta,\epsilon)$ -近似 Nash 平衡状态可以视为在一定容忍程度下的一个" 满意"状态.

(3) 在算法设计模块下, 条件 (3.1) 代表最优值容许误差为 $\epsilon$, 最优解容许误差为 $\delta$.

${\bf定理3.1}$ 在群体博弈 $PG$ 中, 对于任意 $p\in P$, 假设下列条件成立

(i) $\forall n=1,2,\cdots,$ 任意 $j\in S^{p}$, 函数 $F_{j}^{(n)p}:\ X\rightarrow {\bf R}$ 满足 $n\rightarrow\infty$ 时有

$ \sup\limits_{x\in X}|F_{j}^{(n)p}(x)-F_{j}^{p}(x)|\rightarrow0,\nonumber $

其中, $F_{j}^{p}:\ X\rightarrow {\bf R}$ 是连续的;

(ii) $\forall n=1,2,\cdots,\ A_{n}$$X$ 中的非空子集, 且 $h(A_{n},A)\rightarrow0\ (n\rightarrow\infty)$, 其中 $h$$X$ 上的 Hausdorff 距离, $A$$X$ 中的一个非空紧集;

(iii) $\forall n=1,2,\cdots,\ x_{n}\in X$, 且 $d(x_{n},A_{n})\rightarrow0,$ 其中 $d$$R^{s}$ 上的欧氏距离函数, 对于任意 $i\in S^{p}$ 满足

$ \overline{x}_{i(n)}^{p}>\delta_{n}\Rightarrow F_{i}^{(n)p}(x_{n})\geq\max\limits_{j\in S^{p}}F_{j}^{(n)p}(x_{n})-\epsilon_{n},\nonumber $

其中, $\delta_{n}\in(0,\frac{m}{s}),\ \epsilon_{n}>0,$$n\rightarrow\infty$$\delta_{n}\rightarrow0,\ \epsilon_{n}\rightarrow0$.

(1) 存在 $\{x_{n}\}$ 的一个收敛子列 $\{x_{n_{k}}\}$, 使得 $x_{n_{k}}\rightarrow\overline{x}\in A$;

(2) 对于任意 $p\in P$, 任意 $i\in S^{p}$$ \overline{x}_{i}^{p}>0\Rightarrow F_{i}^{p}(\overline{x})=\max\limits_{j\in S^{p}}F_{j}^{p}(\overline{x});\nonumber $

(3) 若群体博弈的 Nash 平衡状态集是单点集, 必有 $x_{n}\rightarrow\overline{x}\in A$.

${\bf证}$ (1) 由于 $d(x_{n},A_{n})\rightarrow0\ (n\rightarrow\infty)$, 则存在 $x_{n}'\in A_{n},$ 使得

$d(x_{n},x_{n}')\rightarrow0;\ h(A_{n},A)\rightarrow0$

$(n\rightarrow\infty),$$A$ 是紧集, 由引理 $2.1$ 易知,

$\{x_{n}'\}$ 必有子序列 $\{x_{n_{k}}'\}$, 使得 $\{x_{n_{k}}'\}\rightarrow\overline{x}\in A$,

$\{x_{n}\}$ 必有子序列$\{x_{n_{k}}\}\rightarrow\overline{x}\in A$.

(2) 基于结论 (1), 我们不妨设 $x_{n}\rightarrow\overline{x}\in A$. 我们假设结论 (2) 不成立, 则存在 $p_{0}\in P,$$ i_{0}\in S^{p_{0}}$, 使得 $\overline{x}_{i_{0}}^{p_{0}}>0$, 但有

$ F_{i_{0}}^{p_{0}}(\overline{x})\neq\max\limits_{j\in S^{p_{0}}}F_{j}^{p_{0}}(\overline{x}).\nonumber $

即存在 $j_{0}\in S^{p_{0}}$ 使得 $ F_{i_{0}}^{p_{0}}(\overline{x})<F_{j_{0}}^{p_{0}}(\overline{x}).\nonumber $ 由于 $F_{j}^{p_{0}}$$X$ 上是连续的, 则存在一个实数 $\theta_{0}>0$, 存在 $\overline{x}$ 的一个开邻域 $O(\overline{x})$, 使得对于任意 $x'\in O(\overline{x})$, 有 $ F_{i_{0}}^{p_{0}}(x')<F_{j_{0}}^{p_{0}}(x')-\theta_{0}.\nonumber $ 因为 $\sup\limits_{x\in X}|F_{i}^{(n)p_{0}}(x)-F_{i}^{p_{0}}(x)|\rightarrow0$, 且 $\epsilon_{n}\rightarrow0$, 存在正整数 $N_{1},$ 对于任意 $n>N_{1}$, 有

$ \sup\limits_{x\in X}|F_{i}^{(n)p_{0}}(x)-F_{i}^{p_{0}}(x)|<\frac{\theta_{0}}{3},\ \mbox{且}\ \epsilon_{n}<\frac{\theta_{0}}{3}.\nonumber $

再由 $x_{n}\rightarrow\overline{x},\ n\rightarrow\infty$, 存在正整数 $N_{2}$, 当 $n>N_{2}$, 有 $x_{n}\in O(\overline{x})$. 从而, 对于任意 $n>\max\{N_{1},N_{2}\}$, 有 $ F_{i_{0}}^{p_{0}}(x_{n})<F_{j_{0}}^{p_{0}}(x_{n})-\theta_{0}.\nonumber $ 于是

$\begin{eqnarray*} F_{i_{0}}^{(n)p_{0}}(x_{n})&<&\frac{\theta_{0}}{3}+F_{i_{0}}^{p_{0}}(x_{n}) <F_{j_{0}}^{p_{0}}(x_{n})-\frac{2\theta_{0}}{3}\nonumber\\ &<&F_{j_{0}}^{(n)p_{0}}(x_{n})-\frac{\theta_{0}}{3} <\max\limits_{j\in S^{p_{0}}}F_{j}^{(n)p_{0}}(x_{n})-\epsilon_{n}.\nonumber \end{eqnarray*}$

因为 $x_{n}\rightarrow x,\ x_{i_{0}}^{p0}>0$, 且 $\delta_{n}\rightarrow0\ (n\rightarrow\infty)$, 所以存在正整数 $N_{3}$, 使得 $\overline{x}_{i_{0}(n)}^{p_{0}}>\delta_{n}$. 则当$n>\max\{N_{1}, N_{2},N_{3}\}$ 时, 与条件 (iii) 矛盾.

(3) 如果结论 (3) 不成立, 则存在 $\theta>0$$\{x_{n}\}$ 的一个子序列 $\{x_{n_{k}}\}$, 使得 $d(x_{n_{k}},\overline{x})\geq\theta$, 序列 $\{x_{n_{k}}\}$ 又必有收敛子序列, 不妨设 $x_{n_{k}}\rightarrow x'$.$d(x_{n_{k}},x')\rightarrow0,\ x'\in A$ 且也是该群体博弈的 Nash 平衡状态, 由于该群体博弈的 Nash 平衡状态集是单点集, 故有$x'\neq\overline{x}$, 则$d(x_{n_{k}},x')\geq\theta$矛盾.

证毕.

${\bf注3.2}$$\delta=0$ 时, 定理 3.1 将还原为定理 2.3.

4 多目标群体博弈的逼近定理

下面我们给出多目标群体博弈近似弱 Pareto-Nash 平衡状态的定义.

${\bf定义4.1}$ 在多目标群体博弈 $MPG$ 中, 若群体状态 $\overline{x}\in X,\ \forall p\in P$, 给定一个实数 $\delta\in[0,\frac{m}{s}), $ 一个正实数向量$\varepsilon=\{\varepsilon^{1},\cdots,\varepsilon^{N}\}$, 其中 $\varepsilon^{p}=(\varepsilon^{1p},\cdots,\varepsilon^{k^{p}p}),$ 任意 $p\in P,$ 任意 $i\in S^{p}$ 满足

$\begin{matrix}\label{eqnarray 4.1} \overline{x}_{i}^{p}>\delta\Rightarrow F_{i}^{p}(\overline{x})-F_{j}^{p}(\overline{x})\notin -int{\bf R}_{+}^{k^{p}}-\varepsilon^{p},\ \forall j\in S^{p}, \end{matrix} $

则称 $\overline{x}\in X$ 是多目标群体博弈 $MPG$$(\delta,\varepsilon)$ -近似弱 Pareto-Nash 平衡状态.

${\bf注4.1}$ (1) 当 $\delta=0,\ \varepsilon=0$ 时, 定义 4.1 还原为定义 2.2.

(2) 条件 (4.1) 代表, 当 $\delta>0$ 时, 在 $(\delta,\varepsilon)$ - 近似弱Pareto-Nash 平衡状态中, 虽不少于 $m-s\delta$ 的代理人所选择的策略对应的支付向量都是在其弱Pareto 有效集附近的, 但仍存在少于 $s\delta$ 的一些代理人因为犯错误或者其他原因, 其选择的策略对应的支付向量偏离了其弱 Pareto 有效集. 从整个多目标群体博弈来看, $(\delta,\varepsilon)$ -近似弱 Pareto-Nash 平衡状态可以视为在一定容忍程度下的一个" 满意"状态.

(3) 在算法设计模块下, 条件 (4.1) 代表最优值向量容许误差为 $\varepsilon$, 最优解容许误差为 $\delta$.

${\bf定理4.1}$ 在多目标群体博弈 $MPG$ 中, 对于任意 $p\in P$, 假设下列条件成立

(i) $\forall n=1,2,\cdots,\ t=1,2,\cdots,k^{p}$, 任意 $j\in S^{p}$, 函数 $F_{j}^{(n)tp}:\ X\rightarrow {\bf R}$ 满足 $n\rightarrow\infty$ 时有

$ \sup\limits_{x\in X}|F_{j}^{(n)tp}(x)-F_{j}^{tp}(x)|\rightarrow0,\nonumber $

其中, $F_{j}^{tp}:\ X\rightarrow {\bf R}$ 是连续的;

(ii) $\forall n=1,2,\cdots,\ A_{n}$$X$ 中的非空子集, 且 $h(A_{n},A)\rightarrow0\ (n\rightarrow\infty)$, 其中 $h$$X$ 上的 Hausdorff 距离, $A$$X$ 中的一个非空紧集;

(iii) $\forall n=1,2,\cdots,\ x_{n}\in X$, 且 $d(x_{n},A_{n})\rightarrow0,$ 其中 $d$$R^{s}$ 上的欧氏距离函数, 对于任意 $p\in P,$ 任意 $i\in S^{p},$ 满足

$ \overline{x}_{i(n)}^{p}>\delta_{n}\Rightarrow F_{i}^{(n)p}(x_{n})-F_{j}^{(n)p}(x_{n})\notin-int{\bf R}_{+}^{k^{p}}-\varepsilon^{p}_{n},\ \forall j\in S^{p},\nonumber $
其中, $\delta_{n}\in(0,\frac{m}{s}),\ \varepsilon^{tp}_{n}>0,\ t=1,2,\cdots,k^{p},$ 且 $n\rightarrow\infty$ 时 $\delta_{n}\rightarrow0,\ \varepsilon^{tp}_{n}\rightarrow0$.

(1) 存在 $\{x_{n}\}$ 的一个收敛子列 $\{x_{n_{k}}\}$, 使得 $x_{n_{k}}\rightarrow\overline{x}\in A$;

(2) 对于任意 $p\in P$, 任意 $i\in S^{p}$, 有

$ \overline{x}_{i}^{p}>0\Rightarrow F_{i}^{p}(\overline{x})-F_{j}^{p}(\overline{x})\notin-int{\bf R}_{+}^{k^{p}},\ \forall j\in S^{p};\nonumber $

(3) 若多目标群体博弈的弱 Pareto-Nash 平衡状态集是单点集, 必有 $x_{n}\rightarrow\overline{x}\in A$.

${\bf证}$ (1) 证明类似于定理 3.1 的结论 (1).

(2) 基于结论 (1), 我们不妨设 $x_{n}\rightarrow\overline{x}\in A$. 我们假设结论 (2) 不成立, 则存在 $p_{0}\in P,$$ i_{0}\in S^{p_{0}}$, 使得 $\overline{x}_{i_{0}}^{p_{0}}>0$, 但存在 $j_{0}\in S^{p_{0}}$

$ F_{i_{0}}^{p_{0}}(\overline{x})-F_{j_{0}}^{p_{0}}(\overline{x})\in -int{\bf R}_{+}^{k^{p_{0}}}.\nonumber $

即对于任意 $t=1,2,\cdots,k^{p_{0}}$

$ F_{i_{0}}^{tp_{0}}(\overline{x})<F_{j_{0}}^{tp_{0}}(\overline{x}).\nonumber $

由于 $F_{j}^{tp_{0}}$$X$ 上是连续的, 则存在一个实数 $\theta_{0}>0$, 存在 $\overline{x}$ 的一个开邻域 $O(\overline{x})$, 使得对于任意 $x'\in O(\overline{x})$, 有

$ F_{i_{0}}^{tp_{0}}(x')<F_{j_{0}}^{tp_{0}}(x')-\theta_{0}.\nonumber $

因为 $\sup\limits_{x\in X}|F_{i}^{(n)tp_{0}}(x)-F_{i}^{tp_{0}}(x)|\rightarrow0$, 且 $\varepsilon^{tp_{0}}_{n}\rightarrow0$, 存在正整数 $N_{t1},$ 对于任意 $n>N_{t1}$, 有

$ \sup\limits_{x\in X}|F_{i}^{(n)tp_{0}}(x)-F_{i}^{tp_{0}}(x)|<\frac{\theta_{0}}{3},\ \mbox{且}\ \varepsilon^{tp_{0}}_{n}<\frac{\theta_{0}}{3}.\nonumber $

再由 $x_{n}\rightarrow\overline{x},\ n\rightarrow\infty$, 存在正整数 $N_{t2}$, 当 $n>N_{t2}$, 有 $x_{n}\in O(\overline{x})$. 从而, 对于任意 $n>\max\{N_{t1},N_{t2}\}$, 有 $ F_{i_{0}}^{tp_{0}}(x_{n})<F_{j_{0}}^{tp_{0}}(x_{n})-\theta_{0}.\nonumber $ 于是

$\begin{eqnarray*} F_{i_{0}}^{(n)tp_{0}}(x_{n})&<&\frac{\theta_{0}}{3}+F_{i_{0}}^{tp_{0}}(x_{n}) <F_{j_{0}}^{tp_{0}}(x_{n})-\frac{2\theta_{0}}{3}\nonumber\\ &<&F_{j_{0}}^{(n)tp_{0}}(x_{n})-\frac{\theta_{0}}{3} <\max\limits_{j\in S^{p_{0}}}F_{j}^{(n)tp_{0}}(x_{n})-\varepsilon^{tp_{0}}_{n}.\nonumber \end{eqnarray*}$

因为 $x_{n}\rightarrow x,\ x_{i_{0}}^{p0}>0$, 且 $\delta_{n}\rightarrow0(n\rightarrow\infty)$, 所以存在正整数 $N_{t3}$, 使得 $\overline{x}_{i_{0}(n)}^{p_{0}}>\delta_{n}$. 则当$n>\max\{N_{t1},N_{t2},N_{t3}\}$ 时有

$ F_{i_{0}}^{(n)tp_{0}}(\overline{x})<F_{j_{0}}^{(n)tp_{0}}(\overline{x})-\varepsilon^{tp_{0}}_{n}.\nonumber $

于是当 $n>\max\limits_{t=1,2,\cdots,k^{p_{0}}}\{N_{t1},N_{t2},N_{t3}\}$ 时有

$ F_{i_{0}}^{(n)p_{0}}(\overline{x})-F_{j_{0}}^{(n)p_{0}}(\overline{x})\in -int{\bf R}_{+}^{k^{p_{0}}}-\varepsilon^{p_{0}}_{n}.\nonumber $

这与条件 (iii) 矛盾.

(3) 证明类似于定理 3.1 的结论 (2).

证毕.

5 总结

本文定义了在一定程度上更合适的"满意"群体状态, 即 $(\delta,\epsilon)$ -近似 Nash 平衡状态(定义 3.1) 和 $(\delta,\varepsilon)$ -近似弱 Pareto-Nash 平衡状态(定义 4.1), 并证明了相应的逼近定理(定理 3.1 和定理 4.1). 其近似 Nash 平衡状态和近似弱 Pareto-Nash 平衡状态是对代理人有限理性的进一步减弱, 更加的符合实际情况. 相应的逼近定理论证了在这样的情况下, 最终的结果仍然是向着完全理性靠近的. 也进一步完善了其对算法设计可行性的理论支撑.

显然, 即使是考虑相应的"满意"回应决策规则, 最优回应的决策规则还是太过理性. 其往往要求决策者对问题本身有特别全面的认识和掌握. 显然, 在决策者初期阶段, 这样的要求过于苛刻, 也比较偏离实际. 后续我们将从决策者的决策规则入手, 在使其符合实际情况的同时, 进一步减弱决策规则的理性要求, 并为 Nash 平衡的求解算法的其他思路提供理论支撑, 期望可以在提高算法的效率上提供一些理论依据.

参考文献

Nash Jr J. Non-cooperative games[M]//Essays on Game Theory. Edward Elgar Publishing, 1996: 22-33

[本文引用: 1]

Smith M. Evolution and the Theory of Games. Cambridge: Cambridge University Press, 1982

[本文引用: 4]

Sandholm W H. Population Games and Evolutionary Dynamics. London: MIT Press, 2011

[本文引用: 1]

Yang G H, Yang H.

Stability of weakly Pareto-Nash equilibria and Pareto-Nash equilibria for multiobjective population games

Set-Valued and Variational Analysis, 2017, 25(2): 427-439

DOI:10.1007/s11228-016-0391-6      URL     [本文引用: 4]

Yang G H, Yang H, Song Q Q.

Stability of weighted Nash equilibrium for multiobjective population games

The Journal of Nonlinear Sciences and Applications, 2016, 9(6): 4167-4176

DOI:10.22436/jnsa      URL     [本文引用: 1]

Yang Z, Zhang H Q.

Essential stability of cooperative equilibria for population games

Optimization Letters, 2019, 13(7): 1573-1582

DOI:10.1007/s11590-018-1303-5      [本文引用: 1]

In this paper, we first introduce the notion of cooperative equilibria for population games and prove its existence theorem by Proposition 2 in Kajii (J Econ Theory 56:194-205, 1992). We next identify a residual dense subclass of population games whose cooperative equilibria are all essential. Moreover, we show the existence of essential components of the cooperative equilibrium set by proving the connectivity of minimal essential sets of the cooperative equilibrium set.

Simon H A. 现代决策理论的基石. 杨砾等译. 北京: 北京经济学院出版社, 1989

[本文引用: 1]

Simon H A. The Cornerstone of Modern Decision Theory. Translated by Yang L, et al. Beijing: Beijing Institute of Economics Press, 1989

[本文引用: 1]

俞建. 有限理性与博弈论中平衡点集的稳定性. 北京: 科学出版社, 2017

[本文引用: 2]

Yu J. Bounded Rationality and Stability of Equilibrium Set in Game Theory. Beijing: Science Press, 2017

[本文引用: 2]

Qiu X L, Jia W S, Peng, D T.

An approximation theorem and generic convergence for equilibrium problems

Journal of Inequalities and Applications, 2018, 30: 1-12

[本文引用: 1]

丘小玲, 贾文生.

有限理性下变分不等式的逼近定理

数学物理学报, 2019, 39(4): 730-737

[本文引用: 1]

Qiu X L, Jia W S.

Approximation theorem of variational inequality under bounded rationality

Acta Mathematica Scientia, 2019, 39(4): 730-737

[本文引用: 1]

Jia W S, Qiu X L, Peng D T.

An approximation theorem for vector equilibrium problems under bounded rationality

Mathematics, 2020, 45: 1-9

[本文引用: 1]

陈华鑫, 贾文生.

群体博弈的逼近定理及通有收敛性

数学物理学报, 2021, 41(5): 1566-1573

[本文引用: 3]

Chen H X, Jia W S.

Approximation Theorem and General Convergence of Population Games

Acta Mathematica Scientia, 2021, 41(5): 1566-1573

[本文引用: 3]

牟玉霜, 贾文生.

不连续多目标博弈的逼近定理

江西师范大学学报(自然科学版), 2022, 46(6): 606-609

[本文引用: 1]

Mou Y H, Jia W S.

The approximation theorem for discontinuous multiobjective games

Journal of Jiangxi Normal University (Natural Science), 2022, 46(6): 606-609

[本文引用: 1]

/