群体博弈与多目标群体博弈的逼近定理
Approximation Theorem of Population Games and Multi-objective Population Games
通讯作者:
收稿日期: 2022-04-25 修回日期: 2023-02-12
基金资助: |
|
Received: 2022-04-25 Revised: 2023-02-12
Fund supported: |
|
在群体博弈和多目标群体博弈模型下, 通过策略扰动, 代理人的理性程度被进一步减弱了. 由此定义了相应的近似解, 并证明了其逼近定理. 这不仅使得其逼近过程更符合实际, 而且还完善了其 Nash 平衡状态和弱 Pareto-Nash 平衡状态求解算法的理论支撑.
关键词:
In population games and multi-objective population games, by perturbation of strategies, we relax rationality of agents further, which is represented by an approximate solution called approximate Nash equilibria and approximate weakly Pareto-Nash equilibria. And we prove their approximation theorem. They not only realistically weaken the condition of approximation theorem, but they also improve the theoretical support for the algorithm of population games.
Keywords:
本文引用格式
王春, 杨辉, 杨光惠, 王国玲.
Wang Chun, Yang Hui, Yang Guanghui, Wang Guoling.
1 引言
二十一世纪以来, 随着科学技术的飞跃发展, 人与人之间的距离越来越小, 互动越来越频繁, 作为研究群体行为和社会现象最有力工具之一的群体博弈理论, 自然而然地成为了国内外学者关注和研究的重点. 群体博弈的思想最早可追溯到 Nash 的博士论文[1], Nash 首次用其解释非合作博弈的混合策略. 1982 年, Smith 在其专著《演化与博弈论》[2]中提到, "在许多情形下, 博弈的参与者往往不只是与单一的参与者进行博弈, 而是与一个由很多参与者构成的群体或者其中的一部分进行博弈." Sandholm 在 2011 年出版的专著《群体博弈与演化动力学》[3]中系统地给出了群体博弈(群体数量庞大, 但是固定且有限的)的基本模型和演化动力学的各种形式, 并着重阐述了在这些演化动力学下群体博弈平衡状态的稳定性结果. 2017 年, 杨光惠和杨辉[4]将单目标群体博弈扩展成多目标群体博弈, 并证明了其弱 Pareto-Nash 平衡状态的存在性和稳定性. 2016 年, 杨光惠等[5]研究了多目标群体博弈加权 Nash 平衡的存在性和稳定性. 2019 年, 杨哲等[6]在群体博弈中引入了合作平衡概率, 并证明了其存在性和通有稳定性.
很多现实生活中的博弈问题都可以抽象为群体博弈模型, 其实用价值很高. 那么在这个计算机科学普及的时代, 是否可以通过设计可行且高效的算法来求解群体博弈的平衡状态呢? 逼近定理在一定程度上给出了肯定的回答. 逼近定理论证了, 一个优化问题, 在满足一定条件下, 可以通过一系列近似的优化问题来逼近, 并且在决策者本身不是完全理性的条件下, 其对应的近似解最终会收敛到原优化问题的最优解. 这为优化问题算法设计的可行性提供了系统的理论支撑, 其主要思想是有限理性思想. 1955 年, Simon[7] 首先给出了有限理性的思想, 其核心是" 满意"原则, 也就是使决策者感到满意的原则. 他认为问题本身就是近似的, 其求解方法也是近似的, 只能寻求到某种近似的解, 虽然这并不是最优解, 但这已经足够使决策者感到满意和放心. 根据 Simon 的有限理性思想, 影响决策者的决策主要有三个因素: 首先, 决策者的决策方案策略集是近似的; 其次, 选择的目标函数是近似的; 最后, 求解的计算方法也是近似的. 俞建在其专著《有限理性与博弈论中平衡点集的稳定性》[8]中首次给出了逼近定理, 证明了
值得注意的是, 逼近定理不只是为算法设计提供可行性依据, 而且还是现实生活中决策者面对各种优化问题特别贴切的缩影. 现实生活中, 由于决策能力有限或者信息不对称等诸多因素, 决策者对一个优化问题的认识和处理往往是不够完美的. 优化问题的可行策略集和支付函数可能会有偏差, 决策者对决策过程和结果的要求和执行也不是完美的, 特别是在初期面对该优化问题的时候, 尤为明显. 这些局限性正好符合逼近定理所描述的条件. 然而, 对于现有的定义的" 满意解", 我们认为还可以通过决策者选择策略的扰动偏差上得到进一步完善, 这将使得决策者的有限理性得到更充分的体现. 这样的改进思路是较为合理的. 一方面, 从计算机算法角度看, 不仅其最优值是近似的, 而且最优解也是近似的. 另一方面, 现实生活中, 面对经典的优化问题, 决策者本身在执行最优决策时也是可能会犯错误的. 尤其是, 在群体博弈中, 代理人数量特别大, 一小部分代理人在选择最优策略时犯错误是完全可能的. 在犯错误情况充分小的情况下, 这被认为是" 满意解"也应该是比较合理的.
本文在陈华鑫和贾文生[12]研究成果的基础上, 分别在群体博弈和多目标群体博弈下, 考虑其代理人在选择策略时可能会发生偶然偏移, 对代理人的有限理性再次进行减弱, 证明了其相应的逼近定理. 本文第2节是必要的基本定义和定理; 第3节在群体博弈模型下, 给出了新的近似 Nash 平衡状态的定义, 并证明了相应减弱版本的逼近定理; 第4节在多目标群体博弈模型下, 给出了新的近似弱 Pareto-Nash 平衡状态的定义, 并证明了相应的逼近定理; 第5节是简要的总结与展望.
2 基本定义与预备知识
首先引入群体博弈模型[2].
设
当
则称
其次引入多目标群体博弈[4].
设
(1) 一个社会状态
(2) 一个社会状态
以下定义和定理来自于文献[12].
则称
(i)
其中,
(ii)
(iii)
其中,
则
(1) 存在
(2) 对于任意
(3) 若群体博弈的 Nash 平衡状态集是单点集, 必有
3 群体博弈的逼近定理
下面我们给出近似 Nash 平衡状态(定义 2.3 )的扩展定义.
则称
(2) 条件 (3.1) 代表, 当
(3) 在算法设计模块下, 条件 (3.1) 代表最优值容许误差为
(i)
其中,
(ii)
(iii)
其中,
则
(1) 存在
(2) 对于任意
(3) 若群体博弈的 Nash 平衡状态集是单点集, 必有
故
(2) 基于结论 (1), 我们不妨设
即存在
再由
因为
(3) 如果结论 (3) 不成立, 则存在
证毕.
4 多目标群体博弈的逼近定理
下面我们给出多目标群体博弈近似弱 Pareto-Nash 平衡状态的定义.
则称
(2) 条件 (4.1) 代表, 当
(3) 在算法设计模块下, 条件 (4.1) 代表最优值向量容许误差为
(i)
其中,
(ii)
(iii)
则
(1) 存在
(2) 对于任意
(3) 若多目标群体博弈的弱 Pareto-Nash 平衡状态集是单点集, 必有
(2) 基于结论 (1), 我们不妨设
即对于任意
由于
因为
再由
因为
于是当
这与条件 (iii) 矛盾.
(3) 证明类似于定理 3.1 的结论 (2).
证毕.
5 总结
本文定义了在一定程度上更合适的"满意"群体状态, 即
显然, 即使是考虑相应的"满意"回应决策规则, 最优回应的决策规则还是太过理性. 其往往要求决策者对问题本身有特别全面的认识和掌握. 显然, 在决策者初期阶段, 这样的要求过于苛刻, 也比较偏离实际. 后续我们将从决策者的决策规则入手, 在使其符合实际情况的同时, 进一步减弱决策规则的理性要求, 并为 Nash 平衡的求解算法的其他思路提供理论支撑, 期望可以在提高算法的效率上提供一些理论依据.
参考文献
Stability of weakly Pareto-Nash equilibria and Pareto-Nash equilibria for multiobjective population games
DOI:10.1007/s11228-016-0391-6 URL [本文引用: 4]
Stability of weighted Nash equilibrium for multiobjective population games
DOI:10.22436/jnsa URL [本文引用: 1]
Essential stability of cooperative equilibria for population games
DOI:10.1007/s11590-018-1303-5
[本文引用: 1]
In this paper, we first introduce the notion of cooperative equilibria for population games and prove its existence theorem by Proposition 2 in Kajii (J Econ Theory 56:194-205, 1992). We next identify a residual dense subclass of population games whose cooperative equilibria are all essential. Moreover, we show the existence of essential components of the cooperative equilibrium set by proving the connectivity of minimal essential sets of the cooperative equilibrium set.
An approximation theorem and generic convergence for equilibrium problems
有限理性下变分不等式的逼近定理
Approximation theorem of variational inequality under bounded rationality
An approximation theorem for vector equilibrium problems under bounded rationality
群体博弈的逼近定理及通有收敛性
Approximation Theorem and General Convergence of Population Games
/
〈 |
|
〉 |
