1 引言
群体博弈模型是Sandholm[1 ] 根据John Nash[2 ] 博士论文中对混合策略的"Mass Action"的思想建立的. 群体博弈是以代理人数量巨大且有限的群体为研究对象, 群体中的代理人具有相同的策略集, 代理人通过策略的选择形成了群体状态间接的对所有群体状态产生影响. 当每个群体中的所有代理人收益达到最大时, 代理人就没有改变策略的动机, 进而达到了一个群体均衡. 该模型被广泛的应用于交通拥堵问题、生物学、经济学和社会学中具有大量个体策略交互的实际问题中. 主从博弈是Stackelberg[3 ] 提出的一个经济模型, 是指具有两类决策者:具有较高决策层的领导者和下级决策的跟随者的博弈模型. 该模型通常用于解决一方处于支配的行业竞争问题, 被广泛应用于经济学、管理学及其他社会科学中.
另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性.
在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性.
因此, 受到文献[14 ,19 -20 ]研究的启发, 在一主多从群体博弈模型下, 群体跟随者之间同样会受到利益的驱动而进行合作, 所以本文首先在主从群体博弈模型下引入合作均衡的概念, 并应用最值存在定理和文献[命题2], 证明了主从群体博弈合作均衡的存在性. 最后定义了主从群体博弈的本质合作均衡和本质主从群体博弈, 应用Fort定理证明了在Baire分类意义下, 得到在支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是通有稳定的.
2 预备知识
$\Gamma=\{{\cal P},X,f,\{Y^{k}\}_{k\in{\cal P}},\{G^{k}\}_{k\in{\cal P}}\}, $
其中有一个领导者, $X$ 为领导者的策略集, $K$ 个群体跟随者构成的群体集合为${\cal P}=\{1,2,\cdots,$ $K\}$ , 每个群体$k\in{\cal P}$ 中的跟随者数量巨大且是有限的记为$m^{k}>0$ , 群体$k$ 中的跟随者具有相同的纯策略集$S^{k}=\{1,2,\cdots,n^{k}\}$ , 其中$n^{k}$ 表示第$k$ 个群体纯策略的个数, 所有群体的所有纯策略总数记为$n=\sum\limits_{k\in {\cal P}}n^{k}$ . 群体$k$ 的群体状态为
$ Y^{k}=\bigg\{y^{k}=(y^{k}_{1},y^{k}_{2},\cdots,y^{k}_{n^{k}})\in R^{n^{k}}_{+}|\sum\limits_{i\in S^{k}}y^{k}_{i}=m^{k}\bigg\},$
其中$\forall l\in N_{+}$ 有$R^{l}_{+}=\{a=(a_{1},a_{2},\cdots,a_{l})\in R^{l}|a_{i}\geq 0,i=1,\cdots,l)\}$ . $y^{k}$ 的分量$y^{k}_{i}\in R_{+}$ 表示群体$k$ 中选取策略$i\in S^{k}$ 的代理人人数. 社会状态集合
$Y=\prod\limits_{k\in {\cal P}}Y^{k}=\{y=(y^{1},y^{2},\cdots,y^{K})\in R^{n}|y^{k}\in Y^{k}\}, $
其中$y=(y^{1},y^{2},\cdots,y^{K})$ 描述了整个群体跟随者的群体行为.
$f:X\times R^{n}_{+}\rightarrow R$ 表示领导者的支付函数. $\forall k\in {\cal P},\forall i\in S^{k},G^{k}_{i}:X\times R^{n}_{+}\rightarrow R$ 表示群体跟随者$k$ 在选择策略$i$ 时的支付函数. 群体跟随者$k$ 的支付函数为$G^{k}=(G^{k}_{1},G^{k}_{2},\cdots,G^{k}_{n^{k}}):X\times R^{n}_{+}\rightarrow R^{n^{k}}.$ $G=(G^{1},G^{2},\cdots,G^{K}):X\times R^{n}_{+}\rightarrow R^{n}$ 为整个跟随者群体的支付函数.
假设群体跟随者间有合作行为, 因此对每个群体跟随者联盟$S\subseteq {\cal P}$ , $\hat{Z}_{S}$ 是联盟$S$ 的可行状态集
$\hat{Z}_{S}=\bigg\{y_{S}\in \prod \limits _{k\in S}R_{+}^{n^{k}}|\sum \limits _{k\in S}\sum \limits _{i\in S^{k}}y^{k}_{i}=\sum \limits _{k\in S}m^{k}\bigg\}.$
在该模型中, 领导者先做出决策$x\in X$ , 下面$k$ 个群体跟随者观察到领导者的行动后, 群体跟随者进行一个含有参数$x$ 的群体博弈. 由文献[20 ]中群体合作均衡定义知, $\overline{y}\in R^{n}_{+}$ 是群体跟随者合作均衡, 如果:$\overline{y}\in \hat{Z}_{{\cal P}}$ 且$\forall S\subseteq {\cal P},$ 不存在$z_{S}\in \hat{Z}_{S}$ 使得
$(z_{S})^{k}G^{k}(x,\overline{y})> \overline{y}^{k}G^{k}(x,\overline{y}),\forall k\in S.$
显然群体跟随者的合作均衡集合依赖于领导者选取的决策$x$ , 记为${\cal LC}(x)$ , 由$x$ 到${\cal LC}(x)$ 定义了一个集值映射${\cal LC}:X\rightarrow \hat{Z}_{{\cal P}}$ , 将其称为下层群体跟随者的反映函数.
领导者要实现其自身的利益最大化, 故首先领导者要求$\max\limits_{y\in {\cal LC}(x)}f(x,y)$ , 同时要求$\max\limits_{x\in X}[\max\limits_{y\in {\cal LC}(x)}f(x,y)]$ . 从而可以给出一个领导者和$K$ 个群体跟随者构成的主从群体博弈模型合作均衡的定义。
${\bf定义2.1}$ 称$(\bar{x},\bar{y})\in X \times \hat{Z}_{P}$ 为主从群体博弈$\Gamma=\{{\cal P},X,f,\{Y^{k}\}_{k\in{\cal P}},\{G^{k}\}_{k\in{\cal P}}\}$ 的合作均衡, 如满足
(1) $\max\limits_{y\in {\cal LC}(\bar{x})}f(\bar{x},y)=\max\limits_{x\in X}\max\limits_{y\in{\cal LC}(x)}f(x,y);$
(2) $\bar{y}\in {\cal LC}(\overline{x})$ 且 $f(\bar{x},\bar{y})=\max\limits_{y\in {\cal LC}(\bar{x})}f(\bar{x},y).$
${\bf引理2.1}$ [23 ] 设$F:X\rightarrow P_{0}(Y)$ 是一个集值映射, $F$ 的图定义为
$graph(F)=\{(x,y)\in X\times Y:y\in F(x)\}.$
如果$graph(F)$ 是$X\times Y$ 中的闭集, 则称集值映射$F$ 是闭的.
${\bf引理2.2}$ [23 ] 若$Y$ 是$R^{n}$ 中的有界闭集, 集值映射$F:X\rightarrow P_{0}(Y)$ 上是闭的, 则$F$ 在$X$ 上必是上半连续的.
${\bf引理2.3}$ [21 ] 设$X$ 和$Y$ 是两个度量空间, $\{A_{m}\}^{+\infty}_{m=1}$ 是一紧序列, $\{y_{m}\}^{+\infty}_{m=1}$ 是$Y$ 中一序列, $\{\varphi_{m}(x,y)\}^{+\infty}_{m=1}$ 是$X\times Y$ 上一连续函数列, 如果$A_{m}\rightarrow A$ 且$A$ 紧, $y_{m}\rightarrow y\in Y$ 且
$\sup\limits_{(x,y)\in X\times Y}|\varphi_{m}(x,y)-\varphi(x,y)|\rightarrow 0,$
这里$\varphi(x,y)$ 是$X\times Y$ 上的连续函数, 则
$\max\limits_{x\in A_{m}}\varphi_{m}(x,y_{m})\rightarrow \max\limits_{x\in A}\varphi_{m}(x,y).$
${\bf定理2.1}$ [22 ] (Fort定理) 设X是一个完备度量空间, $Y$ 是一个度量空间, 集值映射$F:X\rightarrow P_{0}(Y)$ 满足$\forall x\in X,F(x)$ 是$Y$ 中的非空紧集, 且$F$ 在$x$ 是上半连续的, 则存在$X$ 中的一个第二纲的稠密剩余集$Q$ , 使$\forall x\in Q$ , 集值映射$F$ 在$x$ 下半连续.
3 合作均衡存在性定理
${\bf定理3.1}$ 假设主从群体博弈$\Gamma=\{{\cal P},X,f,\{Y^{k}\}_{k\in{\cal P}},\{G^{k}\}_{k\in{\cal P}}\}$ 满足下面的条件
(i) $X$ 是$R^{N}$ 空间中的非空凸紧集;
(ii) $f:X\times R^{n}_{+}\rightarrow R$ 在$X\times R^{n}_{+}$ 上连续;
(iii) $G^{k}_{i}:X\times R^{n}_{+}\rightarrow R$ 在$X\times R^{n}_{+}$ 上连续.
${\bf证}$ 首先定义$R^{n}_{+}$ 中的一个有界闭集, 设$a\in R_{+}$ 满足$a>\sum \limits_{k\in {\cal P}}m^{k}$ , $Y^{k}_{a}=\{y^{k}\in R^{n^{k}}_{+}|y^{k}_{i}\leq a,$ $\forall i\}$ , $Y_{a}=\prod \limits_{k\in {\cal P}} Y^{k}_{a}$ . 构造一个群体跟随者的合作均衡对应, $\forall x\in X$ 和$\forall k\in {\cal P}$ 定义一个集值映射$F^{k}(x,\cdot):Y_{a}\rightarrow Y_{a}$ , 且
$F^{k}(x,y)=\{z\in Y_{a}| z^{k}G^{k}(x,y)>y^{k}G^{k}(x,y)\}.$
下面验证含有参数$x$ 的广义群体跟随者博弈$\{{\cal P},(Y^{k}_{a},F^{k})_{k\in{\cal P}},(\widehat{Z}_{S})_{S\in{\cal P}}\}$ 满足文献[命题2]的假设(A-1)-(A-4).
(1) $\forall k\in {\cal P}$ , $Y^{k}_{a}$ 是一个非空紧凸集, 所以满足假设(A-1).
(2)下面证$F^{k}(x,\cdot)$ 的图是开的, 即证$graphF^{k}(x,\cdot)$ 的余集 $graphF^{k}(x,\cdot)^{C}=\{(y,z)\in Y_{a}\times Y_{a},z\notin F^{k}(x,y)\}$ 是闭集. 假设$\{(y_{n},z_{n})\}$ 是$Y_{a}\times Y_{a}$ 中的一个序列, 满足$(y_{n},z_{n})\rightarrow(y,z)$ 和$z_{n}\notin F^{k}(x,y_{n})$ , 下面只需要验证$z\notin F^{k}(x,y)$ . 运用反证法, 假设$z\in F^{k}(x,y)$ , 则$z\in Y_{a}$ 且
$z^{k}G^{k}(x,y)> y^{k}G^{k}(x,y),\forall k\in{\cal P},$
由于$(y_{n},z_{n})\rightarrow(y,z)$ 且$G^{k}(x,y)$ 是连续的, 所以当$n$ 充分大时, 有
$(z_{n})^{k}G^{k}(x,y_{n})> (y_{n})^{k}G^{k}(x,y_{n}).$
显然与$z_{n}\notin F^{k}(x,y_{n})$ 矛盾, 因此$F^{k}(x,\cdot)$ 的图是开的. 显然$F^{k}(x,\cdot)$ 是凸的. 所以假设(A-2)成立.
(3) $\forall S\subseteq {\cal P}$ , $\forall y \in Y_{a}$ , $\widehat{Z}_{S}$ 与$y$ 无关, 所以假设(A-3)成立.
(4)由文献[20 ]定理2.2知, 显然满足假设(A-4).
所以存在$y\in Y_{a}$ 使得$y\in \widehat{Z}_{{\cal P}}$ , 并且$\forall S\subseteq {\cal P}$ , 都不存在$z_{S}\in \widehat{Z}_{S}$ 满足
$(z_{S})^{k}G^{k}(x,y)> y^{k}G^{k}(x,y),\forall k\in{\cal P}.$
因此$y\in {\cal LC}(x)$ , 即${\cal LC}(x)$ 非空.
而$Y_{a}$ 为$R^{n}_{+}$ 中的非空有界闭集, 由引理2.2知要证明集值映射${\cal LC}:X\rightarrow \hat{Z}_{{\cal P}}$ 是上半连续的. 下面只需证明${\cal LC}(x)$ 是闭的. 即$\forall x_{n}\in X,x_{n}\rightarrow x$ , $\forall y_{n}\in {\cal LC}(x_{n})$ , $y_{n}\rightarrow y$ . 要证$y\in {\cal LC}(x).$
假设$y\notin {\cal LC}(x)$ , 则存在$S'\subseteq {\cal P}$ 和$z_{S'}\in \hat{Z}_{S'}$ 满足
$(z_{S'})^{k}G^{k}(x,y)>(y)^{k}G^{k}(x,y), \forall k\in S'.$
又由$G^{k}(x,y)$ 连续, 存在$n_{0}$ , $\forall n>n_{0}$ 有
$(z_{S'})^{k}G^{k}(x_{n},y_{n})>(y_{n})^{k}G^{k}(x_{n},y_{n}), \forall k\in S'.$
故$\forall y_{n}\notin {\cal LC}(x_{n})$ , 与条件矛盾, 所以$y\in {\cal LC}(x)$ , 进一步得到${\cal LC}(x)$ 是闭的. 则${\cal LC}(x)\subseteq \hat{Z}_{{\cal P}}$ 必然是有界闭集.
另一方面, 由${\cal LC}$ 是上半连续且${\cal LC}(x)$ 是有界闭集, $\max \limits_{y\in {\cal LC}(x)}f(x,y)$ 必然在$X$ 上是上半连续的. 因$X$ 是$R^{N}$ 中的有界闭集, 由上半连续函数一定有最大值知, 存在$\bar{x}\in X$ , 使得
$\max \limits_{y\in {\cal LC}(\bar{x})}f(\bar{x},y)=\max\limits_{x\in X}\max\limits_{y\in {\cal LC}(x)}f(x,y), $
满足定义2.1(1). 又因$f$ 是连续的, $\forall x\in X$ , ${\cal LC}(x)$ 是非空紧的, 故$\exists \bar{y}\in {\cal LC}(\bar{x})$ , 使
$f(\bar{x},\bar{y})=\max\limits_{y\in {\cal LC}(\bar{x})}f(\bar{x},y),$
满足定义2.1(2). 从而得证$(\bar{x},\bar{y})$ 是主从群体博弈的合作均衡.
${\bf例3.1}$ 一个领导者, $2$ 个群体跟随者. 领导者策略集为$X=[0,1]$ , 群体跟随者规模$m^{1}=m^{2}=1$ , 群体跟随者策略集为$S^{1}=S^{2}=\{1,2\}$ , 群体状态
$\begin{eqnarray*} &&Y^{1}=\{y_{1}=(y_{11},y_{12})\in R^{2}_{+}|y_{11}+y_{12}=1\}=\hat{Y}_{1}, \\ &&Y^{2}=\{y_{2}=(y_{21},y_{22})\in R^{2}_{+}|y_{21}+y_{22}=1\}=\hat{Y}_{2}, \\ &&\hat{Y}_{12}=\{(y_{1},y_{2})\in R^{4}_{+}|y_{11}+y_{12}+y_{21}+y_{22}=2\}, \end{eqnarray*}$
领导者支付函数$f(x,y)=x+y_{11}$ ;
$G^{1}_{1}(x,y)=G^{1}_{2}(x,y)=1, G^{2}_{1}(x,y)=G^{2}_{2}(x,y)=-1, $
参照文献[14 ]中Nash均衡定义, 主从群体博弈中群体跟随者的Nash均衡集为$Y^{1}\times Y^{2}$ , 领导者在$x=1,y_{11}=1$ 时使得自身利益最大, 所以主从群体博弈的Nash均衡集为 $\{1\}\times \{(1,0)\}\times Y^{2}$ .
${\cal LC}(x)=\{(y_{1},y_{2})\in R^{4}_{+}|y_{11}+y_{12}=2,y_{21}=y_{22}=0\}. $
领导者在$x^{*}=1$ , $y^{*}_{11}=2$ 时取得最大收益, 所以主从群体博弈的合作均衡为
$(x^{*},y^{*})=(1,(2,0,0,0)). $
${\bf注3.1}$ (1)当文中的$x$ 为常量或给定时, 本文主从合作均衡退化为文献[20 ]中的合作均衡;在文献[19 ]中Yang研究的是主从博弈模型, 领导者和跟随者都进行的是$n$ 人非合作博弈, 而本文着重研究主从群体博弈模型, 其中跟随者是由大量个体构成的群体, 进行的是群体博弈, 所以本文与文献 [19 ]的模型不同;
(2)本文研究的是群体跟随者间存在着合作行为, 而文献[14 ]中赵薇研究的是主从群体博弈中的领导者和群体跟随者间都是非合作的, 研究的出发点不同, 且通过例3.1发现, 非合作均衡集与合作均衡集是两个不同的集合.
4 主从群体博弈合作均衡的通有稳定性
因为主从博弈的合作均衡是在可行集$X\times \widehat{Z}_{{\cal P}}$ 中讨论的, $\widehat{Z}_{{\cal P}}$ 是$R^{n}$ 上的非空凸紧集且$Y\subset\widehat{Z}_{P}\subset R^{n}_{+}$ , 所以主从群体博弈的支付函数记为:$f:X\times\widehat{Z}_{{\cal P}}\rightarrow R$ , $G^{k}_{i}:X\times\widehat{Z}_{{\cal P}}\rightarrow R$ . 因为群体跟随者支付函数的扰动会导致合作均衡映射${\cal LC}$ 的扰动, 故只考虑映射${\cal LC}$ 的扰动, 下面设
$\begin{eqnarray*} {\cal M}&=&\Big\{\Lambda(f,{\cal LC}):f\ \mbox{在$X\times \widehat{Z}_{P}$上是连续的,$ {\cal LC}: X\rightarrow \widehat{Z}_{P}$是连续的,}\\ && \mbox{且$\forall x\in X,{\cal LC}(x)非空\Big\}$ 是主从群体博弈集合.} \end{eqnarray*}$
$\forall \Lambda, \Lambda'\in {\cal M}$ , 定义距离
$\rho (\Lambda,\Lambda')=\sup \limits _{(x,y)\in X\times \widehat{Z}_{{\cal P}}}|f(x,y)-f'(x,y)|+\sup \limits _{x\in X}h({\cal LC}(x)-{\cal LC}'(x)).$
其中$h$ 是$\widehat{Z}_{P}$ 的Hausdorff距离. 显然$\rho$ 是${\cal M}$ 上的一个度量, 易证$({\cal M},\rho)$ 是一个完备的度量空间.
$\forall \Lambda \in {\cal M}$ , ${\cal C}(\Lambda)$ 表示主从群体博弈$\Lambda$ 的所有合作均衡集合, 由定理3.1知${\cal C}(\Lambda)\neq\emptyset.$ 因此${\cal C}: {\cal M}\rightarrow X\times \widehat{Z}_{{\cal P}}$ 是一个非空集值映射.
${\bf定义4.1}$ 设博弈$\Lambda \in {\cal M}$ , 称一个合作均衡$(x,y)\in{\cal C}(\Lambda)$ 关于$({\cal M},\rho)$ 是本质的, 是指如果$\forall \varepsilon >0$ , $\exists\delta >0$ , 使得当$\Lambda'\in {\cal M},$ $\rho (\Lambda,\Lambda')< \delta$ 时, 有$O(\varepsilon,(x,y))\cap {\cal C}(\Lambda')\neq \emptyset.$ 如果${\cal C}(\Lambda)$ 中每一个$(x,y)$ 都是主从群体博弈的本质合作均衡, 则称博弈$\Lambda$ 关于$({\cal M},\rho)$ 是本质的.
${\bf注4.1}$ 主从群体博弈$\Lambda\in{\cal M}$ 是本质的, 当且仅当集值映射${\cal C}:{\cal M}\rightarrow X\times \widehat{Z}_{{\cal P}}$ 是下半连续的.
下面证明集值映射${\cal C}:M\rightarrow P_{0}(X\times \widehat{Z}_{p})$ 是上半连续且紧值的.
${\bf定理4.1}$ 集值映射${\cal C}:{\cal M}\rightarrow P_{0}(X\times \widehat{Z}_{p})$ 是上半连续且紧值的.
${\bf证}$ 因$X\times \widehat{Z}_{p}$ 紧, 由引理2.1知只需证明${\cal C}$ 的图是闭的. 即证明当$\Lambda^{n}\rightarrow \Lambda\in M$ , $(x^{n},y^{n})\in{\cal C}(\Lambda^{n})$ , $(x^{n},y^{n})\rightarrow (\overline{x},\overline{y})$ 时, 有$ (\overline{x},\overline{y})\in {\cal C}(\Lambda)$ .
由于$(x^{n},y^{n})\in {\cal C}(\Lambda^{n})$ , 由定义2.1知
(1) $\max \limits_{y\in {\cal LC}^{n}(x^{n})}f^{n}(x^{n},y)=\max\limits_{x\in X}\max\limits_{y\in {\cal LC}^{n}(x)}f^{n}(x,y)$ ;
(2) $y^{n}\in {\cal LC}^{n}(x)$ 且$\forall y\in {\cal LC}^{n}(x^{n})$ , $f^{n}(x^{n},y^{n})=\max \limits_{y\in {\cal LC}^{n}(x^{n})}f^{n}(x^{n},y)$ . 由$f$ 的连续性有
$\begin{eqnarray*} f^{n}(x^{n},y)-f(\overline{x},y) &\leq &|f^{n}(x^{n},y)-f(x^{n},y)|+|f(x^{n},y)-f(\overline{x},y)|\\ &\leq &\rho(\Lambda^{n},\Lambda)+|f(x^{n},y)-f(\overline{x},y)|\rightarrow0, \end{eqnarray*}$
由${\cal LC}$ 的连续性和$x^{n}\rightarrow \overline{x}$ , 则
$\begin{eqnarray*} h({\cal LC}^{n}(x^{n}),{\cal LC}(\overline{x})) &\leq& h({\cal LC}^{n}(x^{n}),{\cal LC}({x^{n}}))+h({\cal LC}(x^{n}),{\cal LC}(\overline{x}))\\ &\leq&\rho(\Lambda^{n},\Lambda)+h({\cal LC}(x^{n}),{\cal LC}(\overline{x}))\rightarrow0, \end{eqnarray*}$
又${\cal LC}(\overline{x}), {\cal LC}^{n}(x^{n})$ 是非空紧集, 由引理2.3知
$\max \limits_{y\in {\cal LC}^{n}(x^{n})}f^{n}(x^{n},y)\rightarrow \max\limits_{y\in {\cal LC}(\overline{x})}f(\overline{x},y).$
$\max \limits_{y\in {\cal LC}^{n}(x)}f^{n}(x,y)\rightarrow \max\limits_{y\in {\cal LC}(x)}f(x,y),$
$\max \limits_{x\in X}[\max \limits_{y\in {\cal LC}^{n}(x)}f^{n}(x,y)]\rightarrow \max\limits_{x\in X}\max\limits_{y\in {\cal LC}(x)}f(x,y).$
$\max \limits_{y\in {\cal LC}^{n}(x^{n})}f^{n}(x^{n},y)=\max\limits_{x\in X}\max\limits_{y\in {\cal LC}^{n}(x)}f^{n}(x,y),$
$\max\limits_{y\in {\cal LC}(\bar{x})}f(\bar{x},y)=\max\limits_{x\in X}\max\limits_{y\in{\cal LC}(x)}f(x,y).$
另一方面由$X$ 是非空紧集, 且$x^{n}\rightarrow \overline{x}$ , $y^{n}\rightarrow \overline{y}$ , $y^{n}\in {\cal LC}^{n}(x^{n})$ , 则$\overline{y}\in {\cal LC}(\overline{x})$ .
又由$f$ 在$X\times \widehat{Z}_{{\cal P}}$ 连续, 有
$f^{n}(x^{n},y^{n})\rightarrow f(\overline{x},\overline{y}).$
$\max\limits_{y\in {\cal LC}^{n}(x^{n})}f(x^{n},y)\rightarrow \max\limits_{y\in {\cal LC}(\overline{x})}f(\overline{x},y).$
故$f(\overline{x},\overline{y})=\max\limits_{y\in {\cal LC}(\overline{x})}f(\overline{x},y)$ . 所以$(\overline{x},\overline{y})$ 满足定义2.1的两个条件, $(\overline{x},\overline{y})\in {\cal C}(\Lambda)$ , 定理得证.
${\bf定理4.2}$ 存在$M$ 的一个稠密剩余集${\cal Q}$ , 使得$\forall \Lambda \in {\cal Q}$ 是本质的.
${\bf证}$ 因$({\cal M},\rho)$ 是完备的度量空间, 又由定理4.1知${\cal C}:{\cal M}\rightarrow P_{0}(X\times \widehat{Z}_{P})$ 是非空紧值且上半连续的, 则由Fort定理, 存在${\cal M}$ 中的一个稠密剩余集${\cal Q}$ , 使得$\forall \Lambda \in {\cal Q}$ , ${\cal C}$ 在$\Lambda$ 是下半连续的, 因此$\forall \Lambda \in {\cal Q}$ 都是本质的.
${\bf注4.2}$ $\forall\Lambda\in{\cal M}$ , 因${\cal Q}$ 在${\cal M}$ 中是稠密的, 则$\Lambda$ 可以由本质博弈逼近。又由${\cal Q}$ 是第二纲的, 我们可以说, 在Baire分类意义下, 对大多数的博弈$\Lambda$ 都是本质的, 或者说博弈$\Lambda$ 是本质的是${\cal M}$ 上的通有性质.
下面举例说明不是所有的主从群体博弈都有本质均衡, 即${\cal M}\neq{\cal Q}.$
${\bf 例4.1}$ 设主从群体博弈$\Gamma=\{X,f,\{Y^{k}\}_{k\in{\cal P}},\{G^{k}\}_{k\in{\cal P}}\}$ 有一个领导者及2个群体跟随者. 领导者策略集为$X=[0,1]$ , 群体跟随者规模$m^{1}=m^{2}=1$ , 群体跟随者策略集为$S^{1}=S^{2}=\{1,2\}$ ,群体状态
$\begin{eqnarray*} &&Y^{1}=\{y_{1}=(y_{11},y_{12})\in R^{2}_{+}|y_{11}+y_{12}=1\}=\hat{Y}_{1}, \\ && Y^{2}=\{y_{2}=(y_{21},y_{22})\in R^{2}_{+}|y_{21}+y_{22}=1\}=\hat{Y}_{2}, \\ &&\hat{Y}_{12}=\{(y_{1},y_{2})\in R^{4}_{+}|y_{11}+y_{12}+y_{21}+y_{22}=2\}, \end{eqnarray*}$
群体跟随者的支付$G^{1}_{1}(x,y)=G^{1}_{2}(x,y)=G^{2}_{1}(x,y)=G^{2}_{2}(x,y)=0$ , 其中$y\in Y_{1}\times Y_{2}$ . 显然主从群体博弈$\Gamma\in {\cal M}$ , 且${\cal C}(\Gamma)=X\times\hat{Y}_{12}. $
对每个$n\in N_{+}$ , 考虑扰动主从群体博弈$\Gamma^{n}=\{X,f^{n},\{Y^{k}\}_{k\in{\cal P}},\{G^{nk}\}_{k\in{\cal P}}\}$
领导者支付函数$f^{n}(x,y)=\frac{1}{n}x$ ;
群体跟随者的支付$G^{n1}_{1}(x,y)=G^{n1}_{2}(x,y)=G^{n2}_{1}(x,y)=G^{n2}_{2}(x,y)=0$ ,
显然$\Gamma^{n}\rightarrow \Gamma$ , ${\cal C}(\Gamma^{n})=\{1\}\times\hat{Y}_{12}. $
因此, $[0,1)\times \hat{Y}_{12}$ 不是本质合作均衡.
同样对任意的$m\in N_{+}$ , 构造扰动主从群体博弈$\Gamma^{m}=\{X,f^{m},\{Y^{k}\}_{k\in{\cal P}},\{G^{mk}\}_{k\in{\cal P}}\}$
领导者支付函数$f^{m}(x,y)=-\frac{1}{m}x$ ;
群体跟随者的支付$G^{1}_{1}(x,y)=G^{1}_{2}(x,y)=G^{2}_{1}(x,y)=G^{2}_{2}(x,y)=0$ , 显然$\Gamma^{m}\rightarrow \Gamma$ , ${\cal C}(\Gamma^{m})=\{0\}\times\hat{Y}_{12}. $
因此, $(0,1]\times \hat{Y}_{12}$ 不是本质合作均衡.
综上所述, ${\cal C}(\Gamma)$ 中的每个点都不是本质合作均衡. 所以主从群体博弈$\Gamma$ 不是本质的, 则${\cal M}\neq {\cal Q}$ .
5 总结
该文在一类新的主从博弈模型下, 当群体跟随者有合作行为时, 引入了合作均衡的概念. 因为在很多实际问题中跟随者往往是数量巨大的个体组成的群体, 并且群体跟随者之间在利益的驱动下会有合作共赢的行为, 所以引入合作均衡更具有一般的现实意义. 并且在策略空间非空紧、支付函数连续的条件下, 我们证明了主从群体博弈合作均衡的存在性, 进一步通过例3.1说明了主从群体博弈合作均衡与Nash均衡是两个不同的集合. 最后定义了本质合作均衡和本质博弈, 并应用Fort定理证明了在Baire分类意义下, 得到了支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是本质的, 即群体博弈合作均衡集是通有稳定的, 并通过算例4.1说明并不是所有的主从群体博弈都有本质均衡.
参考文献
View Option
[1]
Sandholm W H . Population Games and Evolutionary Dynamics . London : MIT Press , 2010
[本文引用: 1]
[2]
Nash J . Noncooperative Games . Princetion : Princeton University , 1950
[本文引用: 1]
[3]
Stackelberg H V . Theory of the Market Economy . Oxford : Oxford University Press , 1952
[本文引用: 1]
[4]
Wu W T , Jiang J H . Essential equilibrium points of $n$ - person non-cooperative games
Science in China, Ser A , 1962 , 10 : 1307 -1322
[本文引用: 1]
[6]
Yu J , Luo Q . On essential components of the solution set of generalized game
Journal of Mathematical Analysis and Applications , 1999 , 230 (2 ): 303 -310
DOI:10.1006/jmaa.1998.6202
URL
[本文引用: 1]
[7]
Yu J , Yang H . The essential components of the set of equilibrium points for set-valued maps
Journal of Mathematical Analysis and Applications , 2004 , 300 (2 ): 334 -342
DOI:10.1016/j.jmaa.2004.06.042
URL
[本文引用: 1]
[8]
Zhou Y H , Yu J , Xiang S W . Essential stability in games with infinitely many pure strategies
International Journal of Game Theory , 2007 , 35 (4 ): 493 -503
DOI:10.1007/s00182-006-0063-0
URL
[本文引用: 1]
[9]
Yang H , Xiao X C . Essential components of Nash equilibria for games parametrized by payoffs and strategies
Nonlinear Analysis , 2009 , 71 (12 ): 2322 -2326
[本文引用: 1]
[10]
Yang Z . On the existence and stability of solutions of a mixed general type of variational relation problems
Journal of Nonlinear Science and Applications , 2014 , 337 : 1 -10
[本文引用: 1]
[11]
Yang G H , Yang H . Stability of weakly pareto-Nash equilibria and pareto-nash equilibria for multiobjective population games
Set-Valued and Variational Analysis , 2017 , 25 (2 ): 427 -439
DOI:10.1007/s11228-016-0391-6
URL
[本文引用: 1]
[12]
Yang G H , Yang H , Song Q Q . Stability of weighted Nash equilibria for multiobjective population games
J Nonlinear Sci Appl , 2016 , 9 (3 ): 4167 -4176
DOI:10.22436/jnsa
URL
[本文引用: 1]
[18]
Kajii A . A generalization of Scarf's theorem: An $\alpha$ - core existence theorem without transitivity or completeness
Journal of Economic Theory , 1992 , 56 (1 ): 194 -205
DOI:10.1016/0022-0531(92)90076-T
URL
[本文引用: 1]
[19]
Yang Z , Ju Y . Existence and generic stability of cooperative equilibria for multi-leader-multi-follower games
Journal of Global Optimization , 2016 , 65 (3 ): 563 -573
DOI:10.1007/s10898-015-0393-1
URL
[本文引用: 4]
[20]
Yang Z , Zhang H Q . Essential stability of cooperative equilibria for population games
Optimization Letters , 2019 , 13 (7 ): 1573 -1582
DOI:10.1007/s11590-018-1303-5
[本文引用: 5]
In this paper, we first introduce the notion of cooperative equilibria for population games and prove its existence theorem by Proposition 2 in Kajii (J Econ Theory 56:194-205, 1992). We next identify a residual dense subclass of population games whose cooperative equilibria are all essential. Moreover, we show the existence of essential components of the cooperative equilibrium set by proving the connectivity of minimal essential sets of the cooperative equilibrium set.
[22]
俞建 . 博弈论与非线性分析 . 北京 : 科学出版社 , 2008
[本文引用: 1]
Yu J . Game Theory and Nonlinear Analysis . Beijing : Science Press , 2008
[本文引用: 1]
[23]
俞建 . 博弈论选讲 . 北京 : 科技出版社 , 2014
[本文引用: 2]
Yu J . Lectures on Game Theory . Beijing : Science Press , 2014
[本文引用: 2]
1
2010
... 群体博弈模型是Sandholm[1 ] 根据John Nash[2 ] 博士论文中对混合策略的"Mass Action"的思想建立的. 群体博弈是以代理人数量巨大且有限的群体为研究对象, 群体中的代理人具有相同的策略集, 代理人通过策略的选择形成了群体状态间接的对所有群体状态产生影响. 当每个群体中的所有代理人收益达到最大时, 代理人就没有改变策略的动机, 进而达到了一个群体均衡. 该模型被广泛的应用于交通拥堵问题、生物学、经济学和社会学中具有大量个体策略交互的实际问题中. 主从博弈是Stackelberg[3 ] 提出的一个经济模型, 是指具有两类决策者:具有较高决策层的领导者和下级决策的跟随者的博弈模型. 该模型通常用于解决一方处于支配的行业竞争问题, 被广泛应用于经济学、管理学及其他社会科学中. ...
1
1950
... 群体博弈模型是Sandholm[1 ] 根据John Nash[2 ] 博士论文中对混合策略的"Mass Action"的思想建立的. 群体博弈是以代理人数量巨大且有限的群体为研究对象, 群体中的代理人具有相同的策略集, 代理人通过策略的选择形成了群体状态间接的对所有群体状态产生影响. 当每个群体中的所有代理人收益达到最大时, 代理人就没有改变策略的动机, 进而达到了一个群体均衡. 该模型被广泛的应用于交通拥堵问题、生物学、经济学和社会学中具有大量个体策略交互的实际问题中. 主从博弈是Stackelberg[3 ] 提出的一个经济模型, 是指具有两类决策者:具有较高决策层的领导者和下级决策的跟随者的博弈模型. 该模型通常用于解决一方处于支配的行业竞争问题, 被广泛应用于经济学、管理学及其他社会科学中. ...
1
1952
... 群体博弈模型是Sandholm[1 ] 根据John Nash[2 ] 博士论文中对混合策略的"Mass Action"的思想建立的. 群体博弈是以代理人数量巨大且有限的群体为研究对象, 群体中的代理人具有相同的策略集, 代理人通过策略的选择形成了群体状态间接的对所有群体状态产生影响. 当每个群体中的所有代理人收益达到最大时, 代理人就没有改变策略的动机, 进而达到了一个群体均衡. 该模型被广泛的应用于交通拥堵问题、生物学、经济学和社会学中具有大量个体策略交互的实际问题中. 主从博弈是Stackelberg[3 ] 提出的一个经济模型, 是指具有两类决策者:具有较高决策层的领导者和下级决策的跟随者的博弈模型. 该模型通常用于解决一方处于支配的行业竞争问题, 被广泛应用于经济学、管理学及其他社会科学中. ...
Essential equilibrium points of $n$ -person non-cooperative games
1
1962
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
On essetnial components of the Nash equilibrium points
1
1999
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
On essential components of the solution set of generalized game
1
1999
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
The essential components of the set of equilibrium points for set-valued maps
1
2004
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
Essential stability in games with infinitely many pure strategies
1
2007
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
Essential components of Nash equilibria for games parametrized by payoffs and strategies
1
2009
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
On the existence and stability of solutions of a mixed general type of variational relation problems
1
2014
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
Stability of weakly pareto-Nash equilibria and pareto-nash equilibria for multiobjective population games
1
2017
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
Stability of weighted Nash equilibria for multiobjective population games
1
2016
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
群体博弈的有限理性问题及演化动力学研究
1
2020
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
群体博弈的有限理性问题及演化动力学研究
1
2020
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
基于参数不确定及主从结构等的群体博弈研究
4
2021
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
... 因此, 受到文献[14 ,19 -20 ]研究的启发, 在一主多从群体博弈模型下, 群体跟随者之间同样会受到利益的驱动而进行合作, 所以本文首先在主从群体博弈模型下引入合作均衡的概念, 并应用最值存在定理和文献[命题2], 证明了主从群体博弈合作均衡的存在性. 最后定义了主从群体博弈的本质合作均衡和本质主从群体博弈, 应用Fort定理证明了在Baire分类意义下, 得到在支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是通有稳定的. ...
... 参照文献[14 ]中Nash均衡定义, 主从群体博弈中群体跟随者的Nash均衡集为$Y^{1}\times Y^{2}$ , 领导者在$x=1,y_{11}=1$ 时使得自身利益最大, 所以主从群体博弈的Nash均衡集为 $\{1\}\times \{(1,0)\}\times Y^{2}$ . ...
... (2)本文研究的是群体跟随者间存在着合作行为, 而文献[14 ]中赵薇研究的是主从群体博弈中的领导者和群体跟随者间都是非合作的, 研究的出发点不同, 且通过例3.1发现, 非合作均衡集与合作均衡集是两个不同的集合. ...
基于参数不确定及主从结构等的群体博弈研究
4
2021
... 另一方面, 博弈均衡的稳定性也是一个研究热点. 1962年吴文俊和江嘉禾[4 ] 在支付函数扰动的情况下, 定义了有限博弈的本质均衡和本质博弈. 随后俞建教授 [5 ] 将本质均衡的概念定义在一般博弈中. 基于这些结果, 学者们得到了一些深刻的研究结果, 见文献[6 ⇓ ⇓ ⇓ -10 ]. 近年来, 群体博弈均衡的存在性和稳定性也是学者们关注的重点, 本文合作者杨光惠和杨辉[11 -12 ] 将单目标群体博弈推广到了多目标群体博弈, 并应用非线性分析的方法证明了Pareto-Nash均衡和弱Pareto-Nash均衡的存在性及稳定性. 仲崇轶[13 ] 研究了群体博弈Nash均衡的精炼及Nash均衡的通有稳定性. 赵薇[14 ] 把经典博弈中主从博弈的思想引入到群体博弈中, 建立了主从群体博弈模型, 定义了该模型下Nash均衡概念, 并且证明了Nash均衡的存在性和通有稳定性. ...
... 因此, 受到文献[14 ,19 -20 ]研究的启发, 在一主多从群体博弈模型下, 群体跟随者之间同样会受到利益的驱动而进行合作, 所以本文首先在主从群体博弈模型下引入合作均衡的概念, 并应用最值存在定理和文献[命题2], 证明了主从群体博弈合作均衡的存在性. 最后定义了主从群体博弈的本质合作均衡和本质主从群体博弈, 应用Fort定理证明了在Baire分类意义下, 得到在支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是通有稳定的. ...
... 参照文献[14 ]中Nash均衡定义, 主从群体博弈中群体跟随者的Nash均衡集为$Y^{1}\times Y^{2}$ , 领导者在$x=1,y_{11}=1$ 时使得自身利益最大, 所以主从群体博弈的Nash均衡集为 $\{1\}\times \{(1,0)\}\times Y^{2}$ . ...
... (2)本文研究的是群体跟随者间存在着合作行为, 而文献[14 ]中赵薇研究的是主从群体博弈中的领导者和群体跟随者间都是非合作的, 研究的出发点不同, 且通过例3.1发现, 非合作均衡集与合作均衡集是两个不同的集合. ...
The core of a cooperative game without side payments
1
1961
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
On the existence of a coopertive solution for a general class of $N$ -person games
1
1971
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
A social coalitional equilibrium existence lemma
1
1981
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
A generalization of Scarf's theorem: An $\alpha$ -core existence theorem without transitivity or completeness
1
1992
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
Existence and generic stability of cooperative equilibria for multi-leader-multi-follower games
4
2016
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
... 因此, 受到文献[14 ,19 -20 ]研究的启发, 在一主多从群体博弈模型下, 群体跟随者之间同样会受到利益的驱动而进行合作, 所以本文首先在主从群体博弈模型下引入合作均衡的概念, 并应用最值存在定理和文献[命题2], 证明了主从群体博弈合作均衡的存在性. 最后定义了主从群体博弈的本质合作均衡和本质主从群体博弈, 应用Fort定理证明了在Baire分类意义下, 得到在支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是通有稳定的. ...
... ${\bf注3.1}$ (1)当文中的$x$ 为常量或给定时, 本文主从合作均衡退化为文献[20 ]中的合作均衡;在文献[19 ]中Yang研究的是主从博弈模型, 领导者和跟随者都进行的是$n$ 人非合作博弈, 而本文着重研究主从群体博弈模型, 其中跟随者是由大量个体构成的群体, 进行的是群体博弈, 所以本文与文献 [19 ]的模型不同; ...
... 人非合作博弈, 而本文着重研究主从群体博弈模型, 其中跟随者是由大量个体构成的群体, 进行的是群体博弈, 所以本文与文献 [19 ]的模型不同; ...
Essential stability of cooperative equilibria for population games
5
2019
... 在标准式博弈模型中, 参与人之间除了竞争之外也会有合作. 1961年Aumann[15 ] 首次引入了标准式博弈$\alpha$ -核的概念. $\alpha$ -核是指不能被任何联盟$\alpha$ -阻止的所有策略组成的集合. 1971 年Scarf[16 ] 证明了具有连续拟凹的支付函数的标准式博弈$\alpha$ -核的非空性. 而后1981年Ichiishi[17 ] 将Sacrf的结果推广到了社会联盟均衡点情形, 并得到了一个社会联盟均衡存在性引理. 1992年, Kajii[18 ] 将Scarf的工作拓展到了具有无序偏好博弈的情形, 并证明了$n$ 人非合作博弈和广义博弈$\alpha$ -核的存在性. 2016年, Yang和Ju[19 ] 在多个领导者多个跟随者博弈中定义了合作均衡的概念, 并证明了合作均衡的存在性和通有稳定性. 2019 年, Yang和Zhang[20 ] 将合作均衡的概念引入到群体博弈中, 并且分析了均衡点的存在性和本质稳定性. ...
... 因此, 受到文献[14 ,19 -20 ]研究的启发, 在一主多从群体博弈模型下, 群体跟随者之间同样会受到利益的驱动而进行合作, 所以本文首先在主从群体博弈模型下引入合作均衡的概念, 并应用最值存在定理和文献[命题2], 证明了主从群体博弈合作均衡的存在性. 最后定义了主从群体博弈的本质合作均衡和本质主从群体博弈, 应用Fort定理证明了在Baire分类意义下, 得到在支付函数扰动的情况下, 大多数主从群体博弈的合作均衡点集都是通有稳定的. ...
... 在该模型中, 领导者先做出决策$x\in X$ , 下面$k$ 个群体跟随者观察到领导者的行动后, 群体跟随者进行一个含有参数$x$ 的群体博弈. 由文献[20 ]中群体合作均衡定义知, $\overline{y}\in R^{n}_{+}$ 是群体跟随者合作均衡, 如果:$\overline{y}\in \hat{Z}_{{\cal P}}$ 且$\forall S\subseteq {\cal P},$ 不存在$z_{S}\in \hat{Z}_{S}$ 使得 ...
... (4)由文献[20 ]定理2.2知, 显然满足假设(A-4). ...
... ${\bf注3.1}$ (1)当文中的$x$ 为常量或给定时, 本文主从合作均衡退化为文献[20 ]中的合作均衡;在文献[19 ]中Yang研究的是主从博弈模型, 领导者和跟随者都进行的是$n$ 人非合作博弈, 而本文着重研究主从群体博弈模型, 其中跟随者是由大量个体构成的群体, 进行的是群体博弈, 所以本文与文献 [19 ]的模型不同; ...
Bounded rationality in multiobjective games
1
2007
... ${\bf引理2.3}$ [21 ] 设$X$ 和$Y$ 是两个度量空间, $\{A_{m}\}^{+\infty}_{m=1}$ 是一紧序列, $\{y_{m}\}^{+\infty}_{m=1}$ 是$Y$ 中一序列, $\{\varphi_{m}(x,y)\}^{+\infty}_{m=1}$ 是$X\times Y$ 上一连续函数列, 如果$A_{m}\rightarrow A$ 且$A$ 紧, $y_{m}\rightarrow y\in Y$ 且 ...
1
2008
... ${\bf定理2.1}$ [22 ] (Fort定理) 设X是一个完备度量空间, $Y$ 是一个度量空间, 集值映射$F:X\rightarrow P_{0}(Y)$ 满足$\forall x\in X,F(x)$ 是$Y$ 中的非空紧集, 且$F$ 在$x$ 是上半连续的, 则存在$X$ 中的一个第二纲的稠密剩余集$Q$ , 使$\forall x\in Q$ , 集值映射$F$ 在$x$ 下半连续. ...
1
2008
... ${\bf定理2.1}$ [22 ] (Fort定理) 设X是一个完备度量空间, $Y$ 是一个度量空间, 集值映射$F:X\rightarrow P_{0}(Y)$ 满足$\forall x\in X,F(x)$ 是$Y$ 中的非空紧集, 且$F$ 在$x$ 是上半连续的, 则存在$X$ 中的一个第二纲的稠密剩余集$Q$ , 使$\forall x\in Q$ , 集值映射$F$ 在$x$ 下半连续. ...
2
2014
... ${\bf引理2.1}$ [23 ] 设$F:X\rightarrow P_{0}(Y)$ 是一个集值映射, $F$ 的图定义为 ...
... ${\bf引理2.2}$ [23 ] 若$Y$ 是$R^{n}$ 中的有界闭集, 集值映射$F:X\rightarrow P_{0}(Y)$ 上是闭的, 则$F$ 在$X$ 上必是上半连续的. ...
2
2014
... ${\bf引理2.1}$ [23 ] 设$F:X\rightarrow P_{0}(Y)$ 是一个集值映射, $F$ 的图定义为 ...
... ${\bf引理2.2}$ [23 ] 若$Y$ 是$R^{n}$ 中的有界闭集, 集值映射$F:X\rightarrow P_{0}(Y)$ 上是闭的, 则$F$ 在$X$ 上必是上半连续的. ...