不平等问题日益成为全世界的热点话题.它的存在是导致社会、经济、甚至政治问题的根本原因. Easterly指出高度的不平等将会对国家的发展、高素质人才的培育带来显著的障碍[4], Clarke指出不平等并不是经济增长的必要条件, 但却是与增长放缓息息相关, 这可能是因为不平等的加剧将会带来更多财富分配的冲突以及更高昂的税收[2].针对我国的实证研究也表明收入不平等对国家经济发展、国民健康都是不利的[22].既然如此, 不平等的度量指标就显得尤为重要.不平等度量指标大致有两类:一种是绝对指标, 特点为带有量纲; 另一种是相对指标, 常用的有Gini系数(Gini coefficient)、广义熵(Generalized Entropy, GE)指数等.本文主要针对相对指标进行研究.
众所周知, 不平等指标起初是为了度量收入不平等而建立的, 而指标的作用主要是用来比较不平等程度.由于在收入不平等度量中需要采集每个个体或者地区的数据, 这样便会消耗大量的时间, 产生大量成本, 那么如何在耗费少量人力和物力的情况下, 达到比较收入不平等程度的目的, 这是一个有趣的问题.对于这个问题, 我们目前没有找到相关文献.但是, 在对相对指标的分析中, 我们发现不平等度量指标与Schur-凸函数有着直接关联, 而通过Schur-凸函数变量向量间的优超(Majorization)关系, 便能比较函数值间的大小关系.于是, 本文尝试直接从少量的Schur-凸函数变量向量分量出发, 寻找变量向量间优超的充分条件, 进而方便地比较函数值间的大小.对应地, 便能通过采集少量数据和优超关系比较两个地区或者同一地区不同时间的不平等性程度.
以下介绍几个不平等度量的相对指标和一些概念.
Gini系数是由意大利统计学家和社会学家Gini C提出的, 衡量一个国家居民收入分配是否平等的统计度量指标, 是国内外最常用的不平等度量指标[5, 7].一种常用的表达式如下
其中$\{y_i;i=1, \cdots, n\}$为一个非减序列, 表示每个人或者每个家庭的收入或者财富值按从小到大排列.
Sadras等将Gini系数应用到农业来表征粮食产量的不平等性[15]. Thomas等利用Gini系数研究了特定时间段内85个国家的教育不平等程度, 通过这样可以预测社会的发展趋势[18]. Weymark基于Gini系数和一个机会不平等性的度量准则提出了广义Gini机会平等序集, 并且给出了这个偏序集一系列的性质[21].
Theil指数是由Erasmus大学的经济学家Theil H提出的, 衡量个人之间或者地区间收入差距的指标.它可以看作是广义熵指数的特殊情况[5].表达形式如下
其中$x_i$表示第$i(i=1, \cdots N)$个个人或者地区的收入, $\mu$表示平均收入且$\mu=\frac{1}{N}\sum\limits_{i=1}^{N}x_i$.
Novotný利用Theil指数有效估计了全球和欧洲的发展水平, 并基于不平等空间维度的相对重要性, 指出Theil指数分解方法是分析地区间不平等性的一个有效工具[14]. Sampath给出了Theil指数在灌溉系统性能评估方面的应用, 并对排序、相对平均离差、方差、变异系数、对数标准差、Gini系数、Theil指数七种有效平等性措施的鲁棒性做出了评价[16].
1948年, Shannon C E在其论文[17]中成功定义了"信息", 建立了信息论, 而且给出了"Shannon熵"这一度量方法.后来, 许多学者也给出了信息的不同含义, 促使信息熵被应用到许多领域, 比如编码解码、多样性度量、数据压缩、语音文字识别[3, 8-9, 13, 20]等等. Shannon给出的信息熵的定义如下
其中
是完备的有限维离散概率空间.可以看出, Theil指数可以从Shannon熵演变而来.
作为Shannon熵的推广, Tsallis熵[6]
其中$P=(p_1, p_2, \cdots, p_n)$是给定的概率分布, $k$为正常数, $q\in {\Bbb R}^+$.可以看到
由于不平等性度量指标和优超概念以及Schur-凸函数是有紧密联系的, 下面介绍优超以及Schur-凸函数.
若向量
其中$p_1\geq p_2\geq\cdots \geq p_n, q_1\geq q_2\geq\cdots \geq q_n$.当满足$\sum\limits_{i=1}^{k}p_i\leq \sum\limits_{i=1}^{k}q_i, \ k=1, 2, \cdots, n-1$且$\sum\limits_{i=1}^{n}p_i=\sum\limits_{i=1}^{n}q_i$时, 则称$P$被$Q$优超, 记作$P\sqsubset Q$.
20世纪60年代后, 优超概念才被引入到不平等性度量中, 为此做贡献的有Arnold[1]等. Mosler K也通过各阶级经济差异指数介绍了单变量和多变量优超偏序及其性质.优超最初是为了比较收入不平等程度的, 由于不平等问题出现在物理、化学、政治科学、工程学、经济学等等, 所以优超也被应用到很多领域[11].
用优超关系定义一类函数便是Schur-凸(凹)函数.
定义在集合${\cal A}\subset {\Bbb R}^n$上的实值函数$\phi$, 如果其对偏序"$\sqsubset$"具有保序性, 即若
则称函数$\phi$在集合${\cal A}$上是Schur-凸函数.反之, 若$P\sqsubset Q\in {\cal A}\Rightarrow \phi(P)\geq \phi(Q)$, 则称函数$\phi$在集合${\cal A}$上是Schur -凹函数.
由定义可知如果能预先判断变量向量之间的优超关系, 那么就能直接比较其函数值间的大小关系.
由于(1.1)式是关于$\{y_i;i=1, \cdots, n\}$的对称函数、(1.3)式是关于$\{p_i;i=1, \cdots, n\}$的对称函数.又由于
则$G$为Schur-凸函数.又由于$(p_1-p_2)\ln\frac{p_2}{p_1}\leq 0$, 则$H(P)$是Schur -凹函数.相反地, 可知$T$是关于$\{x_i;i=1, \cdots , n\}$的Schur-凸函数.也就是说, 在比较两个地区收入不平等性时, 若预先判断出个体或地区收入向量的优超关系, 就不需要计算具体的Gini系数或者Theil指数.
其实对于一个不平等度量指标, 如果能预先判断指标变量向量之间的优超关系, 那么就能直接比较指标值的大小关系.由于不平等度量指标与Schur-凸函数有着密切关联, 本文便以Schur-凸函数为基础, 在给出变量向量中少量已知分量值的情况下, 确定其变量向量的优超上界和优超下界, 进而给出判断变量向量间优超关系的充分条件.由于Theil指数是Shannon熵的演变形式, 所以本文以信息不平等度量中, (1.3)式Shannon熵为基础给出应用, 寻找使$H(P)\geq H(Q)$成立的充分条件, 其中$P, Q\in\Gamma_n$. Li等[10]虽然给出了$P\sqsubset Q$与$H(P)\geq H(Q)$的等价条件, 但是并没有给出具体的构造方法.我们则利用离散概率分布中的少量已知概率得到了$P\sqsubset Q$的充分条件.
在提出定理之前, 我们引入一些记号.
当$n\geq 2$时, 令
特别地, 若$a=1$, 可以简单地记$\bigtriangleup_n(1)$为$\bigtriangleup_n$.
令
表示与向量$P\in \bigtriangleup_n(a)$在相应位置分量$p_{k_1}, p_{k_2}, \cdots, p_{k_l}(l\leq n)$的值相等的所有属于$\bigtriangleup_n(a)$的向量的集合.
由于集合$M_{n, a}(P_{k_1, k_2, \cdots, k_l})$是由向量$P\in \bigtriangleup_n(a)$的部分信息$p_{k_1}, p_{k_2}, \cdots, p_{k_l}(l\leq n)$构成的, 所以称$M_{n, a}(P_{k_1, k_2, \cdots , k_l})$是关于向量$P$的不完全信息集.在不至于混淆的情况下, 也可简称为不完全信息集.
显然对任意的$P$和$k_1, k_2, \cdots, k_l(l\leq n)$, 都有$M_{n, a}(P_{k_1, k_2, \cdots, k_l})\subset \bigtriangleup_n(a)$.
设定义在集合${\cal A}\subset {\Bbb R}^n$上的实值函数$\phi$, 若$P, Q\in \bigtriangleup_n(a)\subset{\cal A}$, 令
表示在$M_{n, a}(P_{k_1, k_2, \cdots, k_l})$上, $\phi(P)$在$P=P^{(n, a)}_{\max}(k_1, k_2, \cdots, k_l)$处达到最大值.
表示在$M_{n, a}(P_{k_1, k_2, \cdots, k_l})$上, $\phi(P)$在$P=P^{(n, a)}_{\min}(k_1, k_2, \cdots, k_l)$处达到最小值.
以下定理可以说明, 若$\phi$为是Schur-凸函数, 则$P^{(n, a)}_{\max}(\phi;k_1, \cdots, k_l)$和$P^{(n, a)}_{\min}(\phi;k_1, \cdots, k_l)$均与$\phi$无关, 因此可以分别记作$P^{(n, a)}_{\max}(k_1, k_2, \cdots, k_l)$和$P^{(n, a)}_{\min}(k_1, k_2, \cdots, k_l)$.
若已知$n, a$以及$k_1, k_2, \cdots, k_l$ $(l\leq n)$, 在不至于混淆的情况下, 为了简单起见, 记$M_{n, a}(P_{k_1, k_2, \cdots, k_l})$为$M(P)$, 记$P^{(n, a)}_{\max}(k_1, k_2, \cdots, k_l)$为$P_{\max}$, 记$P^{(n, a)}_{\min}(k_1, k_2, \cdots, k_l)$为$P_{\min}$.
定理2.1 设定义在集合${\cal A}\subset{\Bbb R}^n$上的实值函数$\phi$是Schur-凸函数, 对于任意的$P\in \bigtriangleup_n(a)\subset {\cal A}$和给定的$p_{k_1}, p_{k_2}, \cdots, p_{k_l}(l\leq n)$, 其中$1=k_0\leq k_1 <k_2<\cdots <k_l\leq k_{l+1}=n$.若存在$0\leq s\leq l$使得$p_{k_s}\geq \frac{a}{n} \geq p_{k_{s+1}}$, 那么
(1) $\phi(P)$取最大值当且仅当$P=P_{\max}$,
若$k_1\geq 2$, 则
当$k_1=1$时,
(ⅰ) 若$a-(\sum\limits_{i=1}^{l-1}(k_{i+1}-k_i)p_{k_i}+p_{k_l})\geq 0$, 则
其中$p_i=p_{k_l}(k_l <i<r\leq n), p_r=a-(\sum\limits_{i=1}^{l-1}(k_{i+1}-k_i)p_{k_i}+(r-l)p_{k_l})$且$0\leq p_r\leq p_{k_l}$.
(ⅱ) 若$\exists 0<s<l$, 使得
则
其中$p_{i}=p_{k_{s}}(k_{s} < i<r), p_{i}=p_{k_{s+1}}(r<i<k_{s+1}) , p_{r}=a-(\sum\limits_{i=1}^{s-1}(k_{i+1}-k_i)p_{k_i}+(r-k_s)p_{k_s} +(k_{s+1}-r)p_{k_{s+1}}+ \sum\limits_{i=s+2}^{l}(k_{i}-k_{i-1})p_{k_i})$且$p_{k_s}\geq p_r\geq p_{k_{s+1}}$.特别地, 若$k_{s+1}=k_s+1$, 则考虑$P_{\max}$在(ⅰ)中.
(2) $\phi(P)$取最小值当且仅当$P=P_{\min}$,
(ⅰ) 若$p_{k_1}\leq \frac{a-(\sum\limits_{i=1}^{l}(k_{i+1}-k_i)p_{k_i}+p_{k_l})}{k_1-1}$或者$s=0$, 则
特别地, 若$k_1=1$, 则考虑$P_{\min}$在(ⅱ)和(ⅲ)中.
(ⅱ) 若$p_{k_l}\geq \frac{a-(\sum\limits_{i=1}^{l}(k_i-k_{i-1})p_{k_i}+p_{k_1})}{n-k_l}$或者$s=l$, 则
特别地, 若$k_l=n$, 则考虑$P_{\min}$在(ⅰ)和(ⅲ)中.
(ⅲ) 若$\exists0<s< l$, 令
使得$p_{k_s}\geq v_s\geq p_{k_{s+1}}$, 则
特别地, 若$k_{s+1}=k_s+1$, $P_{\min}$在(ⅰ)和(ⅱ)中.
由这个定理可以写出已知变量向量的少量分量值时, 任意变量向量$P$的$P_{\min}$和$P_{\max}$, 显然$P_{\min}\sqsubset P\sqsubset P_{\max}$.我们先给出例子, 然后再给出定理的证明.
例1 假设$a=1, P=(p_1, p_2, \cdots, p_{10})$.
若$p_2=0.15, p_7=0.1$, 我们先看$P_{\min}$.为求出$P_{\min}$, 我们从前往后安排, 先让前面的$p_1, p_3, p_4, p_5, p_6$尽可能的小, 由此令$p_1=p_2, p_3=\cdots =p_7$, 这样还有余值$a-(2p_2+5p_7)=1-0.8=0.2$.现在安排后面的$p_8, p_9, p_{10}$, 为使后面各个值与前面相加的和尽可能小, 而$p_8\geq p_9\geq p_{10}$, 所以只能是$p_8=p_9=p_{10}=0.2/3$.又因为$0.2/3 <0.1$, 则$P_{\min}=(0.15, 0.15, 0.1, 0.1, 0.1, 0.1, 0.1, 0.2/3, 0.2/3, 0.2/3)$.
再看$P_{\max}$.为求出$P_{\max}$, 我们从后往前安排, 使后面的$p_3, p_4, p_5, p_6, p_8, p_9, p_{10}$尽可能的小, 由此令$p_3=\cdots =p_7, p_8=p_9=p_{10}=0$, 这样还有余值$a-5p_7=0.5$.现在安排前面的$p_1$.按照前面的安排, 可以知道此时总有$p_1\geq p_2$且$p_1=0.5-p_2=0.35$是最大值.那么$P_{\max}=(0.35, 0.15, 0.1, 0.1, 0.1, 0.1, 0.1, 0, 0, 0)$.
若$p_2=0.16, p_7=0.05$, 先求$P_{\min}$.按照从前往后的安排, 可以知道$p_1=p_2=0.16, p_3=\cdots =p_7=0.05$.此时$p_8=p_9=p_{10}=0.43/3>p_7$, 不满足$P$的条件, 需要调整$p_2, p_7$之间的$p_3, p_4, p_5, p_6$而令$p_8=p_9=p_{10}=p_7$.这样还有余值$a-2p_2-4p_7=0.48$.为使前面相加的和尽可能小, 只能让$p_3=p_4=p_5=p_6=0.48/4=0.12$.又因为$0.16>0.12>0.05$, 则$P_{\min}=(0.16, 0.16, 0.12, 0.12, 0.12, 0.12, 0.05, 0.05, 0.05, 0.05)$.
再看$P_{\max}$.按照从后往前安排可知$P_{\max}=(0.59, 0.16, 0.05, 0.05, 0.05, 0.05, 0.05, 0, 0, 0)$.
若$p_2=0.08, p_7=0.05$, 先求$P_{\min}$.按照从前往后的安排, 可以知道$p_1=p_2=0.08, p_3=\cdots =p_7=0.05$.此时$p_8=p_9=p_{10}=0.59/3>p_7$, 不满足$P$的条件, 需要调整$p_2, p_7$之间的$p_3, p_4, p_5, p_6$而令$p_8=p_9=p_{10}=p_7$.余值为$a-2p_2-4p_7=0.64$.再令$p_3=p_4=p_5=p_6=0.64/4=0.16$, 此时$0.08 <0.16$, 故需要进一步调整$p_2$的前值$p_1$, 而让$p_3=p_4=p_5=p_6=p_2$.因此有$p_1=1-5p_2-4p_7=0.4$.由于$0.4>0.08$, 所以$P_{\min}=(0.4, 0.08, 0.08, 0.08, 0.08, 0.08, 0.05, 0.05, 0.05, 0.05)$.
再看$P_{\max}$.按照从后往前安排可知$P_{\max}=(0.67, 0.08, 0.05, 0.05, 0.05, 0.05, 0.05, 0, 0, 0)$.
由这个例子可以看出, 当变量向量$P$的第一个变量$p_1$未知时, 求$P_{\max}$时十分简单, 按照从后往前安排即可.但是求$P_{\min}$时就会产生多种情况.下面一个例子是在已知$p_1$的情况下求解变量向量$P$的$P_{\min}$和$P_{\max}$.
例2 假设$a=1, P=(p_1, p_2, \cdots, p_{10})$.
若$p_1=0.2, p_4=0.1, p_7=0.04$, 先求$P_{\min}$.按照从前往后的安排, 可以知道$p_2=p_3=p_4=0.1, p_5=p_6=p_7=0.04$.此时$p_8=p_9=p_{10}=0.38/3>p_7$, 不满足$P$的条件, 需要调整$p_4, p_7$之间的$p_5, p_6$而令$p_8=p_9=p_{10}=p_7$, 此时余值为$a-p_1-3p_4-4p_7=0.34$.令$p_5=p_6=0.34/2=0.17>0.1$可知仍然不符合条件, 需要调整$p_1, p_4$之间的$p_2, p_3$而令$p_5=p_6=p_4, p_8=p_9=p_{10}=p_7$, 此时余值为$a-p_1-3p_4-4p_7=0.34$.令$p_2=p_3=0.34/2=0.17$, 此时满足条件, 即$P_{\min}=(0.2, 0.17, 0.17, 0.1, 0.1, 0.1, 0.04, 0.04, 0.04, 0.04)$.
现求$P_{\max}$, 按照从后往前的安排, 令$p_2=p_3=p_1, p_5=p_6=p_4$, 此时余值为$a-3p_1-3p_4-p_7=0.06$.由于$0.06 <3p_7=0.12$, 在安排$p_8, p_9, p_{10}$时, 为了使各个值与前面的相加尽可能的大, 因为$p_7\geq p_8\geq p_9\geq p_{10}$, 所以$p_8, p_9, p_{10}$中前面尽量多的等于$p_7$, 剩余的若不足$p_7$, 再利用后面的一个变量一次补齐即可, 若还有剩余的变量, 则全部补$0$.也就是说$p_8=p_7$, 由于$0.06-0.04=0.02<0.04$, 则令$p_9=0.02$, 那么$p_{10}=0$, 即$P_{\max}=(0.2, 0.2, 0.2, 0.1, 0.1, 0.1, 0.04, 0.04, 0.02, 0)$.
若$p_1=0.2, p_3=0.15, p_7=0.08$, 先求$P_{\min}$.按照从前往后的安排, 可以知道$p_2=p_3=0.15, p_4=\cdots =p_7=0.08$.此时余值为$a-p_1-2p_3-4p_7=0.18$.令$p_8=p_9=p_{10}=0.18/3=0.06$可知符合条件, 即$P_{\min}=(0.2, 0.15, 0.15, 0.08, 0.08, 0.08, 0.08, 0.06, 0.06, 0.06)$.
现求$P_{\max}$, 按照从后往前的安排, 令$p_1=p_2, p_4=p_5=p_6=p_3$, 此时各个变量值相加已超过$a=1$, 不满足条件, 考虑调整$p_3, p_7$之间的$p_4, p_5, p_6$而令$p_8=p_9=p_{10}=0$, 此时余值为$a-2p_1-p_3-p_7=0.37$.由于$0.45=3p_3>0.37>3p_7=0.24$, 在安排$p_4, p_5, p_6$时, 为了使各个值与前面的相加尽可能的大, 因为$p_4\geq p_5\geq p_6$, 所以$p_4, p_5, p_6$中前面尽量多的等于$p_3$, 令$p_4=p_3$, 则余值为$0.37-p_4=0.22>0.15$, 若令$p_5=0.15$, 那么余值即为$0.22-0.15=0.07<0.08$已不满足条件.此时需要调整$p_5, p_6$, 而且令$p_6=0.8$, 所以$p_5=0.14$.由于$0.15>0.14>0.08$, 所以$P_{\max}=(0.2, 0.2, 0.15, 0.15, 0.14, 0.08, 0.08, 0, 0, 0)$.
从这个例子可以看出, 当变量向量$P$的第一个变量$p_1$已知时, 求$P_{\max}$时会比较复杂.
由以上两个例子可以看出, 在已知少量变量时, 求任意变量向量$P$的$P_{\min}$和$P_{\max}$的过程中, $P_{\min}$的解法遵循从前往后的安排规则, 即先让前面的和后面那个已知变量相等, 然后从后面调整不符合条件的安排规则; 而$P_{\max}$的解法遵循从后往前的安排规则, 当变量向量的第一个变量未知时, 即让后面的最小化, 第一个变量最大化, 当变量向量的第一个变量已知时, 先让后面的等于前面那个已知变量, 然后再从后往前调整不符合条件的安排规则.
定理2.1的证明 依$P_{\min}, P_{\max}$的定义可知, 当$P=P_{\min}$时, $\phi(P)$达到最小值; 当$P=P_{\max}$时, $\phi(P)$达到最大值.
下面证明当$\phi(P)$达到最小值时, $P=P_{\min}$; 当$\phi(P)$达到最大值时, $P=P_{\max}$.
依题意可知, $p_{k_i}\leq a/k_i(i=1, \cdots , l)$且$a-\sum\limits_{i=1}^{l}(k_i-k_{i-1})p_{k_i}\geq p_{k_1}$.
对于任意的$Q\in M(P)$, 其中$q_{k_i}=p_{k_i}(i=1, \cdots, l)$.我们将证明$P_{\min}\sqsubset Q\sqsubset P_{\max}$.若$l\geq n-1$, 则有$P_{\min}=Q=P_{\max}$.下面假设$l<n-1$.
(1) 对于$Q\sqsubset P_{\max}$,
当$k_1\geq 2$时, 由于$q_1+\sum\limits_{i=1}^{l}(k_i-k_{i-1})q_{k_i}\leq a$, 故$q_1\leq a-\sum\limits_{i=1}^{l}(k_i-k_{i-1})p_{k_i}$.
若$\exists\ k_m\leq i_0< k_{m+1}(0\leq m\leq l-1)$使得$\sum\limits_{i=1}^{i_0}q_i>a-\sum\limits_{i=1}^{l}(k_i-k_{i-1})p_{k_i}+\sum\limits_{i=1}^{m}(k_i-k_{i-1})p_{k_i}+(i_0-k_m)p_{k_{m+1}}, $则
矛盾!
当$k_l\leq i_0\leq n$时总有$\sum\limits_{i=1}^{i_0}q_i\leq a$, 故此种情况$Q\sqsubset P_{\max}$成立.
(ⅰ)对于$\forall\ k_m\leq i_1<k_{m+1}(1\leq m\leq l-1)$, 总有
对于$\forall\ k_{l}\leq i_1< r$, 总有
由以上可知, 当$i_1=r$时, $p_{r}\leq q_r$.故此种情况$Q\sqsubset P_{\max}$成立.
(ⅱ)对于$\forall\ k_m\leq i_2< k_{m+1}(1\leq m< s)$, 总有
成立.
对于$\forall\ k_s\leq i_2< r$, 总有
对于$\forall\ r\leq i_2< k_{s+1}$, 总有
对于$\forall\ k_{m}\leq i_2\leq k_{m+1}(s+1\leq m\leq l-1)$, 总有
成立.故此种情况$Q\sqsubset P_{\max}$成立.特别地, 若$k_{s+1}=k_s+1$, 则考虑$P_{\max}$在(ⅰ)中.
(2) 对于$P_{\min}\sqsubset Q$,
(ⅰ)当$k_1>1$时, 由于$(k_1-1)q_1+\sum\limits_{i=1}^{l}(k_{i+1}-k_{i})p_{k_i}+p_{k_l}\geq \sum\limits_{i=1}^{n}q_i=a$, 故
若$\exists\ 1\leq i_1 < k_1-1$使得
那么$q_{i_1} <\frac{a-(\sum\limits_{i=1}^{l}(k_{i+1}-k_i)p_{k_i}+p_{k_l})}{k_1-1}, $则
若$\exists\ k_m\leq i_1\leq k_{m+1}(1\leq m\leq l)$使得
那么
故当$p_{k_1}\leq \frac{a-(\sum\limits_{i=1}^{l}(k_{i+1}-k_i)p_{k_i}+p_{k_l})}{k_1-1}$时$P_{\min}\sqsubset Q$成立.由于当$s=0$时, $p_{k_1}\leq a/n$, 总有不等式成立, 故此时$P_{\min}\sqsubset Q$成立.
(ⅱ) 依题意可知$q_1\geq q_{k_1}=p_{k_1}$且对于$\forall\ k_m\leq i_2\leq k_{m+1}(0\leq m\leq l-1)$, 总有$\sum\limits_{i=1}^{i_2}q_i\geq p_{k_1}+\sum\limits_{i=1}^{m}(k_i-k_{i-1})p_{k_i}+(i_2-k_m)p_{k_{m+1}}$成立.
当$k_l <n$时, 若$\exists i_2>k_l$使得
故当$p_{k_l}\geq \frac{a-(\sum\limits_{i=1}^{l}(k_i-k_{i-1})p_{k_i}+p_{k_1})}{n-k_l}$时$P_{\min}\sqsubset Q$成立.由于当$s=l$时, $p_{k_l}\geq a/n$, 总有不等式成立, 故此时$P_{\min}\sqsubset Q$成立.
(ⅲ) 令
对于$\forall\ k_{m-1}\leq i_3\leq k_{m}(1\leq m\leq s)$, 总有$\sum\limits_{i=1}^{i_3}q_i\geq p_{k_1}+\sum\limits_{i=1}^{m-1}(k_i-k_{i-1})p_{k_i}+(i_3-k_{m-1})p_{k_{m}}$成立.
当$k_{s+1}>k_s+1$时, 若$\exists k_s<i_3<k_{s+1}$使得
则$q_{i_3}<v_s$.那么
对于$\forall\ k_{m}\leq i_3\leq k_{m+1}(s+1\leq m\leq l)$, 总有$\sum\limits_{i=i_3}^{l}q_i\leq p_{k_l}+\sum\limits_{i=m+1}^{l}(k_{i+1}-k_{i})p_{k_i}+(k_{m+1}-i_3)p_{k_{m}}$成立.
故当$p_{k_s}\geq \frac{a-(\sum\limits_{i=1}^{s}(k_i-k_{i-1})p_{k_i}+p_{k_1}+\sum\limits_{i=s+1}^{l}(k_{i+1}-k_i)p_{k_i}+p_{k_l})}{k_{s+1}-k_s-1}\geq p_{k_{s+1}}$, $0<s<l$时$P_{\min}\sqsubset Q$成立.
特别地, 若$k_1=k_0=1$, 则考虑$P_{\min}$在(ⅱ)和(ⅲ)中; 若$k_l=k_{l+1}=n$, 则考虑$P_{\min}$在(ⅰ)和(ⅲ)中; 若$k_{s+1}=k_s+1$, 则考虑$P_{\min}$在(ⅰ)和(ⅱ)中.
例3 假设$a=1, P=(p_1, p_2, \cdots, p_6)$.
当$p_2=0.15, p_4=0.1$时, 按定理2.1(1)可知$k_1=2>1$则$P_{\max}=(0.65, 0.15, 0.1, 0.1, 0, 0)$.又$1/6>p_2>p_4$, 则由(2)(ⅰ)可知$P_{\min}=(0.4, 0.15, 0.15, 0.1, 0.1, 0.1)$.
当$p_2=0.2, p_4=0.15$时, 按定理2.1(1)可知$k_1=2>1$则$P_{\max}=(0.5, 0.2, 0.15, 0.15, \\0, 0)$.又$p_2>1/6>p_4$且$p_2>1-(2p_2+3p_4)=0.15\geq p_4$, 则由(2)(ⅲ)可知$P_{\min}=(0.2, 0.2, 0.15, 0.15, 0.15, 0.15)$.
当$p_2=0.2, p_4=0.18$时, 按定理2.1(1)可知$k_1=2>1$则$P_{\max}=(0.44, 0.2, 0.18, 0.18, \\0, 0)$.又$p_2>p_4>1/6$, 则由(2)(ⅱ)可知$P_{\min}=(0.2, 0.2, 0.18, 0.18, 0.12, 0.12)$.
例4 假设$a=1, P=(p_1, p_2, \cdots, p_6)$.
当$p_2=0.3, p_4=0.14$时$p_2>1/6>p_4$, 由于$p_2>p_4>1-(2p_2+3p_4)=-0.12$, 则均不满足定理2.1(2)中(ⅰ)(ⅲ)的条件; 又由于$p_4>(1-(2p_2+2p_4))/2=0.06$, 则按(ⅱ), $P_{\min}=(0.3, 0.3, 0.14, 0.14, 0.06, 0.06)$.
当$p_2=0.2, p_4=0.13$时$p_2>1/6>p_4$, 由于$p_4 <(1-(2p_2+2p_4))/2=0.17, 1-(2p_2+3p_4)=0.21>p_2>p_4$, 则均不满足定理2.1(2)中(ⅱ)(ⅲ)的条件, 但是满足(ⅰ), 则$P_{\min}=(0.21, 0.2, 0.2, 0.13, 0.13, 0.13)$.
当$p_2=0.2, p_4=0.14$时$p_2>1/6>p_4$, 由于$p_4<(1-(2p_2+2p_4))/2=0.16, p_2>1-(2p_2+3p_4)=0.18>p_4$, 则均不满足定理2.1(2)中(ⅰ)(ⅱ)的条件, 但是满足(ⅲ), 则$P_{\min}=(0.2, 0.2, 0.18, 0.14, 0.14, 0.14)$.
例5 假设$a=1, P=(p_1, p_2, \cdots, p_9)$.
当$p_1=0.23, p_5=0.1, p_8=0.01$时$k_1=1$, 由于$(5-1)p_1+(8-5)p_5>1$, 所以不满足定理2.1(2)中(ⅰ)的条件, 又由于$p_1>(1-(p_1+p_5+3p_8))/3=0.64/3>p_5$, 则按(ⅱ)可知, $r=4$, $P_{\max}=(0.23, 0.23, 0.23, 0.18, 0.1, 0.01, 0.01, 0.01, 0)$.
当$p_1=0.2, p_5=0.1, p_8=0.01$时$k_1=1$, 由于$(5-1)p_1+(8-5)p_5>1$, 所以不满足定理2.1(2)中(ⅰ)的条件, 又由于$p_1 <(1-(p_1+p_5+3p_8))/3=0.67/3$, 而$p_5>(1-(4p_1+p_5+p_8))/2=0.045>p_8$, 则按(ⅱ)可知, $r=6$, $P_{\max}=(0.2, 0.2, 0.2, 0.2, 0.1, 0.08, 0.01, 0.01, 0)$.
当$p_1=0.18, p_5=0.12, p_7=0.03$时$k_1=1$, 由于$1-((5-1)p_1+(7-5)p_5+p_7)=0.01>p_7$, 满足定理2.1(2)中(ⅰ)的条件, 则$r=8$, $P_{\max}=(0.18, 0.18, 0.18, 0.18, 0.12, 0.12, 0.03, 0.01, 0)$.
推论2.1 设定义在集合${\cal A}\subset {\Bbb R}^n$上的实值函数$\phi$是Schur-凸函数, 对于任意的$P\in \bigtriangleup_n(a)\subset {\cal A}$和给定的$p_k(1\leq k\leq n)$, 那么
(ⅰ) 若$k>1$, 则$P=P_{\max}=(a-(k-1)p_{k}, p_{k}, \cdots , p_{k}, 0, \cdots, 0)$;
(ⅱ) 若$k=1$, 则$P=P_{\max}=(p_{k}, p_{k}, \cdots , p_{k}, p_r, 0, \cdots, 0)$, 其中$p_i=p_{k}$ $(k <i<r\leq n)$, $p_r=a-(r-l)p_{k}$且$0\leq p_r\leq p_{k}$.
(ⅰ) 若$p_k\leq a/n$, 则$P_{\min}=(\frac{a-(n-k+1)p_k}{k-1}, \cdots, \frac{a-(n-k+1)p_k}{k-1}, p_k, \cdots, p_k)$.
(ⅱ) 若$p_k\geq a/n$, 则$P_{\min}=(p_k, \cdots, p_k, \frac{a-kp_k}{n-k}, \cdots, \frac{a-kp_k}{n-k})$.
证 令定理2.1中$l=1$, 则$k_1=k_2=\cdots =k_l=k$.由此可知$s=0$或者$s=l$.
(1) 直接代入即可得到.
(2) (ⅰ)若$p_k\leq a/n$, 可知$s=0$.由此当$k>1$时, 代入$k_1=k_2=\cdots =k_l=k$即可得. (ⅱ)若$p_k\geq a/n$, 可知$s=l$.由此当$k <n$时, 代入$k_1=k_2=\cdots =k_l=k$即可得.若$k=1$或者$k=n$, 则必然有$p_k=a/n$, 同样满足题意.故原命题成立.
例6 假设$a=1, P=(p_1, p_2, \cdots, p_5)$.
当$p_3=0.3>1/5$时, 按推论2.1(1), $k_1=2>1$则$P_{\max}=(0.4, 0.3, 0.3, 0, 0)$.由推论2.1(2)(ⅱ)可知$P_{\min}=(0.3, 0.3, 0.3, 0.05, 0.05)$.
当$p_3=0.1 <1/5$时, 按推论2.1(1), $k_1=2>1$则$P_{\max}=(0.8, 0.1, 0.1, 0, 0)$.由推论2.1(2)(ⅰ)可知$P_{\min}=(0.35, 0.35, 0.1, 0.1, 0.1)$.
由推论2.1直接令$k=n$可得以下推论.
推论2.2 设定义在集合${\cal A}\subset {\Bbb R}^n$上的实值函数$\phi$是Schur-凸函数, 对于任意的$P\in \bigtriangleup_n(a)\subset {\cal A}$和给定的$p_n$, 那么
(1) 当且仅当$P=P_{\max}=(a-(n-1)p_n, p_n, \cdots, p_n)$时, $\phi(P)$达到最大值;
(2) 当且仅当$P=P_{\min}=(\frac{a-p_n}{n-1}, \frac{a-p_n}{n-1}, \cdots , p_n)$时, $\phi(P)$达到最小值.
基于定理2.1, 对于任意$P\in \bigtriangleup_n(a)$, 记$\underline{P}^{(n, a)}(k_1, k_2, \cdots , k_l)=P^{(n, a)}_{\min}(k_1, k_2, \cdots, k_l)$并称之为向量$P$在不完全信息集$M_{n, a}(P_{k_1, k_2, \cdots , k_l})$下的优超下界, 简称不完全信息下向量$P$的优超下界; 记$\overline{P}^{(n, a)}(k_1, k_2, \cdots , k_l)=P^{(n, a)}_{\max}(k_1, k_2, \cdots, k_l)$并称之向量$P$在不完全信息集$M_{n, a}(P_{k_1, k_2, \cdots , k_l})$下的优超上界, 简称不完全信息下向量$P$的优超上界.
若已知$n, a$以及$k_1, k_2, \cdots, k_l(l\leq n)$, 在不至于混淆的情况下, 为了简单起见, 记$\underline{P}^{(n, a)}$ $(k_1, k_2, \cdots, k_l)$为$\underline{P}$, 以及$\overline{P}^{(n, a)}(k_1, k_2, \cdots, k_l)$为$\overline{P}$.显然, 我们有$\underline{P}\sqsubset P\sqsubset\overline{P}$, 也可以形象的写成$P\in[\underline{P}, \overline{P}]$.
定理3.1 对于任意的$P\in\bigtriangleup_n(a), Q\in\bigtriangleup_m(a)$以及给定的$p_{k_1}, p_{k_2}, \cdots , p_{k_l}, q_{s_1}, q_{s_2}, \cdots, q_{s_t}$ $(l\leq n, t\leq m)$, 其中$1=k_0\leq k_1 < k_2<\cdots <k_l\leq k_{l+1}=n, 1=s_0\leq s_1<s_2<\cdots <s_t\leq s_{t+1}=m$.若$\overline{P}^{(n, a)} (k_1, k_2, \cdots, k_l)\sqsubset \underline{Q}^{(m, a)} (s_1, s_2, \cdots, s_t)$, 则$P\sqsubset Q$.
由于$P\sqsubset \overline{P}^{(n, a)}(k_1, k_2, \cdots, k_l)\sqsubset \underline{Q}^{(m, a)}(s_1, s_2, \cdots, s_t)\sqsubset Q$, 所以这是一个明显的结论.
另外值得注意的是, 若$P\in\bigtriangleup_n(a), Q\in\bigtriangleup_m(a)$, 由优超定义, 只能是$n\geq m$, 此时只需将$\underline{Q}$尾后补零, 扩展到$n$维向量$\underline{Q}^{\prime}$即可.
例7 假设$a=1, P=(p_1, p_2, \cdots, p_9), Q=(q_1, q_2, \cdots , q_8)$.若已知$p_1=0.15, p_5=0.11$且$q_7=0.05$时, 由定理2.1的当$k_1=1$且$a-(\sum\limits_{i=1}^{l-1}(k_{i+1}-k_i)p_{k_i}+p_{k_l})\geq 0$的情况可知, $\overline{P}=(0.15, 0.15, 0.15, 0.15, 0.11, 0.11, 0.11, 0.07, 0)$, $\underline{Q}=(0.15, 0.15, 0.15, 0.15, 0.15, 0.15, 0.05, 0.05)$.显然$\overline{P}\sqsubset \underline{Q}$, 则$P\sqsubset Q$.
根据定理2.1, 除了$k_1=1$且$a-(\sum\limits_{i=1}^{l-1}(k_{i+1}-k_i)p_{k_i}+p_{k_l})\geq 0$的情况, 若$k_l <k_{l+1}=n$, 为使$\overline{P}^{(n, a)}(k_1, k_2, \cdots, k_l)\sqsubset \underline{Q}^{(m, a)}(s_1, s_2, \cdots, s_t)$成立, 那么必须$s_t=s_{t+1}=m$且$q_{s_t}=0$.为此, 我们直接讨论$k_l=k_{l+1}=n$时的情况.
由于当$t\geq 2$或者$l\geq 2$时, 由定理2.1可知, 不仅要考虑已知概率的大小关系, 还需要讨论已知概率的位置关系, 因此为了简单起见, 令$a=1, l=t=1$, 即$P, Q\in \bigtriangleup_n$.
推论3.1 对于任意的$P, Q\in \bigtriangleup_n, \ n\geq2$和$p_n, q_k(k\leq n)$,
(1) 若$q_k\leq 1/n$, 当$\frac{1}{n-1}-\frac{1-(n-k+1)q_k}{(k-1)(n-1)}\leq p_n\leq \frac{1}{n}$时, $P\sqsubset Q$.
(2) 若$q_k\geq 1/n$, 当$\frac{1}{n-k}-\frac{kq_k}{n-k}\leq p_n\leq \frac{1}{n}$时, $P\sqsubset Q$.
证 不失一般性, 设$P\sqsubset Q$.由定理3.1可知只需要考虑$\overline{P}\sqsubset \underline{Q}$.由推论2.2可知, $\overline{P}=(1-(n-1)p_{n}, p_{n}, \cdots , p_{n})$.由推论2.1可知, 当$q_k\leq 1/n$时, $\underline{Q}=(\frac{1-(n-k+1)p_k}{k-1}, \cdots , \frac{1-(n-k+1)p_k}{k-1}, $ $p_k, \cdots, p_k);$当$q_k\geq 1/n$时, $\underline{Q}=(q_k, \cdots, q_k, \frac{1-kq_k}{n-k}, \cdots , \frac{1-kq_k}{n-k})$.
(1) 若$q_k\leq 1/n$, 则$\overline{P}\sqsubset \underline{Q}$等价于$\frac{1-(n-k+1)p_k}{k-1}\geq 1-(n-1)p_{n}, q_k\leq p_{n}$, 即$p_n\geq \frac{1}{n-1}-\frac{1-(n-k+1)q_k}{(k-1)(n-1)}\geq q_k$.原命题成立.
(2) 若$q_k\geq 1/n$, 则$\overline{P}\sqsubset \underline{Q}$等价于$q_k\geq 1-(n-1)p_{n}, \frac{1-kq_k}{n-k}\leq p_{n}$, 即$p_n\geq \frac{1}{n-k}-\frac{kq_k}{n-k}\geq \frac{1}{n-1}-\frac{q_k}{n-1}$.原命题成立.
特别地, 令$k=n$, 我们有如下结论.
推论3.2 对于任意的$P, Q\in \bigtriangleup_n, \ n\geq2$,
(1) 若$\frac{1}{n-1}-\frac{1-q_n}{(n-1)^2}\leq p_n\leq \frac{1}{n}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.
(2) 若$p_n=q_n <\frac{1}{n}, n\geq3$且$\frac{1-p_n}{n-2}-\frac{1-p_n-q_{n-1}}{(n-2)^2}\leq p_{n-1}\leq \frac{1-p_n}{n-1}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.特别地, 若$n=2$且$p_n=q_n$, 则$P=Q$.
证 (1) 考虑推论3.1, 令$k=n$, 由于$q_n\leq 1/n$, 可知$P\sqsubset Q$, 又$H$是Schur -凹函数, 从而$H(Q)\leq H(P)$.又由Tsallis熵的保序性[19]可知, 若对于任意$P, Q\in \Gamma_n$, $H(P)\geq H(Q)$, 那么$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
(2) 当$n=2$, $p_n=q_n <\frac{1}{n}$时, 易知$P=Q$.若$n\geq3$, 令$P^{\prime}=(p_1, p_2, \cdots, p_{n-1})$, $Q^{\prime}=(q_1, q_2, \cdots, q_{n-1})$.由(1)及推论2.2可知, 若$\frac{1-p_n}{n-2}-\frac{1-p_n-q_{n-1}}{(n-2)^2}\leq p_{n-1}\leq \frac{1-p_n}{n-1}$, 则$P^{\prime}\sqsubset Q^{\prime}$, 即$P\sqsubset Q$, $H(Q)\leq H(P)$.又由Tsallis熵的保序性[19]可知, $S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
由此推论(2)可知, 当$p_n=q_n$时, $p_n$与$q_n$对$P, Q$间的优超关系判断毫无价值, 为此只能进一步获取$p_{n-1}$以及$q_{n-1}$.
例8 假设$P=(p_1, p_2, \cdots, p_5), Q=(q_1, q_2, \cdots, q_4)$, 若$p_5=0.19$, 而根据推论2.2可知$q_5=0$.由推论3.2计算可以得到$p_5>0.25-(1-q_5)/16=0.1875$, 故$P\sqsubset Q$.
为了简单起见, 当$l=2$或者$t=2$时, 我们也只讨论$p_1, p_n, q_n$或者$p_n, q_1, q_n$的情形.
推论3.3 对于任意的$P, Q\in \bigtriangleup_n, \ n\geq2$, 如果$p_n\geq q_n$,
(1) 若$q_1\geq 1-(n-1)p_n$或者$p_1\leq \frac{1-q_n}{n-1}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.
(2) 若$p_n=q_n <\frac{1}{n}, n\geq3$且$q_1\geq 1-p_n-(n-2)p_{n-1}$或者$p_1\leq \frac{1-q_n-q_{n-1}}{n-2}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.特别地, 若$n=2$且$p_n=q_n$, 则$P=Q$.
证 由$p_n\geq q_n$可知要证明$P\sqsubset Q$.若已知$p_1, p_n, q_n$, 由定理2.1可知$\overline{P}=(p_{1}, \cdots, p_{1}, $ $p_r, $ $p_{n}, \cdots , p_{n})$, 其中$p_1\geq p_r\geq p_n$, $\underline{Q}=(\frac{1-q_n}{n-1}, \cdots, \frac{1-q_n}{n-1}, q_n)$.若已知$p_n, q_1, q_n$, 由定理2.1可知$\overline{P}=(1-(n-1)p_n, p_{n}, \cdots, p_{n})$, $\underline{Q}=(q_1, \frac{1-q_1-q_n}{n-2}, \cdots , \frac{1-q_1-q_n}{n-2}, q_n)$.根据定理3.1可知, 只需$\overline{P}\sqsubset \underline{Q}$即可.
(1) 若已知$p_n, q_1, q_n$, 则只需满足$q_1\geq 1-(n-1)p_n$, 那么$\overline{P}\sqsubset \underline{Q}$.
对于$q_1\geq 1-(n-1)p_n$, 若$\exists\ 1\leq i_0\leq n-1$使得$\sum\limits_{i=1}^{i_0}q_i <1-(n-i_0)p_n$, 则$q_{i_0}\leq p_n$, 因此$\sum\limits_{i=1}^{n}q_i<1-(n-i_0)p_n+\sum\limits_{i=i_0+1}^{n}q_i\leq 1$.矛盾!故此时$\overline{P}\sqsubset \underline{Q}$.
若已知$p_1, p_n, q_n$, 则只需满足$p_1\leq \frac{1-q_n}{n-1}$, 那么$\overline{P}\sqsubset \underline{Q}$.
对于$p_1\leq \frac{1-q_n}{n-1}$, 若$\exists\ 1\leq i_1\leq n-1$使得$\sum\limits_{i=1}^{i_1}p_i>i_1\frac{1-q_n}{n-1}$, 则$p_{i_1}>\frac{1-q_n}{n-1}$.矛盾!故此时$\overline{P}\sqsubset \underline{Q}$.
综上所述, 若$q_1\geq 1-(n-1)p_n$或者$p_1\leq \frac{1-q_n}{n-1}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$.由Tsallis熵的保序性可知[19], 若对于任意$P, Q\in \Gamma_n$, $H(P)\geq H(Q)$, 那么$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
(2) 当$n=2$, $p_n=q_n <\frac{1}{n}$时, 易知$P=Q$.若$n\geq3$, 令$P^{\prime}=(p_1, p_2, \cdots, p_{n-1})$, $Q^{\prime}=(q_1, q_2, \cdots, q_{n-1})$.由(1)及推论2.2得, 当$\frac{1-p_n}{n-2}-\frac{1-p_n-q_{n-1}}{(n-2)^2}\geq p_{n-1}\geq q_{n-1}$时, 若$q_1\geq 1-p_n-(n-2)p_{n-1}$或者$p_1\leq \frac{1-q_n-q_{n-1}}{n-2}$, 则$P^{\prime}\sqsubset Q^{\prime}$, 即$P\sqsubset Q$, $H(Q)\leq H(P)$, 进而$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.
例9 假设$P=(0.25, 0.2, 0.19, 0.18, 0.18), \ Q=(0.3, 0.22, 0.2, 0.15, 0.13)$.如果现在只知道$p_5=0.18, q_5=0.13$, 计算可知不满足推论3.2的条件.我们需要更多的信息.假设我们又知道$q_1=0.3$, 由于$q_1>1-4p_5=0.28$可知满足推论3.3的条件, 故$P\sqsubset Q$.
对于任意的$P, Q\in\bigtriangleup_n, \ n\geq2$, 推论3.1与3.2讨论的其实是$\overline{P}\sqsubset \underline{Q}$, 即两个区间$[\underline{P}, \overline{P}], [\underline{Q}, \overline{Q}]$无重叠部分的情况, 而推论3.3讨论的其实是$\underline{P}\sqsubset P \sqsubset \underline{Q}$, 或者$\overline{P}\sqsubset Q \sqsubset \overline{Q}$, 即当$[\underline{P}, \overline{P}], [\underline{Q}, \overline{Q}]$有重叠部分时, 无重叠区域中的情况; 下面将讨论$[\underline{P}, \overline{P}], [\underline{Q}, \overline{Q}]$有重叠部分时, 重叠区域内的情况.由文献[10]可知, 当$H(P)=H(Q)$且$P\sqsubset Q$时必有$P=Q$.那么对于两个Shannon熵相等的有限离散概率分布不存在优超关系, 我们可以想象优超关系只能存在于其中一个Shannon熵的邻域之外.
推论3.4 对于任意的$P, Q\in \bigtriangleup_n, \ n\geq4$, 如果$\frac{1}{n-1}-\frac{1-q_n}{(n-1)^2}\geq p_n\geq q_n$, $\frac{1-q_n}{n-1} \leq p_1\leq q_1\leq 1-(n-1)p_n$,
(1) 若$q_2\geq 1-q_1-(n-2)p_n$或者$p_2\leq \frac{1-p_1-q_n}{n-2}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.
(2) 若$p_n=q_n\leq \frac{1}{n}, n\geq4$且$q_2\geq 1-q_1-p_n-(n-3)p_{n-1}$或者$p_2\leq \frac{1-p_1-q_n-q_{n-1}}{n-3}$, 则$P\sqsubset Q$, $H(Q)\leq H(P)$进而$S_q(Q)\leq S_q(P)$.
证 由$p_n\geq q_n$可知要证明$P\sqsubset Q$.由推论3.2, 3.3可知$\underline{P} \sqsubset \underline{Q}, \ \overline{P} \sqsubset \overline{Q}$且$\frac{1-q_n}{n-1} \leq p_1\leq q_1\leq 1-(n-1)p_n$.
(1) 令$P^{\prime}=(q_1, 1-q_1-(n-2)p_n, p_n, \cdots, p_n)$, 可以验证$P^{\prime}\in \bigtriangleup_n$.由$q_1\geq p_1$可知$P\sqsubset P^{\prime}$.若$P^{\prime}\sqsubset Q$, 则有$P\sqsubset Q$.由推论2.2、推论3.3, 比较$P^{\prime}$和$Q$可知, 若$q_2\geq 1-q_1-(n-2)p_n$, 则$P^{\prime}\sqsubset Q$, 即$P\sqsubset Q$, $H(Q)\leq H(P)$.又由于由Tsallis熵的保序性可知[19], 若对于任意$P, Q\in \Gamma_n$, $H(P)\geq H(Q)$, 那么$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
令$Q^{\prime}=(p_1, \frac{1-p_1-q_n}{n-2}, \cdots , \frac{1-p_1-q_n}{n-2}, q_n)$, 可以验证$Q^{\prime}\in \bigtriangleup_n$.由$q_1\geq p_1$可知$Q^{\prime}\sqsubset Q$.若$P\sqsubset Q^{\prime}$, 则有$P\sqsubset Q$.由推论2.2、推论3.3, 比较$Q^{\prime}$和$P$可知, 若$p_2\leq \frac{1-p_1-q_n}{n-2}$, 则$P\sqsubset Q^{\prime}$, 即$P\sqsubset Q$, $H(Q)\leq H(P)$, 进而$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
(2) 令$P^{\prime}=(p_1, p_2, \cdots, p_{n-1})$, $Q^{\prime}=(q_1, q_2, \cdots, q_{n-1})$.根据(1)和推论2.2可得, 当$\frac{1-p_n}{n-2}-\frac{1-p_n-q_{n-1}}{(n-2)^2}\geq p_{n-1}\geq q_{n-1}$, 若$\frac{1-q_n-q_{n-1}}{n-2}\leq p_1\leq q_1\leq 1-p_n-(n-2)p_{n-1}$, $q_2\geq 1-q_1-p_n-(n-3)p_{n-1}$或者$p_2\leq \frac{1-p_1-q_n-q_{n-1}}{n-3}$, 则有$H(Q^{\prime})\leq H(P^{\prime})$, $P^{\prime}\sqsubset Q^{\prime}$, 即$P\sqsubset Q$, $H(Q)\leq H(P)$, 进而$S_q(P)\geq S_q(Q)$, 其中$q\in\mathbb{R}^+$.得证.
例10 假设$P=(0.4, 0.25, 0.13, 0.12, 0.1), \ Q=(0.5, 0.2, 0.11, 0.1, 0.09)$, 如果我们知道$p_5=0.1, q_5=0.09$, $p_5 <0.25-(1-q_5)/16=0.193125$可知不满足推论3.2的条件, 那么就需提供更多的信息.倘若此时我们知道$p_1=0.4, q_1=0.5$, 然而$p_1>(1-q_5)/4=0.22725$且$q_1<1-4p_5=0.6$, 可知不满足推论3.3的条件.此时需进一步知道$q_2=0.2$, 由于$q_2=0.2=1-0.5-3p_5=0.2$, 此时满足上述推论3.4的条件, 故$P\sqsubset Q$.
综上, 若比较$P, Q\in\bigtriangleup_n(a), p_n>q_n$之间的优超关系, 一般需要以下步骤
1) 由定理3.1的讨论可知需已知$p_n, q_n$的信息, 若$p_n, q_n$满足推论3.2的(1), 则可以直接判断$P, Q$之间的优超关系.
2) 若$p_n, q_n$不满足推论3.2, 那么可以先获取$q_1$, 若$p_n, q_1, q_n$满足推论3.3的(1), 则可以直接判断$P, Q$之间的优超关系; 不然, 则获取$p_1$, 若$p_n, p_1, q_n$满足推论3.3的(1), 则可以直接判断$P, Q$之间的优超关系;
3) 若$p_n, p_1, q_1, q_n$不满足推论3.3, 那么可以根据步骤1)和2), 继续获取$p_{n-1}, q_{n-1}$或者$p_2, q_2$的信息, 再利用推论3.4的(1)或者定理3.1来判断.
但是若$p_n=q_n$, 由推论3.2的讨论可知$p_n$与$q_n$对$P, Q$间的优超关系判断毫无价值, 为此只能进一步获取$p_{n-1}$以及$q_{n-1}$, 然后令$P^{\prime}=(p_1, p_2, \cdots, p_{n-1})$, $Q^{\prime}=(q_1, q_2, \cdots, q_{n-1})$, 继续上面的步骤.
文章末尾, 我们单独考虑一下$n=3$时的特殊情况.
定理3.2 对于任意$P=(p_1, p_2, p_3), Q=(q_1, q_2, q_3)\in \bigtriangleup_3$,
(1) 若$H(P)=H(Q)$, 则$p_3 \geq q_3$当且仅当$p_1\geq q_1$.等号当且仅当$p_3=q_3$或$p_1=q_1$时成立.
(2) 若$H(P)\geq H(Q)+(1-q_1)\ln\frac{1-q_1-q_3}{1-q_1-p_3}+q_3\ln\frac{q_3}{1-q_1-q_3}+p_3\ln\frac{1-q_1-p_3}{p_3}$且$p_3 \geq q_3$, 则$P\sqsubset Q$.
(3) 若$H(Q)\leq H(P)-((1-p_1)\ln\frac{1-p_1-q_3}{1-p_1-p_3}+q_3\ln\frac{q_3}{1-p_1-q_3}+p_3\ln\frac{1-p_1-p_3}{p_3})$且$p_3 \geq q_3$, 则$P\sqsubset Q$.
证 (1) 由于$H(P)=H(Q)$, 那么有$\underline{P} \sqsubset \underline{Q}, \ \overline{P} \sqsubset \overline{Q}$且$\frac{1-q_3}{2} \leq p_1\leq q_1\leq 1-2p_3$, 因此$P^{\prime}=(q_1, 1-q_1-p_3, p_3)\in \bigtriangleup_3$.
若$p_3 \geq q_3$, 则$P^{\prime}\sqsubset Q$且$H(P^{\prime})\geq H(Q)=H(P)$, 因此$P^{\prime}\sqsubset P$, 进而$p_1\geq q_1$.若$p_1\geq q_1$, 则$P^{\prime}\sqsubset P$且$H(P^{\prime})\geq H(P)=H(Q)$, 因此$P^{\prime}\sqsubset Q$, 进而$p_3\geq q_3$.
(2)(3) 基于(1), $P\sqsubset Q$当且仅当$P\sqsubset P^{\prime}$也就是$H(P)\geq H(P^{\prime})$.如果给定$Q$且$p_3 \geq q_3$, 则
令$Q^{\prime}=(p_1, 1-p_1-q_3, q_3)\in \bigtriangleup_3$.由(1)可知, $P\sqsubset Q$当且仅当$Q^{\prime}\sqsubset Q$也就是$H(Q)\leq H(Q^{\prime})$.如果给定$P$且$p_3 \geq q_3$, 则
证毕.
例11 假设$P=(0.5, 0.32, 0.18), \ Q=(0.6, 0.2, 0.2), \ R=(0.7, 0.15, 0.15)$, 若我们此时只知道$p_3=0.18, q_3=0.2, r_3=0.15$, 由推论3.2计算可以得到$p_3=0.18 <q_3=0.2<0.5-(1-r_3)/4=0.285$, 故考虑推论3.3.此时若知道$r_1=0.7$, 由于$r_1=0.7>1-2p_3=0.64>1-2q_3=0.6$, 故$Q\sqsubset R, \ P\sqsubset R$.若知道$q_1=0.6, p_1=0.5$, 由于$q_1=0.6>(1-p_3)/2=0.41, p_1=0.5<1-2q_3=0.4$, 故此时推论3.3也不满足.为了比较$P$和$Q$, 令$P^\prime=(0.5, 0.3, 0.2)$, 可知$P^\prime \sqsubset Q$, $P^\prime \sqsubset P$, 由定理3.2可知$P$与$Q$之间没有优超关系.
不平等问题日益重要, 常用的不平等度量指标有Gini系数(1.1)、Theil指数(1.2)等.按式(1.1)(1.2)(1.3)定义的函数均是Schur-凸(凹)函数.对于一个Schur-凸(凹)函数而言, 如果能预先判断变量向量之间的优超关系, 那么就能直接比较其函数值间的大小关系, 特别地, 对于不平等度量指标就能直接比较不平等性程度.本文给出了通过已知变量向量的少量分量值确定其变量向量优超上界和优超下界的方法(定理2.1), 进而给出能判断变量向量间优超关系的条件(定理3.1).由于Theil指数可以从Shannon熵(1.3)演变而来, 本文便以Shannon熵(1.3)式为例, 证明了使$P\sqsubset Q$成立的充分条件(推论3.2、3.3、3.4).如果$p_n=q_n<\frac{1}{n}$, 上述条件可退化成$n-1$维离散概率分布的情况.这些充分条件说明只需要少量已知概率, 就能够判断出两个离散概率分布间的优超关系.另外特别对$n=3$维时的离散概率分布情况进行讨论, 并找到了等价条件(定理3.2).