数学物理学报, 2019, 39(4): 971-992 doi:

论文

多元统计分析新观点:点估计

张燕1, 杨林1, 廖靖宇1, 张应山,2

New View: Point Estimation of Multivariate Statistical Analysis

Zhang Yan1, Yang Lin1, Liao Jingyu1, Zhang Yingshan,2

通讯作者: 张应山, E-mail: hmilyzhangyan@126.com

收稿日期: 2017-12-18  

基金资助: 国家自然科学基金.  11301455
河南省教育厅科学技术重点项目.  13A110744

Received: 2017-12-18  

Fund supported: the NSFC.  11301455
the Key Scientific and Technological Projects of Henan Education Department.  13A110744

摘要

在科学研究中,经常利用观测到的数据对复杂系统的某些客观对象进行估计,这实际上是科学的一个最基础问题,在统计科学之中也是一个最基本的问题,称为:点估计.对点估计的优良性研究文章众多,但是由于东西方认知世界的哲学思想不同,所以历史上东西方对点估计的计算和论证方法有着相当大的差异.该文通过对东西方点估计的计算方法进行模拟比较,说明东方象数学的多元统计分析点估计的计算方法具有再现性,而西方多元统计分析点估计的计算方法不具有再现性.从再现性的观点来看,东方象数学的点估计的计算方法科学性更强.

关键词: 点估计 ; 象数学点估计 ; 再现性

Abstract

In scientific research, often using the observed data of some objective object for complex systems, estimates that this is actually one of the most basic problems with the scientific, in statistical science is one of the most basic problem, known as the point estimate, of point estimate optimal benign numerous research articles. But because cognitive world philosophy east and west is different, so the history of east and west point estimate calculation and reasoning methods have quite big difference. In this paper, through the comparison of the calculation method of east and west point estimation, illustrate the east as the calculation method of the point estimation in image mathematics has reproducibility, and the west as the calculation method of the point estimation of multivariate statistical analysis has not reproducibility. Reproducibility from the point of view, the oriental image mathematical point estimation method is more scientific.

Keywords: Point estimation ; Image mathematical point estimation ; Reproducibility

PDF (577KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

张燕, 杨林, 廖靖宇, 张应山. 多元统计分析新观点:点估计. 数学物理学报[J], 2019, 39(4): 971-992 doi:

Zhang Yan, Yang Lin, Liao Jingyu, Zhang Yingshan. New View: Point Estimation of Multivariate Statistical Analysis. Acta Mathematica Scientia[J], 2019, 39(4): 971-992 doi:

1 引言

在西方传统科学研究中,尤其在试验设计领域[1],一般采用从微观局部认知到宏观全局认知的思维路线来进行逻辑推理和解决问题.也就是说根据自己的观察提出公理和假设,利用形式逻辑(自生逻辑)的真假命题推理来认知世界,从而导致对同样的数据,不同的研究者根据不同的假设和不同的数据个数,可以推导出不同的结论,使得数据分析结论不具有再现性.这里的再现性包含两个方面的含义:其一是数据分析结论和客观事实是否一致?称为客观一致性;其二是多次收集数据并进行数据分析的结论是否基本一致?称为重复出现性.而同样数据的客观真实结论只有一个,数据分析结论的不同,至少说明其中某些数据分析结论不是客观事实,这说明西方数据分析方法和研究者的行为有关.自生逻辑要求对研究对象本身充分观测,根据观测数据本身,提出公理系统和假设命题,用公理和形式逻辑推理来判断命题的真假,所得结论和观测数据本身及其研究者的行为有关.也就是说,自生逻辑是由观测数据及其研究者本身产生的逻辑.在20世纪50年代,西方科学家把这种现象归结为:形式逻辑的相干性缺乏,并提出在古典形式逻辑推理的基础上,增加相干性分析的约束,形成了许多具有现代意义的形式逻辑.

在东方传统科学研究中,尤其在象数学领域[2],一般采用从宏观全局认知到微观局部认知的思维路线来进行逻辑推理和解决问题.不根据自己的观察提出公理和假设,利用满足唯一性、遗传性、可逆性、结合律等基本运算规则的逻辑(不自生逻辑)进行推理来认知世界,从而导致对同样的数据,不同的研究者根据不同的假设和不同的数据个数,可以推导出基本相同的分析结论,使得数据分析结论具有再现性.而同样数据的客观真实结论只有一个,数据分析结论的基本相同,至少说明数据分析结论与客观事实更加接近,这说明东方数据分析方法和研究者的行为基本无关.不自生逻辑要求以观察研究对象的关系为主,无公理无假设,但采用的关系逻辑满足唯一性、遗传性、可逆性、结合律等,要求关系逻辑推理不能和研究对象及其研究者的行为有关.也就是说,不自生逻辑是和观测数据及其研究者本身无关的关系分析逻辑.而相干性分析是排除数据和研究者行为关系对数据分析结论影响的基本方法,从而相干性分析是东方不自生逻辑本身就具有的特征.

相干性分析的严格数学定义是:设$ A, B $是两个集合,集合$ a = R(A) $$ A $唯一确定,集合$ b = R(B) $$ B $唯一确定,如果$ R(A)\supseteq R(B) $,那么说$ A $$ B $相干. $ R(A) $是大系统,而$ R(B) $是子系统.简单地说:相干性分析就是大系统和子系统的关系分析.

点估计的首要任务是数据的相干性分析,也就是说在数据中排除和研究对象无关的信息,使得修饰后的数据仅仅包含研究对象的信息,即修饰后的数据和研究对象具有相干性.首先某个分布在研究的大系统是存在的,其次数据必须是从这个分布中抽取的,即数据是子系统数据,但在哪些子系统抽取数据的多少?抽取的总数据个数的多少?这些行为仅仅和统计学者的行为有关,和大系统的具体存在无关.

点估计的目的是用子系统数据检验分布函数的某些值是否正确.这从象数学逻辑是可以推理的,因为大系统成立的结论,在子系统一定成立,所以用子系统数据检验大系统结论是可以的.缺乏这些条件是不能使用点估计的.

点估计要首先确定一个分布簇(大空间$ R(A) $),用数据确定其中的一个分布(子空间$ R(B) $).用子空间数据可以检验大空间的假设,因为大空间$ R(A) $成立的性质,在子空间$ R(B) $一定成立.对于一个多元分析问题,能够采用点估计进行处理的一个基本条件是数据和参变量之间必须有相干性.但原始数据除了包含相干性信息之外,一定包含着许多不相干信息,例如:收集子系统数据的个数、总数据个数、干扰误差信息等,都是和研究对象不相干的信息.排除这些不相干信息是相干性分析的首要工作.也应是在东西方的点估计中的首要工作.

为了排除数据的不相干信息,象数学一般认为所有数据都是分类数据.同类数据基本类似,具有相同的象,可以相加,从而可以用平均来消除不相干信息;不同类的数据差别较大,不具有相同的象,不可以直接相加,从而其平均也就没有意义.关于象数学的数据分类准则的量化方法较多,一般称为比类取象方法.本文为了便于读者理解,仍采用统计学中常用的SAS的距离聚类方法进行聚类.由于统计学者对某些分类数据的偏好,造成对各类数据收集的个数或者多或者少,这是统计学者的自然行为,是无法指责的行为,或者说是无法控制的行为.而这种行为势必造成数据包含与研究对象的不相干信息.在获得数据以后的第一步工作是要把数据分类,并且识别各类数据是否有显著差异.对有显著差异的数据要分类处理,用以排除由于数据收集者关于不同类别数据的收集个数多少造成的对研究对象数据分析结论的影响,从而使得修饰过的数据具有相干性,这样就保证了数据分析结论具有再现性.

张应山的《多边矩阵理论》[3]研究了再现性问题,由其推导出的优良设计正交表[4-6]、广义正交表[8-13],对称表[14]等,是解决再现性问题的重要设计工具.本文研究的多元统计分析的点估计问题,实际上是试图把上述设计推广到多元统计分析场合的初步工作.由于试验设计的最初步工作是单参数试验设计模型[1],这个模型相应的是关于总均值的点估计问题,这是统计学的基础问题,所以本文从这个问题开始,通过模拟,比较研究东西方传统多元统计分析方法及其传统多元试验设计方法的再现性问题.

象数学点估计的数据分类准则(比类取象准则)是:经常把数据分成三类,阳性(实病)、阴性(虚病)、正常.阴阳平衡的状态是好的状态.象数学最关注的相干性分析是首先识别获得的三类数据是否具有显著性差异?如果显著性差异较大,那么必须从数据分析中尽可能的排除不相干的成分.这个思想也称为零成分搜索.即找出不相干数据因素,然后将其排除,排除不相干因素以后的数据才可能具有相干性.

象数学点估计的问题与模型:对于一般不自生逻辑下的多元分析问题,设一复杂系统的输出向量$\mathit{\boldsymbol{y}} = (y_1, \cdots, y_p)^T $可用如下自由模型来表示

$ \begin{equation} \begin{array}{rl} \mathit{\boldsymbol{y}}& = \mathit{\boldsymbol{f}}(x_0, x_1, \cdots, x_m, \omega) = \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m)+\mathit{\boldsymbol{\varepsilon }}, \\ \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m)& = E(\mathit{\boldsymbol{y}}|x_0, x_1, \cdots, x_m) = E(\mathit{\boldsymbol{f}}|x_0, x_1, \cdots, x_m)\\ & = E(\mathit{\boldsymbol{f}}(x_0, x_1, \cdots, x_m, \omega)|x_0, x_1, \cdots, x_m), \\ \mathit{\boldsymbol{\varepsilon }}& = \mathit{\boldsymbol{y}}-\mathit{\boldsymbol{g}} (x_0, x_1, \cdots, x_m) = \mathit{\boldsymbol{y}}-E(\mathit{\boldsymbol{y}}|x_0, x_1, \cdots, x_m)\\ & = \mathit{\boldsymbol{f}}-E(\mathit{\boldsymbol{f}}|x_0, x_1, \cdots, x_m)\\ & = \mathit{\boldsymbol{f}}(x_0, x_1, \cdots, x_m, \omega)-E(\mathit{\boldsymbol{f}}(x_0, x_1, \cdots, x_m, \omega)|x_0, x_1, \cdots, x_m), \\ Var(\mathit{\boldsymbol{y}})& = Var(\mathit{\boldsymbol{g}})+Var(\mathit{\boldsymbol{\varepsilon }}), \end{array} \end{equation} $

其中$\mathit{\boldsymbol{f}}(x_0, x_1, \cdots, x_m, \omega) = (f_1(x_0, x_1, \cdots, x_m, \omega), \cdots, f_p(x_0, x_1, \cdots, x_m, \omega))^T $为已知或者未知的多元向量函数,称为系统函数.在用模拟分析来说明数据分析方法是否具有再现性时,这个系统函数一般认为是已知的.在解决实际问题时,这个系统函数一般认为是未知的.也就是说:用已知函数讲道理,用未知函数做应用.

$ x_0 $是区组因子,表示数据收集者的行为对数据的影响因素,可以通过数据分类对区组因子进行观测,但它是不可控因子,也就是说对每个小区组内部数据的观测个数是不可控的或者说是难以控制的.

$ \omega $是干扰因子,表示数据的不可控因素对数据的影响因素,这是不可观测的,也是不可控制的.

$ x_1, \cdots, x_m $是处理因子,表示数据对复杂系统本身具有相干性的变化部分的因素,一般来说既是可以观测的,也是可以控制的.区组因子、干扰因子是一定存在的,但处理因子可以存在,也可以不存在.对处理因子的分析数据,才能认为是相干性数据,它的变化空间$ R(B) $才有可能完全包含于系统全空间$ R(A) $的变化范围之内.作为这类问题的研究开始,本文考虑处理因子不存在的情形.

这里$ \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m) = E(\mathit{\boldsymbol{y}}|x_0, x_1, \cdots, x_m) $是统计学中的条件期望,这种条件期望仅仅在数据中排除了干扰因子$ \omega $对数据的相干性影响.称函数$ \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m) $是系统观测函数.从理论上讲,在实际问题中,是难以对系统观测函数$ \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m) $进行假设的,因为系统函数$ \mathit{\boldsymbol{f}} $是未知的.但在模拟分析中,观测函数$ \mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m) $是可以由系统函数$ \mathit{\boldsymbol{f}} $进行推导的,因为系统函数$ \mathit{\boldsymbol{f}} $是已知的.

这里$ \mathit{\boldsymbol{\varepsilon }} = \mathit{\boldsymbol{y}}-\mathit{\boldsymbol{g}}(x_0, x_1, \cdots, x_m) $是统计学中试验误差的一种定义,一般情况下是不能对其进行假设的,或者要尽可能少地对其进行假设.

可观测自变量$ \mathit{\boldsymbol{x}} = (x_0, x_1, \cdots, x_m)^T $的定义域为如下多维区间$ \prod\limits_{j = 0}^m [x_j^0-\Delta x_j, x_j^0+\Delta x_j], $

其中$ \mathit{\boldsymbol{x}}^0 = (x_0^0, x_1^0, \cdots, x_m^0)^T $称为试验中心, $ \Delta \mathit{\boldsymbol{x}} = (\Delta x_0, \Delta x_1, \cdots, \Delta x_m)^T $称为试验容差.

常记$ \Delta = \mathop{\max}\limits_{0\leq j \leq m}\Delta x_j, $并仍称$ \Delta $是试验容差.这里的变量$ x_j $可以是区组因子,也可以是处理因子.试验容差一般认为是可以逐渐变小的,并且在试验容差逐渐变小时,数据分析结论是逐渐接近客观事实的.

在象数学理论中,虽然一般对试验误差

不进行假设,但有时对干扰自变量$ \omega $也考虑它的变化范围,并利用幻方方法对干扰自变量$ \omega $的不相干影响进行排除,本文暂不涉及这些内容.本文按西方统计学的一般观点,把试验误差$ \mathit{\boldsymbol{\varepsilon }} = (\varepsilon_1, \cdots, \varepsilon_p)^T $视为一随机的误差向量,记$ \mathit{\boldsymbol{x}} = (x_0, x_1, \cdots, x_m) $,其期望与方差分别满足

这里$ \mathit{\boldsymbol{\Sigma}}(\mathit{\boldsymbol{x}}) $表明:随机误差的方差与自变量$ \mathit{\boldsymbol{x}} $有关.此时

这些结论实际上都不是假设,它们是根据模型(1.1)进行推导而得到的.

点估计方法好坏的标准不是仅仅由统计领域能够确定的,必须用和点估计无关的第三者模型(1.1)来模拟检验说明.

在统计学中,点估计的一个检验标准是用假设检验的方法来进行检验.假设检验一般观注$ p $值和第二类错误.为了比较东西方点估计计算方法的再现性,本文也把假设检验方法引入.正因为点估计是基于不完全信息作出的对系统函数的检验,它就不可避免地会有误差.一个好的点估计法则应该是检验的犯错误率很小.另外,点估计一定和统计的假设分布有关.根据相应的假设分布,可以计算相应假设检验的$ p $值和第二类错误.第一类错误是拒绝原假设所犯的错误,可以用$ p $值表示,其和统计学者的行为无关;第二类错误是接受原假设所犯的错误,计算需要选取备择假设和置信水平,但这种选取和统计学者的行为有关.为了避免这种相关性,本文使用实际估计模型作为备择假设,置信水平取0.05.好的点估计需要在拒绝原假设时两类错误都较小,在接受原假设时两类错误都较大.

象数学经常把零成分放在原假设,并要求对原假设的识别要尽可能准确.在识别时,要把和原假设相关的人为因素排除.例如排除区组因素和排除零因素.排除区组因素主要识别数据的不相干信息.排除零因素主要识别不显著因素.可以犯把不显著因素当成显著因素处理的错误,但要尽可能的少犯把显著因素当成不显著因素处理的错误.一般来说:象数学方法经常使得犯第二类错误的可能性较小,这和西方的点估计的优良性准则经常是相反的.

2 西方点估计的计算方法

2.1 点估计例子

例2.1  人的出汗多少与人体内的钠和钾的含量有一定关系.今测量了20名健康成年女性的出汗量($ X_1 $)、钠的含量($ X_2 $)和钾的含量($ X_3 $)的数据如下

在正态假设下,即

$ \begin{equation} X_i = (X_{i1}, X_{i2}, X_{i3})^T\sim N_p(\mu, \Sigma), i = 1, \cdots, 20, p = 3, \ {\rm i.i.d.} \end{equation} $

用上述数据估计均值和方差.

从数据无法直接看出:这个数据分布假设是否正确?它的正确性与统计学者的行为有关,统计学者可能只对其经常关注的某类数据有兴趣.如果某类数据的个数可以任意改动,那么不可避免地将会导致数据的正态性假设不再满足,即数据将会呈现片面性.比如人为主观增加或减少某些不利的数据,从而达到主观想要的目的.这种情况下,如果统计学数据分析方法不具有再现性,结果可想而知将会产生偏差.虽然西方数据方法不允许更改数据的行为,但象数学数据分析方法允许这些行为,并认为这种行为是很自然的行为,一个具有再现性的数据分析方法应该和这些行为无关,即将数据稍微改动之后,仍然不影响统计分析结果.

2.2 点估计程序输出

在数据分布假设(2.1)正确时,相应的西方点估计SAS程序有如下结论.

数据矩阵

数据均值向量$ meanx^T = \bar X = \hat \mu = \frac{1}{n}\sum\limits_{i = 1}^{n}X_i\sim N_p(\mu, \frac{1}{\lambda_{\mu}}\Sigma), \lambda_{\mu} = n = 20, $

自由度参数$ lambdamu = \lambda_{\mu} = n = 20, fe = f_e = rk(\tau_n) = n-1 = 19, $

误差方差矩阵估计$ eee = X^T\tau_nX/f_e = \hat \Sigma = S^2, f_e = rk(\tau_n) = n-1, $

上述统计量$ \hat \Sigma = S^2 $具有性质$ f_e*\hat \Sigma \sim W_p(f_e, \Sigma), f_e = n-1. $

2.3 点估计的结论

在数据分布假设(2.1)正确时,由于

所以估计是渐近正确的.

大数定律是西方点估计理论的基础,也是从微观局部认知到宏观全局认知这一过程需要的必要条件.而在东方象数学领域中,由于坚持有限资源规则,所以从宏观全局认知到微观局部认知这一过程,并不以大数定律为基础,仅仅以数据是否具有全面代表性为基础.象数学仅仅认为大数定律是一个微观局部的指标.即,大数定律仅仅在自由模型(1.1)的区组因子$ x_0 $的某个小区组内部$ x_0 = x_0(i) $是可能成立的,因为只有在这种微观局部场合,数据的相加和平均才是有意义的.而在宏观全局认知场合,大数定律一般是无效的,因为在这种宏观全局场合,数据是不能相加和平均的,或者说数据的相加和平均可能是没有意义的.

在数据分布假设(2.1)不正确时,上述点估计结论有可能不成立.譬如:统计学者在收集数据以后,去掉了某些数据,或者说某些数据没有收集到,这些统计学者的个人行为,都可能造成数据分布假设不成立.象数学的估计方法要求其估计结论,不能和这些统计学者的个人行为有关,无论数据分布假设是否正确,数据分析结论应尽可能的一致,即数据分析结论要具有再现性.可以通过删除某些数据的方法,用程序计算,来检验数据分析结论的再现性.对许多西方点估计结论,常常可以用这个方法模拟检验发现:删除少量数据就可以大幅度地改变点估计的结论.这说明西方点估计结论和数据个数高度相关、稳定性差、不具有再现性.

3 象数学点估计的计算方法

3.1 点估计例子

在例2.1同样的数据前提下,不考虑数据分布假设(2.1),或者说把数据分布假设(2.1)改成如下分类数据假设(3.1)

$ \begin{equation} X_{ij} = (X_{ij1}, X_{ij2}, X_{ij3})^T, X_{ijl}\sim N(\mu_{il}, \sigma_{il}^2), l = 1, 2, 3, i = 1, \cdots, b, j = 1, \cdots, k_i, \end{equation} $

其中,分类数据的个数$ k_i $及其数据的总个数$ n $可以任意,但满足$ k_1+\cdots+k_b = n. $再现性估计要求其与分类数据的个数$ k_i $及其数据的总个数$ n $基本无关.

分类数据分布假设(3.1)也可以等价的写成

$ \begin{equation} \begin{array}{rl} X_{ij} = &\mu+\alpha_i+\varepsilon_{ij}, \varepsilon_{ij} = (\varepsilon_{ij1}, \varepsilon_{ij2}, \varepsilon_{ij3})^T, \varepsilon_{ijl}\sim N(0, \sigma_{il}^2), \\ &l = 1, 2, 3, i = 1, \cdots, b, j = 1, \cdots, k_i; \\ \zeta_{ij} = & \sqrt{\frac{\pi}{2}}|\varepsilon_{ij}| = \mu^{\sigma}+\alpha_i^{\sigma}+\varepsilon_{ij}^{\sigma}, E\varepsilon_{ij}^{\sigma} = 0, Var(\varepsilon_{ijl}^{\sigma}) = (\frac{\pi}{2}-1)\sigma_{il}^2, \end{array} \end{equation} $

其中, $ \mu = Ef, \alpha_i = E(f|x_0 = x_0(i))-Ef $, $ \mu^{\sigma} = \frac{1}{p}trace(Var(f)), \alpha_i^{\sigma} = E(f^{\sigma}|x_0 = x_0(i))-Ef $, $ f^{\sigma} = E\zeta_{ij} $.这里$ f $是自由模型(1.1)的系统函数$ f(x_0, x_1, \cdots, x_m, \omega) $.模型(3.1)和(3.2)是模型(1.1)的派生模型.

此时,分类数据$ (X_{ij}) $的每一类数据$ X_{i1}, \cdots, X_{ik_i} $是基本类似的数据,这些数据之间具有可加性,其平均值$ \bar X_{i*} = \frac{1}{k_i}\sum\limits_{j = 1}^{k_i}X_{ij} $是具有客观象$ \mu_i $的估计$ \hat\mu_i $,无论$ k_i $的大小如何,估计$ \hat\mu_i $和真实值$ \mu_i $将不会具有较大的差异.也就是说:象数学认为估计$ \hat\mu_i $是客观象$ \mu_i $的具有再现性的估计,这个估计和统计学者收集的相应类的数据个数$ k_i $的大小及其总数据个数$ n $基本没有关系,因此也说每一类数据$ X_{i1}, \cdots, X_{ik_i} $是估计客观象$ \mu_i $的再现性数据.

另外,在已知再现性估计$ \hat\mu_i $的条件下,可以在分类数据$ (X_{ij}) $的每一类误差数据$ X_{i1}, \cdots, X_{ik_i} $之中除去相应的再现性估计$ \hat\mu_i $,得到分类误差数据$ (\varepsilon_{ij}) $的每一类数据$ \varepsilon_{i1} = X_{i1}-\hat\mu_i, \cdots, \varepsilon_{ik_i} = X_{ik_i}-\hat\mu_i $,这些数据也是基本类似的数据,这些数据之间具有可加性.由于在正态假设下,误差向量$ \varepsilon_{ij} $的各个分量$ \varepsilon_{ijl} $的绝对值$ |\varepsilon_{ijl}| $具有半正态分布,所以$ E|\varepsilon_{ijl}| = \sqrt{\frac{2}{\pi}}\sigma_{il} $, $ E|\varepsilon_{ijl}|^2 = \sigma_{il}^2 $, $ Var(|\varepsilon_{ijl}|) = (1-\frac{2}{\pi})\sigma_i^2 $.从而平均值$ |\bar\varepsilon_{i*l}| = \frac{1}{k_i}\sum\limits_{j = 1}^{k_i}|\varepsilon_{ijl}| $也是具有客观象$ \sqrt{\frac{2}{\pi}}\sigma_{il} $的再现性估计$ \sqrt{\frac{2}{\pi}}\hat \sigma_{il} $,或者说:记$ \zeta_{ijl} = \sqrt{\frac{\pi}{2}}|\varepsilon_{ijl}| $, $ \zeta_{ij} = (\zeta_{ij1}, \zeta_{ij2}, \zeta_{ij3})^T $,则$ \hat \sigma_i = \bar \zeta_{i*} $是具有客观象$ \sigma_i $的再现性估计,无论$ k_i $的大小如何,估计$ \hat \sigma_i $和真实值$ \sigma_i $将不会具有较大的差异.也就是说:象数学认为估计$ \hat \sigma_i $是客观象$ \sigma_i $的具有再现性的估计,这个估计和统计学者收集的相应类的数据个数$ k_i $的大小及其总数据个数$ n $基本没有关系,因此也说每一类数据$ \zeta_{i1}, \cdots, \zeta_{ik_i} $是估计客观象$ \sigma_i $的再现性数据.

象数学认为:具有客观象的再现性估计之间,可以进行与客观象之间的相同运算,再现性估计之间的运算结果仍然是相应客观象之间的相同运算结果的再现性估计.

例如:估计$ \hat \mu = \frac{1}{b}\sum\limits_{i = 1}^{b}\hat \mu_i $是客观象$ \mu = \frac{1}{b}\sum\limits_{i = 1}^{b}\mu_i $的再现性估计;

估计$ \hat \alpha_i = \hat \mu_i-\hat\mu $是客观象$ \alpha_i = \mu_i-\mu $的再现性估计;

估计$ \hat \sigma = \frac{1}{b}\sum\limits_{i = 1}^{b}\hat \sigma_i $是客观象$ \sigma = \frac{1}{b}\sum\limits_{i = 1}^{b} \sigma_i $的再现性估计;

估计$ \hat \alpha_i^{\sigma} = \hat \sigma_i-\hat \sigma $是客观象$ \alpha_i^{\sigma} = \sigma_i- \sigma $的再现性估计.

象数学一般认为不但分类均值$ \mu_i $和总均值$ \mu $是不相同的,而且分类标准差$ \sigma_i $和总标准差$ \sigma $也是不相同的.但西方科学的数据假设(2.1)实际上不但包含了分类均值$ \mu_i $和总均值$ \mu $是相同的假设,而且也包含了分类标准差$ \sigma_i $和总标准差$ \sigma $是相同的假设.例2.1的问题实际上就是根据观测数据估计总平均$ \mu $和估计总标准差$ \sigma $.这些问题是东西方科学都关注的问题.只是西方科学根据从微观到宏观的思维路线,在较强的数据分布假设下进行估计,而东方科学根据从宏观到微观的思维路线,在较弱的数据分布假设下进行估计.

在本例中, $ b = 3, n = 20 $.$ k_1, k_2, k_3 $是未知的.象数学在获得数据以后,首先要把数据分类,通常分成3类.关于象数学的数据分类准则的量化方法较多,一般称为比类取象方法.本文为了便于读者理解,仍采用统计学中常用的SAS的距离聚类方法进行聚类,从而获得相应分类数据个数$ k_i $和相应的分类数据$ X_{i1}, \cdots, X_{ik_i} $,用于获得再现性估计$ \hat \mu_i $$ \hat \mu $;然后,根据获得的再现性估计,得到新的关于误差的分类数据$ \zeta_{i1} = \sqrt{\frac{\pi}{2}}|\varepsilon_{i1}|, \cdots, \zeta_{ik_i} = \sqrt{\frac{\pi}{2}}|\varepsilon_{ik_i}| $,这里向量$ \varepsilon_{ij} = X_{ij}-\hat \mu_i $的绝对值$ |\varepsilon_{ij}| $的意义为各个分量取绝对值,用于计算向量$ \hat \sigma_i $$ \sigma $,等.

把上述思想,用SAS语言编写成象数学点估计的计算程序,有如下结果.

3.2 象数学点估计结论

3.2.1 区组因子各类平均值效应的估计

表 3.1   总体平均$\mu$和区组因子水平效应$\alpha_i$的估计值

MEANX($\mu$)
3.6634.1110.01
XTAU($\alpha_i$)
-2.16-20.610.09
0.850.15-0.04
1.3220.45-0.06

新窗口打开| 下载CSV


表 3.2   区组均值效应方差$Var(\tau_{x_0})$和误差均值效应方差$Var(\varepsilon)$的估计值

VARXTAU($Var(\tau_{x_0})$)
2.3823.88-0.1
23.88281-1.03
-0.1-1.030
EEE($Var(\varepsilon)$)
2.552.55-1.99
2.5553.1-5.92
-1.99-5.924.05

新窗口打开| 下载CSV


分类数据个数$ K = (k_1, k_2, k_3) $、权重平均$ \bar W = \frac{1}{b}\sum\limits_{i = 1}^{b}\frac{1}{k_i} $、区组均值效应方差的平均迹$ aa = \frac{1}{p}trace(Var(\tau_{x_0})) $、误差均值效应方差的平均迹$ bb = \frac{1}{p}trace(Var(\varepsilon)) $、区组均值效应贡献率$ r_{\tau_{x_0}} = \frac{\frac{1}{p}trace(Var(\tau_{x_0}))}{\frac{1}{p}trace(Var(\tau_{x_0}))+\frac{1}{p}trace(Var(\varepsilon))} $,误差均值效应贡献率$ r_{\varepsilon} = \frac{\frac{1}{p}trace(Var(\varepsilon))}{\frac{1}{p}trace(Var(\tau_{x_0}))+\frac{1}{p}trace(Var(\varepsilon))} $,区组-误差均值效应贡献率之比$ rf = \frac{r_{\tau_{x_0}}}{r_{\varepsilon}} $

表 3.3    

K($K=(k_1, k_2, k_3)$)
1  7  12
W($\bar W$)= 0.4087302
TRACEVARXTAU($aa$)TRACEEEE($bb$)SUM($aa+bb$)
94.4619.9114.36
RXTAU($r_{\tau_{x_0}}$)REPSILON($r_{\varepsilon}$)RF($\frac{r_{\tau_{x_0}}}{r_{\varepsilon}}$)
0.830.174.88

新窗口打开| 下载CSV


表 3.4   均值贡献率的假设检验,临界值$rfa$$p$$aaa$和第二类错误$bbb$

RFaaaabbb
0.9700

新窗口打开| 下载CSV


统计量rf的值大于临界值rfa,说明原假设模型$ H_0:r_{\tau_{x_0}} = 0 $和真实模型不一致.因为$ p $值和第二类错误(aaa和bbb)都很小,所以要拒绝原假设.此与西方分析结论不一致,因为西方数据分布的假设(2.1)中,包含了假设$ H_0:r_{\tau_{x_0}} = 0 $.

表 3.5   区组均值效应的原假设$\alpha_{i0}$、总平均的原假设$\mu_0$和自由度参数$\lambda_{\mu}, \lambda_{\alpha}, f_e$

XTAU0($\alpha_{i0}$)
2  20  0
0  0  0
-2  -20  0
MU0($\mu_0$)
4  50  10
LAMBDAMU($\lambda_{\mu}$)LAMBDAALPHA($\lambda_{\alpha}$)FE$f_e$
7.340.8217

新窗口打开| 下载CSV


表 3.6   均值总平均$\mu$的假设检验统计量$C, T^2, F, F_a$,总数据个数$N$,分类数据个数$K$,分类的类个数$B$,总平均$\mu$的原假设、估计、$p$值和第二类错误

CT2FFA
3.3442.6212.543.29
NKBJYMU
201712345010
3.6634.1110.01
0.0000.0000.000
0.0010.0010.001

新窗口打开| 下载CSV


统计量F的值大于临界值fa,说明原假设模型$ H_0:\mu = (4, 50, 10)^T $和真实模型不一致.因为$ p $值和第二类错误都很小,所以要拒绝原假设,将原假设改成$ H_0:\mu = (4, 34, 10)^T $比较合适.此与西方分析结论不一致,因为西方分析的$ p $值和第二类错误都较大(见3.2节),所以要接受原假设.

表 3.7   区组因子的第一水平均值效应的假设检验统计量$C, T^2, F, F_a$,总数据个数$N$,分类数据个数$K$,分类的类个数$B$,区组因子的第一水平效应$\alpha_1$的原假设、估计、$p$值和第二类错误

CT2FFA
3.340.0640.023.29
NKBJYALPHA1
2017123-2-200
-2.16-20.610.09
0.9970.9970.997
0.9470.9470.947

新窗口打开| 下载CSV


统计量F的值小于临界值fa,说明原假设模型和真实模型一致.因为$ p $值和第二类错误都很大,所以要接受原假设.西方分析没有这个结论.

表 3.8   区组因子的第二水平均值效应的假设检验统计量$C, T^2, F, F_a$,总数据个数$N$,分类数据个数$K$,分类的类个数$B$,区组因子的第二水平效应$\alpha_1$的原假设、估计、$p$值和第二类错误

CT2FFA
3.340.070.023.29
NKBJYALPHA2
2017123000
0.850.15-0.04
0.700.700.70
0.870.870.87

新窗口打开| 下载CSV


表 3.9   区组因子的第三水平均值效应的假设检验统计量$C, T^2, F, F_a$,总数据个数$N$,分类数据个数$K$,分类的类个数$B$,区组因子的第三水平效应$\alpha_1$的原假设、估计、$p$值和第二类错误

CT2FFA
3.340.220.063.29
NKBJYALPHA3
20171232200
1.3220.45-0.06
0.790.790.79
0.890.890.89

新窗口打开| 下载CSV


统计量F的值小于临界值fa,说明原假设模型和真实模型一致.因为$ p $值和第二类错误都很大,所以要接受原假设.西方分析没有这个结论.

3.2.2 区组因子各类标准差效应的估计

表 3.10   总体标准差$\mu^{\sigma}=\sigma$和区组因子水平标准差效应$\alpha_i^{\sigma}=\sigma_i-\sigma$的估计值

MEANX($\mu^{\sigma}$)
1.214.681.47
XTAU($\alpha_i^{\sigma}$)
-1.01-3.92-1.36
0.371.460.97
0.642.450.39

新窗口打开| 下载CSV


分类数据个数$ K = (k_1, k_2, k_3)) $、权重平均$ \bar W = \frac{1}{b}\sum\limits_{i = 1}^{b}\frac{1}{k_i} $、区组标准差效应方差的平均迹$ aa = \frac{1}{p}trace(Var(\tau_{x_0}^{\sigma})) $、误差标准差效应方差的平均迹$ bb = \frac{1}{p}trace(Var(\varepsilon^{\sigma})) $、区组标准差效应贡献率$ r_{\tau_{x_0}^{\sigma}} = \frac{\frac{1}{p}trace(Var(\tau_{x_0}))}{\frac{1}{p}trace(Var(\tau_{x_0}^{\sigma}))+\frac{1}{p}trace(Var(\varepsilon^{\sigma}))} $,误差标准差效应贡献率$ r_{\varepsilon^{\sigma}} = \frac{\frac{1}{p}trace(Var(\varepsilon^{\sigma}))}{\frac{1}{p}trace(Var(\tau_{x_0}^{\sigma}))+\frac{1}{p}trace(Var(\varepsilon^{\sigma}))} $,区组-误差标准差效应贡献率之比$ rf = \frac{r_{\tau_{x_0}^{\sigma}}}{r_{\varepsilon^{\sigma}}} $

表 3.11   区组标准差效应方差$Var(\tau_{x_0}^{\sigma})$和误差均值效应方差$Var(\varepsilon^{\sigma})$的估计值

VARXTAU($Var(\tau_{x_0}^{\sigma})$)
0.522.020.66
2.027.832.57
0.662.570.98
EEE($Var(\varepsilon^{\sigma})$)
1.55-2.010.14
-2.0132.170.48
0.140.481.48

新窗口打开| 下载CSV


表 3.12    

K($K=(k_1, k_2, k_3)$)
1  7  12
W ($\bar W$)= 0.4087302
TRACEVARXTAU($aa^{\sigma}$)TRACEEEE($bb^{\sigma}$)SUM($aa^{\sigma}+bb^{\sigma}$)
3.1111.7314.84
RXTAU($r_{\tau_{x_0}^{\sigma}}$)REPSILON($r_{\varepsilon^{\sigma}}$)RF($\frac{r_{\tau_{x_0}^{\sigma}}}{r_{\tau_{x_0}^{\sigma}}}$)
0.210.790.27

新窗口打开| 下载CSV


表 3.13   标准差贡献率的假设检验,临界值$rfa$$p$$aaa$和第二类错误$bbb$

水平RFaaaabbb
0.050.970.460.37

新窗口打开| 下载CSV


在水平0.05下,统计量rf的值小于临界值rfa,说明原假设模型$ H_0:r_{\tau_{x_0}^{\sigma}} = 0 $和真实模型一致.此与西方分析结论一致,因为西方数据分布的假设(2.1)中,包含了假设$ H_0:r_{\tau_{x_0}^{\sigma}} = 0 $.

表 3.14   区组标准差效应的原假设$\alpha_{i0}^{\sigma}$、区组标准差效应的总平均的原假设$\mu_0^{\sigma}$和自由度参数$\lambda_{\mu}, \lambda_{\alpha}, f_e$

XTAU0($\alpha_{i0}^{\sigma}$)
0  0  0
0  0  0
0  0  0
MU0 ($\mu_0^{\sigma}$)
1.7  6.5  2
LAMBDAMU ($\lambda_{\mu}$)FE($f_e$)
2019

新窗口打开| 下载CSV


统计量F的值小于临界值fa,说明原假设模型$ H_0:r_{\tau_{x_0}^{\sigma}} = 0 $和真实模型一致.因为$ p $值和第二类错误都很大,所以要接受原假设.此与西方分析结论一致,因为西方数据分布的假设(2.1)中,包含了假设$ H_0:r_{\tau_{x_0}^{\sigma}} = 0 $.

表 3.15   标准差总平均$\mu^{\sigma}$的假设检验统计量$C, T^2, F, F_a$,总数据个数$N$,分类数据个数$K$,分类的类个数$B$,总平均$\mu$的原假设、估计、$p$值和第二类错误

CT2FFA
3.280.020.013.2
NKBJYMU
20171231.76.52
1.676.471.97
111
0.950.950.95

新窗口打开| 下载CSV


4 讨论

4.1 东西方点估计的主要区别在数据是否需要分类

1、象数学点估计的逻辑是不自生逻辑,即不是由研究对象本身产生的逻辑.其逻辑要求不能对研究对象提任何假设,分析的问题与统计学者个人行为无关,要求分析结论具有再现性.为了保证再现性,需要按所采用的不自生逻辑对数据进行分类.本文采用中医学中的三元逻辑把数据分成三类:阳性(实病)、阴性(虚病)、正常.

譬如,由于认识复杂系统的逻辑结构的需要,所以认定"天人"两方的复杂系统逻辑结构一样.因为认识复杂系统要认识它的五脏六腑,于是变量因子的个数需要六个,所有的卦数需要64个等,否则不能利用五脏六腑理论进行以后的推理研究,也不能类推复杂系统内部的关系结构.同类相招、相生相克的非相容分析也就无从谈起.

2、西方点估计的逻辑是自生逻辑,即其是由研究对象本身产生的逻辑.首先要求对研究对象充分观测,提出各种假设等,需要由经验来断定数据是否需要分类,一般不对数据分类.

由于西方的逻辑是根据已经观测到的数据和假设来判断推理,主要是为了根据已经观测到的数据判定命题的真假,所以它的结论和观测得到的数据的多少和数据的真实性有关.由于它的命题是人类任意提出的,分析结论自然和统计学者的学识程度有关,不同的学者可以得出不同的结论,所以很难相信其结论具有再现性.

4.2 东西方均值点估计的比较例子

根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let rf = 1000;"那么可以得到西方点估计没有数据分类的结论

表 4.1    

CT2FFA
3.289.772.913.2
NKBJYMU
201712345010
4.6445.49.965
0.0650.0650.065
0.3620.3620.362

新窗口打开| 下载CSV


在水平0.05的条件下,因为$ p $值和第二类错误都大于0.05,所以要接受原假设.

根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let rf = 2;"或者"%Let rf = rfa; "那么可以得到象数学点估计进行数据分类的结论

表 4.2    

CT2FFA
3.3442.6212.543.29
NKBJYMU
201712345010
3.6634.1110.01
0.0000.0000.000
0.0010.0010.001

新窗口打开| 下载CSV


在水平0.05的条件下,因为$ p $值和第二类错误都小于0.05,所以要拒绝原假设.

东西方均值点估计的结论不一致.问题出在什么地方呢?

根据东方点估计SAS程序,可以得到均值贡献率检验的结论

表 4.3    

K
1  7  12
W= 0.4087302
TRACEVARXTAUTRACEEEESUM
94.4619.9114.36
RXTAUREPSILONRFRFaaaabbb
0.830.174.880.9700

新窗口打开| 下载CSV


按象数学的均值贡献率检验规则,因为区组因子与干扰因子的贡献率估计之比为$ 4.88 > 2 > 0.97 $,所以认为区组因子存在,即西方点估计的数据分布假设(2.1)关于均值的假设部分不正确.

上述东西方哪一个结论更真实?在不真正知道实际值时,仅仅用统计标准(无偏、方差最小、$ p $值大小)难以判断哪一个结论是真实的,甚至可能都不真实.而真实的结论只有一个.这说明:双方比较需要第三方标准.

4.3 东西方标准方差矩阵点估计的比较例子

根据东方点估计SAS程序,如果选取宏变量"%Let rf = 1000;"那么可以得到西方误差方差矩阵估计没有数据分类的结论

表 4.4    

西方误差方差估计结论eee
2.8810.01-1.81
10.01199.79-5.64
-1.81-5.643.63
误差方差平均迹为$trace(EEE/p)= 68.77$,
自由度参数$lambdamu=20, fe=19$

新窗口打开| 下载CSV


根据东方点估计SAS程序,如果选取宏变量"%Let rf = rfa; "那么可以得到象数学误差方差矩阵估计进行数据分类的结论

表 4.5    

象数学误差方差估计结论EEEx
2.552.55-1.99
2.5553.1-5.92
-1.99-5.924.05
误差方差平均迹为$trace(EEEx/p)=19.9$,
自由度参数$lambdamu=7.34, lambdaalpha=0.82, fe=17$

新窗口打开| 下载CSV


东西方关于误差方差平均迹估计严重不一致.因为象数学的误差方差平均迹为$ trace(EEEx/p) = 19.9 $严格小于西方误差方差平均迹为$ trace(EEE/p) = 68.77 $,所以按"误差较小的结论可能更正确"的统计标准,象数学方法的可信程度要大一些.

即使如此,仅仅在统计领域也难以说明哪个结论是正确的,因为可能都不正确.

4.4 东西方标准差$ \mu^{\sigma} = \sigma, \alpha_i^{\sigma} = \sigma_i-\sigma $点估计的比较例子

根据东方点估计SAS程序,如果选取宏变量"%Let rf = 1000;"那么可以得到西方误差标准差估计没有数据分类的结论

表 4.6    

CT2FFA
3.2811.53.433.2
NKBJYMU
20171231.76.52
1.6313.931.97
0.040.040.04
0.280.280.28

新窗口打开| 下载CSV


在水平0.05的条件下,因为第一类错误小于0.05,所以要拒绝原假设.

根据东方点估计SAS程序,如果选取宏变量"%Let rf = rfa; "那么可以得到东方误差标准差估计进行数据分类的结论

表 4.7    

CT2FFA
3.280.020.013.2
NKBJYMU
20171231.76.52
1.676.471.97
111
0.950.950.95

新窗口打开| 下载CSV


在水平0.05的条件下,因为$ p $值和第二类错误都大于0.05,所以要接受原假设.

东西方标准差点估计的结论不一致.问题出在什么地方呢?由于真值未知,这个问题无法回答,所以必须用第三方标准模型(1.1)及其派生模型(3.1)和(3.2),通过模拟分析来回答这个问题.

5 模拟分析

5.1 模拟东西方点估计结论

模拟分析需要知道真实结论.我们要说明象数学点估计具有再现性,就是要说明不但和统计模型无关,而且和数据的收集方式无关.这样需要分析假设模型正确和不正确两种情况进行讨论.

在模型假设正确时,东西方分析的结论一致.在模型假设不正确时,东西方分析的结论不一致.西方分析结论不正确,而东方分析结论仍然正确.这说明象数学点估计与数据分布假设是否正确无关.无论是同均值同方差假设,或者异均值同方差假设,或者同均值异方差假设,或者异均值异方差假设,象数学都给出正确结论.因为本文的数据例子是异均值同方差情况,所以本文按异均值同方差假设模拟分析,其它情况模拟分析类似.

模拟比较的一般结论:

1、西方的点估计和数据各个类的个数$ k_i $关系很大.在$ k_i $不相同时,点估计的结论关于数据各个类的个数$ k_i $不再具有再现性.

象数学的点估计和数据各个类的个数$ k_i $关系很小.在$ k_i $不相同时,点估计的结论关于数据各个类的个数$ k_i $仍具有再现性.

2、西方的点估计和总数据个数$ n $的关系很大.在总数据个数$ n $较小时, $ p $值一般较大;在总数据个数$ n $较大时, $ p $值一般较小.点估计的结论关于总数据个数$ n $不再具有再现性.所以,西方的点估计一般以大数定律为基础,以大数定律的结论为准.

象数学的点估计和总数据个数$ n $关系很小.在数据具有全面代表性以后总数据个数$ n $变化时, $ p $值基本稳定.点估计的结论关于总数据个数$ n $具有再现性.所以,象数学的点估计一般不以大数定律为基础,而以数据的全面平衡分析结论为准.强调资源有限规则,放弃数据个数无限逼近设想.

3、西方的点估计和原假设分布与备择假设分布的依赖性很大.在备择分布与原假设分布接近时,如果第一类错误较小,那么第二类错误较大;如果第一类错误较大,那么第二类错误较小.在备择分布与原假设分布差别很大时,如果第一类错误较小,那么第二类错误不确定,可能大,也可能小;如果第一类错误较大,那么第二类错误也不确定,可能大,也可能小.两类错误不稳定.点估计的结论不再具有再现性.

象数学的点估计和原假设分布与备择假设分布的依赖性很小.在备择分布与原假设分布接近时, $ p $值和第二类错误都较大.在备择分布与原假设分布差别很大时, $ p $值和第二类错误都较小. $ p $值和第二类错误($ \beta $值)基本稳定, $ p $值和第二类错误($ \beta $值)的大小一般表示原假设分布与备择假设分布的接近程度.点估计的结论具有再现性.

5.2 客观一致性模拟

表 5.1    

XTAU0($\alpha_{i0}$)XTAU0($\alpha_{i0}^{\sigma}$)
考虑均值原假设:2200考虑标准差原假设:000
000000
-2-200000
MU0($\mu_0$)MU0 ($\mu_0^{\sigma}$)
450101.76.52

新窗口打开| 下载CSV


根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let r = 2;",那么程序将根据原假设模拟产生300个模拟数据,放在虚拟数据集a之中.如果把调用数据集的程序"data bbb; set d321; num = _n_; "改成"data bbb; set a; num = _n_; ",并选取宏变量"%Let rf = 1000;",那么程序将输出西方均值和标准差点估计模拟结论

表 5.2    

CT2FFA
2.821.520.52.64
NKBJYMU
均值:3002751510345010
2.3731.679.83
000
000
CT2FFA
2.8219.396.422.64
NKBJYMU
标准差:300275151031.76.52
1.868.731.9
000
0.030.030.03

新窗口打开| 下载CSV


真实均值是$ \mu = (4, 50, 10)^T $,相应真实标准差是$ \sigma = (1.7, 6.50, 2)^T $. F值大于临界值fa说明:真实均值不是$ \mu = (4, 50, 10)^T $.特别注意到,对真实均值$ \mu = (4, 50, 10)^T $第二分量的模拟估计$ \hat{\mu_2} = 31.67 $与真实值的相对误差为$ |31.67-50|/50 = 18.33/50 = 36.66/100 $,相差36.66%.相对误差相差大于30%,按统计常识,相对误差是较大的.绝对误差18.33大于真实标准差6.5的二倍,说明绝对误差也较大.根据假设检验规则,因为点估计的$ p $值和第二类错误都是0,所以假设检验的结论是要拒绝原假设.此点估计的检验结论是错误的,因为数据是根据原假设$ \mu = (4, 50, 10) $进行模拟获得的.这说明,通过模拟,可以认为西方的均值点估计方法不具有客观一致性,或者说模拟结论和真实客观结论不一致.

表 5.3    

CT2FFA
2.821.520.52.64
NKBJYMU
均值:3002751510345010
3.8349.1610.03
0.680.680.68
0.850.850.85
CT2FFA
2.823.871.282.64
NKBJYMU
标准差:300275151031.76.52
1.796.141.91
0.280.280.28
0.660.660.66

新窗口打开| 下载CSV


同样,真实标准差是$ \sigma = (1.7, 6.50, 2)^T $. F值大于临界值fa说明:真实标准差不是$ \sigma = (1.7, 6.50, 2)^T $.特别注意到,对真实标准差$ \sigma = (1.7, 6.50, 2)^T $第二分量的模拟估计$ \hat\sigma_2 = 8.73 $与真实值的相对误差为$ |8.73-6.5|/6.5 = 2.23/6.5 = 0.343 $,相差34.3%.由于没有关于标准差估计的误差标准,所以无法判断绝对误差的大小,但相对误差大于30%,按统计常识,相对误差也是较大的,所以模拟标准差估计可以认为是不正确的.因为标准差点估计的假设检验的$ p $值和第二类错误都小于0.05,所以假设检验的结论是要拒绝原假设.此点估计的检验结论是不正确的,因为数据是根据原假设$ \sigma = (1.7, 6.50, 2)^T $进行模拟获得的.换句话说,通过模拟,可以认为西方的标准差点估计方法不具有客观一致性,或者说模拟结论和真实客观结论不一致.

如果根据同样的模拟数据,即选取宏变量"%Let r = 2;",并选取宏变量"%Let rf = rfa; ",那么程序将输出东方点估计模拟结论:

真实均值是$ \mu = (4, 50, 10)^T $,相应的真实标准差是$ \sigma = (1.7, 6.50, 2)^T $. F值小于临界值fa说明:真实均值是$ \mu = (4, 50, 10)^T $.特别注意到,对真实均值$ \mu = (4, 50, 10)^T $第二分量的模拟估计$ \hat{\mu_2} = 49.16 $与真实值的相对误差为$ |49.16-50|/50 = 0.84/50 = 1.68/100 $,相差百分之1.68.由于绝对误差0.84小于相应的标准差6.5,相对误差在百分之十之内,所以模拟估计可以认为正确的.因为点估计的$ p $值和第二类错误大于0.05,所以假设检验的结论是要接受原假设.此点估计的检验结论是正确的,因为数据是根据原假设$ \mu = (4, 50, 10) $进行模拟获得的.这说明,通过模拟,可以认为东方的均值点估计方法具有客观一致性,或者说模拟结论和真实客观结论一致.

同样,真实标准差是$ \sigma = (1.7, 6.50, 2)^T $. F值小于临界值fa说明:真实均值是$ \sigma = (1.7, 6.50, 2)^T $.特别注意到,对真实标准差$ \sigma = (1.7, 6.50, 2)^T $第二分量的模拟估计$ \hat\sigma_2 = 6.14 $与真实值的相对误差为$ |6.14-6.5|/6.5 = 0.36/6.5 = 0.055 $.由于绝对误差0.36小于相应的标准差6.5,相对误差在百分之十以内,所以可以认为模拟估计是正确的.因为点估计的$ p $值和第二类错误大于0.05,所以假设检验的结论是要接受原假设.此点估计的检验结论是正确的,因为数据是根据原假设$ \sigma = (1.7, 6.50, 2)^T $进行模拟获得的.换句话说,通过模拟,可以认为东方的标准差点估计方法具有客观一致性,或者说模拟结论和真实客观结论一致.

5.3 重复出现性模拟

根据上述同样程序,如果选取宏变量"%Let r = 29;", "%Let rf = 10000;",那么程序将输出西方点估计模拟结论:

比较均值的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很大.比如:对真实均值$ \mu = (4, 50, 10)^T $第一分量的两次模拟估计分别为$ \hat{\mu_1} = 2.37 $$ \hat{\mu_1} = 5.07 $,两次估计的绝对误差是$ |2.37-5.07| = 2.70 $,相对误差是$ 2.70/2.37\approx 1.14 $;绝对误差大于两次关于标准差的估计最大值2.08,相对误差超过了一倍,远远大于30%,说明两次估计不一致.对真实均值$ \mu = (4, 50, 10)^T $第二分量的两次模拟估计分别为$ \hat{\mu_2} = 31.84 $$ \hat{\mu_2} = 58.78 $,两次估计的绝对误差是$ |31.84-58.78| = 26.94 $,相对误差是$ 26.94/31.84\approx 0.85 $;绝对误差超过了两次标准差估计的最大值14.01,相对误差大于30%,说明两次估计不一致.上述说明:西方两次模拟的均值点估计结论不一致,即两次模拟的均值点估计是不重复出现的.

表 5.4    

CT2FFA
2.8210033.112.64
NKBJYMU
均值:30010165125345010
5.0758.679.83
000
000
CT2FFA
2.8210033.112.64
NKBJYMU
标准差:3001016512531.76.502
2.0814.011.9
000
000

新窗口打开| 下载CSV


比较标准差的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很大.比如:对真实标准差$ \sigma = (1.7, 6.50, 2)^T $第二分量的两次模拟估计分别为$ \hat\sigma_2 = 8.73 $$ \hat\sigma_2 = 14.01 $,两次估计的相对误差为$ |14.01-8.73|/8.73 = 5.27/8.73 \approx 0.604 $.由于没有关于标准差估计的误差标准,所以无法判断绝对误差的大小,但相对误差大于30%,按统计常识,相对误差也是较大的,所以模拟的两次标准差估计可以认为是不一致的.上述说明:西方两次模拟的标准差点估计结论不一致,即两次模拟的标准差点估计是不重复出现的.

这两次模拟数据的差别仅仅是对各个类的数据个数$ k_i $的选取不一致.因为前一次数据大部分在第一类中选取数据,即$ K = (275, 15, 10) $,所以均值估计值常常低估;而后一次数据大部分在第二、三类中选取数据,即$ K = (10, 165, 125) $,所以均值估计值常常高估.而对各个类内的数据个数的选取是统计学者的自然行为,这说明西方点估计和统计学者的行为有关.

如果根据同样的模拟数据,即选取宏变量"%Let r = 29;",并选取宏变量"%Let rf = rfa; ",那么程序将输出东方点估计模拟结论

表 5.5    

CT2FFA
2.8220.662.64
NKBJYMU
均值:30010165125345010
4.2749.7110.02
0.580.580.58
0.810.810.81
CT2FFA
2.823.871.282.64
NKBJYMU
标准差:3001016512531.76.52
1.846.41.91
0.290.290.29
0.660.660.66

新窗口打开| 下载CSV


比较均值的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很小.比如:对真实均值$ \mu = (4, 50, 10)^T $第二分量的两次模拟估计分别为$ \hat{\mu_2} = 49.16 $$ \hat{\mu_2} = 49.71 $,两次估计的绝对误差是$ |49.16-49.71| = 0.55 $,相对误差是$ 0.55/49.16\approx 0.011 $;绝对误差小于两次标准差估计的最小值6.14,相对误差小于10%,说明两次估计一致.上述说明:东方两次模拟的均值点估计结论一致,即两次模拟的均值点估计是重复出现的.

比较标准差的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很小.比如:对真实标准差$ \sigma = (1.7, 6.50, 2)^T $第二分量的两次模拟估计分别为$ \hat\sigma_2 = 6.14 $$ \hat\sigma_2 = 6.4 $,两次估计的相对误差是相对误差为$ |6.14-6.4|/6.14 = 0.26/6.14 \approx 0.042 $.由于没有关于标准差估计的误差标准,所以无法判断绝对误差的大小,但相对误差小于10%,按统计常识,相对误差也是较小的,所以模拟标准差估计可以认为是一致的.上述说明:东方两次模拟的标准差点估计结论一致,即两次模拟的标准差点估计是重复出现的.

再现性是指客观一致性和重复出现性同时满足的性质.上述模拟说明:西方点估计不具有再现性,而东方点估计具有再现性.

西方点估计把所有区组的效应都假设为0,只有关于总均值和相应的标准差的估计概念;而东方点估计除了可以用总均值和相应的标准差之外,在区组效应显著时,或者在区组效应的贡献率较高时,还可以估计相应的区组因子的各个水平效应.通过模拟可以发现,在区组效应的贡献率较高时,东方点估计关于区组因子的各个水平效应的估计也具有再现性.

6 东西方点估计的参数差别

象数学

总均值的假设检验

拒绝域为

$ p $值和第二类错误为

区组因子各个水平效应的假设检验

拒绝域为

$ p $值和第二类错误为

贡献率的假设检验区组均值效应贡献率

误差均值效应贡献率

区组-误差均值效应贡献率之比

对于统计量$ \hat r_f = \frac{\hat r_{\tau_{x_0}}}{\hat r_{\varepsilon}} $,可以构造近似非中心$ F(b-1, f_e, \delta) $分布的统计量

拒绝域为

$ p $值和第二类错误为

异标准差估计仅仅需要把原实验数据$ X_{ij} $,改成对异标准差的估计数据$ \zeta_{ij} = abs(\varepsilon_{ij})\sqrt{\pi/2} $,用相同的分析程序进行估计即可.

西方

总均值的假设检验

拒绝域为

$ p $值和第二类错误为

异标准差估计仅仅需要把原实验数据$ X_{ij} $,改成对异标准差的估计数据$ \zeta_{ij} = abs(\varepsilon_{ij})\sqrt{\pi/2} $,用相同的分析程序进行估计即可.

东西方点估计的区别主要在自由度参数$ \lambda_{\mu}, \lambda_{\alpha}, f_e $.

7 结论

本文研究了东西方关于数据均值和标准差估计的差别.由于按统计学标准,在不同的模型假设下,两种估计方法都是无偏差和方差最小的,假设检验方法也基本是相同的,所以在统计学内部,在不知道真实结论时,无法比较两种估计计算方法的优劣.如果考虑第三方标准,即考虑模型(1.1),那么在给定模型(1.1)的模型系统函数$ f $的形式以后,相当于在给定要估计的均值和标准差以后,可以产生各种各样的模拟数据.根据这些模拟数据,用东西方两种估计方法,都可以得到相应的估计值.在已知真值的情况下,如果相应方法的估计值都与真实值相同,那么其估计是正确的,其估计方法是可信的.称这种性质相应的估计方法具有客观一致性.在未知真值的情况下,如果相应方法的各种各样的估计值都是基本相同的,那么其估计有可能是正确的,其估计方法是近似可信的,但不能完全相信估计结论,因为可能估计结论都不正确.称这种性质相应的估计方法具有重复出现性.如果相应的估计方法既具有客观一致性,又具有重复出现性,那么称相应的估计方法具有再现性.按再现性标准,本文证明:西方的点估计方法不具有再现性,而东方的点估计方法具有再现性.

参考文献

茆诗松, 周纪芗, 陈颖. 试验设计. 第二版 北京: 中国统计出版社, 2012

[本文引用: 2]

Mian S S , Zhou J X , Chen Y . Experimental Design. Second Edition Beijing: China Statistics Publishing House, 2012

[本文引用: 2]

Zhang Y S , Shao W L .

Image mathematics-Mathematical intervening principle based on "Yin Yang Wu Xing" theory in traditional chinese mathematics(I)

Applied Mathematics, 2012, 3 (6): 617- 636

DOI:10.4236/am.2012.36096      [本文引用: 1]

张应山. 多边矩阵理论. 北京: 中国统计出版社, 1993

[本文引用: 1]

Zhang Y S . Multilateral Matrix Theory. Beijing: China Statistics Publishing House, 1993

[本文引用: 1]

Zhang Y S , Lu Y Q , Pang S Q .

Orthogonal arrays obtained by orthogonal decomposition of projection matrices

Statistica Sinica, 1999, 9: 595- 604

[本文引用: 1]

Pang S Q , Zhang Y S , Liu S Y .

Normal mixed difference matrix and the construction of orthogonal arrays

Stat & Prob Lett, 2004, 69: 431- 437

张应山.正交表的数据分析及其构造[D].上海:华东师范大学, 2006

[本文引用: 1]

Zhang Y S. Data Analysis and Construction of Orthogonal Tables[D]. Shanghai: East China Normal University, 2006

[本文引用: 1]

Zhang Y S , Li W G , Mao S S , et al.

Orthogonal arrays obtained by generalized difference matrices with g levels

Science China Mathematics, 2011, 54 (1): 133- 143

DOI:10.1007/s11425-010-4144-y     

吴亚桢, 廖靖宇, 张应山, .

正交平衡区组设计统计分析模型的参数估计

数学的实践与认识, 2012, 42 (2): 200- 208

DOI:10.3969/j.issn.1000-0984.2012.02.023      [本文引用: 1]

Wu Y Z , Liao J Y , Zhang Y S , et al.

Parameter estimation of statistical analysis model for orthogonal balanced block design

Practice and Understanding of Mathematics, 2012, 42 (2): 200- 208

DOI:10.3969/j.issn.1000-0984.2012.02.023      [本文引用: 1]

吴亚桢, 廖靖宇, 张应山, .

正交平衡区组设计统计分析模型参数估计的分布特征研究

数学的实践与认识, 2012, 42 (3): 212- 221

DOI:10.3969/j.issn.1000-0984.2012.03.033     

Wu Y Z , Liao J Y , Zhang Y S , et al.

Distribution characteristics of parameter estimation in statistical analysis model of orthogonal balanced block design

Practice and Understanding of Mathematics, 2012, 42 (3): 212- 221

DOI:10.3969/j.issn.1000-0984.2012.03.033     

吴亚桢, 廖靖宇, 张应山, .

正交平衡区组设计统计分析模型参数估计的矩阵表达

数学的实践与认识, 2012, 42 (16): 185- 189

DOI:10.3969/j.issn.1000-0984.2012.16.025     

Wu Y Z , Liao J Y , Zhang Y S , et al.

Matrix expression of parameter estimation in statistical analysis model of orthogonal balanced block design

Practice and Understanding of Mathematics, 2012, 42 (16): 185- 189

DOI:10.3969/j.issn.1000-0984.2012.16.025     

罗纯, 潘长缘.

穷举法寻找正交平衡区组设计

应用概率统计, 2011, 27 (1): 1- 13

DOI:10.3969/j.issn.1001-4268.2011.01.001     

Luo C , Pan C Y .

Exhaustion method for orthogonal balanced block design

Application of Probability Statistics, 2011, 27 (1): 1- 13

DOI:10.3969/j.issn.1001-4268.2011.01.001     

田金亭, 张应山, 张晓琴, .

平衡区组正交表的比较及应用

数学的实践与认识, 2009, 39 (2): 127- 137

URL    

Tian J T , Zhang Y S , Zhang X Q , et al.

Comparison and application of balanced block orthogonal tables

Practice and Understanding of Mathematics, 2009, 39 (2): 127- 137

URL    

廖靖宇, 张建军, 田萍, .

正交平衡区组设计矩阵象的基本概念及其基本定理

数学的实践与认识, 2012, 42 (17): 170- 177

DOI:10.3969/j.issn.1000-0984.2012.17.022      [本文引用: 1]

Liao J Y , Zhang J J , Tian P , et al.

Basic concepts and theorems of matrix image in orthogonal balanced block design

Practice and Understanding of Mathematics, 2012, 42 (17): 170- 177

DOI:10.3969/j.issn.1000-0984.2012.17.022      [本文引用: 1]

Luo C , Zhang Y S .

Symmetrical design of experiment in global sensitivity analysis based on ANOVA high-dimensional model representation

Communications in Statistics-Simulation and Computation, 2016, 45 (1): 48- 72

DOI:10.1080/03610918.2013.849740      [本文引用: 1]

/