多元统计分析新观点:点估计
New View: Point Estimation of Multivariate Statistical Analysis
通讯作者:
收稿日期: 2017-12-18
基金资助: |
|
Received: 2017-12-18
Fund supported: |
|
在科学研究中,经常利用观测到的数据对复杂系统的某些客观对象进行估计,这实际上是科学的一个最基础问题,在统计科学之中也是一个最基本的问题,称为:点估计.对点估计的优良性研究文章众多,但是由于东西方认知世界的哲学思想不同,所以历史上东西方对点估计的计算和论证方法有着相当大的差异.该文通过对东西方点估计的计算方法进行模拟比较,说明东方象数学的多元统计分析点估计的计算方法具有再现性,而西方多元统计分析点估计的计算方法不具有再现性.从再现性的观点来看,东方象数学的点估计的计算方法科学性更强.
关键词:
In scientific research, often using the observed data of some objective object for complex systems, estimates that this is actually one of the most basic problems with the scientific, in statistical science is one of the most basic problem, known as the point estimate, of point estimate optimal benign numerous research articles. But because cognitive world philosophy east and west is different, so the history of east and west point estimate calculation and reasoning methods have quite big difference. In this paper, through the comparison of the calculation method of east and west point estimation, illustrate the east as the calculation method of the point estimation in image mathematics has reproducibility, and the west as the calculation method of the point estimation of multivariate statistical analysis has not reproducibility. Reproducibility from the point of view, the oriental image mathematical point estimation method is more scientific.
Keywords:
本文引用格式
张燕, 杨林, 廖靖宇, 张应山.
Zhang Yan, Yang Lin, Liao Jingyu, Zhang Yingshan.
1 引言
在西方传统科学研究中,尤其在试验设计领域[1],一般采用从微观局部认知到宏观全局认知的思维路线来进行逻辑推理和解决问题.也就是说根据自己的观察提出公理和假设,利用形式逻辑(自生逻辑)的真假命题推理来认知世界,从而导致对同样的数据,不同的研究者根据不同的假设和不同的数据个数,可以推导出不同的结论,使得数据分析结论不具有再现性.这里的再现性包含两个方面的含义:其一是数据分析结论和客观事实是否一致?称为客观一致性;其二是多次收集数据并进行数据分析的结论是否基本一致?称为重复出现性.而同样数据的客观真实结论只有一个,数据分析结论的不同,至少说明其中某些数据分析结论不是客观事实,这说明西方数据分析方法和研究者的行为有关.自生逻辑要求对研究对象本身充分观测,根据观测数据本身,提出公理系统和假设命题,用公理和形式逻辑推理来判断命题的真假,所得结论和观测数据本身及其研究者的行为有关.也就是说,自生逻辑是由观测数据及其研究者本身产生的逻辑.在20世纪50年代,西方科学家把这种现象归结为:形式逻辑的相干性缺乏,并提出在古典形式逻辑推理的基础上,增加相干性分析的约束,形成了许多具有现代意义的形式逻辑.
在东方传统科学研究中,尤其在象数学领域[2],一般采用从宏观全局认知到微观局部认知的思维路线来进行逻辑推理和解决问题.不根据自己的观察提出公理和假设,利用满足唯一性、遗传性、可逆性、结合律等基本运算规则的逻辑(不自生逻辑)进行推理来认知世界,从而导致对同样的数据,不同的研究者根据不同的假设和不同的数据个数,可以推导出基本相同的分析结论,使得数据分析结论具有再现性.而同样数据的客观真实结论只有一个,数据分析结论的基本相同,至少说明数据分析结论与客观事实更加接近,这说明东方数据分析方法和研究者的行为基本无关.不自生逻辑要求以观察研究对象的关系为主,无公理无假设,但采用的关系逻辑满足唯一性、遗传性、可逆性、结合律等,要求关系逻辑推理不能和研究对象及其研究者的行为有关.也就是说,不自生逻辑是和观测数据及其研究者本身无关的关系分析逻辑.而相干性分析是排除数据和研究者行为关系对数据分析结论影响的基本方法,从而相干性分析是东方不自生逻辑本身就具有的特征.
相干性分析的严格数学定义是:设
点估计的首要任务是数据的相干性分析,也就是说在数据中排除和研究对象无关的信息,使得修饰后的数据仅仅包含研究对象的信息,即修饰后的数据和研究对象具有相干性.首先某个分布在研究的大系统是存在的,其次数据必须是从这个分布中抽取的,即数据是子系统数据,但在哪些子系统抽取数据的多少?抽取的总数据个数的多少?这些行为仅仅和统计学者的行为有关,和大系统的具体存在无关.
点估计的目的是用子系统数据检验分布函数的某些值是否正确.这从象数学逻辑是可以推理的,因为大系统成立的结论,在子系统一定成立,所以用子系统数据检验大系统结论是可以的.缺乏这些条件是不能使用点估计的.
点估计要首先确定一个分布簇(大空间
为了排除数据的不相干信息,象数学一般认为所有数据都是分类数据.同类数据基本类似,具有相同的象,可以相加,从而可以用平均来消除不相干信息;不同类的数据差别较大,不具有相同的象,不可以直接相加,从而其平均也就没有意义.关于象数学的数据分类准则的量化方法较多,一般称为比类取象方法.本文为了便于读者理解,仍采用统计学中常用的SAS的距离聚类方法进行聚类.由于统计学者对某些分类数据的偏好,造成对各类数据收集的个数或者多或者少,这是统计学者的自然行为,是无法指责的行为,或者说是无法控制的行为.而这种行为势必造成数据包含与研究对象的不相干信息.在获得数据以后的第一步工作是要把数据分类,并且识别各类数据是否有显著差异.对有显著差异的数据要分类处理,用以排除由于数据收集者关于不同类别数据的收集个数多少造成的对研究对象数据分析结论的影响,从而使得修饰过的数据具有相干性,这样就保证了数据分析结论具有再现性.
象数学点估计的数据分类准则(比类取象准则)是:经常把数据分成三类,阳性(实病)、阴性(虚病)、正常.阴阳平衡的状态是好的状态.象数学最关注的相干性分析是首先识别获得的三类数据是否具有显著性差异?如果显著性差异较大,那么必须从数据分析中尽可能的排除不相干的成分.这个思想也称为零成分搜索.即找出不相干数据因素,然后将其排除,排除不相干因素以后的数据才可能具有相干性.
象数学点估计的问题与模型:对于一般不自生逻辑下的多元分析问题,设一复杂系统的输出向量
其中
而
这里
这里
可观测自变量
其中
常记
在象数学理论中,虽然一般对试验误差
不进行假设,但有时对干扰自变量
这里
这些结论实际上都不是假设,它们是根据模型(1.1)进行推导而得到的.
点估计方法好坏的标准不是仅仅由统计领域能够确定的,必须用和点估计无关的第三者模型(1.1)来模拟检验说明.
在统计学中,点估计的一个检验标准是用假设检验的方法来进行检验.假设检验一般观注
象数学经常把零成分放在原假设,并要求对原假设的识别要尽可能准确.在识别时,要把和原假设相关的人为因素排除.例如排除区组因素和排除零因素.排除区组因素主要识别数据的不相干信息.排除零因素主要识别不显著因素.可以犯把不显著因素当成显著因素处理的错误,但要尽可能的少犯把显著因素当成不显著因素处理的错误.一般来说:象数学方法经常使得犯第二类错误的可能性较小,这和西方的点估计的优良性准则经常是相反的.
2 西方点估计的计算方法
2.1 点估计例子
例2.1 人的出汗多少与人体内的钠和钾的含量有一定关系.今测量了20名健康成年女性的出汗量(
在正态假设下,即
用上述数据估计均值和方差.
从数据无法直接看出:这个数据分布假设是否正确?它的正确性与统计学者的行为有关,统计学者可能只对其经常关注的某类数据有兴趣.如果某类数据的个数可以任意改动,那么不可避免地将会导致数据的正态性假设不再满足,即数据将会呈现片面性.比如人为主观增加或减少某些不利的数据,从而达到主观想要的目的.这种情况下,如果统计学数据分析方法不具有再现性,结果可想而知将会产生偏差.虽然西方数据方法不允许更改数据的行为,但象数学数据分析方法允许这些行为,并认为这种行为是很自然的行为,一个具有再现性的数据分析方法应该和这些行为无关,即将数据稍微改动之后,仍然不影响统计分析结果.
2.2 点估计程序输出
在数据分布假设(2.1)正确时,相应的西方点估计SAS程序有如下结论.
数据矩阵
数据均值向量
自由度参数
误差方差矩阵估计
上述统计量
2.3 点估计的结论
在数据分布假设(2.1)正确时,由于
所以估计是渐近正确的.
大数定律是西方点估计理论的基础,也是从微观局部认知到宏观全局认知这一过程需要的必要条件.而在东方象数学领域中,由于坚持有限资源规则,所以从宏观全局认知到微观局部认知这一过程,并不以大数定律为基础,仅仅以数据是否具有全面代表性为基础.象数学仅仅认为大数定律是一个微观局部的指标.即,大数定律仅仅在自由模型(1.1)的区组因子
在数据分布假设(2.1)不正确时,上述点估计结论有可能不成立.譬如:统计学者在收集数据以后,去掉了某些数据,或者说某些数据没有收集到,这些统计学者的个人行为,都可能造成数据分布假设不成立.象数学的估计方法要求其估计结论,不能和这些统计学者的个人行为有关,无论数据分布假设是否正确,数据分析结论应尽可能的一致,即数据分析结论要具有再现性.可以通过删除某些数据的方法,用程序计算,来检验数据分析结论的再现性.对许多西方点估计结论,常常可以用这个方法模拟检验发现:删除少量数据就可以大幅度地改变点估计的结论.这说明西方点估计结论和数据个数高度相关、稳定性差、不具有再现性.
3 象数学点估计的计算方法
3.1 点估计例子
在例2.1同样的数据前提下,不考虑数据分布假设(2.1),或者说把数据分布假设(2.1)改成如下分类数据假设(3.1)
其中,分类数据的个数
分类数据分布假设(3.1)也可以等价的写成
其中,
此时,分类数据
另外,在已知再现性估计
象数学认为:具有客观象的再现性估计之间,可以进行与客观象之间的相同运算,再现性估计之间的运算结果仍然是相应客观象之间的相同运算结果的再现性估计.
例如:估计
估计
估计
估计
象数学一般认为不但分类均值
在本例中,
把上述思想,用SAS语言编写成象数学点估计的计算程序,有如下结果.
3.2 象数学点估计结论
3.2.1 区组因子各类平均值效应的估计
表 3.1
总体平均
MEANX( | ||
3.66 | 34.11 | 10.01 |
XTAU( | ||
-2.16 | -20.61 | 0.09 |
0.85 | 0.15 | -0.04 |
1.32 | 20.45 | -0.06 |
表 3.2
区组均值效应方差
VARXTAU( | ||
2.38 | 23.88 | -0.1 |
23.88 | 281 | -1.03 |
-0.1 | -1.03 | 0 |
EEE( | ||
2.55 | 2.55 | -1.99 |
2.55 | 53.1 | -5.92 |
-1.99 | -5.92 | 4.05 |
分类数据个数
表 3.3
K( | ||
1 7 12 | ||
W( | ||
TRACEVARXTAU( | TRACEEEE( | SUM( |
94.46 | 19.9 | 114.36 |
RXTAU( | REPSILON( | RF( |
0.83 | 0.17 | 4.88 |
统计量rf的值大于临界值rfa,说明原假设模型
表 3.5
区组均值效应的原假设
XTAU0( | ||
2 20 0 | ||
0 0 0 | ||
-2 -20 0 | ||
MU0( | ||
4 50 10 | ||
LAMBDAMU( | LAMBDAALPHA( | FE |
7.34 | 0.82 | 17 |
表 3.6
均值总平均
C | T2 | F | FA | ||||
3.34 | 42.62 | 12.54 | 3.29 | ||||
N | K | B | JYMU | ||||
20 | 1 | 7 | 12 | 3 | 4 | 50 | 10 |
3.66 | 34.11 | 10.01 | |||||
0.000 | 0.000 | 0.000 | |||||
0.001 | 0.001 | 0.001 |
统计量F的值大于临界值fa,说明原假设模型
表 3.7
区组因子的第一水平均值效应的假设检验统计量
C | T2 | F | FA | ||||
3.34 | 0.064 | 0.02 | 3.29 | ||||
N | K | B | JYALPHA1 | ||||
20 | 1 | 7 | 12 | 3 | -2 | -20 | 0 |
-2.16 | -20.61 | 0.09 | |||||
0.997 | 0.997 | 0.997 | |||||
0.947 | 0.947 | 0.947 |
统计量F的值小于临界值fa,说明原假设模型和真实模型一致.因为
表 3.8
区组因子的第二水平均值效应的假设检验统计量
C | T2 | F | FA | ||||
3.34 | 0.07 | 0.02 | 3.29 | ||||
N | K | B | JYALPHA2 | ||||
20 | 1 | 7 | 12 | 3 | 0 | 0 | 0 |
0.85 | 0.15 | -0.04 | |||||
0.70 | 0.70 | 0.70 | |||||
0.87 | 0.87 | 0.87 |
表 3.9
区组因子的第三水平均值效应的假设检验统计量
C | T2 | F | FA | ||||
3.34 | 0.22 | 0.06 | 3.29 | ||||
N | K | B | JYALPHA3 | ||||
20 | 1 | 7 | 12 | 3 | 2 | 20 | 0 |
1.32 | 20.45 | -0.06 | |||||
0.79 | 0.79 | 0.79 | |||||
0.89 | 0.89 | 0.89 |
统计量F的值小于临界值fa,说明原假设模型和真实模型一致.因为
3.2.2 区组因子各类标准差效应的估计
表 3.10
总体标准差
MEANX( | ||
1.21 | 4.68 | 1.47 |
XTAU( | ||
-1.01 | -3.92 | -1.36 |
0.37 | 1.46 | 0.97 |
0.64 | 2.45 | 0.39 |
分类数据个数
表 3.11
区组标准差效应方差
VARXTAU( | ||
0.52 | 2.02 | 0.66 |
2.02 | 7.83 | 2.57 |
0.66 | 2.57 | 0.98 |
EEE( | ||
1.55 | -2.01 | 0.14 |
-2.01 | 32.17 | 0.48 |
0.14 | 0.48 | 1.48 |
表 3.12
K( | ||
1 7 12 | ||
W ( | ||
TRACEVARXTAU( | TRACEEEE( | SUM( |
3.11 | 11.73 | 14.84 |
RXTAU( | REPSILON( | RF( |
0.21 | 0.79 | 0.27 |
在水平0.05下,统计量rf的值小于临界值rfa,说明原假设模型
表 3.14
区组标准差效应的原假设
XTAU0( | ||
0 0 0 | ||
0 0 0 | ||
0 0 0 | ||
MU0 ( | ||
1.7 6.5 2 | ||
LAMBDAMU ( | FE( | |
20 | 19 |
统计量F的值小于临界值fa,说明原假设模型
表 3.15
标准差总平均
C | T2 | F | FA | ||||
3.28 | 0.02 | 0.01 | 3.2 | ||||
N | K | B | JYMU | ||||
20 | 1 | 7 | 12 | 3 | 1.7 | 6.5 | 2 |
1.67 | 6.47 | 1.97 | |||||
1 | 1 | 1 | |||||
0.95 | 0.95 | 0.95 |
4 讨论
4.1 东西方点估计的主要区别在数据是否需要分类
1、象数学点估计的逻辑是不自生逻辑,即不是由研究对象本身产生的逻辑.其逻辑要求不能对研究对象提任何假设,分析的问题与统计学者个人行为无关,要求分析结论具有再现性.为了保证再现性,需要按所采用的不自生逻辑对数据进行分类.本文采用中医学中的三元逻辑把数据分成三类:阳性(实病)、阴性(虚病)、正常.
譬如,由于认识复杂系统的逻辑结构的需要,所以认定"天人"两方的复杂系统逻辑结构一样.因为认识复杂系统要认识它的五脏六腑,于是变量因子的个数需要六个,所有的卦数需要64个等,否则不能利用五脏六腑理论进行以后的推理研究,也不能类推复杂系统内部的关系结构.同类相招、相生相克的非相容分析也就无从谈起.
2、西方点估计的逻辑是自生逻辑,即其是由研究对象本身产生的逻辑.首先要求对研究对象充分观测,提出各种假设等,需要由经验来断定数据是否需要分类,一般不对数据分类.
由于西方的逻辑是根据已经观测到的数据和假设来判断推理,主要是为了根据已经观测到的数据判定命题的真假,所以它的结论和观测得到的数据的多少和数据的真实性有关.由于它的命题是人类任意提出的,分析结论自然和统计学者的学识程度有关,不同的学者可以得出不同的结论,所以很难相信其结论具有再现性.
4.2 东西方均值点估计的比较例子
根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let rf = 1000;"那么可以得到西方点估计没有数据分类的结论
表 4.1
C | T2 | F | FA | ||||
3.28 | 9.77 | 2.91 | 3.2 | ||||
N | K | B | JYMU | ||||
20 | 1 | 7 | 12 | 3 | 4 | 50 | 10 |
4.64 | 45.4 | 9.965 | |||||
0.065 | 0.065 | 0.065 | |||||
0.362 | 0.362 | 0.362 |
在水平0.05的条件下,因为
根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let rf = 2;"或者"%Let rf = rfa; "那么可以得到象数学点估计进行数据分类的结论
表 4.2
C | T2 | F | FA | ||||
3.34 | 42.62 | 12.54 | 3.29 | ||||
N | K | B | JYMU | ||||
20 | 1 | 7 | 12 | 3 | 4 | 50 | 10 |
3.66 | 34.11 | 10.01 | |||||
0.000 | 0.000 | 0.000 | |||||
0.001 | 0.001 | 0.001 |
在水平0.05的条件下,因为
东西方均值点估计的结论不一致.问题出在什么地方呢?
根据东方点估计SAS程序,可以得到均值贡献率检验的结论
表 4.3
K | |||||
1 7 12 | |||||
W= 0.4087302 | |||||
TRACEVARXTAU | TRACEEEE | SUM | |||
94.46 | 19.9 | 114.36 | |||
RXTAU | REPSILON | RF | RFa | aaa | bbb |
0.83 | 0.17 | 4.88 | 0.97 | 0 | 0 |
按象数学的均值贡献率检验规则,因为区组因子与干扰因子的贡献率估计之比为
上述东西方哪一个结论更真实?在不真正知道实际值时,仅仅用统计标准(无偏、方差最小、
4.3 东西方标准方差矩阵点估计的比较例子
根据东方点估计SAS程序,如果选取宏变量"%Let rf = 1000;"那么可以得到西方误差方差矩阵估计没有数据分类的结论
表 4.4
西方误差方差估计结论eee | ||
2.88 | 10.01 | -1.81 |
10.01 | 199.79 | -5.64 |
-1.81 | -5.64 | 3.63 |
误差方差平均迹为 | ||
自由度参数 |
根据东方点估计SAS程序,如果选取宏变量"%Let rf = rfa; "那么可以得到象数学误差方差矩阵估计进行数据分类的结论
表 4.5
象数学误差方差估计结论EEEx | ||
2.55 | 2.55 | -1.99 |
2.55 | 53.1 | -5.92 |
-1.99 | -5.92 | 4.05 |
误差方差平均迹为 | ||
自由度参数 |
东西方关于误差方差平均迹估计严重不一致.因为象数学的误差方差平均迹为
即使如此,仅仅在统计领域也难以说明哪个结论是正确的,因为可能都不正确.
4.4 东西方标准差$ \mu^{\sigma} = \sigma, \alpha_i^{\sigma} = \sigma_i-\sigma $ 点估计的比较例子
根据东方点估计SAS程序,如果选取宏变量"%Let rf = 1000;"那么可以得到西方误差标准差估计没有数据分类的结论
在水平0.05的条件下,因为第一类错误小于0.05,所以要拒绝原假设.
根据东方点估计SAS程序,如果选取宏变量"%Let rf = rfa; "那么可以得到东方误差标准差估计进行数据分类的结论
在水平0.05的条件下,因为
东西方标准差点估计的结论不一致.问题出在什么地方呢?由于真值未知,这个问题无法回答,所以必须用第三方标准模型(1.1)及其派生模型(3.1)和(3.2),通过模拟分析来回答这个问题.
5 模拟分析
5.1 模拟东西方点估计结论
模拟分析需要知道真实结论.我们要说明象数学点估计具有再现性,就是要说明不但和统计模型无关,而且和数据的收集方式无关.这样需要分析假设模型正确和不正确两种情况进行讨论.
在模型假设正确时,东西方分析的结论一致.在模型假设不正确时,东西方分析的结论不一致.西方分析结论不正确,而东方分析结论仍然正确.这说明象数学点估计与数据分布假设是否正确无关.无论是同均值同方差假设,或者异均值同方差假设,或者同均值异方差假设,或者异均值异方差假设,象数学都给出正确结论.因为本文的数据例子是异均值同方差情况,所以本文按异均值同方差假设模拟分析,其它情况模拟分析类似.
模拟比较的一般结论:
1、西方的点估计和数据各个类的个数
象数学的点估计和数据各个类的个数
2、西方的点估计和总数据个数
象数学的点估计和总数据个数
3、西方的点估计和原假设分布与备择假设分布的依赖性很大.在备择分布与原假设分布接近时,如果第一类错误较小,那么第二类错误较大;如果第一类错误较大,那么第二类错误较小.在备择分布与原假设分布差别很大时,如果第一类错误较小,那么第二类错误不确定,可能大,也可能小;如果第一类错误较大,那么第二类错误也不确定,可能大,也可能小.两类错误不稳定.点估计的结论不再具有再现性.
象数学的点估计和原假设分布与备择假设分布的依赖性很小.在备择分布与原假设分布接近时,
5.2 客观一致性模拟
表 5.1
XTAU0( | XTAU0( | ||||||
考虑均值原假设: | 2 | 20 | 0 | 考虑标准差原假设: | 0 | 0 | 0 |
0 | 0 | 0 | 0 | 0 | 0 | ||
-2 | -20 | 0 | 0 | 0 | 0 | ||
MU0( | MU0 ( | ||||||
4 | 50 | 10 | 1.7 | 6.5 | 2 |
根据东方点估计SAS程序开始的宏变量定义,如果选取宏变量"%Let r = 2;",那么程序将根据原假设模拟产生300个模拟数据,放在虚拟数据集a之中.如果把调用数据集的程序"data bbb; set d321; num = _n_; "改成"data bbb; set a; num = _n_; ",并选取宏变量"%Let rf = 1000;",那么程序将输出西方均值和标准差点估计模拟结论
表 5.2
C | T2 | F | FA | ||||||
2.82 | 1.52 | 0.5 | 2.64 | ||||||
N | K | B | JYMU | ||||||
均值: | 300 | 275 | 15 | 10 | 3 | 4 | 50 | 10 | |
2.37 | 31.67 | 9.83 | |||||||
0 | 0 | 0 | |||||||
0 | 0 | 0 | |||||||
C | T2 | F | FA | ||||||
2.82 | 19.39 | 6.42 | 2.64 | ||||||
N | K | B | JYMU | ||||||
标准差: | 300 | 275 | 15 | 10 | 3 | 1.7 | 6.5 | 2 | |
1.86 | 8.73 | 1.9 | |||||||
0 | 0 | 0 | |||||||
0.03 | 0.03 | 0.03 |
真实均值是
表 5.3
C | T2 | F | FA | ||||||
2.82 | 1.52 | 0.5 | 2.64 | ||||||
N | K | B | JYMU | ||||||
均值: | 300 | 275 | 15 | 10 | 3 | 4 | 50 | 10 | |
3.83 | 49.16 | 10.03 | |||||||
0.68 | 0.68 | 0.68 | |||||||
0.85 | 0.85 | 0.85 | |||||||
C | T2 | F | FA | ||||||
2.82 | 3.87 | 1.28 | 2.64 | ||||||
N | K | B | JYMU | ||||||
标准差: | 300 | 275 | 15 | 10 | 3 | 1.7 | 6.5 | 2 | |
1.79 | 6.14 | 1.91 | |||||||
0.28 | 0.28 | 0.28 | |||||||
0.66 | 0.66 | 0.66 |
同样,真实标准差是
如果根据同样的模拟数据,即选取宏变量"%Let r = 2;",并选取宏变量"%Let rf = rfa; ",那么程序将输出东方点估计模拟结论:
真实均值是
同样,真实标准差是
5.3 重复出现性模拟
根据上述同样程序,如果选取宏变量"%Let r = 29;", "%Let rf = 10000;",那么程序将输出西方点估计模拟结论:
比较均值的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很大.比如:对真实均值
表 5.4
C | T2 | F | FA | ||||||
2.82 | 100 | 33.11 | 2.64 | ||||||
N | K | B | JYMU | ||||||
均值: | 300 | 10 | 165 | 125 | 3 | 4 | 50 | 10 | |
5.07 | 58.67 | 9.83 | |||||||
0 | 0 | 0 | |||||||
0 | 0 | 0 | |||||||
C | T2 | F | FA | ||||||
2.82 | 100 | 33.11 | 2.64 | ||||||
N | K | B | JYMU | ||||||
标准差: | 300 | 10 | 165 | 125 | 3 | 1.7 | 6.50 | 2 | |
2.08 | 14.01 | 1.9 | |||||||
0 | 0 | 0 | |||||||
0 | 0 | 0 |
比较标准差的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很大.比如:对真实标准差
这两次模拟数据的差别仅仅是对各个类的数据个数
如果根据同样的模拟数据,即选取宏变量"%Let r = 29;",并选取宏变量"%Let rf = rfa; ",那么程序将输出东方点估计模拟结论
表 5.5
C | T2 | F | FA | ||||||
2.82 | 2 | 0.66 | 2.64 | ||||||
N | K | B | JYMU | ||||||
均值: | 300 | 10 | 165 | 125 | 3 | 4 | 50 | 10 | |
4.27 | 49.71 | 10.02 | |||||||
0.58 | 0.58 | 0.58 | |||||||
0.81 | 0.81 | 0.81 | |||||||
C | T2 | F | FA | ||||||
2.82 | 3.87 | 1.28 | 2.64 | ||||||
N | K | B | JYMU | ||||||
标准差: | 300 | 10 | 165 | 125 | 3 | 1.7 | 6.5 | 2 | |
1.84 | 6.4 | 1.91 | |||||||
0.29 | 0.29 | 0.29 | |||||||
0.66 | 0.66 | 0.66 |
比较均值的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很小.比如:对真实均值
比较标准差的这次模拟估计和前次模拟的差别,可以发现两次估计值的差别很小.比如:对真实标准差
再现性是指客观一致性和重复出现性同时满足的性质.上述模拟说明:西方点估计不具有再现性,而东方点估计具有再现性.
西方点估计把所有区组的效应都假设为0,只有关于总均值和相应的标准差的估计概念;而东方点估计除了可以用总均值和相应的标准差之外,在区组效应显著时,或者在区组效应的贡献率较高时,还可以估计相应的区组因子的各个水平效应.通过模拟可以发现,在区组效应的贡献率较高时,东方点估计关于区组因子的各个水平效应的估计也具有再现性.
6 东西方点估计的参数差别
象数学
总均值的假设检验
拒绝域为
区组因子各个水平效应的假设检验
拒绝域为
贡献率的假设检验区组均值效应贡献率
误差均值效应贡献率
区组-误差均值效应贡献率之比
对于统计量
拒绝域为
异标准差估计仅仅需要把原实验数据
西方
总均值的假设检验
拒绝域为
异标准差估计仅仅需要把原实验数据
东西方点估计的区别主要在自由度参数
7 结论
本文研究了东西方关于数据均值和标准差估计的差别.由于按统计学标准,在不同的模型假设下,两种估计方法都是无偏差和方差最小的,假设检验方法也基本是相同的,所以在统计学内部,在不知道真实结论时,无法比较两种估计计算方法的优劣.如果考虑第三方标准,即考虑模型(1.1),那么在给定模型(1.1)的模型系统函数
参考文献
Image mathematics-Mathematical intervening principle based on "Yin Yang Wu Xing" theory in traditional chinese mathematics(I)
,DOI:10.4236/am.2012.36096 [本文引用: 1]
Orthogonal arrays obtained by orthogonal decomposition of projection matrices
,
Normal mixed difference matrix and the construction of orthogonal arrays
,
Orthogonal arrays obtained by generalized difference matrices with g levels
,
正交平衡区组设计统计分析模型的参数估计
,DOI:10.3969/j.issn.1000-0984.2012.02.023 [本文引用: 1]
Parameter estimation of statistical analysis model for orthogonal balanced block design
DOI:10.3969/j.issn.1000-0984.2012.02.023 [本文引用: 1]
正交平衡区组设计统计分析模型参数估计的分布特征研究
,DOI:10.3969/j.issn.1000-0984.2012.03.033
Distribution characteristics of parameter estimation in statistical analysis model of orthogonal balanced block design
DOI:10.3969/j.issn.1000-0984.2012.03.033
正交平衡区组设计统计分析模型参数估计的矩阵表达
,DOI:10.3969/j.issn.1000-0984.2012.16.025
Matrix expression of parameter estimation in statistical analysis model of orthogonal balanced block design
DOI:10.3969/j.issn.1000-0984.2012.16.025
穷举法寻找正交平衡区组设计
,DOI:10.3969/j.issn.1001-4268.2011.01.001
Exhaustion method for orthogonal balanced block design
DOI:10.3969/j.issn.1001-4268.2011.01.001
平衡区组正交表的比较及应用
,
Comparison and application of balanced block orthogonal tables
正交平衡区组设计矩阵象的基本概念及其基本定理
,DOI:10.3969/j.issn.1000-0984.2012.17.022 [本文引用: 1]
Basic concepts and theorems of matrix image in orthogonal balanced block design
DOI:10.3969/j.issn.1000-0984.2012.17.022 [本文引用: 1]
Symmetrical design of experiment in global sensitivity analysis based on ANOVA high-dimensional model representation
,DOI:10.1080/03610918.2013.849740 [本文引用: 1]
/
〈 | 〉 |