纵向数据下自适应设计广义估计方程的大样本性质
Large Sample Properties of Generalized Estimating Equations with Adaptive Designs for Longitudinal Data
通讯作者:
收稿日期: 2020-10-26
基金资助: |
|
Received: 2020-10-26
Fund supported: |
|
Generalized estimating equation (GEE) is widely adopted in analyzing longitudinal (clustered) data with discrete or nonnegative responses. In this paper, we prove the existence, weak consistency and asymptotic normality of generalized estimating equations estimator with adaptive designs under some mild regular conditions. The accuracy of the asymptotic approximation is examined via numerical simulations. Our results extend the elegant work of Xie and Yang (Ann Statist, 2003, 31: 310-347) and Balan and Schiopu-Kratina (Ann Statist, 2005, 33: 522-541).
Keywords:
本文引用格式
尹长明, 石岳鑫.
Yin Changming, Shi Yuexin.
1 引言
纵向数据或称集团数据、面板数据, 经常出现在生物、医学、经济和社会科学的研究中. 它是对同同一个个体进行多次观测, 所得数据是相关的, 但相关系数未知. 广义估计方程(GEE)[1]是分析响应变量是离散或非负的纵向数据回归问题的重要方法. GEE方法的一个显著特点是即使每个个体多次观测值之间的相关系数(方差)假定错误, 只要均值函数假定正确, 所得回归系数的GEE估计仍具有相合性和渐近正态性. 若相关系数假定也正确, 则得到的GEE估计方差最小.
设
其中'
其中
GEE是广义线性模型(GLM)的推广, GLM和GEE的建模可参看文献[1, 4-7]. GLM大样本性质的可参看文献[8-13]. GEE大样本性质的可参看文献[2, 3, 14]. 文献[2]严格证明了工作相关阵已知, 每个个体观测次数可以无界情形下GEE估计的大样本性质. 文献[14]证明了协变量的维数可以无界情形下GEE估计的渐近性质. 文献[3]证明了具有估计工作相关阵, 误差是鞅差情形GEE估计的相合性和渐近正态性. 文献[2, 14]都假设
2 主要结果
在本文中, 函数在参数
(A1) (ⅰ)
(A2) 未知参数
(A3) 存在一个常数
其中
(A4) 概率为1,
(A5) 存在一个非随机矩阵
(A6) (ⅰ)
定理2.1 若假设(A1)–(A6)成立. 则存在一个随机变量序列
而且
其中
注2.1 对纵向数据, 文献[2]研究的设计阵
注2.3 假设(A4)和(A6)(ⅱ) 要求随机变量(协)方差有界, 而且不趋于0. (A3)是中心极限定理的李雅普诺夫条件. (A6)(ⅰ)是联系函数(link) 的光滑性条件. 这些都是文献中常用条件. 对纵向数据固定设计阵特殊情形, 假设(A2), (A3), (A4)和(A6), 可参看文献[2, 3, 14]. 对非纵向数据这种特殊情形, 文献[9-13, 16, 17]都假设
3 主要结果的证明
为了证明定理2.1, 我们需要如下一些引理.
引理3.1[18] 设
引理3.2[19] 设
则
其中随机变量
引理3.3[2] 记
其中
下面引理3.4至引理3.7的证明放在后面第5节.
引理3.4 若假设(A1)–(A6)成立, 则
引理3.5 若假设(A1)–(A6)成立, 则
引理3.6 若假设(A1)–(A6)成立, 则
引理3.7 若假设(A1)–(A6)成立, 则
定理2.1的证明 由引理3.3至3.6可得
由式(3.1) 和
其中
由假设条件(A4)至(A6), 可得对任意
其中
由引理3.7和式(3.5)知
记
由式(3.2), 对任意
由向量值函数中值定理
因此, 取
由式(3.10)和引理3.1知
所以, 由
由式(3.11)和向量值函数中值定理[20]知
所以
由式(3.14), (3.3), (3.5)和引理3.7, 可得
由式(3.11), (3.12) 和(3.15), 知定理2.1得证.
4 随机模拟
我们考虑相关的自适应设计logit模型:
即
表 1
真实相关阵 | 独立相关阵 | 自回归相关阵 | 真实相关阵 | 独立相关阵 | 自回归相关阵 | |
0.3681 | 0.3474 | 0.3613 | -0.9067 | -0.9014 | -0.9053 | |
(0.3861) | (0.4132) | (0.3975) | (0.2713) | (0.2741) | (0.2748) | |
0.3990 | 0.3716 | 0.3747 | -0.9057 | -0.9040 | -0.9055 | |
(0.2576) | (0.2800) | (0.2639) | (0.1830) | (0.1845) | (0.1833) | |
0.3862 | 0.3837 | 0.3856 | -0.9051 | -0.9047 | -0.9056 | |
(0.1830) | (0.1971) | (0.1868) | (0.1249) | (0.1249) | (0.1244) | |
0.3926 | 0.3917 | 0.3920 | -0.8988 | -0.8987 | -0.8987 | |
(0.1316) | (0.1411) | (0.1340) | (0.0898) | (0.0911) | (0.0903) |
然后我们取
表 2
真实相关阵 | 独立相关阵 | 自回归相关阵 | 真实相关阵 | 独立相关阵 | 自回归相关阵 | |
0.3761 | 0.3480 | 0.3667 | 0.9358 | 0.9596 | 0.9437 | |
(0.2814) | (0.3785) | (0.3124) | (0.2873) | (0.3485) | (0.3098) | |
0.3928 | 0.3778 | 0.3868 | 0.9128 | 0.9254 | 0.9178 | |
(0.1886) | (0.2460) | (0.2031) | (0.1955) | (0.2338) | (0.2069) | |
0.4047 | 0.4018 | 0.4034 | 0.9030 | 0.9089 | 0.9045 | |
(0.1288) | (0.1756) | (0.1427) | (0.1371) | (0.1648) | (0.1472) | |
0.4031 | 0.3961 | 0.4015 | 0.8997 | 0.9021 | 0.9006 | |
(0.0930) | (0.1236) | (0.1039) | (0.0938) | (0.1127) | (0.1007) |
5 引理3.4至引理3.7的证明
引理3.4的证明 由假设(A1)(ⅰ), (3.5)式和
由微分中值定理, 假设(A6)(ⅰ), 式(5.1)知
其中
记
由柯西-施瓦兹不等式, 式(5.3), (5.4), 条件(A4)和(A6)可得
同理
由式(5.5), (5.6)和三角不等式知
因而引理3.4成立.
引理3.5的证明 由微分中值定理, (A6)(ⅰ), 式(5.1)知
其中
与证明(5.5)式同理, 由柯西-施瓦兹不等式, 式(5.10), (5.4), (5.4)可证
由(A1)(ⅱ), (A4), (A6), 式(5.8)可得
与证明(5.5)式同理, 由柯西-施瓦兹不等式, 式(5.13), (5.12), (5.4)可得
由式(5.11)和(5.14)知, 引理3.5成立.
引理3.6的证明 记
则可验证
其中
由假设(A1)(ⅰ)和式(3.5), 可得
由假设(A4)和(A6), 知
由式(5.19), (5.20)和(5.21), 可得
所以, 对任意
由式(5.22), (5.23)和引理3.2, 取
同理
其中
由微分中值定理, 假设(A4), (A6)和式(5.1)可得
由假设(A3), (A6)(ⅰ), 式(5.20)得
记
所以也有
由引理3.2, 式(5.29), (5.30), 取
由式(5.26), (5.27), (5.28)和(5.31)知
同理可证
由式(5.33), (5.32), (5.25), (5.24), (5.18), (5.17), (5.16), (5.15)和(3.5), 知引理3.6成立.
引理3.7的证明 对任意单位向量
由(A1), (A4), (A6)和(3.5)式, 知
对任意
由假设(A5), 知
由假设(A5), 式(5.36), (5.37)和引理3.2, 知
引理3.7得证.
参考文献
Longitudinal data analysis using generalized linear models
,DOI:10.1093/biomet/73.1.13 [本文引用: 2]
Asymptotic for generalized estimating equations with large cluster sizes
,
Asymptotic results with generalized estimating equations for longitudinal data
,
Asymptotic inference from sequential design in a nonlinear situation
,DOI:10.1080/01621459.1985.10478213 [本文引用: 2]
Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models
,
Adaptive quasi-likelihood estimate in generalized linear models
,DOI:10.1360/03ys0369 [本文引用: 1]
Strong consistency of maximum quasi-likelihood estimates in generalized linear models
,DOI:10.1360/04ys0060
Asymptotic normality and strong consistency of maximum quasi-likelihood estimates in generalized linear models
,DOI:10.1007/s11425-004-5169-x [本文引用: 1]
广义线性回归极大拟似然估计的强相合性
,DOI:10.3321/j.issn:1003-3998.2006.02.002
Strong consistency of the maximum likelihood estimator in generalized linear models
DOI:10.3321/j.issn:1003-3998.2006.02.002
广义线性模型中极大拟似然估计的强收敛速度
,
Strong convergence rates of the maximum quasi-likelihood estimator in generalized linear models
GEE analysis of clustered binary data with diverging number of covariates
,
Least squares estimates in stochastic regression models with application to identification and control of dynamics systems
,
Strong consistency of maximum quasi-likelihood estimators in generalized linear models with fixed and adaptive designs
,
Sequential confidence regions of generalized linear models with adaptive designs
,DOI:10.1016/S0378-3758(00)00200-7 [本文引用: 3]
/
〈 | 〉 |