Processing math: 50%

数学物理学报, 2025, 45(3): 919-933

删失指标随机缺失下一般线性模型的加权最小二乘估计

饶珍敏, 王江峰,*, 胡康, 何姗

浙江工商大学统计与数学学院 杭州 310018

Least Squares Estimators of General Linear Model with Censoring Indicators Missing at Random

Rao Zhenmin, Wang Jiangfeng,*, Hu Kang, He Shan

School of Statistic and Mathematics,Zhejiang Gongshang University, Hangzhou 310018

通讯作者: 王江峰,Email: wjf2929@163.com

收稿日期: 2024-07-16   修回日期: 2024-11-7  

基金资助: 国家重点研发计划项目(2024YFA1013502)
国家自然科学基金(U23A2064)
国家自然科学基金(12031005)
浙江省自然科学基金(LY24A010004)
国内访问学者 “教师专业发展项目”(FX2023017)

Received: 2024-07-16   Revised: 2024-11-7  

Fund supported: National Key R&D Program of China(2024YFA1013502)
NSFC(U23A2064)
NSFC(12031005)
Zhejiang Province Natural Science Foundation(LY24A010004)
Teacher Professional Development Program for Domestic Visiting Scholars(FX2023017)

摘要

该文在删失指标随机缺失下, 研究了一般线性模型的加权最小二乘回归估计; 基于校准、插值和逆概率三种加权方法, 分别构建了参数的估计量; 在适当的假设条件下, 建立了这些估计量的渐近正态性, 并提出了一种新的基于最小二乘加权残差 (LSWR) 的 Bootstrap 检验程序; 最后通过数值模拟和实证, 分析了这些估计方法和检验程序的有效性.

关键词: 删失指标; 随机缺失; 一般线性模型; 渐近正态性; Bootstrap 检验

Abstract

This article investigates the weighted least squares regression estimators of general linear models with censoring indicators missing at random. Based on three weighting methods of calibration, interpolation, and inverse probability, parameter estimators are constructed respectively. Under appropriate assumptions, asymptotic normality of these estimators has been established, and a new bootstrap testing program based on least squares weighted residual (LSWR) is proposed. Finally, the effectiveness of these estimators and testing procedures are analyzed through numerical simulations and actual data.

Keywords: censoring indicator; missing at random; general linear models; asymptotic normality; bootstrap testing

PDF (670KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

饶珍敏, 王江峰, 胡康, 何姗. 删失指标随机缺失下一般线性模型的加权最小二乘估计[J]. 数学物理学报, 2025, 45(3): 919-933

Rao Zhenmin, Wang Jiangfeng, Hu Kang, He Shan. Least Squares Estimators of General Linear Model with Censoring Indicators Missing at Random[J]. Acta Mathematica Scientia, 2025, 45(3): 919-933

1 引言

本文讨论响应变量 Tm 维协变量 X 的一般线性回归模型

T=ϕT(X)β+ϵ,
(1.1)

其中 ϕ() 是已知的 p 维向量函数, βp 维的未知参数向量.假定 ϵ 满足如下条件期望: E(ϵ)=0, E(ϵ2)<, 且与 X 独立. 当 ϕ(X)X 时, 模型 (1.1) 就是线性回归模型. 关于线性回归模型的问题, 已经有很多学者做过研究讨论. 与线性回归模型相比, 一般线性回归模型更灵活和适用, 因为它们允许协变量的交互和高阶项.

在生物医学和临床实验中, 经常会遇到受实验个体中途退出实验或者临床实验时间有限制等因素, 导致数据不能完全被观测, 此时观测到的数据被右删失了. 对于右删失数据, Miller[1] 提出使用未删失数据 KM 估计对斜率和截距进行加权, 但估计量的一致性需要临界条件. Buckley 和 James[2] 提出修正残差平方和来估计模型, 但该方法需要复杂的迭代算法. Koul 等人[3]提出了一种基于最小二乘的数据转换方法 (KSV), 这种方法不需要迭代且易执行. 接着, Stute[4] 提出了一种加权的最小二乘估计 (WLS), 证明了估计量的一致性, 并且模拟的估计效果要优于 KSV.

以上文章都是基于右删失数据, 在实际应用中, 删失指标往往会因为部分缺失而不能完全观测到. 根据缺失机制, 将随机缺失分为完全随机缺失 (MCAR) 和随机缺失 (MAR). 本文研究更一般的随机缺失, 在此类数据下, Li 和 Wang[5] 研究了线性回归模型的 WLS 估计, 分别使用校准加权, 插值加权和逆概率加权方法进行估计, 并证明了估计量的渐近正态性; Wang 等人[6]研究了线性回归模型的复合分位数回归估计量, 相比 Li 和 Wang[5] 提出的 WLS 估计更稳健. 针对一般线性回归模型, Guo 和 Xu[7] 在缺失数据下, 研究了一般线性回归模型的参数估计和非参数估计, 并证明了检验统计量的渐近性.

据我们所知, 在删失指标随机缺失数据下, 国内外还没有文献涉及到一般线性回归模型方面的研究. 本文在删失指标随机缺失数据下, 基于校准、插值和逆概率三种加权方法, 分别构造了一般线性回归模型参数的估计量, 并给出这些估计的渐近正态性结果, 把 Li 和 Wang[5] 线性回归模型的结果推广到一般线性回归模型中. 此外, 针对模型 (1.1) 中的未知参数向量 β, 提出了一种新的基于最小二乘加权残差 (LSWR)的 Bootstrap 检验程序, 用以检验如下假设

H0:Aβ=bv.s.H1:Aβb,
(1.2)

其中 A 是已知的 k×p 矩阵, 矩阵的秩为 k(0<kp), b 是已知的 k×1 维向量.

2 估计方法

在右删失的情况下, 令 Ci 为删失时间且独立同分布, G() 是其分布函数, ¯G()=1G(), 这时观察到的数据为 Yi=min(Ti,Ci), δi=I(TiCi). 在线性模型下, Stute[4] 提出了用于估计 β 的加权最小二乘 (WLS) 估计方法, 估计量为

ˆβWLS=(ni=1δi1G(Yi)XiXTi)1ni=1δiXiYi1G(Yi),
(2.1)

其中 ˆβWLS 由最小化目标函数 Q0(β) 估计出来

Q0(β)=ni=1δi1G(Yi)(Yiβ1Xi1βdXid)2.
(2.2)

考虑删失指标随机缺失的情况, 定义缺失指标 ξi: 当指标 δi 被观测到时, ξi=1; 当指标 δi 不可观测时, ξi=0. 那么可以观测到的数据为 {Yi,Xi,δiξi,ξi,1in}. 假设观测样本是来自总体 {Y,X,δξ,ξ} 的独立同分布样本, 且 TiCi 条件独立于 Xi. 为了简便, 令 Zi=(Yi,Xi). 假设在给定 Zi 下, ξiδi 相互独立, 即P(ξi=1|Zi,δi)=P(ξi=1|Zi):=Δ(Zi).由于缺失的存在, 删失指标不能完全被观测. 记 m(Zi)=E(δi|Zi), 注意到

E{m(Z)¯G(Y)(Ya)2|X}=E{E(δ|Z)¯G(Y)(Ya)2|X}=E{δ¯G(Y)(Ya)2|X}.

这样用 m(Zi) 替换 δi, 在一般线性模型下, 得到 WLS 目标函数和估计量分别为

Q(β)=ni=1m(Zi)1G(Yi)(Yiβ1ϕ1(Xi)βpϕp(Xi))2,
(2.3)
ˆβ=(ni=1m(Zi)1G(Yi)ϕ(Xi)ϕT(Xi))1ni=1m(Zi)ϕ(Xi)Yi1G(Yi).
(2.4)

2.1 估计量的构造

在实际情况中, m()G() 经常是未知的. 一种常用来估计 m(Z) 的方法是假设 m(Z)=m0(Z,θ0). m0(,) 是已知函数, θ0Rp+1 是未知参数向量. 根据 Li 和 Wang[5]提出的方法, 可以通过下式极大似然法得到 θ0 的估计量为 ˆθn

ni=1m0(Zi,θ)ξiδi(1m0(Zi,θ))ξi(1δi).
(2.5)

对于函数 G(), 根据 Li 和 Wang[5] 中的定义, 可通过如下式子进行估计

ˆGn(y)=1i:Yiy(nRinRi+1)1ˆun(Yi),
(2.6)

其中 Ri=nj=1I(YjYi), ˆun(y)=ni=1δiξiK(Yiyhn)/ni=1ξiK(Yiyhn)u(y)=E(δ|Y=y) 的 Nadaraya-Watson 估计, K() 是核函数, hn 是窗宽, 满足 0<hn0.

在 (2.4) 式中, 用 m0(Zi;ˆθn)ˆGn(Yi) 分别代替 m(Zi)G(Yi), 得到 WLS 的校准权重和校准估计量分别为

ωi,R=m0(Zi;ˆθn)1ˆGn(Yi),
(2.7)
ˆβR=(ωi,Rϕ(Xi)ϕT(Xi))1ni=1ωi,Rϕ(Xi)Yi.
(2.8)

在缺失数据分析中, 还会用到插值和逆概率两种方法来处理数据. 对于插值方法的加权, 由于 E[ξδ+(1ξ)m(Z)]=E(δ), 得到插值方法的权重为

ωi,I=δiξi+(1ξi)m0(Zi,ˆθn)1ˆGn(Yi),
(2.9)

相应地, WLS 插值估计量为

ˆβI=(ni=1ωi,Iϕ(Xi)ϕT(Xi))1ni=1ωi,Iϕ(Xi)Yi,
(2.10)

对于逆概率加权方法, 根据 Horvitz 和 Thompson[8] 的方法, 令π(y)=E(ξ|Y=y), 其估计为

πn(y)=ni=1ξiW(yYibn)ni=1W(yYibn),

这里 W() 是另一个核函数, bn 是窗宽. 用δiξiπn(Yi)+(1ξiπn(Yi))m0(Zi,ˆθn) 替代 δi 得逆概率权重

ωi,W=δiξiπn(Yi)+(1ξiπn(Yi))m0(Zi,ˆθn)1ˆGn(Yi),
(2.11)

这样 WLS 逆概率估计量为

ˆβW=(ni=1ωi,Wϕ(Xi)ϕT(Xi))1ni=1ωi,Wϕ(Xi)Yi.
(2.12)

2.2 假设检验

(2.8)、(2.10) 以及 (2.12) 式的三个估计量可用于处理模型 (1.1) 中的假设检验问题 (1.2). 然而, 其对应的渐近协方差矩阵的计算非常复杂. 为了避免这个问题, 我们提出了一种基于最小二乘加权残差 (LSWR) 的新检验程序. 首先在原假设下, 定义 LSWR(H0)

LSWR(H0)=ni=1ωi,j(YiϕT(Xi)ˆβ(c))2, j=R,I,W,
(2.13)

其中 ˆβ(c) 为在 H0 下的估计量

ˆβ(c)=argminAβ=bni=1ωi,j(YiϕT(Xi)β)2,
(2.14)

类似地, 我们定义在备择假设下的加权残差平方和 LSWR(H1)

LSWR(H1)=ni=1ωi,j(YiϕT(Xi)ˆβj)2,j=R,I,W.
(2.15)

ˆβj 为 2.1 节中的估计量 ˆβR,ˆβI,ˆβW, ωj 为其对应的权重. 接着计算检验统计量 Rn

Rn=LSWR(H0)LSWR(H1)LSWR(H1)=LSWR(H0)LSWR(H1)1.
(2.16)

当 (1.2) 式中的原假设成立时, LSWR(H0)LSWR(H1) 之间不应存在显着差异. 当 Rn 值很大, 我们应该拒绝 (1.2) 式中的零假设. 假设检验流程如下

第一步 基于样本数据 {Yi,Xi,δiξi,ξi}ni=1, 在原假设下估计出 ˆβ(c), 在备择假设下估计出 ˆβj,j=R,I,W;

第二步 计算残差 ˆηi=YiϕT(Xi)ˆβj, 再根据其经验分布, 利用 Bootstrap 产生残差估计量 ηi, 定义 Yi=ϕT(Xi)ˆβ(c)+ηi,i=1,2,,n;

第三步 将第二步重复 M 次, 得到数据集 Ej={Yi,j,Xi,δiξi,ξi}ni=1,j=1,2,,M, 根据此数据集重新计算 Rnj;

第四步p 值由 ˆp=SM 估计出来, 其中 S 代表事件 {RnjRn} 发生的次数. α 为给出的显著性水平, 当 ˆpα 时, 拒绝原假设.

3 主要结果

在得到结果之前, 我们先对一些需要用到的式子进行标记定义. 记 H()Y 的分布函数, H(t)=P(Yt). 定义 τH=inf{t:H(t)=1}, τ0(0,τH); 设

m0(z,θ0)=(m0(z,θ0)θ1,,m0(z,θ0)θp+1)T

I(θ0)=(σr,s), 其中 σr,s=E[π(Y)m0(Z,θ0)[θ0)]m0(Z,θ0)θrm0(Z,θ0)θs],1r,sp+1,α(z1,z2)=Tm0(z1,θ0)I1(θ0)m0(z2,θ0).

uj=tjK(t)dt, υj=tjK2(t)dt, j=0,1,2.Σ=E[m0(Z,θ0)1G(Y)ϕ(X)ϕT(X)], ΩR(τ0)=Ω1(τ0)+Ω2(τ0)+Ω3(τ0)+2Ω1,2(τ0)+2Ω2,3(τ0), 其构成式定义如下,

Ω1(τ0)=E[μ2(Y)μT2(Y)π(Y)I{Yτ0}m0(Z;θ0)[1m0(Z;θ0)]], μ2(z)=E[ϕ(X)(YϕT(X)β)α(Z,Zj)I{Yτ0}1G(Y)|Zj=z].

定义 g(X1,Y1,δ1,ξ1,τ0)=E{ϕ(X2)m0(Z2;θ0)(Y2ϕT(X2)β)ψ1(Y2)1G(Y2)|X1,Y1,δ1,ξ1}:=g1(τ0),

Ω2(τ0)=E[g1(τ0)gT1(τ0)], Ω3(τ0)=E[m20(Z;θ0)ϕ(X)ϕT(X)(YϕT(X)β)2I{Yτ0}[1G(Y)]2],
Ω1,2(τ0)=E[m0(Z2;θ0)ϕ(X2)(Y2ϕT(X2)β)μT2(τ0)I(Y1Y2)I{Y1τ0}I{Y2τ0}[1G(Y2)][1H(Y1)]],
Ω2,3(τ0)=E[ϕ(X1)(Y1ϕT(X1)β)m0(Z1;θ0)1G(Y1)ϕT(X2)(Y2ϕT(X2)β)m0(Z2;θ0)1G(Y2)I{Y1Y2}

×(Y1Y20d˜H0(s)[1H(s)]2+I(Y2Y1,δ2=0)1H(Y1))].

ΩI(τ0)=ΩR(τ0)+ΩI1(τ0), 其构成式定义如下,

ΩI1(τ0)=E{m0(Z,θ0)[θ0)]I{Yτ0}π(Y)L(Z,τ0)LT(Z,τ0)},

其中 L(Z,τ0)=ϕ(X)(YϕT(X)β)1G(Y)μ2(Z)m0(Z,θ0)[θ0)].

接着设 ΩW(τ0)=ΩR(τ0)+ΩW1(τ0), 其构成式定义如下,

ΩW1(τ0)=E{m0(Z,θ0)[θ0)]I{Yτ0}π(Y)˜L(Z,τ0)˜LT(Z,τ0)},

其中 ˜L(Z,τ0)=ϕ(X)(YϕT(X)β)1G(Y)π(Y)μ2(Z)m0(Z,θ0)[θ0)].

为了证明主要结果, 我们给出以下基本假设

(A1 ) X 是有界支撑的, E{||ϕ(X)||2}< ;

(A2 ) E{||ϕ(X)||2(Yϕ(X)Tβ)2/ˉH2(Y)}< ;

(A3 ) 矩阵 ΩR(τ0), ΩI(τ0), ΩW(τ0) 均是正定的;

(A4 ) K(), W() 是定义在 R 上紧支撑的有界核函数, 满足 RK(u)du=1, RuK(u)du=0, RW(u)du=1, RuW(u)du=0;

(A5 ) 窗宽满足 nhn, nh2n0nbn, nb2n0;

(A6 ) m0(Z,θ)θ0 上连续, π()m() 的一阶导数有界;

(A7 ) σr,s<, 1r,sp+1, I(θ0) 是正定矩阵.

注 3.1 条件 (A1)-(A7) 都是比较常见的. 类似于 (A1) 和 (A2) 的条件, Li 和 Wang[5] 在研究线性回归模型中应用到了, 这里是针对广义线性模型研究中提出的条件; (A3) 在证明渐近正态性时需要用到; (A4) 和 (A5) 这是核函数和窗宽的基本条件; (A6) 和 (A7) 这是在研究删失指标随机缺失下常用的条件, 见文献 Li 和 Wang[5] 以及 Wang等人[6].

最后, 我们给出主要结果.

引理 3.1 在假设 (A4)-(A6) 下, 由 Li 和 Wang[5]

sup0tτ0|ˆGn(t)G(t)1ˆGn(t)|a.s0.

注 3.2 在 (A4)-(A6) 成立条件下, 通过泰勒展开式有如下结论

n(ˆθnθ0)=I1(θ0)1nni=1ξi[δim0(Zi,θ0)]m0(Zi,θ0)m0(Zi,θ0)[θ0)]+op(1).

定理 3.1 在假设 (A1)-(A7) 下, 有 n(ˆβRβ)LN(0,VR), 其中 VR=Σ1ΩRΣ1, ΩR=limτ0τHΩR(τ0). 由于 ΩR 结构复杂, 我们通过 ˆVJR 估计 VR, ˆVJR 是 Jackknife 估计量

ˆVJR=(ni=1m0(Zi;ˆθn)1ˆGn(Yi)ϕ(Xi)ϕT(Xi))1[ni=1(Yi,RϕT(Xi)ˆβR)2ϕ(Xi)ϕT(Xi)](ni=1m0(Zi;ˆθn)1ˆGn(Yi)ϕ(Xi)ϕT(Xi))1.

定理 3.2 在定理 3.1 假设条件下, 则有nˆVJRPVR.

定理 3.3 在定理 3.1 假设条件下, 则有 n(ˆβIβ)LN(0,VI), 其中 VI=Σ1ΩIΣ1, ΩI=limτ0τHΩI(τ0), 类似地, 我们可以用 Jackknife 方法估计 VI.

定理 3.4 在定理 3.1 假设条件下, 则有 n(ˆβWβ)LN(0,VW), 其中 VW=Σ1ΩWΣ1, ΩW=limτ0τHΩW(τ0), 同理可以用 Jackknife 方法估计 VW.

4 模拟研究

本节通过模拟研究来验证所提出的估计量的有限样本性质, 并应用新提出的 Bootstrap 检验程序进行相应的假设检验. 模拟主要包含以下几方面内容: (1) 在一般线性模型下比较五种估计量的估计效果: 完全数据的估计效果 (记为 ˆβC), 右删失数据下的估计效果 (Stute[4] 提出的估计量, 记为 ˆβK), 以及在删失指标随机缺失数据下我们提出的 WLS 校准估计量 ˆβR, WLS 插值估计量 ˆβI 和 WLS 逆概率估计量 ˆβW; (2) 针对广义线性模型, 基于上述五种估计方法对新提出的 Bootstrap 检验程序进行相应的假设检验; (3) 通过对卢布尔雅那大学临床中心数据集进行建模, 来检验所提出的方法的有效性以及假设检验的准确性.

在模拟中, 核函数选为: K(u)=(15/16)(12u2+u4),|u|1, W(u)=1/2,|u|1. 每个模拟研究中进行 200 次模拟运行. 在这里使用一个简单的方法确定窗宽, 即选择 bn=hn 的取值范围从 0.1 到 1.0, 增量为 0.02, 选择使标准差 (Sd) 达到最小的窗宽. 随机产生删失时间 Ci 时, 可能会存在 Ci=0, 导致 ˆGn(Yi) 在有限样本下的不合理估计, 因此用 CiCi 进行替换, Ci=max{Ci,1/n+1/n2}. 那么 Yi=min(Ti,Ci), δi=I(TiCi). 删失时间 Ci 服从指数分布 exp(μ), 调整 μ 的取值可得到不同的删失比例. 由于 δi 是随机缺失的, 令 logit(E(ξi|Zi))=α0+α1X1i+α2X2i+α3Yi, 调整参数 α=(α0,α1,α2,α3)T 可得到不同的缺失比例. 假设 m0(Zi,θ) 服从如下 logistic 模型: logit(m0(Zi,θ))=θ1+θ2X1+θ3X2+θ4Y, 其中参数 \theta\!=\!(\theta_1,\theta_2,\theta_3,\theta_4)^{\rm T} 是通过 (2.5) 式极大似然估计得出.

例 4.1 在这个例子中, 我们考虑如下线性模型

T=\beta_1 X_1+\beta_2 X_2+\epsilon,
(4.1)

其中 \beta_1=1,\beta_2=2,X_1\sim U(0,1),X_2\sim N(0,1),\epsilon \sim N(0,0.5^2). X_1,X_2\epsilon 相互独立. 为了比较不同估计方法 \widehat{\beta}_{C}, \widehat{\beta}_{K}, \widehat{\beta}_{R}, \widehat{\beta}_{I}, \widehat{\beta}_{W} 的估计效果, 选择各估计方法在有限样本下的均值 (Average) 和标准差 (Sd) 作为比较各估计的效果, 这里 \mbox{Average}(\widehat{\beta}_{j})=\frac{1}{M}\sum_{i=1}^{M}\widehat{\beta}_{i, j}, \mbox{Sd}(\widehat{\beta}_{j})=\sqrt{\frac{1}{M-1}\sum_{i=1}^{M}\big(\widehat{\beta}_{i, j}-\mbox{Average}(\widehat{\beta}_{j})\big)^2}, j=C, K, R, I, W.

通过表 1-2, 我们得到如下结论: (1) 总体来说, \widehat\beta _R, \widehat \beta_I, \widehat \beta_W 的估计效果要优于 \widehat \beta_C\widehat \beta_K. 这说明面对删失指标随机缺失数据时, 直接忽略不完全数据或者忽视缺失的删失指标做出的估计会产生一定的偏差; (2) 对于 Average, \widehat \beta_I\widehat \beta_W 估计的效果较好, \widehat \beta_C 估计效果最差; (3) 对于 Sd 方法, \widehat \beta_R 明显要优于 \widehat \beta_I\widehat \beta_W, 这和定理的结论相吻合; (4) 在相同的条件下, 随着样本量 n 的增大, 估计效果越好; (5) 这些方法也受到了 CR 和 MR 的影响, CR 或 MR 越大, 模拟结果越差, 且受 CR 的影响要大于 MR 的影响.

表1   n=200 时, 五种方法下 Average 和 Sd 的模拟结果

新窗口打开| 下载CSV


表2   n=500 时, 五种方法下 Average 和 Sd 的模拟结果

新窗口打开| 下载CSV


例 4.2 为了验证假设检验的效果, 我们考虑如下简单模型

T=\beta_1 X_1+\lambda X_2^2+\epsilon,
(4.2)

其中 X_1\sim N(0,1), X_2\sim U(0,1), \epsilon\sim N(0,0.5^2), 并且 X_1,X_2\epsilon 相互独立. 在 CR=10%, MR=10% 进行如下假设检验

H_0:\lambda =0~~ v.s.~~ H_1:\lambda \not=0,~~ \lambda \in [0,1].
(4.3)

我们将 5 种估计方法, 应用到 2.2 节所提出的 Bootstrap 检验程序, 样本大小为 n=500. 对于每次估计, Bootstrap 重复抽样 200 次. 设置显着性水平为 \alpha=0.05, 分别计算 5 种估计方法下假设检验的 \widehat p 值. 模拟结果在表 3

表3   不同 \lambda 下各估计方法的假设检验 p

新窗口打开| 下载CSV


表 3 中可以看出, 当 \lambda=0 时, 假设检验的 p 值非常接近 0.9, 并且接受 H_0 的概率随着 \lambda 的增加而迅速减小. 总体而言, 我们提出的 \widehat \beta_R, \widehat \beta_I\widehat \beta_W 方法表现相似, 均优于 \widehat \beta_C\widehat \beta_K 方法, 且 \widehat \beta_W 方法在此模型下, 估计效果要更好, 更稳健.

例 4.3 为了能解决实际问题, 我们选取卢布尔雅那大学临床中心的急性心肌梗塞研究数据集进行模拟. 该数据集一共包含从 1980 年到 1998 年的 1040 个患者. 其中有 547 个患者的存活时间未被删失 (CR=47.4%). Wang 和 Wang[10] 研究了该数据集的线性建模, 其中 T=log(time), 是存活天数的 log 值. X_1 是患者年龄 (age), 范围为 24-95 岁. X_2 是患者性别 (gender), 男性为 X_2=1, 女性为 X_2=0. 因此, 考虑如下模型

T=\beta_0+\beta_1 X_{1}+\beta_2 X_2+\beta_3 X_{1}^2+\epsilon,
(4.4)

由于这组数据删失指标是完整的,我们人为地对这组数据进行随机缺失, 缺失指标 \xi 由如下逻辑回归模型生成 (MR=10\%),

\mbox{log}\big(P(\xi_i|T_i,X_{1i},X_{2i})\big)=0.036+0.026X_{1i}+0.017X_{2i}+0.080T_i,

随机缺失后, 1040 个患者中有 496 个患者的存活时间未被删失 (\xi=1, \delta=1), 有 438 个患者的存活时间被删失了 (\xi=1, \delta=0), 最后还有 106 个患者的删失指标被随机缺失了 (\xi=0).

首先应用提出的新假设检验程序来验证如下假设

H_0:\beta_3 =0 v.s. H_1:\beta_3 \not=0,
(4.5)

如果 (4.5) 式中的原假设成立, 那么模型 (4.4) 是经典线性模型. 经过提出的 Bootstrap 检验, 设定重复次数 M=200, R_n 的检验 \widehat p 值均为 1. 即接受 (4.5) 式中的原假设, 模型 (4.4) 就是线性模型.

表 4 为各方法的假设检验结果以及在原假设下建模结果, 为了更好地评价模型估计效果, 我们加入两项模型评价统计指标: MADE 和 MSE, 其定义如下

\rm{MADE}(\widehat \beta)=\frac{1}{d}\sum\limits_{i=1}^d|\widehat T_i-T_i|,
(4.6)
\rm{MSE}(\widehat \beta)=\frac{1}{d}\sum\limits_{i=1}^d(\widehat T_i-T_i)^2.
(4.7)

表4   实例数据下的检验结果和估计结果

新窗口打开| 下载CSV


其中 d=547 表示未被删失的样本个数. 方法 Lcrqcrq 为 Wang 和 Wang[10] 在忽视缺失的删失指标数据下, 基于分位数回归估计方法对该数据集的建模结果. 我们可以看出 \widehat \beta_R, \widehat \beta_I\widehat \beta_W 估计方法效果要明显优于 Lcrqcrq 的估计效果. 对于 MADE, \widehat \beta_W 要优于 \widehat \beta_I, 且优于 \widehat \beta_R; 对于 MSE, \widehat \beta_R 要优于 \widehat \beta_I, 且优于 \widehat \beta_W.

5 结果证明

引理 5.1 在 (A4)-(A6) 假设下, 则有

\widehat{G}_n(t)-G(t) =\frac{1-G(t)}{n} \sum\limits_{j=1}^n \psi(Y_j,\delta_j,\xi_j;t)+o_p(n^{-1/2}),

其中 \psi(Y_j,\delta_j,\xi_j;t)=\frac{-\big[\xi_j-\pi(Y_j)\big]\big[\delta_i-u(Y_j)\big]I(Y_j\leq t)}{\pi(Y_j)\big[1-H(Y_j)\big]}+\int\nolimits_0^{Y_j\wedge t}\frac{\mathrm{d}H_0(s)}{[1-H(s)]^2}+\frac{I(Y_j\leq t,\delta_j=0)}{[1-H(Y_j)]}:=\psi_j(t), 并且 H_0(t) = P(Y_j>t,\delta_j=0).

引理 5.1 的结果在 Li 和 Wang[5] 中被证明, 根据其证明过程, 当 i\not=j, 有 E[\psi_j(Y_i)]=0, {E}[\psi_j^2(Y_i)|Y_i]\leq \dfrac{[1-G(Y_i)]^2}{\bar H^2(Y_i)}, 并得到 \sup_{i}|\widehat{G}_n(Y_i)-G(Y_i)|=O_p(n^{-\frac{1}{2}}).

定理 3.1 的证明\sqrt{n}(\widehat{\beta}_R-\beta)=\varSigma_n^{-1}A_n, 其中 \varSigma_n=\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{m_0(Z_i;\widehat{\theta}_n)}{1-\widehat{G}_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i),A_n=\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)\bigg(\dfrac{m_0(Z_i;\widehat{\theta}_n)-m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}+\dfrac{m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}\bigg).

\begin{matrix} \varSigma_n(\tau_0) &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{m_0(Z_i;\widehat{\theta}_n)}{1-\widehat{G}_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\bigg[\dfrac{m_0(Z_i;\widehat{\theta}_n)-m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)+\dfrac{m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)\bigg]I_{\{Y_i\leq \tau_0\}}\\ &:=&\varSigma_{n1}(\tau_0)+\varSigma_{n2}(\tau_0). \end{matrix}
(5.1)

首先, 我们计算 \varSigma_{n1}(\tau_0), 注意到

\begin{matrix} \varSigma_{n1}(\!\tau_0\!)&\!=\!& \dfrac{1}{n}\sum\limits_{i=1}^{n}\Bigg\{\!\phi(X_i\!)\phi^{\rm T}(\!X_i\!)\!\Big[m_0(\!Z_i;\widehat{\theta}_n\!)\!-\!m_0(\!Z_i;\theta_0\!)\Big]\!I_{\{\!Y_i\leq \tau_0\!\}}\!\times\!\bigg[\dfrac{1}{\!1\!-\!{G}(Y_i)\!}\!\\ &&+\!\dfrac{\!\widehat{G}_n(Y_i)\!-\!{G}(Y_i)\!}{[1\!-\!{G}(Y_i)][1\!-\!\widehat{G}_n(Y_i)]}\bigg]\Bigg\} := \varSigma_{n11}(\tau_0)+\varSigma_{n12}(\tau_0). \end{matrix}
(5.2)

对于 \varSigma_{n11}(\tau_0), 有

\begin{matrix} \varSigma_{n11}(\tau_0) &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\phi(X_i)\phi^{\rm T}(X_i)\big[m_0(Z_i;\widehat{\theta}_n)-m_0(Z_i;\theta_0)\big]I_{\{Y_i\leq \tau_0\}}}{1-{G}(Y_i)}\\ &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\phi(X_i)\phi^{\rm T}(X_i)\nabla^{\rm T} m_0(Z_i;\theta_0)(\widehat{\theta}_n-\theta_0)I_{\{Y_i\leq \tau_0\}}}{1-{G}(Y_i)}+o_p(1). \end{matrix}

由注 3.1 泰勒展开式有, \varSigma_{n11}(\tau_0)=\dfrac{1}{n}\sum\limits_{j=1}^{n}\dfrac{\xi_j\big[\delta_j-m_0(Z_j;\theta_0)\big]\mu_1(Z_j)}{m_0(Z_j;\theta_0)\big[1-m_0(Z_j;\theta_0)\big]}+o_p(1), 其中

\mu_1(z)=E\Big[\dfrac{\phi(X)\phi^{\rm T}(X)\alpha(Z,Z_j)I_{\{Y\leq \tau_0\}}}{1-{G}(Y)}\Big\lvert Z_j=z\Big].
(5.3)

根据缺失机制条件, 可以得 \dfrac{1}{n}\sum\limits_{j=1}^{n}\dfrac{\xi_j\big[\delta_j-m_0(Z_j;\theta_0)\big]\mu_1(Z_j)}{m_0(Z_j;\theta_0)\big[1-m_0(Z_j;\theta_0)\big]}=o_p(1), 因此 \varSigma_{n11}(\tau_0)=o_p(1). 对于 \varSigma_{n12}(\tau_0), 由引理 3.1 得

\begin{matrix} \varSigma_{n12}(\tau_0) &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\Bigg\{\!\phi(X_i)\phi^{\rm T}(X_i)\!\Big[\!m_0(Z_i;\widehat{\theta}_n)\!-\!m_0(Z_i;\theta_0)\!\Big]I_{\{Y_i\leq \tau_0\}}\!\times\!\bigg[\dfrac{\!\widehat{G}_n(Y_i)\!-\!{G}(Y_i)\!}{[1\!-\!{G}(Y_i)][1\!-\!\widehat{G}_n(Y_i)]}\bigg]\Bigg\}\\ &\leq & \sup\limits_{0\leq Y_i\leq \tau_0}\bigg\lvert\dfrac{\widehat{G}_n(Y_i)-{G}(Y_i)}{1-\widehat{G}_n(Y_i)}\bigg\lvert \cdot\varSigma_{n11}(\tau_0)=o_p(1). \end{matrix}

接着我们计算 \varSigma_{n2}(\tau_0), 类似地

\begin{matrix} \varSigma_{n2}(\tau_0) &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\phi(X_i)\phi^{\rm T}(X_i)m_0(Z_i;\theta_0)\bigg[\dfrac{1}{1-{G}(Y_i)}+\dfrac{\widehat{G}_n(Y_i)-{G}(Y_i)}{[1-{G}(Y_i)][1-\widehat{G}_n(Y_i)]}\bigg]I_{\{Y_i\leq \tau_0\}}\\ &:=& \varSigma_{n21}(\tau_0)+\varSigma_{n22}(\tau_0), \end{matrix}
(5.4)

对于 \varSigma_{n21}(\tau_0),

\begin{equation} \varSigma_{n21}(\tau_0)={E}\bigg[\dfrac{\phi(X)\phi^{\rm T}(X)m_0(Z;\theta_0)I_{\{Y\leq \tau_0\}}}{1-{G}(Y)}\bigg]+o_p(1), \end{equation}
(5.5)

对于 \varSigma_{n22}(\tau_0), 根据引理 5.1 有

\begin{equation} \varSigma_{n22}(\tau_0)\leq \sup\limits_{0\leq Y_i\leq \tau_0}\bigg\lvert\dfrac{\widehat{G}_n(Y_i)-{G}(Y_i)}{1-\widehat{G}_n(Y_i)}\bigg\lvert\cdot E\bigg[\dfrac{\phi(X)\phi^{\rm T}(X)m_0(Z;\theta_0)I_{\{Y\leq \tau_0\}}}{1-{G}(Y)}\bigg]+o_p(1)=o_p(1), \end{equation}
(5.6)

联立 (5.1)-(5.6) 式, 有

\begin{equation} \varSigma_{n}^{-1}(\tau_0)={E}^{-1}\bigg[\dfrac{\phi(X)\phi^{\rm T}(X)m_0(Z;\theta_0)I_{\{Y\leq \tau_0\}}}{1-{G}(Y)}\bigg]+o_p(1)=\varSigma^{-1}(\tau_0)+o_p(1). \end{equation}
(5.7)

相应地, 对 A_n 作如下定义

\begin{matrix} A_n(\tau_0) &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y\leq \tau_0\}}\cdot\bigg[\dfrac{m_0(Z_i;\widehat{\theta}_n)-m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}+\dfrac{m_0(Z_i;\theta_0)}{1-\widehat{G}_n(Y_i)}\bigg]\\ &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y\leq \tau_0\}}\cdot\bigg[\dfrac{m_0(Z_i;\widehat{\theta}_n)-m_0(Z_i;\theta_0)}{1-{G}(Y_i)}+ \dfrac{m_0(Z_i;\theta_0)}{1-{G}(Y_i)}\\ && \times \dfrac{\widehat{G}_n(Y_i)-{G}(Y_i)}{1-\widehat{G}_n(Y_i)}+\dfrac{m_0(Z_i;\theta_0)}{1-{G}(Y_i)}\bigg]+o_p(1)\\ &:=& A_{n1}(\tau_0)+A_{n2}(\tau_0)+A_{n3}(\tau_0)+o_p(1), \end{matrix}
(5.8)

\mu_2(z)={E}\bigg[\dfrac{\phi(X)\big(Y-\phi^{\rm T}(X)\beta\big)\alpha(Z,Z_j)I_{\{Y\leq \tau_0\}}}{1-{G}(Y)}\bigg\lvert Z_j=z\bigg], 在条件假设 (A4)-(A7) 下有

A_{n1}(\tau_0)=\dfrac{1}{\sqrt{n}}\sum\limits_{j=1}^{n}\dfrac{\mu_2(Z_j)\xi_j\big[\delta_j-m_0(Z_j;\theta_0)\big]I_{\{Y_j\leq \tau_0\}}}{m_0(Z_j;\theta_0)[1-m_0(Z_j;\theta_0)]}+o_p(1),

在缺失机制的假设下, 有

{E}\bigg\{\dfrac{\mu_2(Z)\xi\big[\delta-m_0(Z;\theta_0)\big]}{m_0(Z;\theta_0)[1-m_0(Z;\theta_0)]}\bigg\}=0.

由中心极限定理得

A_{n1}(\tau_0)\xrightarrow{\mathcal{L}}N( 0,\varOmega_1(\tau_0)),
(5.9)

其中 \varOmega_1(\tau_0)=E\Big[\dfrac{\mu_2(Y)\mu^{\rm T}_2(Y)\pi(Y)I_{\{Y\leq \tau_0\}}}{m_0(Z;\theta_0)[1-m_0(Z;\theta_0)]}\Big]. 根据引理 5.1, A_{n2}(\tau_0) 可写成

\begin{matrix} A_{n2}(\tau_0) &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{m_0(Z_i;\theta_0)}{1-{G}(Y_i)}\cdot\dfrac{\widehat{G}_n(Y_i)-{G}(Y_i)}{1-{G}(Y_i)}+o_p(1)\\ &=& \dfrac{1}{n\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{m_0(Z_i;\theta_0)}{1-{G}(Y_i)}\cdot\sum\limits_{j=1}^{n}\psi(Y_j,\delta_j,\xi_j;Y_i)+o_p(1)\\ &=&\dfrac{1}{n\sqrt{n}}\sum\limits_{i<j}h(X_i,Y_i,\delta_i,\xi_i,\tau_0;X_j,Y_j,\delta_j,\xi_j,\tau_0)\\ &:=&U_n(\tau_0)+o_p(1), \end{matrix}
(5.10)

其中 h(X_i,\!Y_i\!,\delta_i,\xi_i,\tau_0;X_j,\!Y_j\!,\delta_j,\xi_j,\tau_0)=\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{m_0(Z_i;\theta_0)}{1-{G}(Y_i)}\psi_j(Y_i)

\begin{matrix} +\phi(X_j)\big(Y_j-\phi^{\rm T}(X_j)\beta\big)I_{\{Y_j\leq \tau_0\}}\dfrac{m_0(Z_j;\theta_0)}{1-{G}(Y_j)}\psi(Y_i,\delta_i,\xi_i;Y_j):=h_{i,j}. \end{matrix}
(5.11)

h_\alpha(\cdot)=\alpha^{\rm T}h(\cdot), 那么 U_{n\alpha}(\tau_0)=\alpha^{\rm T}U_{n}(\tau_0). 由引理 5.1 易知

{E}\big[h_\alpha(X_1,Y_1,\delta_1,\xi_1,\tau_0;X_2,Y_2,\delta_2,\xi_2,\tau_0)\big]\!=\!0, 且 E\big[h_\alpha^2(X_1,Y_1,\delta_1,\xi_1,\tau_0;X_2,Y_2,\delta_2,\xi_2,\tau_0)\big]\!<\!\infty, \\ U_{n\alpha}(\tau_0)\xrightarrow{\mathcal{L}}N\big(0,\alpha^{\rm T}\varOmega_2(\tau_0)\alpha\big),
(5.12)
\varOmega_2(\tau_0)={E}\big[g(X_1,Y_1,\delta_1,\xi_1,\tau_0)g^{\rm T}(X_1,Y_1,\delta_1,\xi_1,\tau_0)\big],
(5.13)

其中 g(X_1,Y_1,\delta_1,\xi_1,\tau_0)={E}\bigg\{\dfrac{\phi(X_2)m_0(Z_2;\theta_0)\big(Y_2-\phi^{\rm T}(X_2)\beta\big)\psi_1(Y_2)}{1-G(Y_2)}\bigg\lvert X_1,Y_1,\delta_1,\xi_1\bigg\}.

联立 (5.10)-(5.13) 式, 有

A_{n2}(\tau_0)\xrightarrow{\mathcal{L}}N\big(0,\varOmega_2(\tau_0)).
(5.14)

同理可得

A_{n3}(\tau_0)\xrightarrow{\mathcal{L}}N\big(0,\varOmega_3(\tau_0)),
(5.15)

其中 \varOmega_3(\tau_0)={E}\bigg[\dfrac{m_0^2(Z;\theta_0)\phi(X)\phi^{\rm T}(X)\big(Y-\phi^{\rm T}(X)\beta\big)^2I_{\{Y\leq \tau_0\}}}{[1-G(Y)]^2}\bigg].

针对协方差, 在缺失机制的假设下, 有

\begin{eqnarray*} \mbox{Cov}\big(A_{ n1 }( \tau_0 ),A_{ n3 }( \tau_0 )\big)\\ &&= E\bigg[\dfrac{\phi( X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\mu_2(Z_i)\xi_i\big[\delta_i-m_0(Z_i;\theta_0)\big]}{m_0(Z_i;\theta_0)\big[1-m_0(Z_i;\theta_0)\big]}\cdot\dfrac{m_0(Z_i;\theta_0)}{1-G(Y_i)}\bigg]=0, \end{eqnarray*}
\begin{eqnarray*} \mbox{Cov}\big(A_{n1}(\tau_0),A_{n2}(\tau_0)\big)\\ &&=\dfrac{n-1}{n} E\bigg[\dfrac{\mu_2(Z_1)\xi_1\big[\delta_1-m_0(Z_1;\theta_0)]}{m_0(Z_1;\theta_0)\big[1-m_0(Z_1;\theta_0)\big]}\cdot h_{1,2}\bigg] \nonumber\\ &&=\Big(1-\dfrac{1}{n}\Big)E\Bigg\{\dfrac{\phi(X_2)\big(Y_2\!-\!\phi^{\rm T}(X_2)\beta\big)I_{\{\!Y_2\leq \tau_0\!\}}}{1-G(Y_2)}\\ &&\times E\bigg[\dfrac{\mu_2(Z_1)I_{\{Y_1\leq \tau_0\}}\xi_1\big[\delta_1-m_0(Z_1;\theta_0)]}{m_0(Z_1;\theta_0)\big[1-m_0(Z_1;\theta_0)\big]}\psi_1(Y_2)\bigg\lvert Y_2\bigg]\Bigg\}\nonumber\\ &&\to -E\bigg[\dfrac{m_0(Z_2;\theta_0)\big(Y_2-\phi^{\rm T}(X_2)\beta\big)\phi(X_2)\mu_2^{\rm T}(\tau_0)I(Y_1\leq Y_2)I_{\{Y_1\leq \tau_0\}}I_{\{Y_2\leq \tau_0\}}}{\big[1-G(Y_2)\big]\big[1-H(Y_1)\big]}\bigg]:=\varOmega_{1,2}(\tau_0), \end{eqnarray*}
\begin{eqnarray*} &&\mbox{Cov}\big(A_{n2}(\tau_0),A_{n3}(\tau_0)\big)\\ &&=E\bigg[\dfrac{1}{\sqrt n}\sum\limits_{i=1}^n\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{m_0(Z_i;\theta_0)}{1-G(Y_i)}\cdot \dfrac{1}{n\sqrt n}\sum\limits_{i<j}h_{i,j}\bigg]\nonumber\\ &&=\dfrac{n(n\!-\!1)}{n^2}E\bigg[\dfrac{\phi(\!X_1\!)\big(\!Y_1\!-\!\phi^{\rm T}(\!X_1\!)\beta\!\big)m_0(\!Z_1;\theta_0\!)}{1-G(Y_1)}\bigg]\\ &&~~~\times E\bigg[\dfrac{\phi(\!X_2\!)\big(Y_2\!-\!\phi^{\rm T}(X_2)\beta\big)I_{\{\!Y_2\leq \tau_0\!\}}m_0(\!Z_2;\theta_0\!)}{1-G(Y_2)}\psi_2(Y_1)\bigg\lvert Y_1\bigg]\nonumber\\ &&\to E\bigg[\dfrac{\phi(X_1)\big(Y_1-\phi^{\rm T}(X_1)\beta\big)m_0(Z_1;\theta_0)}{1-G(Y_1)}\dfrac{\phi^{\rm T}(X_2)\big(Y_2-\phi^{\rm T}(X_2)\beta\big)m_0(Z_2;\theta_0)}{1-G(Y_2)}I_{\{Y_1\leq Y_2\}} \nonumber\\ & &~~~\times \bigg(\int_0^{Y_1\land Y_2}\dfrac{d\tilde H_0(s)}{[1-H(s)]^2}+\dfrac{I(Y_2\leq Y_1,\delta_2=0)}{1-H(Y_1)}\bigg)\bigg]:=\varOmega_{2,3}(\tau_0), \end{eqnarray*}

上面式子联立 (5.8)-(5.15) 式得

A_{n}(\tau_0)\xrightarrow{\mathcal{L}}N\big( 0,\varOmega_R(\tau_0)\big),
(5.16)

其中 \varOmega_R(\tau_0)=\varOmega_1(\tau_0)+\varOmega_2(\tau_0)+\varOmega_3(\tau_0)+2\varOmega_{1,2}(\tau_0)+2\varOmega_{2,3}(\tau_0), \varOmega_{R}:=\varOmega_{R}(\tau_H). 在假设下有 A_{n}(\tau_0)-A_{n}(\tau_H)\xrightarrow{\mathcal{P}}0, \lim_{\tau_0\to\tau_H}\varOmega_{R}(\tau_0)=\varOmega_{R}, 由此我们得到定理 3.1 的结论.

定理 3.2 的证明 类似于 Wang 和 Dinse 在文献 [11,定理 2.2] 的证明, 这里省略.

定理 3.3 的证明\sqrt{n}(\widehat{\beta}_I-\beta)=\varSigma_{nI}^{-1}A_{nI}, 其中

\begin{matrix} \varSigma_{nI}(\tau_0) &=&\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\delta_i\xi_i+(1-\xi_i)m_0(Z_i,\widehat{\theta}_n)}{1-\widehat G_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ &=& \varSigma_{n}(\tau_0)+\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i\big(\delta_i- m_0(Z_i,{\theta}_0)\big)}{1-G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ && + \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i\big(m_0(Z_i,{\theta}_0)- m_0(Z_i,\widehat{\theta}_n)\big)}{1- G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}+o_p(1)\\ &=& \varSigma_{n}(\tau_0)+\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i\big(m_0(Z_i,{\theta}_0)- m_0(Z_i,\widehat{\theta}_n)\big)}{1- G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}+o_p(1), \end{matrix}

注意到

\begin{eqnarray*} &&\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i\big(m_0(Z_i,{\theta}_0)- m_0(Z_i,\widehat{\theta}_n)\big)}{1- G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\nonumber\\ &&=\dfrac{1}{n}\sum\limits_{j=1}^{n}\dfrac{\mu_1(\!Z_j\!)\xi_j\big[\delta_j- m_0(Z_j,{\theta}_0)\big]}{m_0(Z_j,{\theta}_0)\big[{\theta}_0)\big]}+o_p(1)\nonumber\\ &&=E\bigg[\dfrac{\mu_1(Z)\xi \big[\delta- m_0(Z,{\theta}_0)\big]}{m_0(\!Z,{\theta}_0\!)\big[{\theta}_0)\big]}\bigg]+o_p(1)=o_p(1). \end{eqnarray*}

因此,

\varSigma_{nI}^{-1}(\tau_0)=\varSigma_{n}^{-1}(\tau_0)+o_p(1)=\varSigma^{-1}(\tau_0)+o_p(1).
(5.17)
\begin{matrix} A_{nI}(\tau_0) &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{\delta_i\xi_i+(1-\xi_i)m_0(Z_i,\widehat{\theta}_n)}{1-\widehat G_n(Y_i)}\\ &=& A_{n}(\tau_0)+\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\bigg\{\dfrac{\xi_i\big[\delta_i- m_0(Z_i,\widehat{\theta}_n)\big]}{1-G(Y_i)}\\ && +\dfrac{\xi_i\big[\!\delta_i\!-\! m_0(Z_i\!,\!{\theta}_0)\!\big]}{1-G(Y_i)}\!\cdot\!\dfrac{\widehat G_n(\!Y_i\!)\!-\!G(\!Y_i\!)}{1\!-\!\widehat G_n(Y_i)}\!-\!\dfrac{\xi_i\big[\!m_0(Z_i\!,\!\widehat{\theta}_n)\!-\! m_0(Z_i\!,\!{\theta}_0)\!\big]}{1-G(Y_i)}\!\cdot\!\dfrac{\widehat G_n(\!Y_i\!)\!-\!G(\!Y_i\!)}{1\!-\!\widehat G_n(\!Y_i\!)}\bigg\}\\ &=& A_{n}(\!\tau_0\!)\!+\!\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(\!X_i\!)\big[\!Y_i\!-\!\phi^{\rm T}(X_i)\beta\!\big]I_{\{\!Y_i\!\leq\! \tau_0\!\}}\bigg\{\dfrac{\xi_i\big[\!\delta_i\!-\! m_0(Z_i\!,\!\widehat{\theta}_n)\!\big]}{1-G(Y_i)}\!+\!\dfrac{\xi_i\big[\!\delta_i\!- \! m_0(Z_i\!,\!{\theta}_0)\!\big]}{1-G(Y_i)}\\ && \cdot\dfrac{\widehat G_n(Y_i)-G(Y_i)}{1-G(Y_i)}-\dfrac{\xi_i\big(m_0(Z_i,\widehat{\theta}_n)- m_0(Z_i,{\theta}_0)\big)}{1-G(Y_i)}\cdot\dfrac{\widehat G_n(Y_i)-G(Y_i)}{1-\widehat G_n(Y_i)}\bigg\}+o_p(1)\\ &:=& A_{n}(\tau_0)+B_{n1}(\tau_0)+B_{n2}(\tau_0)+B_{n3}(\tau_0). \end{matrix}
(5.18)

A_{n1}(\tau_0) 类似, 易得

B_{n3}(\tau_0)=-\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\dfrac{\xi_iI_{\{Y_i\leq \tau_0\}}\mu_2(Z_i)\big(\delta_i- m_0(Z_i,{\theta}_0)\big)} {m_0(Z_i,\theta_0)\big[\theta_0)\big]}+o_p(1),

因此,

\begin{matrix} B_{n1}(\tau_0)+B_{n3}(\tau_0) &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\xi_iI_{\{Y_i\leq \tau_0\}}\big(\delta_i- m_0(Z_i,\widehat{\theta}_n)\big)\times \bigg[\dfrac{\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)}{1-G(Y_i)}\\ && -\dfrac{\mu_2(Z_i)}{m_0(Z_i,{\theta}_0)\big[{\theta}_0)\big]}\bigg]+o_p(1):=B_{n1,3}(\tau_0)+o_p(1). \end{matrix}

由中心极限定理得

B_{n1,3}(\tau_0)\xrightarrow{\mathcal{L}}N(0,\varOmega_{I1}(\tau_0)),
(5.19)
\varOmega_{I1}(\tau_0)=E\Big\{L(Z,\tau_0)L^{\rm T}(Z,\tau_0)I_{\{Y\leq \tau_0\}}\pi(Y)m_0(Z,{\theta})[{\theta})]\Big\},
(5.20)

其中 L(Z,\tau_0)=\dfrac{\phi(X)\big(Y-\phi^{\rm T}(X)\beta\big)}{1-G(Y)}-\dfrac{\mu_2(Z)}{m_0(Z,{\theta}_0)\big[{\theta}_0)\big]}. 注意到

\begin{matrix} B_{n2}(\tau_0) &=& \dfrac{1}{n\sqrt{n}}\sum\limits_{i=1}^{n}\sum\limits_{j=1}^{n}\phi(X_i)\big(Y_i\!-\!\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{\xi_i\big[\delta_i\!-\!m_0(Z_i,{\theta}_0)\big]\psi_j(Y_i)}{1-G(Y_i)}+o_p(1)\\ &=& \dfrac{1}{n\sqrt{n}}\sum\limits_{i\not=j}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{\xi_i\big[\delta_i-m_0(Z_i,{\theta}_0)\big]\psi_j(Y_i)}{1-G(Y_i)}+o_p(1). \end{matrix}

与 Wang 和 Dinse[11] 类似, 有

B_{n2}(\tau_0)=o_p(1),
(5.21)

\mbox{Cov}\big(A_{n1}(\tau_0),B_{n1,3}(\tau_0)\big)\!=\!0, \mbox{Cov}\big(A_{n2}(\tau_0),B_{n1,3}(\tau_0)\big)\!=\!0, \mbox{Cov}\big(A_{n3}(\tau_0),B_{n1,3}(\tau_0)\big)\!=\!0.

在假设条件下有 A_{nI}(\tau_0)-A_{nI}(\tau_H)\xrightarrow{\mathcal{P}}0, \lim_{\tau_0\to\tau_H}\varOmega_{I}(\tau_0)=\varOmega_{I}(\tau_H):=\varOmega_{I}, 得证.

定理 3.4 的证明\sqrt{n}(\widehat{\beta}_W-\beta)=\varSigma_{nW}^{-1}A_{nW}, 其中

\begin{matrix} \varSigma_{nW}(\tau_0) &=& \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\delta_i\xi_i/\pi_n(Y_i)+\big[1-\xi_i/\pi_n(Y_i)\big]m_0(Z_i,\widehat{\theta}_n)}{1-\widehat G_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ &=& \varSigma_{n}(\tau_0)+\dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i/\pi_n(Y_i)\big[\delta_i- m_0(Z_i,{\theta}_0)\big]}{1-G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ && + \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i/\pi_n(Y_i)\big(m_0(Z_i,{\theta}_0)- m_0(Z_i,\widehat{\theta}_n)\big)}{1- G(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}\\ && + \dfrac{1}{n}\sum\limits_{i=1}^{n}\dfrac{\xi_i/\pi_n(Y_i)\big[\delta_i- m_0(Z_i,{\theta}_0)\big]}{1-G(Y_i)}\\ &&\cdot\dfrac{\widehat G_n(Y_i)-G(Y_i)}{1-\widehat G_n(Y_i)}\phi(X_i)\phi^{\rm T}(X_i)I_{\{Y_i\leq \tau_0\}}+o_p(1). \end{matrix}

与定理 3.3 证明类似, 可以证明后两项为 o_p(1), 可以得出

{\varSigma}_{nW}(\tau_0)=\varSigma_{n}(\tau_0)+o_p(1)=\varSigma(\tau_0)+o_p(1).
\begin{matrix} A_{nW}(\tau_0) &=& \dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big[Y_i-\phi^{\rm T}(X_i)\beta\big]I_{\{Y_i\leq \tau_0\}}\dfrac{\delta_i\xi_i/\pi_n(Y_i)+\Big(1-\xi_i/\pi_n(Y_i)\Big)m_0(Z_i,\widehat{\theta}_n)}{1-\widehat G_n(Y_i)}\\ &=& A_{n}(\tau_0)+\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\dfrac{\xi_i/\pi_n(Y_i)\big[\delta_i- m_0(Z_i,\widehat{\theta}_n)\big]}{1-\widehat G_n(Y_i)}\\ &=& A_{n}(\tau_0)+\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\phi(X_i)\big(Y_i-\phi^{\rm T}(X_i)\beta\big)I_{\{Y_i\leq \tau_0\}}\bigg\{\dfrac{\xi_i/\pi_n(Y_i)\big(\delta_i- m_0(Z_i,{\theta}_0)\big)}{1-G(Y_i)}\\ && -\dfrac{\xi_i/\pi_n(Y_i)\big(m_0(Z_i,\widehat{\theta}_n)- m_0(Z_i,{\theta}_0)\big)}{1-G(Y_i)}\bigg\} +o_p(1)\\ &:=& A_{n}(\tau_0)+C_{n1}(\tau_0)+C_{n2}(\tau_0)+o_p(1), \end{matrix}
(5.22)

其中

\begin{equation} C_{n2}(\tau_0)=\dfrac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}\dfrac{\xi_i/\pi_n(Y_i)I_{\{Y_i\leq \tau_0\}}\mu_2(Z_i)\big(\delta_i- m_0(Z_i,{\theta}_0)\big)}{m_0(Z_i,{\theta}_0)[{\theta}_0)]}+o_p(1). \end{equation}

由中心极限定理得 C_{n1}(\tau_0)+C_{n2}(\tau_0)\xrightarrow{\mathcal{L}}N\big(0,\varOmega_{W1}(\tau_0)\big), 其中

\begin{equation} \varOmega_{W1}(\tau_0)=E\Big\{\dfrac{m_0(Z,{\theta}_0)[{\theta}_0)]I_{\{Y\leq \tau_0\}}}{\pi(Y)}\widetilde {L}(Z,\tau_0)\widetilde {L}^{\rm T}(Z,\tau_0)\Big\}, \end{equation}
\begin{equation} \widetilde {L}(Z,\tau_0)=\dfrac{\phi(X)\big(Y-\phi^{\rm T}(X)\beta\big)}{1-G(Y)}-\dfrac{\pi(Y)\mu_2(Z)}{m_0(Z,{\theta}_0)[{\theta}_0)]}. \end{equation}

易得 Cov (A_{n}(\tau_0),C_{n1}(\tau_0)+C_{n2}(\tau_0))=0, 因此, 在假设条件下有 A_{nW}(\tau_0)-A_{nW}(\tau_H)\xrightarrow{\mathcal{P}}0, \lim_{\tau_0\to\tau_H}\varOmega_{W}(\tau_0)=\varOmega_{W}(\tau_H):=\varOmega_{W}, 得证.

参考文献

Miller R G.

Least squares regression with censored data

Biometrika, 1976, 63(3): 449-464

[本文引用: 1]

Buckley J, James I.

Linear regression with censored data

Biometrika, 1979, 66(3): 429-436

[本文引用: 1]

Koul H, Susarla V, Ryzin J V.

Regression analysis with randomly right-censored data

Ann Statist, 1981, 9(6): 1276-1288

[本文引用: 1]

Stute W.

Consistent estimation under random censorship when covariables are present

J Multivar Anal, 1993, 45: 89-103

[本文引用: 2]

Li X, Wang Q.

The weighted least square based estimators with censoring indicators missing at random

J Statist Plann Inference, 2012, 142: 2913-2925

[本文引用: 9]

Wang J, Jiang W, Xu F, Fu W.

Weighted composite quantile regression with censoring indicators missing at random

Comm Statist Theory Meth, 2021, 50(12): 2900-2917

[本文引用: 2]

Guo X, Xu W.

Goodness-of-fit tests for general linear models with covariates missed at random

J Statist Plann Inference, 2012, 142(7): 2047-2058

[本文引用: 1]

Horvitz D G, Thompson D J.

A generalization of sampling without replacement from a finite universe

J Amer Statist Assoc, 1952, 47(260): 663-685

[本文引用: 1]

Wang H, Wang L.

Locally weighted censored quantile regression

J Amer Statist Assoc, 2009, 104(487): 1117-1128

Wang Q, Dinse G E.

Linear regression analysis of survival data with missing censoring indicators

Lifetime Data Anal, 2011, 17(2): 256-279

DOI:10.1007/s10985-010-9175-8      PMID:20559722      [本文引用: 2]

Linear regression analysis has been studied extensively in a random censorship setting, but typically all of the censoring indicators are assumed to be observed. In this paper, we develop synthetic data methods for estimating regression parameters in a linear model when some censoring indicators are missing. We define estimators based on regression calibration, imputation, and inverse probability weighting techniques, and we prove all three estimators are asymptotically normal. The finite-sample performance of each estimator is evaluated via simulation. We illustrate our methods by assessing the effects of sex and age on the time to non-ambulatory progression for patients in a brain cancer clinical trial.

/