数学物理学报  2015, Vol. 35 Issue (2): 345-358   PDF (467 KB)    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
陈盼盼
冯三营
薛留根
缺失数据下半参数变系数部分线性模型的统计推断
陈盼盼1,2, 冯三营1, 薛留根1     
1. 北京工业大学应用数理学院 北京 100124;
2. 广西科技信息网络中心 南宁 530022
摘要:该文研究协变量随机缺失下半参数变系数部分线性模型的统计推断. 利用逆概率加权最小二乘方法给出了模型中参数分量和非参数分量的估计, 并证明了它们的渐近正态性. 另外该文又提出了一个逆概率加权经验对数似然比统计量, 并证明该统计量服从标准χ2分布, 从而构造了模型中参数分量的经验似然置信域. 最后通过模拟研究和实例分析说明该文提出的方法具有较好的有限样本性质.
关键词半参数变系数部分线性模型     缺失数据     逆概率加权     渐近正态性     经验似然    
Statistical Inference for Semiparametric Varying Coefficient Partially Linear Model with Missing Data
Chen Panpan1,2, Feng Sanying1, Xue Liugen1     
1. College of Applied Sciences, Beijing University of Technology, Beijing 100124;
2. Guangxi Science & Technology Information Network Center, Nanning 530022
Abstract: In this paper, we consider the statistical inference for semiparametric varying coefficient partially linear model with covariates missing at random. The profile least-squares estimators for the unknown parametric and coefficient functions are obtained by inverse probability weighted least-squares method. The asymptotic normality of the proposed estimators are proved under some appropriate conditions. In addition, we constructed an empirical log-likelihood ratio statistic for the unknown parametric components, and it is shown that the proposed statistic has the asymptotic chi-square distribution, and hence it can be used to construct the confidence regions of the parameter. Simulation studies and a real data analysis are conducted to examine the finite sample performance of the proposed procedure.
Key words: Semiparametric varying coefficient partially linear model     Missing data     Inverse probability weighted     Asymptotic normality     Empirical likelihood    
1 引言

本文考虑半参数变系数部分线性模型,其一般形式为 $$Y= X^{T}\alpha(U) + Z^{T}\beta +\varepsilon,(1.1)$$ 其中 $ \alpha(\cdot)=(\alpha_{1}(\cdot),\cdots,\alpha_{p}(\cdot))^{T}$ 为 $p\times1$ 未知系数函数向量, $\beta=(\beta_{1},\cdots,\beta_{q})^{T}$ 是 $q\times1$ 维的未知参数向量, $X$,$Z$ 以及 $U$ 为协变量,$Y$ 为响应变量, $\varepsilon$ 为模型误差且满足 $E(\varepsilon|X,Z,U)=0$, Var$(\varepsilon|X,Z,U)=\sigma^{2}$. 为了避免``维数灾祸", 一般假设 $U$ 是单变量. 在模型 (1.1) 中,当 $ \alpha(\cdot)\equiv \alpha$ 为某个未知参数向量时, 该模型即为线性模型; 当 $p=1$ 且 $X=1$ 时, 该模型即为部分线性模型; 当 $ Z=0$ 时,该模型即为常见的变系数模型.

关于模型 (1.1) 的统计推断, 在独立数据和纵向数据下已有许多学者对其进行了研究. Fan 和Huang[1] 提出了profile 最小二乘估计并且基于广义似然比检验方法研究了该模型的检验问题, 最后基于模型(1.1) 分析了波士顿住房数据. You和Zhou[2] 基于经验似然方法研究了模型(1.1)的估计问题, 构造了模型中参数的经验似然置信域.Ahmad等[3]考虑模型 (1.1)在误差是条件同方差时情形, 利用级数方法给出了参数的 有效估计, 并将级数方法推广到误差是条件异方差时,研究了参数的估计. Huang和Zhang[4] 则利用经验似然方法研究了模型 (1.1) 中非参数分量 $\alpha(\cdot)$ 的统计推断问题.

对不完全数据的研究是目前统计界的热点问题. 对于缺失数据, 如果仅用可以完全观测到的数据进行统计推断, 得到的估计量往往会产生偏差,而且一般不是渐近有效的. 为了修正缺失数据带来的偏差,常用的方法有参数似然方法[5,6], 借补方法[7,8]以及逆概率加权方法[9,10], 关于这三种方法特点的比较, 可参见Qin等[11]. 对响应变量缺失的情形, Wang等[12]研究了响应变量缺失下半参数回归模型的统计推断. Wang和Rao[8] 考虑了响应变量缺失下线性模型的经验似然推断, 利用线性回归借补方法填充所有的缺失值,从而做进一步的推断. Xue[13]在响应变量缺失下运用经验似然方法构造了线性模型 中参数的经验似然置信域. 赵培信[14] 研究了响应变量缺失下变系数部分线性模型的 经验似然估计. 对协变量缺失的情形,Liang等[15]研究了协变量随机缺 失时部分线性模型的估计问题, 给出了估计量的渐近性质和估计效率. Wang[16] 利用模型纠正方法和一种新的加权方法 给出了部分线性模型中参数和非参数分量的估计, 并证明了它们的渐近性质. 本文基于逆概率加权方法,考虑协变量缺失下变系数部分线性模型的统计推断.

2 估计方法与主要结果

假设 $\{(Y_i,X_i,Z_i,U_i),i=1,\cdots,n\}$ 是来自模型 (1.1) 的独立同分布观测样本,即 $$ Y_{i}=X^{T}_{i}\alpha(U_{i})+ Z^{T}_{i} \beta+\varepsilon_{i},~~~~~~~i=1,2,\cdots,n,(2.1)$$ 其中 $(Y_{i},U_{i},X_{i})$ 可以完全观测,协变量 $ Z_{i}$ 随机缺失, 当 $\delta_{i}=1$ 时 $Z_{i}$ 可观测; 即当 $\delta_{i}=0$ 时 $Z_{i}$ 缺失. 进一步假定 $Z_{i}$ 为随机缺失 (见文献 [17]),即 $$ P(\delta_{i}=1| Y_{i},U_{i},X_{i},Z_{i})=P(\delta_{i}=1| Y_{i},U_{i},X_{i})=\pi( Y_{i},U_{i},X_{i}).(2.2)$$ (2.2) 式暗含在给定 $Y_{i}$,$X_{i}$ 和 $U_{i}$ 的条件下, $\delta_{i}$ 和 $Z_{i}$ 是独立的. 该假定是统计分析中常用的假定且在实际应用中是合理的.

\par 在实际应用中,$\pi(Y_{i},U_{i},X_{i})$往往是未知的, 它是一个需要估计的讨厌参数. 本文考虑使用logistic回归模型作为缺失机制,即 $$ \pi(Y_{i},U_{i},X_{i},\theta)=\frac{\exp(\theta_{0}+\theta_{1}Y_{i}+\theta_{2}U_{i}+\theta_{3}^{T}X_{i})} {1+\exp(\theta_{0}+\theta_{1}Y_{i}+\theta_{2}U_{i}+\theta_{3}^{T}X_{i})},$$ 其中 $\theta=(\theta_{0},\theta_{1},\theta_{2},\theta_{3}^{T})^{T}$ 是未知的参数向量. 由文献 [18] 知 $\theta$ 的拟似然估计为 $\hat{\theta}$. 记 $V_{i}=(Y_{i},U_{i},X^{T}_{i})^{T},$ 则 $\pi(V_i,\theta)$ 的估计为 $\pi(V_i,\hat{\theta})$. \par 若 $\beta$ 已知,则模型 (2.1) 可以转变为下面的形式 $$ Y_{i}-Z^{T}_{i} \beta= X^{T}_{i} \alpha( U_{i})+\varepsilon_{i},~~~~~~~i=1,2,\cdots,n.{(2.3)}$$ 显然在 $\beta$ 已知的的条件下,模型 (2.3) 就是一般的变系数模型. 下面采用局部逆概率 加权最小二乘方法来估计系数函数 $\alpha(\cdot)$. 在任意给定 $u_{0}$ 的某个小邻域内,对 $\alpha_{j}(u)$ 作~Taylor 展开 $$\alpha_{j}(u)\approx\alpha_{j}(u_{0})+\alpha_{j}^\prime(u_{0}) (u-u_{0})\equiv a_{j}+b_{j}(u-u_{0}),~~~j=1,\cdots,p.$$ 记 $a=(a_{1},\cdots,a_{p})^{T},b=(b_{1},\cdots,b_{p})^{T}$. 对任意给定的 $\beta$,极小化下式 $$ \sum_{i=1}^n\Big\{Y_{i}- Z_{i}^{T}\beta-X_{i}^{T}[a+b(U_{i}-u)]\Big\}^2\frac{\delta_{i}}{\pi(V_{i},\hat{\theta})}K_{h}(U_{i}-u),{(2.4)} $$ 可得 $a$ 和 $b$ 的估计,其中 $K_{h}(\cdot)=K(\cdot/h)/h$, $K(\cdot)$ 是核函数,$h$ 是带宽. 为表示方便,引入以下记号 ${\bf Y}=(Y_{1},\cdots,Y_{n})^{T},{\bf X}=(X_{1},\cdots,X_{n})^{T},{\bf Z}=(Z_{1},\cdots,Z_{n})^{T},W_{u}={\rm\\ diag}(K_{h}(U_{1}-u),\cdots,K_{h}(U_{n}-u)),\hat{\Delta}={\rm diag}(\delta_{1}/\hat{\pi}_{1},\cdots,\delta_{n}/\hat{\pi}_{n}),$ $\hat{\pi}_i=\pi(V_i,\hat{\theta}),i=1,\cdots,n.$ 且 $$ D_{u}=\left( \begin{array}{cc} X_{1}^{T} ~~& \frac{U_{1}-u}{h}X_{1}^{T} \\ \vdots ~~& \vdots \\ X_{n}^{T} ~~& \frac{U_{n}-u}{h}X_{n}^{T} \\ \end{array} \right),\quad M=\left( \begin{array}{cc} X_{1}^{T}\alpha(U_1) \\ \vdots \\ X_{n}^{T}\alpha(U_n) \\ \end{array} \right). $$ 记 $\hat{a}$,$\hat{b}$ 是最小化 (2.4) 式的解,则可得 \begin{eqnarray*} [\hat{a},h\hat{b}]^{T}=({D_{u}^{T}}{W_{u}}\hat{\Delta}{D_{u}})^{-1}{D_{u}^{T}}{W_{u}}\hat{\Delta}{({\bf Y}-{\bf Z}\beta)}. \end{eqnarray*} 从而可得 $\alpha(u)$ 的估计为 $$ \tilde{\alpha}(u,\beta)=[I_{p}~~0_{p}]( D_{u}^{T}W_{u}\hat{\Delta} D_{u})^{-1}D_{u}^{T}W_{u}\hat{\Delta}({\bf Y}-{\bf Z}\beta).(2.5)$$ 故 $M$ 的估计可以定义为 $\hat{M}=\hat{S}({\bf Y}-{\bf Z}\beta)$,其中 $$ \hat{S}=\left(\begin{array}{cccc} ( X_{1}^{T}& 0)\{ D_{u_1}^{T} W_{u_{1}}\hat{\Delta} D_{u_{1}}\}^{-1} D_{u_{1}}^{T} W_{u_{1} }\hat{\Delta}\\ ( X_{2}^{T}& 0)\{ D_{u_2}^{T} W_{u_{2}}\hat{\Delta} D_{u_{2}}\}^{-1} D_{u_{2}}^{T}W_{u_{2} }\hat{\Delta}\\ &\vdots \\ ( X_{n}^{T}& 0)\{D_{u_n}^{T} W_{u_{n}}\hat{\Delta} D_{u_{n}}\}^{-1}D_{u_{n}}^{T} W_{u_{n}}\hat{\Delta} \end{array} \right) $$ \par 下面利用逆概率加权估计方程的思想,给出 $\beta$ 的估计. 构造如下估计方程 $$ \frac{1}{n}\sum_{i=1}^n\frac{\delta_{i}}{\pi(V_{i},\hat{\theta})}\tilde{ Z_{i}}\{{\tilde Y_{i}}-{\tilde{ Z_{i}}^{T}\beta}\} =0,(2.6)$$ 其中 $\tilde{\bf Z}=(\tilde{ Z}_{1},\cdots,\tilde{ Z}_{n})^{T}=(I-\hat{S}) {\bf Z}$ ,$\tilde{ {\bf Y}}=(\tilde Y_{1},\cdots,\tilde Y_{n})^{T}=(I-\hat{S}) {\bf Y}$. 则由 (2.6) 式得 $$ \hat{\beta}=\Big\{{\bf Z}^{T}(I-\hat{S})^{T}\hat{\Delta}(I-\hat{S}){\bf Z} \Big\}^{-1}{\bf Z}^{T}(I-\hat{S})^{T} \hat{\Delta}(I-\hat{S}){\bf Y}.(2.7)$$ 将 $\hat{\beta}$ 代入 (2.5) 式可得 $\alpha(u)$ 的最终估计 $$ \hat{\alpha}(u)=[I_{p}~~0_{p}]\{D_{u}^{T}W_{u}\hat{\Delta} D_{u}\}^{-1}D_{u}^{T}W_{u} \hat{\Delta}({\bf Y}-{\bf Z}\hat{\beta}).(2.8)$$

为了得到本文的结果,先给出一些正则条件.

C1: $U$ 有有界支撑 ${\cal U}$, 它的密度函数 $f(\cdot)$ 是二次连续可微的,且 $f(\cdot)>0$.

C2: 矩阵 $\Gamma(U)=E({\bf X}{\bf X}^{T}|U)$ 和 $E({\bf Z}{\bf Z}^{T}\mid U)$ 为正定矩阵. $\Gamma(U)$,$\Gamma^{-1}(U)$ 和 $\Phi(U)=E({\bf X}{\bf Z}^{T}|U)$ 均为Lipschitz 连续的.

C3: 存在某个 $s>2.5$,使得 $E\|{\bf X}\|^{2s}<\infty$ 且 $E\|{\bf Z}\|^{2s}<\infty$, 且存在某个 $\epsilon<2-s^{-1}$, 使得 $n^{2\epsilon-1}h\rightarrow\infty$.

C4: $\{\alpha_{j}(u),j=1,\cdots,p\}$ 关于 $u$ 有连续的二阶导数.

C5: 核函数 $K(\cdot)$ 是对称概率密度函数, 满足二阶核条件,且有 $\int u^{4}K(u){\rm d}u<\infty.$

C6: 带宽 $h=Cn^{-1/5}$,其中 $C>0$ 为某给定常数.

定理 1在条件C1--C6 成立下, 若 $\beta$ 是真实参数,则 $$\sqrt{n}(\hat{\beta}-\beta)\stackrel{{\cal L}}\longrightarrow N(0,\Sigma_1),$$ 其中 $"\stackrel{{\cal L}}\longrightarrow"$ 表示依分布收敛,且 $\Sigma_1=\Omega_{u}^{-1}\Lambda\Omega^{-1}_{u},$ $\Omega_{u}=E({\bf Z}{\bf Z}^{T})-E(\Phi^{T}(U)\Gamma^{-1}(U)\Phi(U)),$ $\Lambda=\sigma^{2}\Big\{E[\pi^{-1}(V){\bf Z}{\bf Z}^{T}]-E[\pi^{-1}(V)\Phi^{T}(U)\Gamma^{-1}(U)\Phi(U)]\Big\}.$

注 1定理 1 表明利用逆概率加权思想得到的~profile 最小二乘估计 $\hat{\beta}$ 具有渐近正态性. 特别地, 当 $Z$ 可以被精确观测时,$\pi(V)=I$, 从而 $\hat{\beta}$ 与Fan 和 Huang[1] 提出的估计量具有相同的渐近方差.

定理2在条件C1--C6 成立下, 当 $n\rightarrow\infty$ 时,有 $$\sqrt{nh}(\hat{\alpha}(u)-\alpha(u)-\frac{1}{2}h^{2} \mu_{2}\alpha''(u))\stackrel{{\cal L}}\longrightarrow N(0,\Sigma_2),$$ 其中 $\Sigma_2=\sigma^{2}\vartheta_{0}f^{-1}(u) \Gamma^{-1}(U)E(\pi^{-1}(V){\bf X}{\bf X}^{T}|U)\Gamma^{-1}(U)$, $\vartheta_{0}=\int K^{2}(u){\rm d}u,$ $\mu_2=\int u^{2}K(u){\rm d}u.$

虽然由定理 1 可以构造参数 $\beta$ 的置信域, 但首先需要估计渐近方差,这是比较复杂的. 因此下面考虑经验似然方法 来构造 $\beta$ 的置信域. 记 $$\hat{R}(u)=[I_p~~0_p]\{D^{T}_{u}\omega_{u}\hat{\Delta} D_{u}\}^{-1}D^{T}_{u} \omega_{u}\hat{\Delta}=(\hat{R}_1(u),\cdots,\hat{R}_n(u)), $$ 为构造 $\beta$ 的经验似然比函数,首先引入一个估计的辅助随机变量 $$ \hat{\eta}_i(\beta)=\frac{\delta_i}{\pi(V_i,\hat{\theta})}\hat{Z_i}\{\hat{Y_i}-\hat{Z_i}^{T}\beta\},(2.9)$$ 其中 $\hat{Y_i}=Y_i-X_i^{T}\hat{g}(U_i)$, $\hat{Z_i}=Z_i-\hat{\varphi}(U_i)^{T}X_i$, $\hat{g}(u)= \sum\limits_{i=1}^{n}\hat{R}_k(u) Y_k$, $\hat{\varphi}(u)= \sum\limits_{i=1}^{n}\hat{R}_k(u) Z^{T}_k$. 由 (2.9) 式可知 $E\{\hat{\eta}_i(\beta)\}=o_p(1)$, 因此关于 $\beta$ 的估计经验对数似然比函数可定义为 $$ \hat{L}(\beta) =-2\max \bigg\{\sum_{i=1}^{n}{\rm log}(np_i)|p_i\geq0,\sum_{i=1}^{n}p_i=1,\sum_{i=1}^{n}p_i\hat{\eta}_i(\beta)=0\bigg\}, (2.10)$$ 由 Lagrange 乘子法,$\hat{L}(\beta)$ 可以表示为 $$ \hat{L}(\beta)=2\sum_{i=1}^{n}{\rm log} (1+\lambda^{T}\hat{\eta}_i(\beta)),(2.11)$$ 其中 $\lambda$ 为Lagrange乘子,满足 $ \frac{1}{n} \sum\limits_{i=1}^{n} \frac{\hat{\eta}_i(\beta)}{1+\lambda^{T}\hat{\eta}_i(\beta)}=0.$ 极小化 $ \hat{L}(\beta)$ 可得 $\beta$ 的估计 $\tilde{\beta}$, 称为最大经验似然估计 (MELE). 由MELE $\tilde{\beta}$ 及 (2.5) 式也可以得到系数函数 $\alpha(u)$ 的估计.

定理 3在条件C1--C6 下, 如果 $\beta$ 为参数真值,那么有 $$ \hat{L}(\beta)\stackrel{{\cal L}}\longrightarrow\chi_q^{2}.$$ 其中"$\stackrel{{\cal L}}\longrightarrow$" 表示依分布收敛, $\chi_q^{2}$ 为自由度为 $q$ 的卡方分布.

以 $\chi_q^{2}(1-\alpha)$ 记 $\chi_q^{2}$ 的 $1-\alpha$ 分位数, 其中 $0<\alpha<1$. 基于定理 3,可以构造 $\beta$ 的置信域 \begin{eqnarray*} C_\alpha(\beta)=\{\beta:\hat{L}(\beta)\leq\chi_q^{2}(1-\alpha)\}. \end{eqnarray*}

3 模拟研究

本节通过数据模拟研究所提方法在有限样本下的表现.考虑如下半参数变系数部分线性模型 $$ Y=\sin(2\pi U)X+2Z_{1}+1.5Z_{2}+1.5Z_{3}+\varepsilon,(3.1)$$ 其中 $\beta=(2,1.5,1.5)^{\tau}$,$U$ 服从 (0,1) 上的均匀分布,$X\sim N(1,1)$,$Z_{1}\sim N(1,1)$, $Z_{2}\sim N(2,1)$,$Z_{3}\sim N(0,1)$,误差 $\varepsilon\sim N(0,0.5^2)$. 在整个模拟研究中,我们选用~Epanechnikov 核函数, 即 $K(u)=0.75(1-u^{2})_+$,并采用交叉核实法来选取最优带宽 $h_{CV}$, 使其满足下式达到最小 $$ CV(h)=\frac{1}{n}\sum\limits^{n}_{i=1}\frac{\delta_i}{\pi_i} \Big\{Y_i-X^{T}_i\hat{\alpha}_{[i]}(U_i)-Z^{T}_i\hat{\beta}_{[i]}\Big\}^{2},$$ 其中 $\hat{\alpha}_{[i]}(U_i)$ 和 $\hat{\beta}_{[i]}$ 分别为去掉第 $i$ 个观测值后的 $\alpha(u)$ 和 $\beta$ 的估计. 考虑如下三种缺失概率

(1)~ $\pi_1(y,u,x)=P(\delta=1\mid Y=y,X=x,U=u)=\{1+0.02\exp(y-x-u-3.5)\}^{-1};$

(2)~ $\pi_2(y,u,x)=P(\delta=1\mid Y=y,X=x,U=u)=\{1+0.08\exp(y-x-u-3)\}^{-1};$

(3)~ $\pi_3(y,u,x)=P(\delta=1\mid Y=y,X=x,U=u)=\{1.25+\exp(y-x-u-6)\}^{-1}.$

以上三种情况对应的数据 $Z$ 的平均缺失概率分别为0.10,0.25 和0.40. 对于参数分量,本节模拟研究比较了两种方法: 本文提出的逆概率加权方法 (ANA) 和 忽略掉缺失值的估计方法 (NNA). 在模拟过程中,样本容量分别取 $n=50,100,150$ 和~200,重复模拟 1000 次. 在三种不同的缺失水平下,给出了两种估计量的偏差、标准差和均方误差. 模拟结果见表 1表 2. 另外,在样本量 $n=200$ 和协变量 $Z$ 的平均缺失概率为0.25 下, 我们在图 1 中给出了系数函数 $\alpha(\cdot)$ 的估计曲线.

表 1表 2 中可以得到以下结论: (1) 对给定的缺失概率, 随着样本量的增加,两种估计方法给出的估计量的偏差和均方误差都在减小; (2) 对给定样本,随着缺失比例的增加, 两种估计方法给出的估计量的标准差和均方误差均增加; (3) 对给定缺失概率和样本量的情况下, 基于~ANA 方法所得 $\beta$ 估计的绝对偏差,标准差和均方误差均小于~NNA 方法, 这说明本文所提估计方法是有效的, 原因在于本文的方法考虑了缺失值的信息.

表 1 基于ANA 得到的参数 $\beta$ 估计的偏差 (Bias)、标准差 (SD) 和均方误差 (MSE)

表 2 基于NNA 得到的参数 $\beta$ 估计的偏差 (Bias)、标准差 (SD) 和均方误差 (MSE)

另外,对比图 1 中估计曲线和真实曲线,可以看出本文所提方法是理想的.

图 1 系数函数的估计曲线(虚线)和真实曲线(实线)

图 2 AIDS 数据研究.$\!\!(\beta_1,\beta_2)$ 的95\% 置信域

下面利用经验似然方法考虑模型 (3.1) 中参数 $\beta$ 的置信域精度. 在三种不同的缺失水平下,利用本文提出的经验似然 (IEI) 和正态 逼近 (INA) 两种方法比较了 $\beta$ 的95\% 置信区间的平均长度以及对应的覆盖概率. 在模拟过程中,样本容量分别取 $n=100,150$ 和200. 模拟结果在表 3 中给出.

表 3 不同缺失水平和样本容量下 $\beta$ 的置信区间长度和覆盖概率, 括号里为覆盖概率

表 3 中可以看出: (1) IEL 明显优于INA. IEL 比INA 给出了更短的置信区间和更大的覆盖概率, 在缺失概率较小和样本量较大情况下,IEL 给出的覆盖概率接近95\%; (2) 对于给定的缺失概率,随着样本量的增加, 经验似然和正态逼近方法得到的置信区间长度均缩短. 相反,对固定的样本量, 随着缺失概率的增加,经验似然和正态逼近给出的置信区间长度均增加. 因此, 缺失概率的大小会影响 置信域的精度.

4 实例分析

下面我们应用本文提出的方法分析来自某AIDS 病研究中心的一组数据. 数据 集包括从 1984 年到 1991 年期间感染 HIV 病毒的283 个同性恋者的 HIV 状况. 该数据曾被许多学者利用变系数模型来进行研究 (例如,Huang 等[19], Xue 和Zhu[20]等). 该数据集的目标是研究患者的 CD4 浓度随时间的变化趋势, 以及患者的抽烟状态,HIV 感染前的 CD4 浓度, 和 HIV 感染时患者的年龄对 HIV 感染后的患者的 CD4 浓度的影响. Huang 等[19] 研究表明,在显著水平为0.05 的情况下, HIV 感染前 CD4 浓度对 HIV 感染后 CD4 浓度的影响为常数效应,不随时间变化, 并且患者感染 HIV 时的年龄以及患者的 抽烟状态对 HIV 感染后 CD4 的浓度均没有显著影响. 该数据是纵向数据, 在此我们不考虑其相关结构. 因此,可以建立如下模型 $$Y(t)=\alpha_0(t)+\alpha_1(t)X+\beta_1 Z_1+\beta_2 Z_2+\varepsilon(t), $$ 其中 $Z_1$ 为 HIV 感染前标准化的 CD4 浓度, $Z_2$ 为患者的抽烟状态 (1 = 抽烟,0 = 不抽烟), $Y(t)$ 为时刻 $t$ 患者的 CD4 浓度,$X$ 为 HIV 感染时患者的年龄, $\alpha_0(t)$ 为 CD4 浓度基准函数,表示 HIV 感染 $t$ 年后, 患者的平均 CD4 浓度.

为了应用该数据说明本文的方法,假定20\% 的 $Z_1$ 和 $Z_2$ 值缺失, 模拟中 $\delta$ 的产生是随机的,核函数取为 $K(t)=0.75(1-t^2)_{+}$,并通过交叉核实方法选择带宽 $h_{CV}=0.405$. 利用本文提出的EL 方法所得的参数分量 $(\beta_1,\beta_2)$ 的95\% 置信域见图 2.

图 2 中可以看出 $\beta_2$ 的 $95\%$ 置信区间覆盖零点, 且其中 $``\circ"$ 表示 $\beta$ 的MELE,$\tilde{\beta}=(2.993,0.109)$. 以上说明患者的抽烟状态 ($Z_2$) 对 HIV 感染后的患者的 CD4 浓度没有显著影响,这与 Huang 等 [19] 研究所得的结果基本一致.

5 定理的证明

记 $c_{n}=h^{2}+\{\frac{\log(1/h)}{nh}\}^{1/2}$,$\mu_{k}=\int u^{k}K(u){\rm d}u$,$\vartheta_{k}=\int u^{k}K^{2}(u){\rm d}u,~k=0,1,2,4.$ $\tau_{i}=(1,Y_{i},U_{i},X^{T}_{i})^{T},$ $\lambda_{\min}$ 表示 $\sum\limits^{n}_{i=1}\tau_{i}\tau^{T}_{i}$ 的最小特征根.

引理 1 假设 $(X_{1},Y_{1}),\cdots,(X_{n},Y_{n})$ 是 $n$ 个独立同分布的随机向量, 其中 $Y_{i}$ 是一维随机变量. 若进 一步假设 $E|Y_1|^s<\infty$ 且 $\sup_{x}\int|y|^s f(x,y){\rm d}y<\infty$, 其中 $f(\cdot,\cdot)$ 表示 $(X,Y)$ 的联合概率密度函数. 令 $K(\cdot)$ 表示满足Lipschitz 条件 且有有界支撑的有界正函数. 那么给定某个 $\varepsilon<1-s^{-1},$ 使得 $n^{2\varepsilon-1}h\rightarrow\infty$ 时,则有 $$ \sup_{x}\bigg|\frac{1}{n}\sum_{i=1}^{n}\Big\{K_{h} (X_{i}-x)Y_{i}-E\big[K_{h}(X_{i}-x)Y_{i}\big]\Big\}\bigg| =O_{p}\Big(\Big\{\frac{\log(1/h)}{nh}\Big\}^{1/2}\Big).(5.1)$$

由Mack 和Silverman[21] 可以得到本引理的证明.

引理2在条件 $\sup\limits_{i\geq 1}\|\tau_{i}\|<\infty$ 且 $\lambda_{\min}\rightarrow\infty$ 下, $\theta$ 的拟似然估计 $\hat{\theta}=(\hat{\theta}_{0},\hat{\theta}_{1},\hat{\theta}_{2},\hat{\theta}_{3}^{T})^{T},$ 满足 $$ \sqrt{n}(\hat{\theta}-\theta)=A^{-1}n^{-1/2}\sum_{i=1}^{n}\tau_{i}(\delta_{i}-\pi_{i})+o_{p}(1),(5.2)$$ 其中 $A=E(\tau_{1}\tau^{T}_{1}\pi_{1}(1-\pi_{1})).$

本引理的证明可参见文献 [18].

引理 3假设条件C1--C6 成立, 则在 $U\in{\cal U}$ 上,当 $n\rightarrow\infty$ 时,有 $$ D^{T}_{u}W_{u}\Delta D_{u}=nf(U)\Gamma(U)\otimes\left( \begin{array}{cc} 1 ~~& 0 \\ 0 ~~& \mu_2 \end{array} \right)\{1+O_p(c_n)\},(5.3)$$ $$ D^{T}_{u}W_{u}\Delta {\bf Z}=nf(U)\Phi(U)\otimes(1,0)^{T}\{1+O_p(c_{n})\},(5.4)$$ $$ D^{T}_{u}W_{u}\Delta M=nf(U)\Gamma(U)\otimes(1,0)^{T}\alpha(U)\{1+O_p(c_{n})\},(5.5)$$ $$ D^{T}_{u}W_{u}\Delta\left(\begin{array}{c} X^{T}_{1}\Big(\frac{U_{1}-u}{h}\Big)^{2}\\\cdots \\ X^{T}_{n}\Big(\frac{U_{n}-u}{h}\Big)^{2}\\ \end{array}\right)=n\mu_{2}f(U)\Gamma(U)\otimes (1,0)^{T}\{1+O_p(c_n)\}.(5.6)$$ 由于 (5.3)--(5.6)式的证明过程类似. 这里我们仅给出 (5.3) 式的证明. 经过一系列简单代数运算,可以得到 $$D^{T}_{u}W_{u}\Delta D_{u}= \left (\begin{array}{cc}laystyle\sum_{i=1}^{n}laystyle\frac{\delta_{i}}{\pi_{i}} X_{i}X^{T}_{i}K_{h}(U_{i}-u)~~ & laystyle\sum_{i=1}^{n}laystyle\frac{\delta_{i}}{\pi_{i}} X_{i}X^{T}_{i}\Big(\frac{U_{i}-u}{h}\Big)K_{h}(U_{i}-u)\\[4mm] laystyle\sum_{i=1}^{n}laystyle\frac{\delta_{i}}{\pi_{i}} X_{i}X^{T}_{i}\Big(\frac{U_{i}-u}{h}\Big)K_{h}(U_{i}-u) ~~& laystyle\sum_{i=1}^{n}laystyle\frac{\delta_{i}}{\pi_{i}} X_{i}X^{T}_{i}\Big(\frac{U_{i}-u}{h}\Big)^{2}K_{h}(U_{i}-u)\\ \end{array} \right ), $$ 由引理 1 及条件期望的平滑性,易证 (5.3) 式成立.

引理4在条件 C1--C6 成立下,有 $$ n^{-1}{\bf Z}^{T}(I-S)^{T}\Delta(I-S){\bf Z}\stackrel{P}\longrightarrow\Omega_{u}, (5.7)$$ 其中 $\Omega_u$ 在定理 1 中定义.

结合引理 1--3, 类似Fan 和 Huang[1] 中引理2 的证明可证本引理成立.

引理5在条件C1--C6 成立下,有 $$ n^{-1}{\bf Z}^{T}(I-S)^{T}\Delta(I-S)M=O_p(c^{2}_n).(5.8)$$

{\heiti证结合引理 1--3, 类似Fan 和 Huang[1] 中引理4 的证明可证本引理成立.

引理6在条件 C1--C6 成立下,有 $$ \frac{1}{n}\Big(D^{T}_{u}W_u\hat{\Delta}D_u-D^{T}_u W_u\Delta D_u \Big)=o_p(n^{-\frac{1}{2}+\frac{1}{2s}}).(5.9)$$

简单计算可得 \begin{eqnarray}\nonumber &&\frac{1}{n}D^{T}_{u}W_u(\hat{\Delta}-\Delta)D_u \\\nonumber &=&\left( \begin{array}{cccc} laystyle\frac{1}{n}\sum\limits_{i=1}^{n}\psi_i X_i X^{T}_i K_h(U_i-u)~~ & laystyle\frac{1}{n}\sum\limits_{i=1}^{n}\psi_i X_i X^{T}_i\Big (\frac{U_i-u}{h}\Big)K_h(U_i-u) \\[4mm] laystyle\frac{1}{n}\sum\limits_{i=1}^{n}\psi_i X_i X^{T}_i\Big(\frac{U_i-u}{h}\Big) K_h(U_i-u)~~ & laystyle\frac{1}{n}\sum\limits_{i=1}^{n}\psi_i X_i X^{T}_i \Big(\frac{U_i-u}{h}\Big)^{2}K_h(U_i-u) \\ \end{array} \right), \end{eqnarray} 其中 $\psi_i= \frac{\delta_i}{\pi(V_i,\hat{\theta})}- \frac{\delta_i}{\pi(V_i,\theta)}.$ 由引理2 知 $\hat{\theta}-\theta=O_p(n^{-1/2}).$ 将 $ \frac{1}{\pi(V_i,\hat{\theta})}$ 在点 $\theta$ 处 ${\rm Taylor}$ 展开得 $$ \begin{array}[b]{rl} \frac{\delta_i}{\pi(V_i,\hat{\theta})} -\frac{\delta_i}{\pi(V_i,\theta)} =& \frac{-\delta_i\pi'(V_i,\theta)} {\pi^{2}(V_i,\theta)}(\hat{\theta}-\theta)+o_p(n^{-1/2}) \\[3mm] =& \frac{-\delta_i(1-\pi(V_i,\theta))}{\pi(V_i,\theta)} \tau^{T}_i(\hat{\theta}-\theta)+o_p(n^{-1/2}) =o_p(n^{-\frac{1}{2}+\frac{1}{2s}}), \end{array}{(5.10)} $$ 其中 $\pi'(V_i,\theta)=\partial\pi(V_i,\theta)/\partial\theta.$ 则由 (5.10) 式可得 \begin{eqnarray*}\nonumber &&\frac{1}{n}\sum^{n}_{i=1}\bigg[\frac{\delta_i}{\pi_i(\hat{\theta})}-\frac{\delta_i}{\pi_i(\theta)}\bigg] X_i X^{T}_i K_h(U_i-u)\\ &=&\frac{1}{n}\sum^{n}_{i=1}\frac{-\delta_i(1-\pi_i(\theta))}{\pi_i(\theta)} \tau^{T}_i(\hat{\theta}-\theta)X_i X^{T}_i K_h(U_i-u)+o_p(n^{-1/2}) = o_p(n^{-\frac{1}{2}+\frac{1}{2s}}), \end{eqnarray*} 从而可得 $ \frac{1}{n}\big(D^{T}_{u}W_u\hat{\Delta}D_u-D^{T}_u W_u\Delta D_u \big)=o_p(n^{-\frac{1}{2}+\frac{1}{2s}}).$

引理7在条件 C1--C6 成立下,有 $$ \hat{S}-S=o_p(n^{-\frac{1}{2}+\frac{1}{2s}}).(5.11)$$

类似引理6 的证明可证明本引理,此处省略.

引理8在条件 C1--C6 成立下,有 $$ \sup\limits_{0<u<1}\|\hat{\varphi}(u)-\Gamma^{-1}(u)\Phi(u)\|=O_p(c_n),(5.12)$$ $$ \sup\limits_{0<u<1}\|\hat{g}(u)-\Gamma^{-1}(u)\Phi(u)\beta-\alpha(u)\|=O_p(c_n),(5.13) $$ 其中 $\hat{\varphi}(u)$ 和 $\hat{g}(u)$ 由 (2.9) 式定义,并且 $c_n=h^2+(\frac{\log(1/h)}{nh})^{1/2}.$

类似引理6 的证明可得 $D^{T}_{u}W_{u}(\hat{\Delta}-\Delta){\bf Z}=o_p(n^{-(\frac{1}{2}-\frac{1}{s})}).$ 于是 $$\hat{\varphi}(u)=[I_p~~0_p]\{D^{T}_{u}W_{u}\hat{\Delta} D_{u}\}^{-1}D^{T}_{u}W_{u}\hat{\Delta}{\bf Z}=[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u} W_{u}\Delta {\bf Z}+o_p(1).$$ 因此由引理 3,对 $u\in(0,1)$,一致有 $\hat{\varphi}(u)=\Gamma^{-1}(u)\Phi(u)\{1+O_p(c_n)\}.$ 因此 (5.12) 式成立. 利用类似方法可以证明 (5.13) 式, 这就完成了本引理的证明.

引理9在条件 C1--C6 成立下, 如果 $\beta$ 是参数真值,则有 $$ \frac{1}{\sqrt{n}}\sum_{i=1}^{n}\hat{\eta}_i(\beta)\stackrel{{\cal L}}\longrightarrow N(0,\Omega), (5.14)$$ 其中 $\Omega=\sigma^{2}\Big\{E[\pi(V)^{-1}{\bf Z}{\bf Z}^{T}]-E[\pi(V)^{-1}\Phi^{T}(U)\Gamma^{-1}(U)\Phi(U)]\Big\}.$

简单计算可得 \begin{eqnarray*} \frac{1}{\sqrt{n}}\sum_{i=1}^{n}\hat{\eta}_i(\beta) &=&\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i}{\pi(V_i,\hat{\theta})}\{Z_i-\varphi^{T}(U_i)X_i\}\varepsilon_i +\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i}{\pi(V_i,\hat{\theta})}(\varphi(U_i)-\hat{\varphi}(U_i))^{T}X_i\varepsilon_i \\ &&+\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i}{\pi(V_i,\hat{\theta})}\{Z_i-\varphi^{T}(U_i)X_i\}X^{T}_i \{\alpha(U_i)-\hat{g}(U_i)+\hat{\varphi}(U_i)\beta\}\\ &&+\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i}{\pi(V_i,\hat{\theta})}(\varphi(U_i)-\hat{\varphi}(U_i))^{T}X_iX^{T}_i \{\alpha(U_i)-\hat{g}(U_i)+\hat{\varphi}(U_i)\beta\}\\ &=:&A_{1}+A_{2}+A_{3}+A_{4}. \end{eqnarray*} 将 $ \frac{1}{\pi(V_i,\hat{\theta})}$ 在 $\theta$ 点 Taylor展开,可得 \begin{eqnarray*} A_1 &=&\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i}{\pi(V_i,\theta)}\{Z_i-\varphi^{T}(U_i)X_i\}\varepsilon_i \\ && -\frac{1}{\sqrt{n}}\sum_{i=1}^{n}\frac{\delta_i\pi'(V_i,\theta)}{\pi^2(V_i,\theta)}(\hat{\theta}-\theta) \{Z_i-\varphi^{T}(U_i)X_i\}\varepsilon_i +o_p(1) \\ &=&\frac{1}{\sqrt{n}}\sum_{i=1}^{n}I_{i1}+\frac{1}{\sqrt{n}}\sum_{i=1}^{n}I_{i2}+o_p(1). \end{eqnarray*} 注意到 $E\{I_{i1}\}=0,$ Var$\{I_{i1}\}=\Omega,$ 故由中心极限定理知 $ \frac{1}{\sqrt{n}}\sum\limits_{i=1}^{n}I_{i1}\stackrel{{\cal L}} \longrightarrow N(0,\Omega).$

下证 $ \frac{1}{\sqrt{n}} \sum\limits_{i=1}^{n}I_{i2}\stackrel{P}\longrightarrow 0.$ 记 $$a_i= \frac{-\delta_i(1-\pi(V_i,\theta))}{\pi(V_i,\theta)} \big\{Z_i-\varphi^{T}(U_i)X_i\big\}\varepsilon_i, $$ 则 $ I_{i2}=a_{i}\tau^{T}_i(\hat{\theta}-\theta)$. 设 $I_{i2,s}$ 为 $I_{i2}$ 的第 $s$ 个分量,$a_{i,s}$ 为 $a_i$ 的第 $s$ 个分量. 由 $\sqrt{n}(\hat{\theta}-\theta)=O_p(1),$ 结合引理8 以及文献 [14,引理2.6.1,2.6.2]可得 \begin{eqnarray*} \bigg|\frac{1}{\sqrt{n}}\sum_{i=1}^{n}I_{i2,s}\bigg| &&=\frac{1}{\sqrt{n}} \bigg|\sum_{i=1}^{n}\tau^{T}_i(\hat{\theta}-\theta)a_{i,s}\bigg| \leq\frac{1}{\sqrt{n}}\max\limits_{1\leq i\leq n}\bigg|\sum_{i=1}^{n}a_{i,s}\bigg|\max\limits_{1\leq i\leq n}\tau^{T}_i(\hat{\theta}-\theta) \\\nonumber &&=\frac{1}{\sqrt{n}}o_p(n^{-1/2})O_p(\sqrt{n}\log n)=o_p(1), \end{eqnarray*} 因此有 $A_1\stackrel{{\cal L}}\longrightarrow N(0,\Omega).$

进一步,由 $E(X_i\varepsilon_i)=0,$ $E\{[Z_i-\varphi^{T}(u_i)X_i]X^{T}_i\}=0,$ 类似引理8,可证 $A_{v}\stackrel{P}\longrightarrow 0,v=2,3.$ 又由文献 [14,引理2.6.1,2.6.2]可得 $\|A_{4}\|\leq O_p(\sqrt{n}c^{2}_n)=o_p(1). $ 综合上述,本引理得证.

引理 10在条件 C1--C6 成立下, 如果 $\beta$ 是参数真值,则有 $$ \frac{1}{n}\sum_{i=1}^{n}\hat{\eta}_i(\beta)\hat{\eta}^{T}_i(\beta) \stackrel{P}\longrightarrow\Omega.(5.15)$$

证明过程类似文献 [14,引理4.5.3]的证明,此处省略.

定理 1 的证明简单计算可得 \begin{eqnarray}\nonumber \sqrt{n}(\hat{\beta}-\beta)=\sqrt{n}\{{\bf Z}^{T}(I-\hat{S})^{T} \hat{\Delta}(I-\hat{S}){\bf Z} \}^{-1}{\bf Z}^{T}(I-\hat{S})^{T}\hat{\Delta}(I-\hat{S})(M+\varepsilon). \end{eqnarray} 首先考虑\begin{eqnarray*} &&\frac{1}{n}{\bf Z}^{T}(I-\hat{S})^{T}\hat{\Delta}(I-\hat{S}){\bf Z} \\ &=&\frac{1}{n}{\bf Z}^{T}(I-S)^{T}\Delta(I-S){\bf Z}+\frac{1}{n}{\bf Z}^{T}(I-S)^{T}\Delta(S-\hat{S}){\bf Z} +\frac{1}{n}{\bf Z}^{T}(I-S)^{T}(\hat{\Delta}-\Delta)(I-S){\bf Z} \\ &&+\frac{1}{n}{\bf Z}^{T}(I-S)^{T}(\hat{\Delta}-\Delta)(S-\hat{S}){\bf Z}+\frac{1}{n}{\bf Z}^{T}(S-\hat{S})^{T}\Delta(I-S){\bf Z} +\frac{1}{n}{\bf Z}^{T}(S-\hat{S})^{T}\Delta(S-\hat{S}){\bf Z} \\ &&+\frac{1}{n}{\bf Z}^{T}(S-\hat{S})^{T}(\hat{\Delta}-\Delta)(I-S){\bf Z}+ \frac{1}{n}{\bf Z}^{T}(S-\hat{S})^{T}(\hat{\Delta}-\Delta)(S-\hat{S}){\bf Z} \\ &=:&T_1+T_2+T_3+T_4+T_5+T_6+T_7+T_8. \end{eqnarray*} 下面证明 $T_i=o_p(n^{-1/2}),i=2,\cdots,8.$ 由引理7 得 $$\|T_2\|=\frac{1}{n}\|{\bf Z}^{T}(I-S)^{T}\Delta(S-\hat{S}){\bf Z}\| \leq n^{-1}\cdot n^{\frac{1}{s}}\cdot n^{-(\frac{1}{2}-\frac{1}{s})}\cdot n^{\frac{1}{2s}} =o_p(n^{-1/2}).$$ 结合 (5.10) 式可证 $$\|T_3\|=\frac{1}{n}\|{\bf Z}^{T}(I-S)^{T}(\hat{\Delta}-\Delta)(I-S){\bf Z}\| \leq n^{-1}\cdot n^{\frac{1}{s}}\cdot n^{-(\frac{1}{2}-\frac{1}{2s})}\cdot n^{\frac{1}{s}} = o_p(n^{-1/2}). $$ 类似可证 $T_i=o_p(n^{-1/2}),i=4,\cdots,8.$ 又由引理4 知 $T_1\stackrel{P}\longrightarrow\Omega_{u}$,从而可得 $$laystyle\frac{1}{n}{\bf Z}^{T}(I-\hat{S})^{T}\hat{\Delta}(I-\hat{S}){\bf Z}\stackrel{P}\longrightarrow \Omega_{u}.$$

其次考虑\begin{eqnarray*}\nonumber &&\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-\hat{S})^{T}\hat{\Delta}(I-\hat{S})(M+\varepsilon)\\ &=&\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}\Delta(I-S)(M+\varepsilon) +\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}\Delta(S-\hat{S})(M+\varepsilon) \\\nonumber &&+\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}(\hat{\Delta}-\Delta)(I-S)(M+\varepsilon) +\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}(\hat{\Delta}-\Delta)(S-\hat{S})(M+\varepsilon) \\\nonumber &&+\frac{1}{\sqrt{n}}{\bf Z}^{T}(S-\hat{S})^{T}\Delta(I-S)(M+\varepsilon) +\frac{1}{\sqrt{n}}{\bf Z}^{T}(S-\hat{S})^{T}\Delta(S-\hat{S})(M+\varepsilon) \\\nonumber &&+\frac{1}{\sqrt{n}}{\bf Z}^{T}(S-\hat{S})^{T}(\hat{\Delta}-\Delta)(I-S)(M+\varepsilon)+ \frac{1}{\sqrt{n}}{\bf Z}^{T}(S-\hat{S})^{T}(\hat{\Delta}-\Delta)(S-\hat{S})(M+\varepsilon) \\\nonumber &=:& R_1+R_2+R_3+R_4+R_5+R_6+R_7+R_8. \end{eqnarray*}

下面证明 $R_i=o_p(1),i=2\cdots,8$. 对于$$R_2=\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}\Delta(S-\hat{S})M +\frac{1}{\sqrt{n}}{\bf Z}^{T}(I-S)^{T}\Delta(S-\hat{S})\varepsilon=:R_{21}+R_{22}.$$ 由条件 ${\rm C{3}}$ 及引理~7 知 $\|R_{21}\|\leq n^{-1/2}\cdot n^{\frac{1}{s}}\cdot n^{-(\frac{1}{2}-\frac{1}{s})}\cdot n^{\frac{1}{2s}}=o_p(1).$ 类似可以证明 $\|R_{22}\|\leq n^{-1/2}\cdot n^{\frac{1}{s}}\cdot n^{-(\frac{1}{2}-\frac{1}{s})}\cdot n^{\frac{1}{2s}}=o_p(1)$ 及 $R_i=o_p(1),i=3,\cdots,8.$ 由此结合引理4 和引理~5 可得$$\sqrt{n}(\hat{\beta}-\beta) =n^{-1/2}\Omega_u^{-1}\sum\limits_{i=1}^{n}\Big[Z_i-\Phi^{T}(U_i)\Gamma^{-1}(U_i)X_i\Big] \frac{\delta_i}{\pi_i}\varepsilon_i\Big\{1+o_p(1)\Big\}.$$ 由中心极限定理和 ${\rm Slutsky}$ 定理可得 $\sqrt{n}(\hat{\beta}-\beta)\stackrel{{\cal L}}\longrightarrow N(0,\Sigma_1).$ 定理得证.

定理2 的证明简单计算可得 \begin{eqnarray}\nonumber \hat{\alpha}(u)&=&[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}\Delta\Big(M+\varepsilon+{\bf Z}(\beta-\hat{\beta})\Big) \\\nonumber &&+[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}(\hat{\Delta}-\Delta)M \\\nonumber &&+[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}(\hat{\Delta}-\Delta)\varepsilon \\\nonumber &&+[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}(\hat{\Delta}-\Delta){\bf Z}(\beta-\hat{\beta}) \\\nonumber &=:&S_1+S_2+S_3+S_4. \end{eqnarray}

首先考虑 $S_2$,由引理~2 和引理 3 可得 \begin{eqnarray*}\nonumber S_2 &=&[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}(\hat{\Delta}-\Delta)\alpha^{T}(U){\bf X} \\\nonumber &=&f^{-1}(U)\Gamma^{-1}(U)\frac{1}{n}\sum\limits_{i=1}^{n}\frac{-\delta_i(1-\pi_i(\theta))}{\pi_i(\theta)} \tau^{T}_i(\hat{\theta}-\theta)X_iX^{T}_i\alpha^{T}(U)K_h(U_i-u)+o_p(n^{-1/2})\\\nonumber &=&o_p(n^{-\frac{1}{2}+\frac{1}{2s}}). \end{eqnarray*} 同理可证 $S_3=o_p(n^{-1/2}),$ $S_4=o_p(n^{-1}).$ 下面考虑 $S_{1}$, \begin{eqnarray}\nonumber S_1&=&[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}\Delta M+[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}\Delta \varepsilon \\\nonumber &&+[I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}\Delta{\bf Z}(\beta-\hat{\beta}) \\\nonumber &=:&S_{11}+S_{12}+S_{13}. \end{eqnarray} 由 $\alpha(U_i)$ 在点 $u$ 处的 ${\rm Taylor}$ 展开, 结合引理 3,简单计算可得 $$ S_{11}=\alpha(u)+ \frac{h^{2}}{2}\mu_2\alpha''(u)+o_p(h^{2}), $$ \begin{eqnarray*} \sqrt{nh}~S_{12}&=&\sqrt{nh} [I_p~~0_p]\{D^{T}_{u}W_{u}\Delta D_{u}\}^{-1}D^{T}_{u}W_{u}\Delta\varepsilon \\\nonumber &=&f^{-1}(U)\Gamma^{-1}(U)\Big(\sqrt{nh}\frac{1}{n}\sum\limits_{i=1}^{n}\frac{\delta_i}{\pi_i}X_i K_h(U_i-u)\varepsilon_i\Big)+o_p(1). \end{eqnarray*} 由中心极限定理和 Slutsky 定理可得 $$\sqrt{nh} S_{12}\stackrel{{\cal L}}\longrightarrow N(0,\Sigma_2).$$

进一步,由定理 1 和引理 3 可得 $$\sqrt{nh}S_{13}=\sqrt{nh}\Gamma^{-1}(U) \Phi(U)(\hat{\beta} -\beta)=o_p(1). $$

综上所述,定理2 得证.

定理 3 的证明由引理9,经简单计算可得 $$\max\limits_{1\leq i\leq n}\|\hat{\eta}_i(\beta)\|=o_p(n^{-1/2}),~~ \lambda=O_p(n^{-1/2}). $$

对 (2.11) 式,利用Taylor 公式可得 $$ \hat{L}(\beta)=2\sum^{n}_{i=1}\Big\{\lambda^{T}\hat{\eta}_i(\beta) -\frac{1}{2}(\lambda^{T}\hat{\eta}_i(\beta))^{2}\Big\}+o_p(1).(5.16)$$ 进而可得 $$ 0=\frac{1}{n}\sum^{n}_{i=1}\frac{\hat{\eta}_i(\beta)}{1+\lambda^{T}\hat{\eta}_i(\beta)} =\frac{1}{n}\sum^{n}_{i=1}\hat{\eta}_i(\beta) -\frac{1}{n}\sum^{n}_{i=1}\hat{\eta}_i(\beta)\hat{\eta}^{T}_i(\beta)\lambda +\frac{1}{n}\sum^{n}_{i=1}\frac{\hat{\eta}_i(\beta)\{\lambda^{T}\hat{\eta}_i(\beta) \}^{2}}{1+\lambda^{T}\hat{\eta}_i(\beta)}. $$ 由引理9,10 得 $$ \sum^{n}_{i=1}[\lambda^{T}\hat{\eta}_i(\beta)]^{2} =\sum^{n}_{i=1}\lambda^{T}\hat{\eta}_i(\beta)+o_p(1).(5.17)$$ $$ \lambda=\Big\{\sum^{n}_{i=1}\hat{\eta}_i(\beta)\hat{\eta}^{T}_i(\beta)\Big\}^{-1} \sum^{n}_{i=1}\hat{\eta}_i(\beta)+o_p(n^{-1/2}).(5.18)$$ 结合 (5.16)--(5.18) 式,简单计算可得 $$\hat{L}(\beta)=\Big\{ \frac{1}{\sqrt{n}} \sum^{n}_{i=1}\hat{\eta}^{T}_i(\beta)\Big\}^{T} \Omega^{-1}\Big\{ \frac{1}{\sqrt{n}} \sum^{n}_{i=1}\hat{\eta}^{T}_i(\beta)\Big\}+o_p(1), $$ 因此由引理9,10,可知定理成立.

参考文献
[1] Fan J Q, Huang T. Profile likelihood inferences on semiparametric varying-coefficient partially linear models. Bernoulli, 2005, 11: 1031-1057
[2] You J H, Zhou Y. Empirical likelihood for semi-parametric varying-coefficient partially linear model. Statistics & Probability Letters, 2006, 76: 412-422
[3] Ahmad I, Leelahanon S, Li Q. Efficient estimation of a semiparametric partially linear varying coefficient model. The Annals of Statistics, 2005, 33: 258-283
[4] Huang Z S, Zhang R Q. Empirical likelihood for nonparametric parts in semiparametric varying-coefficient partially linear models. Statistics & Probability Letters, 2009, 79: 1798-1808
[5] Baker S G, Laird N M. Regression analysis for categorical variables with outcome subject to nonresponse. Journal of the American Statistical Association, 1988, 83: 62-69
[6] Ibrahim J G, Lipsitz S R, Chen M H. Missing covariates in generalized linear models when the missing data mechanism is nonignorable. Journal of the Royal Statistical Society Series B, 1999, 61: 173-190
[7] Sande I G. A personal view of hot deck imputation procedures. Survey Methodology, 1979, 5: 238-258
[8] Wang Q H, and Rao J N K. Empirical likelhood-based inference under imputation for missing response data. The Annals of Statist, 2002, 30(3): 896-924
[9] Robins J M, Rotnitzky A, Zhao L P. Estimation of regression coefficients when some regressors are not always observed. Journal of the American Statistical Association, 1994, 89: 846-86
[10] van der Laan M J, Robins J M. Unified Methods for Censored and Longitudinal Data and Causality. New York: Springer, 2003
[11] Qin J, Shao J, Zhang B. Efficient and doubly robust imputation for covariate-dependent missing responses. Journal of the American Statistical Association, 2008, 103: 797-810
[12] Wang Q H, Linton O, Hardle W. Semiparametric regression analysis with missing response at random. Journal of the American Statistical Association, 2004, 99: 334-345
[13] Xue L G. Empirical likelihood for linear models with missing responses. Journal of Multivariate Analysis, 2009, 100: 1353-1366
[14] 赵培信. 半参数变系数部分线性模型的统计推断[D]. 北京: 北京工业大学, 2010
[15] Liang H, Wang S J, Robins J M, Carroll R J. Estimation in partially linear models with missing covariates. Journal of the American Statistical Association, 2004, 99: 357-367
[16] Wang Q H. Statistical estimation in partial linear models with covariate data missing at random. Annals of the Institute of Statistical Mathematics, 2009, 61: 47-84
[17] Rubin D B. Inference and missing data. Biometrika, 1976, 63: 581-592
[18] 李志强, 薛留根. 协变量随机缺失的广义半参数模型. 北京工业大学学报, 2007, 33(7): 761-765
[19] Huang J Z, Wu C O, Zhou L. Varying-coefficient models and basis function approximations for the analysis of repeated measurements. Biometrika, 2002, 89: 111-128
[20] Xue L G, Zhu L X. Empirical likelihood for a varying coefficient model with longitudinal data. Journal of the American Statistical Association, 2007, 102: 642-654
[21] Mack Y P, Silverman B W. Weak and strong uniform consistency of kernel regression estimates. Z Warsch Verw Gebiete, 1982, 61: 405-415