Loading [MathJax]/jax/element/mml/optable/BasicLatin.js

数学物理学报, 2020, 40(2): 475-483 doi:

论文

重尾非线性自回归模型自加权M-估计的渐近分布

傅可昂,, 丁丽, 李君巧

Asymptotics for the Self-Weighted M-Estimation of Nonlinear Autoregressive Models with Heavy-Tailed Errors

Fu Keang,, Ding Li, Li Junqiao

收稿日期: 2018-09-27  

基金资助: 国家自然科学基.  11971432
浙江省自然科学基金.  LY17A010004
浙江省一流学科A类.  浙江工商大学统计学

Received: 2018-09-27  

Fund supported: the NSFC.  11971432
the NSF of Zhejiang Province.  LY17A010004
the First Class Discipline of Zhejiang-A.  浙江工商大学统计学

作者简介 About authors

傅可昂,E-mail:fukeang@hotmail.com , E-mail:fukeang@hotmail.com

摘要

考虑非线性自回归模型xt=fxt-1,…,xt-pθ)+εt,其中θq维未知参数,εt为随机误差.在允许误差方差无穷的重尾条件下,构造θ的自加权M-估计,并证明了该估计的渐近正态性.最后通过数值模拟,在随机误差服从某些重尾分布的条件下,说明自加权M-估计比最小二乘和L1估计更有效.

关键词: 非线性自回归 ; 自加权M-估计 ; 重尾 ; 渐近正态

Abstract

Consider the nonlinear autoregressive model xt=f(xt-1, …, xt-p, θ)+εt, where θ is the q-dimensional unknown parameter and εt's are random errors with possibly infinite variance. In this paper, the self-weighted M-estimator of θ is constructed, and the asymptotic normality of the proposed estimator is also established. Some simulation studies are also given to show that the self-weighted M-estimators have good performances with some heavy-tailed random errors.

Keywords: Nonlinear autoregression ; Self-weighted M-estimator ; Heavy tail ; Asymptotic normality

PDF (393KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

傅可昂, 丁丽, 李君巧. 重尾非线性自回归模型自加权M-估计的渐近分布. 数学物理学报[J], 2020, 40(2): 475-483 doi:

Fu Keang, Ding Li, Li Junqiao. Asymptotics for the Self-Weighted M-Estimation of Nonlinear Autoregressive Models with Heavy-Tailed Errors. Acta Mathematica Scientia[J], 2020, 40(2): 475-483 doi:

1 引言及主要结论

考虑非线性自回归模型

xt=f(xt1,xt2,,xtp,θ)+ϵt,t=1,,n,
(1.1)

其中f()Rp上的实值可测函数, θ=(θ1,θ2,,θq)T为未知参数且其真实值为θ0, {ϵt}为独立同分布的随机误差, ϵt{xs,s<t}独立.显然,模型(1.1)包含了一系列在金融统计文献中被广泛研究的非线性时间序列模型,具体可见文献[1-2].由于现实世界的运动规律往往是非线性的,因此模型(1.1)在近十年受到了较多的关注,如金阳和安鸿志[3-4]以及张韧和张绍义[5]研究了平稳非线性自回归模型中矩的存在性问题,周杰等[6-7]考虑了未知参数的L1估计及其渐近分布, Cheng和Sun[8]研究了随机误差的拟合分布检验, Fu和Yang[9], Cheng[10]和Li[11]考虑了随机误差的密度函数估计问题, Cheng[12]研究了随机误差的方差估计问题.

在上述非线性自回归模型研究的文献中,所涉及的关于θ的参数估计方法大多采用最小二乘估计或中位数(L1、LAD)估计.由于金融时间序列数据常常具有方差无穷这样的重尾性质以及异常点,最小二乘估计显然易受影响而不稳健;中位数估计虽较稳健,但和最小二乘估计都有一个共同的缺点,就是只研究解释变量对响应变量均值(中位数)的影响,然而在实际应用中,我们有时候更关心变量的尾部特征.例如,股票市场之间的流动性,金融风险的传染性,都是用尾部相关性来描述的.由Koenker和Bassett[13]所提出的分位数估计,利用解释变量和响应变量的条件分位数进行建模,不但具有较好的稳健性,而且还可以描述响应变量的条件分位数,在金融时间序列分析中有着广泛的应用.但是对具有异常点的金融时间序列数据而言,即使是分位数估计也不能有效降低高杠杆点的影响,但Ling[14]所提出的自加权估计却可以通过选择合适的权重函数而有效地解决这一问题.有鉴于此,本文拟对模型(1.1)中的未知参数构建更为稳健的自加权M -估计,并研究该估计的渐近分布.

x1,x2,,xn是满足模型(1.1)的观测值(令xt=0,t0),θ的真实值θ0的自加权M -估计ˆθSM可由

argminθΘnt=1wtρ(xtf(xt1,xt2,,xtp,θ))
(1.2)

解得,其中ΘRq为包含真实值θ0的参数空间, ρ:=ρ()为满足一定条件的非负凸函数, wt为一基于(xt1,,xtp)的正值权重函数.

对非线性自回归模型(1.1),记

Xt=(xt,xt1,,xtp+1)Tp×1,e=(1,0,,0)Tp×1,

Φ(Xt1)=(f(Xt1,θ),xt1,,xtp+1)Tp×1,

则模型(1.1)可记为

Xt=Φ(Xt1)+eϵt.
(1.3)

为了保证模型的平稳性以及有效降低高杠杆点的影响,我们先给出关于模型和权重函数的几个假设条件.

(A1) (ⅰ) ϵt的密度函数g(x)处处大于零, P(|ϵt|>x)xαL(x)(x),其中α>0, L(x)为一缓变函数.

(ⅱ)存在一个Rp上的向量模u以及正常数Cr0r<1,对XRpΦ(X)urXu+Cr.

(A2) g(x)连续可微, sup, { }\sup_{x\in{R}}|g'(x)|<\infty , f(X_{t-1}, \theta) 关于各个分量二阶连续可微.

(A3) w_t = \varphi(x_{t-1}, \cdots, x_{t-p}) 为一正值可测函数,且满足

{\textsf{E}}\{(w_t+w_t^2)(1+\|{Y_{t, \theta}}\|_1+\|{Y_{t, \theta}}\|_1^2)\}<\infty, {\quad} {\textsf{E}}\{(w_t+w_t^2)(1+\|{H_{t, \theta}}\|_2+\|{H_{t, \theta}}\|_2^2)\}<\infty,

其中 \|\cdot\|_1 表示向量的欧式范数, \|\cdot\|_2 表示矩阵的Frobenius范数,

Y_{t, \theta} = \Big(\frac{\partial{f(X_{t-1}, \theta)}}{\partial\theta_1}, \frac{\partial{f(X_{t-1}, \theta)}}{\partial\theta_2}, \cdots, \frac{\partial{f(X_{t-1}, \theta)}}{\partial\theta_q}\Big)^T_{q\times1},

H_{t, \theta} = (h_{i, j})_{q\times q}, \; \; h_{i, j} = \frac{\partial^2f(X_{t-1}, \theta)}{\partial\theta_i\partial\theta_j}.

注1.1  由金阳和安鸿志[3]的结果可知,在假设条件(A1)成立的情况下, (1.3) 式定义的 X_t 是几何遍历的,从而模型 (1.1) 中的 x_t 也是几何遍历的且模型 (1.1) 有唯一平稳解,同时 x_t 的平稳分布也满足 {\textsf{P}}(|x_t|>x)\sim x^{-\alpha}L(x)\; (x\to\infty); 结合假设条件(A2),又可知 Y_{t, \theta} 的平稳遍历性.假设条件(A3)则是用自加权方法处理无穷方差时常用的条件,它给出了选择 w_t 函数的一个标准.

为了使得 \hat{\theta}_{SM} 有渐近正态性,我们需要限制函数 \rho 的范围.对 \rho 所加的条件通常有两种:一种是 \rho 的一阶导数有界, \rho 无界;另一种是 \rho \rho 的一阶导数都有界. Huber[15]和Yohai[16]表明若 \rho 有界,则所得估计对尾分布很稳健;若 \rho 的一阶导数也有界,则该估计对异常点很稳健.根据模型(1.1)的非线性特点,我们要求凸函数 \rho 满足如下假定.

(A4) \rho 的一阶导数 \psi 存在且有界,即存在常数 K 使得 { }\sup_{x\in R}|\psi(x)|\le K.

(A5) G(t) = {\textsf{E}}\psi(\epsilon_1+t) 存在, G(0) = 0 G(t) 在0点的导数值为 \lambda\neq0.

(A6) {\textsf{E}}\psi^2(\epsilon_1) = \tau^2<\infty, 且当 t\to\infty 时, {\textsf{E}}(\psi(\epsilon_1+t)-\psi(\epsilon_1))^2\to0.

注1.2  假设条件(A4)–(A6)是在处理M -估计时经常用到的标准假设,很多常用的稳健估计的 \rho 函数都可以满足这些条件,比如 L_1 估计、分位数估计、Huber估计等.如果 \rho 不可微但存在左右导数 \psi_{-} \psi_{+} ,则可选择一 \psi 函数满足 \psi_{-}\le\psi\le\psi_{+}, 故在本文中我们直接使用 \psi 函数.

接下来介绍我们的主要结论.

定理1.1  若假设条件(A1)–(A6)成立,则在 \theta_0 的半径为 r 的邻域内, (1.2) 式存在局部极小值 \hat{\theta}_{SM} ,当 n\rightarrow\infty 时,有

\begin{equation} \sqrt{n}\big(\hat{\theta}_{SM}-\theta_0\big)\stackrel{d}{\longrightarrow} N_q\Big(0, \frac{\tau^2}{\lambda^2}\Sigma^{-1}\Xi\Sigma^{-1}\Big), \end{equation}
(1.4)

其中 r>0 为一足够小的常数, N_q 表示 q 维正态随机向量, \Sigma = {\textsf{E}}(w_tY_{t, \theta_0}Y^T_{t, \theta_0}), \Xi = {\textsf{E}}(w^2_tY_{t, \theta_0}Y^T_{t, \theta_0}) , \stackrel{d}\longrightarrow(\stackrel{p}\longrightarrow) 表示依分布 ( 概率 ) 收敛.

注1.3  假设条件(A1)(ⅰ)中所定义的 \epsilon_t 显然包括了方差无穷的情况,特别是 \alpha = 1 时,即可取柯西分布.因此,定理 1.1 在允许 \epsilon_t 方差无穷的重尾条件下建立了非线性自回归模型的自加权M -估计的渐近分布,推广了已有的结论.

为了说明自加权M -估计的普适性,我们给出几个常用的 \rho 作为例子.记 \epsilon_t 的分布函数为 F ,密度函数为前面所定义的 g .

例1.1  令 \rho(x) = |x| ,则 \psi(x) = sign(x) ,此时的 \hat\theta_{SM} 即为自加权最小一乘估计或自加权 L_1 估计.计算可得 \lambda = 2g(0), \tau^2 = {\textsf{E}} sign^2(\epsilon_1) = 1 .因此,在定理 1.1 的条件下,有

\begin{eqnarray*} \sqrt{n}(\hat\theta_{SM}-\theta_0)\mathop{\longrightarrow}\limits^d N_q\left(0, \frac{1}{4g^2(0)}\Sigma^{-1}\Xi\Sigma^{-1}\right). \end{eqnarray*}

显然,该结论中允许误差分布为柯西分布,降低了周杰等[7]中要求 {\textsf{E}}\epsilon_t^\delta<\infty\; (\delta\ge1) 的条件.

例1.2  令 \rho(x) = x(\kappa-I(x<0)) ,其中 0<\kappa<1 ,则 \psi(x) = \kappa-I(x<0) ,此时的 \hat\theta_{SM} 即为自加权 \kappa 分位数估计.计算可得 \lambda = g(0), \tau^2 = \kappa^2-(2\kappa-1)F(0), 根据定理 1.1 即有

\sqrt{n}(\hat\theta_{SM}-\theta_0)\mathop{\longrightarrow}\limits^d N_q\left(0, \frac{\kappa^2-(2\kappa-1)F(0)}{g^2(0)}\Sigma^{-1}\Xi\Sigma^{-1}\right).

例1.3  令 \rho(x) = \left\{ \begin{array}{lcl} \frac{1}{2}x^2, & & {|x|\le k}, \\ k|x|-\frac{1}{2}k^2, & & {|x|\ge k}, \end{array} \right. \psi(x) = \left\{ \begin{array}{lcl} -k, & & {x<-k}, \\ x, & & {|x|\le k}, \\ k, & & {x>k}. \end{array} \right. 这是稳健估计中常用的Huber估计所采用的 \rho 函数,相应的 \hat\theta_{SM} 即为自加权Huber估计.计算可得

\lambda = \int_{-k}^k{\rm d} F(x), \tau^2 = k^2-\int_{-k}^k(k^2-x^2){\rm d} F(x).

显然,它也有类似于 (1.4) 式的渐近分布.

2 数值模拟

这一部分将对 \theta_0 的自加权M -估计进行有限样本的模拟研究,主要比较两类自加权M -估计与最小二乘估计 \hat{\theta}_{LS} L_1 估计 \hat{\theta}_{L_1} 在某些重尾误差分布下的表现.

考虑模型

\begin{equation} x_t = \theta_1x_{t-1}+\theta_2x_{t-1}^2e^{-x_{t-1}^2}+\epsilon_t, \end{equation}
(2.1)

其中 \theta = (\theta_1, \theta_2) 的真实值分别取 (-0.9, 2), (0.9, -2) , x_0 的初始值为0, \epsilon_t 服从三类不同的重尾分布: (a)自由度为3的 t 分布: \epsilon_t \sim t(3) ; (b)自由度为2的 t 分布: \epsilon_t \sim t(2) ; (c)柯西分布: \epsilon_t \sim Cauchy (0, 1) .我们选取权重函数为

\omega_t = \left\{ \begin{array}{lcl} 1, & & {a_t = 0}, \\ C^3/a_t^3, & & {a_t\neq0}, \end{array} \right.

其中 a_t = |x_{t-1}|I(|x_{t-1}|\geq C) , C>0 是一个常数且一般选取数据 x_1, x_2, \cdots, x_n 的0.9分位数.为了确保 w_t 存在,我们在生成数据时要防止0.9分位数是0的情况(实际上可以通过调节分位点来避开 w_t 不存在的情况).

表 1   \{\epsilon_t\}\sim t(3)的模拟结果

\theta_1\theta_2\hat{\theta}_{2_{LS}}\hat{\theta}_{2_{{L_1}}}\hat{\theta}_{2_{SM_1}}\hat{\theta}_{2_{SM_2}}
n = 200
-0.92Mean2.08022.05922.02792.0215
SD0.99830.79770.60600.6419
0.9-2Mean-1.8743-1.9307-2.0247-2.0507
SD1.04490.85110.62230.6847
n = 400
-0.92Mean2.01361.98811.99972.0135
SD0.69560.54660.41150.4540
0.9-2Mean-1.9341-1.9648-2.0044-2.0023
SD0.73660.59470.44010.4714

新窗口打开| 下载CSV


表 2   \{\epsilon_t\}\sim t(2)的模拟结果

\theta_1\theta_2\hat{\theta}_{2_{LS}}\hat{\theta}_{2_{{L_1}}}\hat{\theta}_{2_{SM_1}}\hat{\theta}_{2_{SM_2}}
n = 200
-0.92Mean1.92442.03962.00432.0182
SD2.12400.90850.72930.7503
0.9-2Mean-1.9520-2.0495-2.0119-2.0155
SD2.33190.93620.79370.8031
n = 400
-0.92Mean1.96212.01642.00652.0172
SD1.65610.61010.51210.3659
0.9-2Mean-1.9583-1.9832-2.0018-2.0112
SD1.61650.64060.52690.3847

新窗口打开| 下载CSV


表 3   \{\epsilon_t\} (0, 1)$的模拟结果

\theta_1\theta_2\hat{\theta}_{2_{LS}}\hat{\theta}_{2_{{L_1}}}\hat{\theta}_{2_{SM_1}}\hat{\theta}_{2_{SM_2}}
n = 200
-0.92Mean14.47572.67792.06482.0772
SD813.724028.92892.38772.2688
0.9-2Mean-23.0939-1.8470-2.0652-2.0545
SD627.0616295.37153.62102.5467
n = 400
-0.92Mean3.71472.05542.02792.0320
SD233.30331.25081.23251.1376
0.9-2Mean-7.3892-2.1109-2.0242-2.0132
SD326.20411.20151.16311.1284

新窗口打开| 下载CSV


在模拟时,分别产生样本容量为200和400的观察数据,计算相应的自加权Huber估计、自加权 L_1 估计与最小二乘估计、 L_1 估计,并计算重复运行2000次后的均值(Mean)与标准差(SD).由于 \theta_1 的估计都较好,故只对 \theta_2 的四类估计(自加权Huber估计( \hat{\theta}_{2_{SM_1}} )、自加权 L_1 估计( \hat{\theta}_{2_{SM_2}} )、最小二乘估计( \hat{\theta}_{2_{LS}} ) L_1 估计( \hat{\theta}_{2_{L_1}} ))的模拟结果进行比较,具体可见表 13.

从表中数据可以看出,两类自加权M -估计的均值和标准差均比另两种常用估计所得到的结果要好,特别是在随机误差服从柯西分布时,自加权M -估计表现更优.

3 定理证明

在给出证明之前,我们首先给出两个重要的引理.引理3.1同弱收敛随机过程极小点的渐近性质所相关,引理3.2则在定理1.1的证明中起到了重要的作用.

引理3.1  设 \nu_n(\cdot) \nu(\cdot) {\mathbb R}^q 中的随机过程,在 C({\mathbb R}^q) 中有 \nu_n(\cdot)\stackrel{d}\to\nu(\cdot), 其中 C({\mathbb R}^q) 表示由 {\mathbb R}^q 中的连续函数所组成的线性空间.

(i)若 \xi_n \xi 分别是 \nu_n(\cdot) \nu(\cdot) 的最小值点, \xi 依概率唯一, \nu_n(\cdot) 具有凸的样本路径,则在 {\mathbb R}^q 中有 \xi_n\stackrel{d}\longrightarrow\xi .

(ii)若 \xi \nu(\cdot) 唯一的最小值点,则 \nu_n(\cdot) 存在局部极小值点 \xi_n ,使得在 {\mathbb R}^q 中有 \xi_n\stackrel{d}\longrightarrow \xi .

  具体可见文献[17]中的引理2.2和注记1.

引理3.2  在定理 1.1 的条件下,我们有

\frac{1}{\sqrt{n}}\sum\limits_{t = 1}^nw_tY_{t, \theta_0}\psi(\epsilon_{t}(\theta_0)) \stackrel{d}{\longrightarrow} R\sim N_{q}(0, \tau^2\Xi),

其中 \epsilon_{t}(\theta_0) = x_t-f\big(x_{t-1}, x_{t-2}, \cdots, x_{t-p}, \theta_0\big).

  由Cramér-Wold定理,只需说明对任意满足 {\bf b}\Xi{\bf b}^T>0 {\bf b} = (b_1, b_2, \cdots, b_q)\in{{\mathbb R}^q},

\begin{equation} \frac{1}{\sqrt{n}}\sum\limits_{t = 1}^nw_t{\bf b}Y_{t, \theta_0} \psi(\epsilon_{t}(\theta_0)) \stackrel{d}{\longrightarrow} N_1(0, \tau^2\sigma^2), \end{equation}
(3.1)

其中 \sigma^2 = {\bf b}\Xi {\bf b}^T.

\frac{1}{\sqrt{n}}\sum\limits_{t = 1}^nw_t{\bf b}Y_{t, \theta_0} \psi(\epsilon_{t}(\theta_0)) = :\sum\limits_{t = 1}^n\epsilon_{nt}. 显然, \epsilon_{nt} 是一基于 \digamma_{n, t} = \sigma(\epsilon_1, \cdots, \epsilon_t) 的鞅差序列,且

\begin{eqnarray} \sum\limits_{t = 1}^n{\textsf{E}}(\epsilon_{nt}^2|\digamma_{n, t-1}) & = &\frac{1}{n}\sum\limits_{t = 1}^n{\textsf{E}}\Big(w_t^2{\bf b}Y_{t, \theta_0}Y^T_{t, \theta_0}{\bf b}^T\psi^2(\epsilon_{t}(\theta_0))\Big|\digamma_{n, t-1}\Big){} \\ & = &\tau^2{\bf b}\Big(\frac{1}{n}\sum\limits_{t = 1}^nw_t^2Y_{t, \theta}Y^T_{t, \theta}\Big){\bf b}^T \stackrel{p}{\longrightarrow}\tau^2\sigma^2, \end{eqnarray}
(3.2)

其中在最后一步中我们利用了由假设条件(A1)和(A2)以及平稳遍历性定理所推出的

\begin{equation} \frac{1}{n}\sum\limits_{t = 1}^nw_t^2Y_{t, \theta_0}Y_{t, \theta_0}^T\stackrel{p}{\longrightarrow}\Xi. \end{equation}
(3.3)

事实上,由假设条件(A1)和(A2)以及平稳遍历性定理还可推出

\begin{equation} \frac{1}{n}\sum\limits_{t = 1}^{n}w_tY_{t, \theta_0}Y_{t, \theta_0}^T\stackrel{p}{\longrightarrow}\Sigma. \end{equation}
(3.4)

因此,根据鞅中心极限定理以及(3.2)式,为了说明(3.1)式成立,只要说明Lindeberg条件满足即可,即对 \forall\eta>0 ,有

\begin{equation} \sum\limits_{t = 1}^n{\textsf{E}}\big(\epsilon_{nt}^2I\{|\epsilon_{nt}|>\eta\}|\digamma_{n, t-1}\big) = o_p(1). \end{equation}
(3.5)

接下来我们证明(3.5)式成立.对 \forall\eta>0 ,我们有

\begin{eqnarray*} \sum\limits_{t = 1}^n{\textsf{E}}\big(\epsilon_{nt}^2I\{|\epsilon_{nt}|>\eta\}|\digamma_{n, t-1}\big) = \frac{1}{n}\sum\limits_{t = 1}^n(w_t{\bf b}Y_{t, \theta_0})^2{\textsf{E}}\big(\psi^2(\epsilon_t(\theta_0))I\{|\epsilon_{nt}|>\eta\}|\digamma_{n, t-1}\big). \end{eqnarray*}

因此,为证(3.5)式成立只要说明

\begin{equation} \max\limits_{1\leq t\leq n}{\textsf{E}}\big(\psi^2(\epsilon_t(\theta_0))I\{|\epsilon_{nt}|>\eta\}|\digamma_{n, t-1}\big) = o_p(1) \end{equation}
(3.6)

成立即可.

我们注意到对任意的 M>0

\begin{eqnarray*} I(|\epsilon_{nt}|>\eta)\leq I(|\psi(\epsilon_{t}(\theta_0))|>\eta M)+I\left(\frac {|w_t{\bf b}Y_{t, \theta_0}|}{\sqrt{n}}>\frac{1}{M}\right), \end{eqnarray*}

且在 \theta = \theta_0 的条件下所得的 \epsilon_{t}(\theta_0) 即为前面所述的 \epsilon_t .因此,对于任意 M>0 ,当 1\leq t \leq n 时,有

\begin{eqnarray} &&{\textsf{E}}\big(\psi^2(\epsilon_t(\theta_0))I\{|\epsilon_{nt}|>\eta\}\Big|\digamma_{n, t-1}\big){} \\ &\leq&{\textsf{E}}\Big(\psi^2(\epsilon_t(\theta_0))I(|\psi(\epsilon_{t}(\theta_0))|>\eta M)\Big|\digamma_{n, t-1}\Big)+{\textsf{E}}\Big(\psi^2(\epsilon_t(\theta_0))I\Big(\frac {|w_t{\bf b}Y_{t, \theta_0}|}{\sqrt{n}}>\frac 1M\Big)\Big|\digamma_{n, t-1}\Big){} \\ &\le&{\textsf{E}}(\psi^2(\epsilon_1)I(|\psi(\epsilon_1)|>\eta M))+\tau^2\max\limits_{1\leq t \leq n}I\Big(\frac {|w_t{\bf b}Y_{t, \theta_0}|}{\sqrt{n}}>\frac 1M\Big){} \\ &\le&{\textsf{E}}(\psi^2(\epsilon_1)I(|\psi(\epsilon_1)|>\eta M))+\tau^2I\Big(\max\limits_{1\leq t \leq n}\frac {|w_t{\bf b}Y_{t, \theta_0}|}{\sqrt{n}}>\frac 1M\Big).{} \end{eqnarray}

从而可得

\begin{eqnarray*} &&{\textsf{E}}\left(\max\limits_{1\leq t\leq n}{\textsf{E}}\big(\psi^2(\epsilon_t(\theta_0))I\{|\epsilon_{nt}|>\eta\}\Big|\digamma_{n, t-1}\big)\right)\\ &\leq &{\textsf{E}}(\psi^2(\epsilon_1)I(|\psi(\epsilon_1)|>\eta M))+\tau^2{\textsf{P}}\Big(\max\limits_{1\leq t \leq n}\frac {|w_t{\bf b}Y_{t, \theta_0}|}{\sqrt{n}}>\frac 1M\Big). \end{eqnarray*}

{\textsf{E}}\psi^2(\epsilon_1)<\infty 可知,对任意的 \varpi>0 ,存在某个充分大的 M = M(\varpi) 使得

\begin{eqnarray*} {\textsf{E}}(\psi^2(\epsilon_1)I(|\psi(\epsilon_1)|>\eta M))<\varpi. \end{eqnarray*}

同时,由(3.2)式以及平稳遍历性可知 \max\limits_{1\leq t \leq n}\frac {|w_t{\bf b}Y_{t, \theta_0}|^2}{n}\stackrel{p}{\to}0. 这也就意味着

\begin{eqnarray*} \limsup\limits_{n\rightarrow\infty}{\textsf{E}}\left(\max\limits_{1\leq t\leq n}{\textsf{E}}\big(\psi^2(\epsilon_t(\theta_0))I\{|\epsilon_{nt}|>\eta\} \Big|\digamma_{n, t-1}\big)\right)\leq\varpi, \end{eqnarray*}

再结合 \varpi 的任意性即得(3.5)式成立.

接下来开始定理1.1的证明.

  令 \hat{\nu} = \sqrt{n}\big(\hat{\theta}_{SM}-\theta_0\big). 显然, \hat{\nu}^T 是下式的极小化解

\begin{equation} Z_n(\nu): = \sum\limits_{t = 1}^nw_t\bigg(\rho\Big(x_t-f\big(x_{t-1}, x_{t-2}, \cdots, x_{t-p}, \theta_0 +n^{-\frac{1}{2}}\nu\big)\Big)-\rho(\epsilon_{t}(\theta_0))\bigg). \end{equation}
(3.7)

Z_n^*(\nu) = \sum\limits_{t = 1}^nw_t\bigg(\rho\big(\epsilon_{t}(\theta_0)-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}\big) -\rho(\epsilon_{t}(\theta_0))\bigg),

R_n = n^{-\frac{1}{2}}\bigg(\sum\limits_{t = 1}^nw_tY_{t, \theta_0}\psi(\epsilon_{t}(\theta_0))\bigg) , \; \xi_t(\nu) = w_t\int_0^{-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}}\{\psi(\epsilon_{t}(\theta_0)+s) -\psi(\epsilon_{t}(\theta_0))\}{\rm d}s.

于是我们可以得到

\begin{eqnarray*} Z_n^*(\nu)& = &-\nu^TR_n+\sum\limits_{t = 1}^n\xi_t(\nu)\\ & = &-\nu^TR_n+\sum\limits_{t = 1}^n{\textsf{E}}(\xi_t(\nu)|\digamma_{n, t-1})+\sum\limits_{t = 1}^n\Big(\xi_t(\nu)-{\textsf{E}}(\xi_t(\nu)|\digamma_{n, t-1}) \Big). \end{eqnarray*}

由假设条件(A4)可得

\begin{eqnarray*} \sum\limits_{t = 1}^n{\textsf{E}}(\xi_t(\nu)|\digamma_{n, t-1}) & = &\sum\limits_{t = 1}^nw_t\int_0^{-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}}{\textsf{E}}\psi(\epsilon_t(\theta_0)+s\big){\rm d}s\\ & = &\sum\limits_{t = 1}^nw_t\int_0^{-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}}\lambda s(1+o(1)){\rm d}s\\ & = &\frac{\lambda}{2}\nu^T\bigg(\frac{1}{n}\sum\limits_{t = 1}^nw_tY_{t, \theta_0} Y_{t, \theta_0}^T\bigg)\nu+o_p(1). \end{eqnarray*}

由于 \sum\limits_{t = 1}^n\big(\xi_t(\nu)-{\textsf{E}}(\xi_t(\nu)|\digamma_{n, t-1})\big) 是一鞅差,且由Cauchy-Schwartz不等式可得

\begin{eqnarray*} \sum\limits_{t = 1}^n{\textsf{E}}(\xi_t^2(\nu)|\digamma_{n, t-1}) &\leq&\sum\limits_{t = 1}^nw_t^2|{n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}}|\bigg| \int_0^{-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0}}{\textsf{E}}\Big(\psi(\epsilon_t(\theta_0)+s)-\psi(\epsilon_t(\theta_0))\Big)^2{\rm d}s\bigg|\\ & = &\nu^T\bigg(\frac{1}{n}\sum\limits_{t = 1}^nw_t^2Y_{t, \theta_0}Y_{t, \theta_0}^T\bigg)\nu\cdot o(1), \end{eqnarray*}

故结合(3.3)式可得 \sum\limits_{t = 1}^n\big(\xi_t(\nu)-{\textsf{E}}(\xi_t(\nu)|\digamma_{n, t-1})\big) = o_p(1), 再结合(3.4)式和引理3.2即有

Z_n^*(\nu)\stackrel{d}{\longrightarrow}-\nu^TR+\frac{\lambda}{2}\nu^T\Sigma\nu = :Z(\nu).

Z_n^{**}(\nu) = \sum\limits_{t = 1}^nw_t\Big(\rho\Big(\epsilon_{t}(\theta_0)-n^{-\frac{1}{2}}\nu^TY_{t, \theta_0} -\frac{1}{2}n^{-1}\nu^TH_t(\theta_0)\nu\Big)-\rho(\epsilon_{t}(\theta_0))\Big),

{则由假设条件(A6)以及上述证明过程可知, Z_n^{**}(\nu) Z_n^*(\nu) 有相同的极限,所以在 C({\mathbb R}^q) 中有 Z_n^{**}(\nu)\stackrel{d}{\longrightarrow}Z(\nu) .同时,由 \psi 的有界可得

|Z_n(\nu)-Z_n^{**}(\nu)|\leq K\sum\limits_{t = 1}^nn^{-1}|\nu^T\big(H_t(\theta_0)-H_t(\theta^*)\big)\nu|,

其中 \theta^* \theta_0 \theta_0+n^{-\frac{1}{2}}\nu 之间的某一向量.}显然, \theta^*\stackrel{p}\to\theta_0 ,从而由假设条件(A3)可知,对任意给定的 \nu , Z_n(\nu)-Z_n^{**}(\nu)\stackrel{p}\longrightarrow0 ,即在 C({\mathbb R}^q) 中有 Z_n(\nu)\stackrel{d}\longrightarrow Z(\nu) .显然, Z(\nu) \frac{1}{\lambda} \Sigma^{-1}R 处有唯一的最小值.由引理3.1, Z_n(\nu) 存在局部极小值序列 \hat{\nu}^T 且满足

\hat{\nu}^T \stackrel{d}{\longrightarrow}\frac{1}{\lambda} \Sigma^{-1}R\sim N_{q}\bigg(0, \frac{\tau^2}{\lambda^2}\Sigma^{-1}\Xi\Sigma^{-1}\bigg).

定理1.1证毕.

参考文献

Tong H. Non-linear Time Series:A Dynamical Systems Approach. Oxford:Oxford University Press, 1990

[本文引用: 1]

Fan J, Yao Q. Nonlinear Time Series:Nonparametric and Parametric Methods. Berlin:Springer, 2003

[本文引用: 1]

金阳, 安鸿志.

带有重尾扰动项的非线性自回归模型

中国科学, 2005, 35 (1): 39- 45

URL     [本文引用: 2]

Jin Y , An H .

Nonlinear autoregressive models with heavy-tailed innovation

Sci China Ser A Math, 2005, 35 (1): 39- 45

URL     [本文引用: 2]

金阳, 安鸿志.

非线性自回归序列的矩的存在性

应用数学学报, 2006, 29 (1): 1- 8

URL     [本文引用: 1]

Jin Y , An H .

Existence of moment for the nonlinear autoregressive series

Acta Math Appl Sinica, 2006, 29 (1): 1- 8

URL     [本文引用: 1]

张韧, 张绍义.

非线性自回归序列的平稳解及其矩的存在性

数学物理学报, 2013, 33 (2): 260- 266

DOI:10.3969/j.issn.1003-3998.2013.02.009      [本文引用: 1]

Zhang R , Zhang S .

Stochastic stability for the nonlinear autoregressive series

Acta Math Sci, 2013, 33A (2): 260- 266

DOI:10.3969/j.issn.1003-3998.2013.02.009      [本文引用: 1]

周杰, 刘三阳, 张正策.

非线性自回归序列L1估计的渐近分布

高校应用数学学报, 2007, 22 (4): 427- 432

DOI:10.3969/j.issn.1000-4424.2007.04.008      [本文引用: 1]

Zhou J , Liu S , Zhang Z .

Asymptotical distribution of L1-estimator for nonlinear autoregression

Appl Math J Chinese Univ Ser A, 2007, 22 (4): 427- 432

DOI:10.3969/j.issn.1000-4424.2007.04.008      [本文引用: 1]

周杰, 刘三阳, 张正策.

方差无穷非线性自回归序列的自加权L1估计

高校应用数学学报, 2008, 23 (2): 193- 199

DOI:10.3969/j.issn.1000-4424.2008.02.010      [本文引用: 2]

Zhou J , Liu S , Zhang Z .

Self-weighted L1-estimator for infinite variance nonlinear autoregressive model

Appl Math J Chinese Univ Ser A, 2008, 23 (2): 193- 199

DOI:10.3969/j.issn.1000-4424.2008.02.010      [本文引用: 2]

Cheng F , Sun S .

A goodness-of-fit test of the errors in nonlinear autoregressive time series models

Stat Prob Lett, 2008, 78 (1): 50- 59

DOI:10.1016/j.spl.2007.05.003      [本文引用: 1]

Fu K , Yang X .

Asymptotics of kernel error density estimators in nonlinear autoregressive models

J Math Chem, 2008, 44 (3): 831- 838

DOI:10.1007/s10910-008-9379-2      [本文引用: 1]

Cheng F .

Global property of error density estimation in nonlinear autoregressive time series models

Stat Infer Stoch Proc, 2010, 13 (1): 43- 53

DOI:10.1007/s11203-009-9036-9      [本文引用: 1]

Li J .

Asymptotics of the Lp-norms of density estimators in the nonlinear autoregressive models

Commun Stat-Theo Meth, 2014, 43 (22): 4845- 4855

DOI:10.1080/03610926.2012.724503      [本文引用: 1]

Cheng F .

Variance estimation in nonlinear autoregressive time series models

J Stat Plan Infer, 2011, 141 (4): 1588- 1592

DOI:10.1016/j.jspi.2010.11.010      [本文引用: 1]

Koenker R , Bassett G .

Regression quantiles

Econometrica, 1978, 46, 33- 49

DOI:10.2307/1913643      [本文引用: 1]

Ling S .

Self-weighted least absolute deviation estimation for infinite variance autoregressive models

J R Stat Soc B, 2005, 67 (3): 381- 393

DOI:10.1111/j.1467-9868.2005.00507.x      [本文引用: 1]

Huber P .

Robust regression:asymptotics, conjectures and monte carlo

Ann Stat, 1973, 1 (5): 799- 821

DOI:10.1214/aos/1176342503      [本文引用: 1]

Yohai V .

High breakdown-point and high efficiency robust estimates for regression

Ann Stat, 1987, 15 (2): 642- 656

DOI:10.1214/aos/1176350366      [本文引用: 1]

Davis R A , Knight K , Liu J .

M-estimaton for autoregressions with infinite variance

Stoch Proc Appl, 1992, 40, 145- 180

DOI:10.1016/0304-4149(92)90142-D      [本文引用: 1]

/