Processing math: 1%

数学物理学报, 2022, 42(1): 269-281 doi:

论文

双定数混合截尾下两参数Pareto分布的统计分析

龙兵,1, 张忠占2

1 荆楚理工学院数理学院 湖北荆门 448000

2 北京工业大学理学部 北京 100124

Statistical Analysis of Two-Parameter Pareto Distribution Under Double Type-Ⅱ Hybrid Censoring Scheme

Long Bing,1, Zhang Zhongzhan2

1 School of Mathematics and Physics, Jingchu University of Technology, Hubei Jingmen 448000

2 Faculty of Science, Beijing University of Technology, Beijing 100124

通讯作者: 龙兵, E-mail: qh-longbing@163.com

收稿日期: 2020-01-11  

基金资助: 国家自然科学基金.  11771032
荆楚理工学院科研团队项目.  TD202006

Received: 2020-01-11  

Fund supported: the NSFC.  11771032
the Research Team Project of Jingchu University of Technology.  TD202006

Abstract

On the basis of the traditional type-Ⅰ and type-Ⅱ censoring tests, a new type of censoring test scheme, double type-Ⅱ hybrid censoring, is proposed for the first time in this paper. Based on this kind of censored data, the maximum likelihood estimates of the parameters and confidence interval of θ are obtained for two-parameter Pareto distribution. The Bayesian estimates of θ, reliability function and failure rate function under three different loss functions are obtained when α is known and the Gamma prior distribution is selected. When both α and θ are unknown, we take the noninformation prior distribution and exponential prior distribution respectively, and calculate the Bayesian estimates of α and θ, the reliability function and failure rate function under the squared loss function. The Monte-Carlo method is used to simulate double type-Ⅱ hybrid censored samples, the estimates of the parameter and reliability indexes for two-parameter Pareto distribution are obtained. The relative errors are calculated, and the accuracy of various estimates is compared. Finally, a numerical example is analyzed.

Keywords: Two-parameter Pareto distribution ; Double type-Ⅱ hybrid censoring ; Maximum likelihood estimate ; Prior distribution ; Bayesian estimate

PDF (416KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

龙兵, 张忠占. 双定数混合截尾下两参数Pareto分布的统计分析. 数学物理学报[J], 2022, 42(1): 269-281 doi:

Long Bing, Zhang Zhongzhan. Statistical Analysis of Two-Parameter Pareto Distribution Under Double Type-Ⅱ Hybrid Censoring Scheme. Acta Mathematica Scientia[J], 2022, 42(1): 269-281 doi:

1 引言

寿命数据的统计分析在医学、工程学、生物学等许多领域中有着广泛应用. 上世纪五十年代, 为了提高工业产品的寿命, 很多统计学家开始分析各种类型的寿命数据. 其中, 通过截尾获得试验数据是一种经常采用的方法, 在生存分析、可靠性分析等领域中经常遇到这类数据. 传统的定时截尾、定数截尾以及逐步增加的定数截尾这三类截尾数据, 很多统计学家己经广泛研究过, 有比较成熟的理论和方法, 目前的研究成果较多, 如文献[1-8]. 2009年, Wu和Kus[9]提出了逐步增加首失效截尾寿命试验方案, 后来受到很多统计学家的重视, 目前已经产生了很多基于这类截尾数据的研究成果, 如文献[9-13]. 随着实际的需要, 结合定时截尾和定数截尾各自的优点产生了混合Ⅰ型截尾试验和混合Ⅱ型截尾试验. 如果在0时刻把n个样品投入到寿命试验中, Xr:n表示第r个元件的失效时刻, T表示指定的截尾时刻, 混合Ⅰ型截尾试验选择的终止时刻为T1=min, 混合Ⅱ型截尾试验选择的终止时刻为 T_2^\ast=\max(X_{r:n}, T) , 基于这两类截尾试验数据进行统计推断的相关研究成果如文献[14-17]. 无论是混合Ⅰ型截尾还是混合Ⅱ型截尾都是一个定时截尾试验方案和一个定数截尾试验方案的混合. 实际上, 在定数截尾试验中, 如果在达到预先确定的失效样品数时, 进行的寿命试验没有达到规定的时间, 为了更多地了解产品的性能和提高估计的精度, 可以考虑继续进行试验重新确定样品的失效数. 因此在本文中首次提出了一种新的寿命试验方案, 即两个定数截尾试验方案的混合, 在这里被称为双定数混合截尾试验, 具体的方案将在第2节中介绍.

两参数Pareto分布被提出来后主要用来分析社会经济和自然现象, 后来该分布被应用到生存分析和可靠性理论中. 该分布的分布函数和概率密度函数分别为

\begin{equation} F(x;\alpha, \theta)=1-\alpha^{\theta}x^{-\theta}, \quad f(x;\alpha, \theta)=\theta\alpha^{\theta}x^{-(\theta+1)}, \quad x\geq\alpha, \end{equation}
(2.1)

X 表示产品的寿命, 则可靠度函数和失效率函数分别为

\begin{equation} R(x)=\alpha^{\theta}x^{-\theta}, \quad H(x)=\theta x^{-1}, \end{equation}
(2.2)

其中(1.1)–(1.2)式中的 \alpha(>0) , \theta(>0) 分别被称为尺度参数和形状参数.

本文假设受试元件的寿命服从两参数Pareto分布(1.1), 基于双定数混合截尾试验数据对未知参数、可靠度函数以及失效率函数进行统计分析.

2 模型描述

在可靠性试验中双定数混合截尾就是两个定数截尾方案的混合, 其模型描述如下:假设把 n 个独立同分布的元件投入试验, 事先确定时刻 t_0 以及正整数 m_1, m_2 , 且满足 m_1<m_2\leq n . 记第 m_1 个元件的失效时刻为 X_{m_1:n} , 若 X_{m_1:n}\geq t_0 , 则试验在 X_{m_1:n} 时刻停止, 没有失效的 n-m_1 个元件退出试验, 其中 0<X_{1:n}\leq X_{2:n}\leq\cdots\leq X_{m_1:n} 为次序失效时刻; 如果 X_{m_1:n}<t_0 , 则试验继续进行到有 m_2 个元件失效后停止, 没有失效的 n-m_2 个元件退出试验, 其中 0<X_{1:n}\leq X_{2:n}\leq\cdots\leq X_{m_2:n} 为次序失效时刻. 从上面的描述可以看出, 该模型实际上就是在两个定数截尾方案之间的一种随机选择.

在本文中把上述两种情形分别表示为Case Ⅰ和Case Ⅱ, 并且称其为双定数混合截尾试验, 从而得到如下的观测数据

\begin{gathered}{\rm Case I}: \left(X_{1: n}, X_{2: n}, \cdots, X_{m_{1}: n}\right), \quad 若 X_{m_{1}: n} \geq t_{0};\\{\rm Case II}: \left(X_{1: n}, X_{2: n}, \cdots, X_{m_{2}: n}\right), \quad 若 X_{m_{1}: n}<t_{0} .\end{gathered}

3 极大似然估计与区间估计

根据第2节中的寿命试验模型, 下面用极大似然法求两参数Pareto分布中未知参数 \alpha \theta 的估计.

k=\left\{\begin{array}{ll} m_1, & {\rm{Case \; I}}, \\ m_2, & {\rm{Case \; II}}, \end{array}\right.\qquad t=\left\{\begin{array}{ll} X_{m_1:n}, & {\rm{Case \; I}}, \\ X_{m_2:n}, & {\rm{Case \; II}}, \end{array}\right.

并设双定数混合截尾试验所得观测数据为 x^*=\bigl(x_{1:n}, x_{2:n}, \cdots, x_{k:n}\bigr) .

基于上述观测数据, 省略与未知参数无关的常量, 则似然函数可以表示为

\begin{eqnarray} L(\alpha, \theta)&=&\prod\limits_{i=1}^{k}f(x_{i:n})[1-F(t)]^{n-k}I(x_{1:n}\geq\alpha) {} \\ &=&\theta^k\alpha^{n\theta}\prod\limits_{i=1}^{k}x_{i:n}^{-(\theta+1)}t^{-(n-k)\theta}I(x_{1:n}\geq\alpha). \end{eqnarray}
(3.1)

可以求得参数 \theta \alpha 的极大似然估计分别为

\hat{\theta}=\frac{k}{\sum\limits_{i=1}^k \ln x_{i:n}+(n-k)\ln t-n\ln x_{1:n}}, \qquad \hat{\alpha}=x_{1:n}.

\alpha 已知时, 根据似然函数(3.1)式可以得到

\frac{{\rm d}\ln L(\theta)}{{\rm d}\theta}=\frac{k}{\theta}+n\ln\alpha-\sum\limits_{i=1}^k\ln x_{i:n}-(n-k)\ln t,

则参数 \theta 的极大似然估计为

\hat{\theta}_M=\frac{k}{\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln\alpha}.

根据极大似然估计的不变性, 可靠度函数 R(x) 和失效率函数 H(x) 的极大似然估计分别为

\hat{R}(x)=\alpha^{\hat{\theta}_M}x^{-\hat{\theta}_M}, \quad\hat{H}(x)=\hat{\theta}_M x^{-1}.

Y=\ln X-\ln \alpha , 不难得到 Y 的概率密度函数为

\begin{eqnarray} f_Y(y)=\theta e^{-\theta y}, \; y\geq0. \end{eqnarray}
(3.2)

从(3.2)式可以看出 Y 服从均值为 1/\theta 的指数分布, 即 Y\sim\exp(\theta) .

引理3.1[18]  假设总体 Y\sim\exp(\theta) , Y_{1:n}, Y_{2:n}, \cdots, Y_{r:n} 为来自总体 Y 的前 r 个次序统计量, 令 T=\sum\limits_{i=1}^rY_{i:n}+(n-r)Y_{r:n} , 则 2\theta T\sim\chi^2(2r) .

对于双定数混合截尾样本 X_{1:n}, X_{2:n}, \cdots, X_{k:n} , 令 Y_{i:n}=\ln X_{i:n}-\ln\alpha(i=1, 2, \cdots, k) , 则 Y_{1:n}, Y_{2:n}, \cdots, Y_{k:n} 就是来自指数分布总体 \exp(\theta) 的前 k 个次序统计量, 根据引理3.1可得

2\theta\biggl[\sum\limits_{i=1}^kY_{i:n}+(n-k)Y_{k:n}\biggr]\sim\chi^2(2k),

2\theta\biggl[\sum\limits_{i=1}^k\ln X_{i:n}+(n-k)\ln X_{k:n}-n\ln\alpha\biggr]\sim\chi^2(2k).

因此, 当 \alpha 已知时参数 \theta 的置信水平为100(1- \gamma )%的置信区间为 (\theta_L, \theta_U) , 其中

\begin{eqnarray} \theta_L=\frac{\chi_{\gamma/2}^2(2k)}{2\bigl[\sum\limits_{i=1}^k\ln X_{i:n}+(n-k)\ln X_{k:n}-n\ln\alpha\bigr]}, \\ \; \theta_U=\frac{\chi_{1-\gamma/2}^2(2k)}{2\bigl[\sum\limits_{i=1}^k\ln X_{i:n}+(n-k)\ln X_{k:n}-n\ln\alpha\bigr]}, \end{eqnarray}

这里 \chi_{\gamma/2}^2(2k) , \chi_{1-\gamma/2}^2(2k) 分别表示自由度为 2k 的卡方分布下 \gamma/2 分位数和下 1-\gamma/2 分位数.

由于可靠度函数和失效率函数关于 \theta 分别是单调递减和递增的, 因此当 \alpha 已知时可靠度函数 R(x) 和失效率函数 H(x) 的置信水平为100(1- \gamma )%的置信区间分别为

\begin{eqnarray} \biggl(\bigl(\frac{\alpha}{x}\bigr)^{\theta_U}, \bigl(\frac{\alpha}{x}\bigr)^{\theta_L}\biggr)\quad \biggl(\frac{\theta_L}{x}, \frac{\theta_U}{x}\biggr). \end{eqnarray}

4 α已知时的Bayes估计

\theta 的先验分布为Gamma分布, 其概率密度函数为

\begin{eqnarray} \pi(\theta)=\frac{b^a}{\Gamma(a)}\theta^{a-1}e^{-b\theta}, \quad \theta>0, \end{eqnarray}
(4.1)

这里超参数 a>0, b>0 , \Gamma(\cdot) 表示Gamma函数.

\alpha 已知时, 由(3.1)和(4.1)式, 根据Bayes公式可得到 \theta 的后验密度函数为

\begin{eqnarray} \pi(\theta|x^*)=\frac{(A+b)^{k+a}}{\Gamma(k+a)}\theta^{k+a-1}e^{-\theta(A+b)}, \quad \theta>0, \end{eqnarray}
(4.2)

其中 A=\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln\alpha .

引理4.1[19]  设 x^*=\bigl(x_{1:n}, x_{2:n}, \cdots, x_{k:n}\bigr) 为来自某总体的双定数混合截尾数据, \theta 为其未知参数, 则有

\rm (i) 在平方损失函数 L_1(\theta, \delta)=(\theta-\delta)^2 下, \theta 的Bayes估计为 \hat{\theta}_{B1}=E(\theta\mid x^*) .

\rm (ii) 在Linex损失函数 L_2(\theta, \delta)=e^{c(\delta-\theta)}-c(\delta-\theta)-1, (c\neq 0) 下, \theta 的Bayes估计为

\hat{\theta}_{B2}=-\frac{1}{c}\ln[E(e^{-c\theta}\mid x^*)].

\rm (iii) 在广义熵损失函数 L_3(\theta, \delta)\propto \bigl(\frac{\delta}{\theta}\bigr)^q-q\ln\bigl(\, \frac{\delta}{\theta}\, \bigr)-1 下, \theta 的Bayes估计为

\hat{\theta}_{B3}=[E(\theta^{-q}\mid x^*)]^{-1/q},

这里 \delta 是未知参数 \theta 的一个估计.

Linex损失和广义熵损失函数都是非对称损失函数, 过高估计和过低估计带来的损失是不一样的. 从引理4.1可以看出:对于Linex损失函数, 当 c<0 时, 过低估计的损失大于过高估计的损失, 当 c>0 时, 正好相反; 对于广义熵损失函数, 当 q>0 时, 过高估计的损失大于过低估计的损失, 当 q<0 时, 正好相反.

定理4.1  设 x^*=(x_{1:n}, x_{2:n}, \cdots, x_{k:n}) 为来自两参数Pareto分布 (1.1) 的双定数混合截尾数据, 当 \alpha 已知时, 若 \theta 的先验分布由 (4.1) 式给出, 则有下列结论

\rm (i) 在平方损失函数下, \theta 的Bayes估计为

\hat{\theta}_{B1}=\frac{k+a}{A+b}.

\rm (ii) c>-(A+b) 时, 在Linex损失函数下 \theta 的Bayes估计为

\hat{\theta}_{B2}=\frac{k+a}{c}\ln\biggl(1+\frac{c}{A+b}\biggr).

\rm (iii) q<k+a 时, 在广义熵损失函数下 \theta 的Bayes估计为

\hat{\theta}_{B3}=\biggl[\frac{\Gamma(k+a)}{\Gamma(k+a-q)}\biggr]^{1/q}(A+b)^{-1},

其中 A=\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln\alpha .

  (i)在平方损失函数下, \theta 的Bayes估计为其后验分布的均值, 因此

\hat{\theta}_{B1}=\int_0^{+\infty}\theta\pi(\theta\mid x^*){\rm d}\theta= \frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a}e^{-\theta(A+b)}{\rm d}\theta =\frac{k+a}{A+b}.

(ii)

\begin{eqnarray} E(e^{-c\theta}\mid x^*)&=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-1}e^{-\theta(A+b+c)}{\rm d}\theta \\ &=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\cdot \frac{\Gamma(k+a)}{(A+b+c)^{k+a}}=\frac{(A+b)^{k+a}}{(A+b+c)^{k+a}}, \end{eqnarray}

因此在Linex损失函数下, \theta 的Bayes估计为

\hat{\theta}_{B2}=-\frac{1}{c}\ln\biggl[\frac{(A+b)^{k+a}}{(A+b+c)^{k+a}}\biggr]=\frac{k+a}{c}\ln\biggl(1+\frac{c}{A+b}\biggr) .

(iii)

\begin{eqnarray} E(\theta^{-q}\mid x^*)&=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-q-1}e^{-\theta(A+b)}{\rm d}\theta \\ &=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\cdot \frac{\Gamma(k+a-q)}{(A+b)^{k+a-q}}=\frac{\Gamma(k+a-q)(A+b)^{q}}{\Gamma{(k+a)}}, \end{eqnarray}

因此在广义熵损失函数下, \theta 的Bayes估计为

\hat{\theta}_{B3}=\biggl[\frac{\Gamma(k+a-q)(A+b)^{q}}{\Gamma{(k+a)}}\biggr]^{-1/q}=\biggl[\frac{\Gamma(k+a)}{\Gamma{(k+a-q)}}\biggr]^{1/q}(A+b)^{-1}.

定理4.1得证.

利用定理4.1的结论, 要得到参数 \theta 的Bayes估计值就需要确定超参数 a, b 的值. 如果没有先验信息可以利用, 为了得到较稳健的Bayes估计可以考虑求参数 \theta 的E-Bayes估计. 根据文献[20]中关于E-Bayes估计的定义, 需要利用超参数 a, b 的先验密度函数并对 \theta 的Bayes估计再求一次数学期望.

根据文献[20]的研究成果, 可取超参数 a, b 的联合先验密度函数为

\pi(a, b)=\frac{1}{s}, 0<a<1, \; 0<b<s.

因此在平方损失函数下, \theta 的E-Bayes估计为

\begin{eqnarray} \hat{\theta}_{EB1}=\int_0^1\int_0^s\hat{\theta}_{B1}\pi(a, b){\rm d}b{\rm d}a =\frac{1}{s}(k+\frac{1}{2})\ln(1+\frac{s}{A}). \end{eqnarray}

c>-A 时, 在Linex损失函数下 \theta 的E-Bayes估计为

\begin{eqnarray} \hat{\theta}_{EB2}&=&\int_0^1\int_0^s\hat{\theta}_{B2}\pi(a, b){\rm d}b{\rm d}a =\frac{1}{cs}\int_0^1(k+a){\rm d}a\int_0^s\ln(1+\frac{c}{A+b}){\rm d}b\\ &=&\frac{1}{cs}(k+\frac{1}{2})\bigl[(A+s+c)\ln(A+s+c)-(A+c)\ln(A+c)\\ &&-(A+s)\ln(A+s)+A\ln A\bigr]. \end{eqnarray}

q<k 时, 在广义熵损失函数下 \theta 的E-Bayes估计为

\begin{eqnarray} \hat{\theta}_{EB3}&=&\int_0^1\int_0^s\hat{\theta}_{B3}\pi(a, b){\rm d}b{\rm d}a =\frac{1}{s}\int_0^1\biggl[\frac{\Gamma(k+a)}{\Gamma(k+a-q)}\biggr]^{1/q}{\rm d}a\int_0^s\frac{1}{A+b}{\rm d}b\\ &=&\frac{1}{s}\ln(1+\frac{s}{A})\int_0^1\biggl[\frac{\Gamma(k+a)}{\Gamma(k+a-q)}\biggr]^{1/q}{\rm d}a. \end{eqnarray}

定理4.2  设 x^*=(x_{1:n}, x_{2:n}, \cdots, x_{k:n}) 为来自两参数Pareto分布 (1.1) 的双定数混合截尾数据, 当 \alpha 已知时, 若 \theta 的先验分布由 (4.1) 式给出, 则有下列结论

\rm (i) 在平方损失函数下, 可靠度函数 R(x) 的Bayes估计为

\hat{R}_{B1}(x)=\frac{(A+b)^{k+a}}{(A+b+\ln x-\ln\alpha)^{k+a}}.

\rm (ii) 在Linex损失函数下, 可靠度函数 R(x) 的Bayes估计为

\hat{R}_{B2}(x)=-\frac{1}{c}\ln\biggl\{(A+b)^{k+a}\sum\limits_{j=0}^{\infty}\frac{(-c)^j}{j!}\bigl[A+b+j(\ln x-\ln\alpha)\bigr]^{-(k+a)} \biggr\}.

\rm (iii) q<\frac{A+b}{\ln x-\ln\alpha} 时, 在广义熵损失函数下可靠度函数 R(x) 的Bayes估计为

\hat{R}_{B3}(x)=\biggl[1+\frac{q(\ln\alpha-\ln x)}{A+b}\biggr]^{\frac{k+a}{q}},

其中 A=\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln\alpha , x>\alpha.

  (i)在平方损失函数下, 可靠度函数 R(x) 的Bayes估计为

\begin{eqnarray} \hat{R}_{B1}(x)&=&\int_0^{+\infty}R(x)\pi(\theta\mid x^*){\rm d}\theta =\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-1}e^{-\theta(A+b+\ln x-\ln\alpha)}{\rm d}\theta\\ &=&\frac{(A+b)^{k+a}}{(A+b+\ln x-\ln\alpha)^{k+a}}. \end{eqnarray}

(ii)

\begin{eqnarray} E\bigl[e^{-cR(x)}\mid x^*\bigr]&=&\int_0^{+\infty}e^{-cR(x)}\pi(\theta\mid x^*){\rm d}\theta\\ &=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\sum\limits_{j=0}^{\infty}\frac{(-c)^j}{j!}\int_0^{+\infty}\theta^{k+a-1}e^{-\theta[A+b+j(\ln x-\ln\alpha)]}{\rm d}\theta \\ &=&(A+b)^{k+a}\sum\limits_{j=0}^{\infty}\frac{(-c)^j}{j!}\bigl[A+b+j(\ln x-\ln\alpha)\bigr]^{-(k+a)}, \end{eqnarray}

因此在Linex损失函数下, 可靠度函数 R(x) 的Bayes估计为

\begin{eqnarray} \hat{R}_{B2}(x)&=&-\frac{1}{c}\ln\bigl\{E[e^{-cR(x)}\mid x^*]\bigr\}\\ &=&-\frac{1}{c}\ln\biggl\{(A+b)^{k+a}\sum\limits_{j=0}^{\infty}\frac{(-c)^j}{j!}\bigl[A+b+j(\ln x-\ln\alpha)\bigr]^{-(k+a)} \biggr\}. \end{eqnarray}

(iii)

\begin{eqnarray} E[R^{-q}(x)\mid x^*]&=&\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-1} e^{-\theta[A+b+q(\ln\alpha-\ln x)]}{\rm d}\theta \\ &=&\frac{(A+b)^{k+a}}{[A+b+q(\ln\alpha-\ln x)]^{k+a}}, \end{eqnarray}

因此在广义熵损失函数下, 可靠度函数 R(x) 的Bayes估计为

\hat{R}_{B3}(x)=[E(R^{-q}(x)\mid x^*)]^{-1/q}=\biggl[1+\frac{q(\ln\alpha-\ln x)}{A+b}\biggr]^{\frac{k+a}{q}}.

定理4.2证毕.

定理4.3  设 x^*=(x_{1:n}, x_{2:n}, \cdots, x_{k:n}) 为来自两参数Pareto分布 (1.1) 的双定数混合截尾数据, 当 \alpha 已知时, 若 \theta 的先验分布由 (4.1) 式给出, 则有下列结论

\rm (i) 在平方损失函数下, 失效率函数 H(x) 的Bayes估计为

\hat{H}_{B1}(x)=\frac{k+a}{(A+b)x}.

\rm (ii) c>-(A+b)x 时, 在Linex损失函数下失效率函数 H(x) 的Bayes估计为

\hat{H}_{B2}(x)=\frac{k+a}{c}\ln\biggl(1+\frac{cx^{-1}}{A+b}\biggr).

\rm (iii) q<k+a 时, 在广义熵损失函数下失效率函数 H(x) 的Bayes估计为

\hat{H}_{B3}(x)=\biggl[\frac{\Gamma(k+a)}{\Gamma(k+a-q)}\biggr]^{1/q}(A+b)^{-1}x^{-1}.

其中 A=\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln\alpha , x>\alpha.

  (i)

\hat{H}_{B1}(x)=x^{-1}\int_0^{+\infty}\theta\pi(\theta\mid x^*){\rm d}\theta=\frac{k+a}{(A+b)x}.

(ii)

E\bigl[e^{-cH(x)}\mid x^*\bigr]=\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-1}e^{-\theta(A+b+cx^{-1})}{\rm d}\theta= \frac{(A+b)^{k+a}}{(A+b+cx^{-1})^{k+a}},

\hat{H}_{B2}(x)=-\frac{1}{c}\ln\biggl\{E\bigl[e^{-cH(x)}\mid x^*\bigr]\biggr\}=\frac{k+a}{c}\ln\biggl(1+\frac{cx^{-1}}{A+b}\biggr) .

(iii)

E[H^{-q}(x)\mid x^*]=x^q\frac{(A+b)^{k+a}}{\Gamma(k+a)}\int_0^{+\infty}\theta^{k+a-q-1}e^{-\theta(A+b)}{\rm d}\theta =\frac{\Gamma(k+a-q)(A+b)^q x^q}{\Gamma{(k+a)}},

\hat{H}_{B3}(x)=\biggl[\frac{\Gamma(k+a-q)(A+b)^q x^q}{\Gamma{(k+a)}} \biggr]^{-1/q}=\biggl[\frac{\Gamma(k+a)}{\Gamma(k+a-q)}\biggr]^{1/q}(A+b)^{-1}x^{-1}.

定理4.3证毕.

5 \alpha \theta 都未知时的Bayes估计

取参数 \alpha 的无信息先验分布为 \pi(\alpha)=\frac{1}{\alpha}, \quad \alpha>0.

取参数 \theta 的先验分布为指数分布, 概率密度函数为

\begin{eqnarray} \pi(\theta)=\lambda e^{-\lambda\theta}, \quad \theta>0, \end{eqnarray}
(5.1)

其中超参数 \lambda>0 .

根据Bayes公式可得参数 \alpha , \theta 的联合后验分布为

\begin{eqnarray} \pi(\alpha, \theta\mid x^*)=\frac{n(B+\lambda-n\ln x_{1:n})^{k}}{\Gamma(k)}\theta^{k}\alpha^{n\theta-1}e^{-\theta(B+\lambda)}, \quad 0<\alpha\leq x_{1:n}\; , \theta>0, \end{eqnarray}
(5.2)

其中 B=\sum\limits_{i=1}^{k}\ln x_{i:n}+(n-k)\ln t.

根据(5.2)式可以得到 \theta 的后验分布为Gamma分布, 概率密度函数为

\begin{eqnarray} \pi_1(\theta\mid x^*)=\frac{(B+\lambda-n\ln x_{1:n})^{k}}{\Gamma(k)}\theta^{k-1}e^{-\theta(B+\lambda-n\ln x_{1:n})}, \; \theta>0. \end{eqnarray}
(5.3)

\alpha 的后验密度函数为

\begin{eqnarray} \pi_2(\alpha\mid x^*)=nk(B+\lambda-n\ln x_{1:n})^{k}\alpha^{-1}(B+\lambda-n\ln\alpha)^{-(k+1)}, \; 0<\alpha\leq x_{1:n}. \end{eqnarray}
(5.4)

因此在平方损失函数下, 参数 \theta 的Bayes估计为

\hat{\theta}_B=\int_0^{+\infty}\theta\pi_1(\theta\mid x^*){\rm d}\theta=\frac{k}{B+\lambda-n\ln x_{1:n}}.

在平方损失函数下, 参数 \alpha 的Bayes估计为

\begin{eqnarray} \hat{\alpha}_B=nk(B+\lambda-n\ln x_{1:n})^{k}\int_0^{x_{1:n}}(B+\lambda-n\ln\alpha)^{-(k+1)}{\rm d}\alpha. \end{eqnarray}
(5.5)

由于(5.5)式中的定积分不易求出, 因此 \alpha 的Bayes估计没有显式表达式, 但是可以进行数值计算求出近似值.

下面介绍一种采用随机模拟求参数 \alpha 的Bayes估计的方法.

\theta 给定时, 参数 \alpha 的条件后验分布为

\pi(\alpha\mid \theta, x^*)=\frac{n\theta}{x_{1:n}^{n\theta}}\alpha^{n\theta-1}, \; \; 0<\alpha \leq x_{1:n}.

在平方损失下, \alpha 的Bayes估计为

\begin{eqnarray} \tilde{\alpha}_B=\int_0^{x_{1:n}}\alpha\pi(\alpha\mid \theta, x^*){\rm d}\alpha=\frac{n\theta}{n\theta+1}x_{1:n}. \end{eqnarray}
(5.6)

由于(5.6)式中的 \theta 是未知的, 因此并不能求出具体值, 可以借助 \theta 的后验分布(5.3)式利用统计模拟计算出近似值, 具体步骤如下:

Step 1: 产生 N 个服从Gamma分布(5.3)式的随机数, 记为 \theta^{(1)}, \theta^{(2)}, \cdots, \theta^{(N)} ;

Step 2: 计算出参数 \alpha 的Bayes估计为 \hat{\alpha}_B\approx\frac{1}{N}\sum\limits_{i=1}^{N}\frac{n\theta^{(i)}}{n\theta^{(i)}+1}x_{1:n}.

另外, 在平方损失下, 可靠度函数 R(x) 的Bayes估计为

\begin{eqnarray} \hat{R}_B(x)&=&\int_0^{+\infty}\int_0^{x_{1:n}}\alpha^\theta x^{-\theta}\pi(\alpha\mid \theta, x^*)\pi_1(\theta\mid x^*){\rm d}\alpha {\rm d}\theta\\ &=&\frac{n}{n+1}\cdot\frac{(B+\lambda-n\ln x_{1:n})^{k}}{\Gamma(k)}\int_0^{+\infty}\theta^{k-1}e^{-\theta[B+\lambda+\ln x-(n+1)\ln x_{1:n}]}{\rm d}\theta\\ &=&\frac{n}{n+1}\biggl[\frac{B+\lambda-n\ln x_{1:n}}{B+\lambda+\ln x-(n+1)\ln x_{1:n}}\biggr]^k, \quad x>x_{1:n}. \end{eqnarray}

在平方损失下, 失效率函数 H(x) 的Bayes估计为

\hat{H}_B(x)=\frac{k}{x(B+\lambda-n\ln x_{1:n})}, \; \; x>x_{1:n}.

对于多参数分布总体, 要求出参数及可靠性指标的Bayes估计, 通常要计算较复杂的多重积分, 在很多情况下都没有显式表达式, 可以选择采用Gibbs抽样法、Lindley方法和TK方法求出Bayes估计的近似值. 实际上, 超参数 \lambda 是未知的, 从而导致上述Bayes估计不能得到具体的值, 因此需要确定超参数的值. 本文利用参数的极大似然估计给出超参数 \lambda 的估计. 根据 \theta 的先验分布(5.1)式可得 E(\theta)=1/\lambda , 而 \theta 的极大似然估计为

\hat{\theta}=\frac{k}{\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln x_{1:n}},

\hat{\theta}=1/\lambda , 则可以得到超参数 \lambda 的估计为

\hat{\lambda}=\frac{\sum\limits_{i=1}^k\ln x_{i:n}+(n-k)\ln t-n\ln x_{1:n}}{k}.

6 随机模拟

由于分布函数 F(x;\alpha, \theta)\sim U(0, 1) , 则 1-F(x;\alpha, \theta)\sim U(0, 1) . r_1, r_2, \cdots, r_n 是来自均匀分布 U(0, 1) 的相互独立随机数, 给定参数 \alpha, \theta 的值, 根据直接抽样法, 则 x_i=\alpha r_i^{-1/\theta}, i=1, 2, \cdots, n, 即为来自两参数Pareto分布(1.1)的随机数. 在小样本量( n=20 )、中样本量( n=30 )和大样本量( n=50 )下给定 m_1, m_2, t_0 的值; 若 x_{m_1:n}\geq t_0 , 可以得到定数截尾样本 (x_{1:n}, x_{2:n}, \cdots, x_{m_1:n}) ; 若 x_{m_1:n}<t_0 则得到定数截尾样本 (x_{1:n}, x_{2:n}, \cdots, x_{m_2:n}) . 超参数的值取 (a, b)=(2, 1) 且在损失函数中取 c=1, q=1, 利用所得到的定数截尾样本计算出各种估计值. 以上过程重复10000次, 可以得到各种点估计的均值和平均相对误差(括号中), 其中相对误差的计算公式为 RE(\hat{\beta})=|\hat{\beta}-\beta|/\beta . 模拟计算结果如表 14所示.

表 1   α已知时, θ的估计

n(α, θ)m1m2t0\hat{\theta}_M\hat{\theta}_{B1}\hat{\theta}_{B2}\hat{\theta}_{B3}
20(6, 2)91282.13782.09421.93271.9298
(0.2663)(0.2178)(0.2021)(0.2188)
(7, 3)111693.12692.89872.65402.7132
(0.2270)(0.1880)(0.1951)(0.2026)
30(6, 2)131882.07302.05591.94371.9417
(0.2170)(0.1903)(0.1816)(0.1922)
(7, 3)162393.06432.91362.73202.7799
(0.1851)(0.1640)(0.1696)(0.1742)
50(6, 2)223082.03942.03421.96341.9623
(0.1612)(0.1492)(0.1473)(0.1527)
(7, 3)263993.02822.94152.82562.8588
(0.1465)(0.1366)(0.1393)(0.1418)

新窗口打开| 下载CSV


表 2   α已知时, 可靠度函数R(x)的估计(x=8)

n(α, θ)m1m2t0\hat{R}(x) \hat{R}_{B1}(x)\hat{R}_{B2}(x)\hat{R}_{B3}(x)
20(6, 2)91280.55050.56140.54810.5460
(0.1438)(0.1185)(0.1196)(0.1230)
(7, 3)111690.66280.68480.67920.6783
(0.0891)(0.0767)(0.0769)(0.0761)
30(6, 2)131880.55870.56480.55570.5542
(0.1189)(0.1046)(0.1055)(0.1064)
(7, 3)162390.66630.68140.67810.6767
(0.0743)(0.0670)(0.0671)(0.0667)
50(6, 2)223080.56050.56400.55950.5574
(0.0918)(0.0851)(0.0852)(0.0855)
(7, 3)263990.67010.67890.67740.6760
(0.0574)(0.0545)(0.0546)(0.0542)

新窗口打开| 下载CSV


表 3   α已知时, 失效率函数H(x)的估计(x=8)

n(α, θ)m1m2t0\hat{H}(x) \hat{H}_{B1}(x)\hat{H}_{B2}(x)\hat{H}_{B3}(x)
20(6, 2)91280.26760.26200.25930.2415
(0.2677)(0.2188)(0.2156)(0.2186)
(7, 3)111690.39130.36240.35820.3392
(0.2316)(0.1915)(0.1914)(0.2064)
30(6, 2)131880.25910.25700.25510.2428
(0.2133)(0.1872)(0.1856)(0.1892)
(7, 3)162390.38230.36360.36060.3469
(0.1860)(0.1649)(0.1650)(0.1750)
50(6, 2)223080.25470.25400.25290.2451
(0.1630)(0.1509)(0.1503)(0.1542)
(7, 3)263990.37740.36670.36480.3564
(0.1449)(0.1355)(0.1355)(0.1407)

新窗口打开| 下载CSV


表 4   αθ都未知时的估计

n(α, θ)m1m2t0\hat{\alpha} \hat{\theta}\hat{\alpha}_{B}\hat{\theta}_{B}
20(6, 2)91286.15342.36606.00332.1155
(0.0256)(0.3123)(0.0185)(0.2516)
(7, 3)111697.11793.37247.00123.1045
(0.0168)(0.2500)(0.0122)(0.2174)
30(6, 2)131886.10172.22696.00172.0765
(0.0169)(0.2359)(0.0122)(0.2085)
(7, 3)162397.07843.24267.00063.0715
(0.0112)(0.1992)(0.0082)(0.1830)
50(6, 2)223086.06072.10806.00072.0251
(0.0101)(0.1674)(0.0074)(0.1590)
(7, 3)263997.04743.10857.00073.0146
(0.0068)(0.1466)(0.0050)(0.1425)

新窗口打开| 下载CSV


比较表 14中的平均相对误差可以看出, 各种估计量的Bayes估计都要优于相应的极大似然估计, 特别是在小样本场合Bayes估计的优势更加明显. 随着样本量 n 的增大, 参数及可靠性指标的估计的平均相对误差逐渐减小.

7 数值例子

下面分析文献[21]中第3.1节中的例子, 其中的失效数据服从Ⅱ型Pareto分布, 经过变换后可以得到来自两参数Pareto分布(1.1)的失效数据, 按从小到大的顺序排列如下:

\begin{array}{c}0.5009,0.5040,0.5142,0.5221,0.5261,0.5418,0.5473,0.5834,0.6091,0.6252 \\0.6404,0.6498,0.6750,0.7031,0.7099,0.7168,0.7918,0.8465,0.9035,1.1143 \text {. }\end{array}

根据本文中的结论, 我们能够计算得到未知参数、可靠度及失效率的估计, 相关结果列于表 5中.

表 5   参数、可靠度及失效率的估计(x=0.7)

m1m2t0\hat{\alpha}\hat{\theta}\hat{\lambda}\hat{\alpha}_B \hat{\theta}_B \hat{R}_B(x) \hat{H}_B(x)
6100.530.50094.61440.21670.49353.95520.28795.6503
0.600.50093.25050.30760.49172.95500.37094.2215
8120.580.50093.52100.28400.49203.12970.35594.4711
0.610.50093.48050.28730.49263.21280.34014.5897
11140.620.50093.31570.30160.49213.03940.35994.3420
0.630.50093.46740.28840.49283.23620.33554.6232
13160.660.50093.46470.28860.49273.21720.33854.5960
0.680.50094.10000.24390.49413.85890.27515.5127
15180.700.50093.66270.27300.49333.43370.31474.9053
0.720.50093.79570.26350.49373.59600.29715.1371
17200.780.50093.74300.26720.49353.53510.30345.0501
0.840.50093.93520.25410.49403.74780.28215.3541

新窗口打开| 下载CSV


表 5可以看到, 尺度参数 \alpha 的极大似然估计与其Bayes估计比较接近, 随着 m_1, m_2 的增大, 形状参数 \theta 的极大似然估计与其Bayes估计的差距逐渐变小.

8 结论

由于两参数Pareto分布在可靠性工程中的重要地位, 近年来产生了许多关于此分布的研究成果. 在本文中首次提出了双定数混合截尾试验方案, 并在此类截尾样本下讨论了两参数Pareto分布的参数及可靠性指标的估计问题. 利用经典统计理论计算出极大似然估计值, 根据Bayes理论在三种不同损失函数下得到了参数及可靠度指标的估计. 通过随机模拟得到各种估计量的均值和平均相对误差, 结果表明各种估计的Bayes估计都要优于相应的极大似然估计, 估计量的精度随着样本量的增大而逐渐提高. 另外也可以利用本文中提出的截尾试验模型对其它的寿命分布进行统计分析.

参考文献

Han M .

E-Bayesian estimation and its E-posterior risk of the exponential distribution parameter based on complete and Type-Ⅰ censored samples

Commun Statist-Theor M, 2020, 49 (8): 1858- 1872

DOI:10.1080/03610926.2019.1565837      [本文引用: 1]

Zhu X J , Balakrishnan N , Feng C Z , et al.

Exact likelihood-ratio tests for joint Type-Ⅱ censored exponential data

Statistics, 2020, 54 (3): 636- 648

DOI:10.1080/02331888.2020.1764559     

Hideki N , Balakrishnan N .

A consistent method of estimation for the three-parameter lognormal distribution based on Type-Ⅱ right censored data

Commun Statist-Theor M, 2016, 45 (19): 5693- 5708

DOI:10.1080/03610926.2014.948205     

Indrani B , Balakrishnan N .

A note on the prediction of censored exponential lifetimes in a simple step-stress model with Type-Ⅱ censoring

Calc Stat Assoc Bull, 2018, 70 (1): 57- 73

Ren J R , Gui W H .

A statistical inference for generalized Rayleigh model under Type-Ⅱ progressive censoring with binomial removals

J Syst Eng Electron, 2020, 31 (1): 206- 223

Indrani B , Balakrishnan N .

Prediction of censored exponential lifetimes in a simple step-stress model under progressive Type-Ⅱ censoring

Computation Stat, 2017, 32 (4): 1665- 1687

DOI:10.1007/s00180-016-0684-0     

邓严林.

双边定数截尾下Topp-Leone分布的Bayes估计与预测

江西师范大学学报(自然科学版), 2021, 45 (3): 272- 277

URL    

Deng Y L .

Bayesian estimation and prediction for the Topp-Leone distribution under type-Ⅱ doubly censored sample

Journal of Jiangxi Normal University(Natural Science), 2021, 45 (3): 272- 277

URL    

Rezapour M , Alamatsaz M H , Balakrishnan N .

Distribution of the number of observations greater than the ith dependent progressively Type-Ⅱ censored order statistic and its use in goodness-of-fit testing

Commun Statist-Theor M, 2015, 44 (12): 2517- 2529

DOI:10.1080/03610926.2015.1043796      [本文引用: 1]

Wu S J , Kus C .

On estimation based on progressive first-failure-censored sampling

Comput Stat Data An, 2009, 53 (10): 3659- 3670

DOI:10.1016/j.csda.2009.03.010      [本文引用: 2]

Ahmadi M V , Doostparast M , Ahmadi .

Estimating the lifetime performance index with Weibull distribution based on progressive first-failure censoring scheme

J Comput Appl Math, 2013, 239 (1): 93- 102

URL    

Ahmed E .

Estimation and prediction for the generalized inverted exponential distribution based on progressively first-failure-censored data with application

J Appl Stat, 2017, 44 (9): 1576- 1608

DOI:10.1080/02664763.2016.1214692     

Lio Y L , Tsai T R .

Estimation of δ=P(X < Y) for Burr XII distribution based on the progressively first failure-censored samples

J Appl Stat, 2012, 39: 309- 322

DOI:10.1080/02664763.2011.586684     

Gyan P .

Empirical estimation based on progressive first failure censored generalized pareto data

Afri Stat, 2018, 13 (2): 1683- 1697

[本文引用: 1]

Shafay A R , Balakrishnan N .

Estimation and prediction for an exponential form distribution based on combined Type-Ⅱ censored samples

Bull Malays Math Sci Soc, 2019, 42 (4): 1535- 1553

DOI:10.1007/s40840-017-0563-z      [本文引用: 1]

Lin C T , Hsu Y Y , Lee S Y , Balakrishnan N .

Inference on constant stress accelerated life tests for log-location-scale lifetime distributions with Type-Ⅰ hybrid censoring

J Stat Comput Sim, 2019, 89 (4): 720- 749

DOI:10.1080/00949655.2019.1571591     

Debasis K D , Avijit J .

Analysis of Type-Ⅱ progressively hybrid censored data

Comput Stat Data An, 2006, 50 (4): 2509- 2528

Balakrishnan N , Shafay A R .

One- and two-sample Bayesian prediction intervals based on Type-Ⅱ hybrid censored data

Commun Statist-Theor M, 2012, 41 (9): 1511- 1531

DOI:10.1080/03610926.2010.543300      [本文引用: 1]

茆诗松, 濮晓龙, 刘忠. 寿命数据中的统计模型与方法. 北京: 中国统计出版社, 1998: 101- 103

[本文引用: 1]

Mao S S , Pu X L , Liu Z . Statistical Models and Methods for Lifetime Data. Beijing: China Statistics Press, 1998: 101- 103

[本文引用: 1]

Arora S , Mahajan K K , Kumari R .

Bayes estimators for the reliability and hazard rate functions of Topp-Leone distribution using Type-Ⅱ censored data

Commun Statist-Simul C, 2019,

DOI:10.1080/03610918.2019.1602646      [本文引用: 1]

韩明.

不同损失函数下Poisson分布参数的E-Bayes估计及其E-MSE

数学物理学报, 2019, 39A (3): 664- 673

DOI:10.3969/j.issn.1003-3998.2019.03.023      [本文引用: 2]

Han M .

E-Bayesian estimation and its E-MSE of Possion distribution parameter under different loss functions

Acta Math Sci, 2019, 39A (3): 664- 673

DOI:10.3969/j.issn.1003-3998.2019.03.023      [本文引用: 2]

Nigm A M , Al-Hussaini E K , Jaheen Z F .

Bayesian one-sample prediction of future observations under Pareto distribution

Statistics, 2003, 37 (6): 527- 536

DOI:10.1080/02331880310001598837      [本文引用: 1]

/