双定数混合截尾下两参数Pareto分布的统计分析
Statistical Analysis of Two-Parameter Pareto Distribution Under Double Type-Ⅱ Hybrid Censoring Scheme
通讯作者:
收稿日期: 2020-01-11
基金资助: |
|
Received: 2020-01-11
Fund supported: |
|
On the basis of the traditional type-Ⅰ and type-Ⅱ censoring tests, a new type of censoring test scheme, double type-Ⅱ hybrid censoring, is proposed for the first time in this paper. Based on this kind of censored data, the maximum likelihood estimates of the parameters and confidence interval of θ are obtained for two-parameter Pareto distribution. The Bayesian estimates of θ, reliability function and failure rate function under three different loss functions are obtained when α is known and the Gamma prior distribution is selected. When both α and θ are unknown, we take the noninformation prior distribution and exponential prior distribution respectively, and calculate the Bayesian estimates of α and θ, the reliability function and failure rate function under the squared loss function. The Monte-Carlo method is used to simulate double type-Ⅱ hybrid censored samples, the estimates of the parameter and reliability indexes for two-parameter Pareto distribution are obtained. The relative errors are calculated, and the accuracy of various estimates is compared. Finally, a numerical example is analyzed.
Keywords:
本文引用格式
龙兵, 张忠占.
Long Bing, Zhang Zhongzhan.
1 引言
寿命数据的统计分析在医学、工程学、生物学等许多领域中有着广泛应用. 上世纪五十年代, 为了提高工业产品的寿命, 很多统计学家开始分析各种类型的寿命数据. 其中, 通过截尾获得试验数据是一种经常采用的方法, 在生存分析、可靠性分析等领域中经常遇到这类数据. 传统的定时截尾、定数截尾以及逐步增加的定数截尾这三类截尾数据, 很多统计学家己经广泛研究过, 有比较成熟的理论和方法, 目前的研究成果较多, 如文献[1-8]. 2009年, Wu和Kus[9]提出了逐步增加首失效截尾寿命试验方案, 后来受到很多统计学家的重视, 目前已经产生了很多基于这类截尾数据的研究成果, 如文献[9-13]. 随着实际的需要, 结合定时截尾和定数截尾各自的优点产生了混合Ⅰ型截尾试验和混合Ⅱ型截尾试验. 如果在0时刻把
两参数Pareto分布被提出来后主要用来分析社会经济和自然现象, 后来该分布被应用到生存分析和可靠性理论中. 该分布的分布函数和概率密度函数分别为
若
其中(1.1)–(1.2)式中的
本文假设受试元件的寿命服从两参数Pareto分布(1.1), 基于双定数混合截尾试验数据对未知参数、可靠度函数以及失效率函数进行统计分析.
2 模型描述
在可靠性试验中双定数混合截尾就是两个定数截尾方案的混合, 其模型描述如下:假设把
在本文中把上述两种情形分别表示为Case Ⅰ和Case Ⅱ, 并且称其为双定数混合截尾试验, 从而得到如下的观测数据
3 极大似然估计与区间估计
根据第2节中的寿命试验模型, 下面用极大似然法求两参数Pareto分布中未知参数
设
并设双定数混合截尾试验所得观测数据为
基于上述观测数据, 省略与未知参数无关的常量, 则似然函数可以表示为
可以求得参数
当
则参数
根据极大似然估计的不变性, 可靠度函数
令
从(3.2)式可以看出
引理3.1[18] 假设总体
对于双定数混合截尾样本
即
因此, 当
这里
由于可靠度函数和失效率函数关于
4 α已知时的Bayes估计
取
这里超参数
当
其中
引理4.1[19] 设
这里
Linex损失和广义熵损失函数都是非对称损失函数, 过高估计和过低估计带来的损失是不一样的. 从引理4.1可以看出:对于Linex损失函数, 当
定理4.1 设
其中
证 (i)在平方损失函数下,
(ii)
因此在Linex损失函数下,
(iii)
因此在广义熵损失函数下,
定理4.1得证.
利用定理4.1的结论, 要得到参数
根据文献[20]的研究成果, 可取超参数
因此在平方损失函数下,
当
当
定理4.2 设
其中
证 (i)在平方损失函数下, 可靠度函数
(ii)
因此在Linex损失函数下, 可靠度函数
(iii)
因此在广义熵损失函数下, 可靠度函数
定理4.2证毕.
定理4.3 设
其中
证 (i)
(ii)
(iii)
则
定理4.3证毕.
5 $ \alpha $ 和$ \theta $ 都未知时的Bayes估计
取参数
取参数
其中超参数
根据Bayes公式可得参数
其中
根据(5.2)式可以得到
因此在平方损失函数下, 参数
在平方损失函数下, 参数
由于(5.5)式中的定积分不易求出, 因此
下面介绍一种采用随机模拟求参数
当
在平方损失下,
由于(5.6)式中的
Step 1: 产生
Step 2: 计算出参数
另外, 在平方损失下, 可靠度函数
在平方损失下, 失效率函数
对于多参数分布总体, 要求出参数及可靠性指标的Bayes估计, 通常要计算较复杂的多重积分, 在很多情况下都没有显式表达式, 可以选择采用Gibbs抽样法、Lindley方法和TK方法求出Bayes估计的近似值. 实际上, 超参数
令
6 随机模拟
由于分布函数
表 1 α已知时, θ的估计
n | (α, θ) | m1 | m2 | t0 | ||||
20 | (6, 2) | 9 | 12 | 8 | 2.1378 | 2.0942 | 1.9327 | 1.9298 |
(0.2663) | (0.2178) | (0.2021) | (0.2188) | |||||
(7, 3) | 11 | 16 | 9 | 3.1269 | 2.8987 | 2.6540 | 2.7132 | |
(0.2270) | (0.1880) | (0.1951) | (0.2026) | |||||
30 | (6, 2) | 13 | 18 | 8 | 2.0730 | 2.0559 | 1.9437 | 1.9417 |
(0.2170) | (0.1903) | (0.1816) | (0.1922) | |||||
(7, 3) | 16 | 23 | 9 | 3.0643 | 2.9136 | 2.7320 | 2.7799 | |
(0.1851) | (0.1640) | (0.1696) | (0.1742) | |||||
50 | (6, 2) | 22 | 30 | 8 | 2.0394 | 2.0342 | 1.9634 | 1.9623 |
(0.1612) | (0.1492) | (0.1473) | (0.1527) | |||||
(7, 3) | 26 | 39 | 9 | 3.0282 | 2.9415 | 2.8256 | 2.8588 | |
(0.1465) | (0.1366) | (0.1393) | (0.1418) |
表 2 α已知时, 可靠度函数R(x)的估计(x=8)
n | (α, θ) | m1 | m2 | t0 | ||||
20 | (6, 2) | 9 | 12 | 8 | 0.5505 | 0.5614 | 0.5481 | 0.5460 |
(0.1438) | (0.1185) | (0.1196) | (0.1230) | |||||
(7, 3) | 11 | 16 | 9 | 0.6628 | 0.6848 | 0.6792 | 0.6783 | |
(0.0891) | (0.0767) | (0.0769) | (0.0761) | |||||
30 | (6, 2) | 13 | 18 | 8 | 0.5587 | 0.5648 | 0.5557 | 0.5542 |
(0.1189) | (0.1046) | (0.1055) | (0.1064) | |||||
(7, 3) | 16 | 23 | 9 | 0.6663 | 0.6814 | 0.6781 | 0.6767 | |
(0.0743) | (0.0670) | (0.0671) | (0.0667) | |||||
50 | (6, 2) | 22 | 30 | 8 | 0.5605 | 0.5640 | 0.5595 | 0.5574 |
(0.0918) | (0.0851) | (0.0852) | (0.0855) | |||||
(7, 3) | 26 | 39 | 9 | 0.6701 | 0.6789 | 0.6774 | 0.6760 | |
(0.0574) | (0.0545) | (0.0546) | (0.0542) |
表 3 α已知时, 失效率函数H(x)的估计(x=8)
n | (α, θ) | m1 | m2 | t0 | ||||
20 | (6, 2) | 9 | 12 | 8 | 0.2676 | 0.2620 | 0.2593 | 0.2415 |
(0.2677) | (0.2188) | (0.2156) | (0.2186) | |||||
(7, 3) | 11 | 16 | 9 | 0.3913 | 0.3624 | 0.3582 | 0.3392 | |
(0.2316) | (0.1915) | (0.1914) | (0.2064) | |||||
30 | (6, 2) | 13 | 18 | 8 | 0.2591 | 0.2570 | 0.2551 | 0.2428 |
(0.2133) | (0.1872) | (0.1856) | (0.1892) | |||||
(7, 3) | 16 | 23 | 9 | 0.3823 | 0.3636 | 0.3606 | 0.3469 | |
(0.1860) | (0.1649) | (0.1650) | (0.1750) | |||||
50 | (6, 2) | 22 | 30 | 8 | 0.2547 | 0.2540 | 0.2529 | 0.2451 |
(0.1630) | (0.1509) | (0.1503) | (0.1542) | |||||
(7, 3) | 26 | 39 | 9 | 0.3774 | 0.3667 | 0.3648 | 0.3564 | |
(0.1449) | (0.1355) | (0.1355) | (0.1407) |
表 4 α和θ都未知时的估计
n | (α, θ) | m1 | m2 | t0 | ||||
20 | (6, 2) | 9 | 12 | 8 | 6.1534 | 2.3660 | 6.0033 | 2.1155 |
(0.0256) | (0.3123) | (0.0185) | (0.2516) | |||||
(7, 3) | 11 | 16 | 9 | 7.1179 | 3.3724 | 7.0012 | 3.1045 | |
(0.0168) | (0.2500) | (0.0122) | (0.2174) | |||||
30 | (6, 2) | 13 | 18 | 8 | 6.1017 | 2.2269 | 6.0017 | 2.0765 |
(0.0169) | (0.2359) | (0.0122) | (0.2085) | |||||
(7, 3) | 16 | 23 | 9 | 7.0784 | 3.2426 | 7.0006 | 3.0715 | |
(0.0112) | (0.1992) | (0.0082) | (0.1830) | |||||
50 | (6, 2) | 22 | 30 | 8 | 6.0607 | 2.1080 | 6.0007 | 2.0251 |
(0.0101) | (0.1674) | (0.0074) | (0.1590) | |||||
(7, 3) | 26 | 39 | 9 | 7.0474 | 3.1085 | 7.0007 | 3.0146 | |
(0.0068) | (0.1466) | (0.0050) | (0.1425) |
7 数值例子
下面分析文献[21]中第3.1节中的例子, 其中的失效数据服从Ⅱ型Pareto分布, 经过变换后可以得到来自两参数Pareto分布(1.1)的失效数据, 按从小到大的顺序排列如下:
根据本文中的结论, 我们能够计算得到未知参数、可靠度及失效率的估计, 相关结果列于表 5中.
表 5 参数、可靠度及失效率的估计(x=0.7)
m1 | m2 | t0 | |||||||
6 | 10 | 0.53 | 0.5009 | 4.6144 | 0.2167 | 0.4935 | 3.9552 | 0.2879 | 5.6503 |
0.60 | 0.5009 | 3.2505 | 0.3076 | 0.4917 | 2.9550 | 0.3709 | 4.2215 | ||
8 | 12 | 0.58 | 0.5009 | 3.5210 | 0.2840 | 0.4920 | 3.1297 | 0.3559 | 4.4711 |
0.61 | 0.5009 | 3.4805 | 0.2873 | 0.4926 | 3.2128 | 0.3401 | 4.5897 | ||
11 | 14 | 0.62 | 0.5009 | 3.3157 | 0.3016 | 0.4921 | 3.0394 | 0.3599 | 4.3420 |
0.63 | 0.5009 | 3.4674 | 0.2884 | 0.4928 | 3.2362 | 0.3355 | 4.6232 | ||
13 | 16 | 0.66 | 0.5009 | 3.4647 | 0.2886 | 0.4927 | 3.2172 | 0.3385 | 4.5960 |
0.68 | 0.5009 | 4.1000 | 0.2439 | 0.4941 | 3.8589 | 0.2751 | 5.5127 | ||
15 | 18 | 0.70 | 0.5009 | 3.6627 | 0.2730 | 0.4933 | 3.4337 | 0.3147 | 4.9053 |
0.72 | 0.5009 | 3.7957 | 0.2635 | 0.4937 | 3.5960 | 0.2971 | 5.1371 | ||
17 | 20 | 0.78 | 0.5009 | 3.7430 | 0.2672 | 0.4935 | 3.5351 | 0.3034 | 5.0501 |
0.84 | 0.5009 | 3.9352 | 0.2541 | 0.4940 | 3.7478 | 0.2821 | 5.3541 |
从表 5可以看到, 尺度参数
8 结论
由于两参数Pareto分布在可靠性工程中的重要地位, 近年来产生了许多关于此分布的研究成果. 在本文中首次提出了双定数混合截尾试验方案, 并在此类截尾样本下讨论了两参数Pareto分布的参数及可靠性指标的估计问题. 利用经典统计理论计算出极大似然估计值, 根据Bayes理论在三种不同损失函数下得到了参数及可靠度指标的估计. 通过随机模拟得到各种估计量的均值和平均相对误差, 结果表明各种估计的Bayes估计都要优于相应的极大似然估计, 估计量的精度随着样本量的增大而逐渐提高. 另外也可以利用本文中提出的截尾试验模型对其它的寿命分布进行统计分析.
参考文献
E-Bayesian estimation and its E-posterior risk of the exponential distribution parameter based on complete and Type-Ⅰ censored samples
,DOI:10.1080/03610926.2019.1565837 [本文引用: 1]
Exact likelihood-ratio tests for joint Type-Ⅱ censored exponential data
,DOI:10.1080/02331888.2020.1764559
A consistent method of estimation for the three-parameter lognormal distribution based on Type-Ⅱ right censored data
,DOI:10.1080/03610926.2014.948205
A note on the prediction of censored exponential lifetimes in a simple step-stress model with Type-Ⅱ censoring
,
A statistical inference for generalized Rayleigh model under Type-Ⅱ progressive censoring with binomial removals
,
Prediction of censored exponential lifetimes in a simple step-stress model under progressive Type-Ⅱ censoring
,
双边定数截尾下Topp-Leone分布的Bayes估计与预测
,
Bayesian estimation and prediction for the Topp-Leone distribution under type-Ⅱ doubly censored sample
Distribution of the number of observations greater than the ith dependent progressively Type-Ⅱ censored order statistic and its use in goodness-of-fit testing
,DOI:10.1080/03610926.2015.1043796 [本文引用: 1]
On estimation based on progressive first-failure-censored sampling
,DOI:10.1016/j.csda.2009.03.010 [本文引用: 2]
Estimating the lifetime performance index with Weibull distribution based on progressive first-failure censoring scheme
,
Estimation and prediction for the generalized inverted exponential distribution based on progressively first-failure-censored data with application
,DOI:10.1080/02664763.2016.1214692
Estimation of δ=P(X < Y) for Burr XII distribution based on the progressively first failure-censored samples
,DOI:10.1080/02664763.2011.586684
Empirical estimation based on progressive first failure censored generalized pareto data
,
Estimation and prediction for an exponential form distribution based on combined Type-Ⅱ censored samples
,DOI:10.1007/s40840-017-0563-z [本文引用: 1]
Inference on constant stress accelerated life tests for log-location-scale lifetime distributions with Type-Ⅰ hybrid censoring
,DOI:10.1080/00949655.2019.1571591
Analysis of Type-Ⅱ progressively hybrid censored data
,
One- and two-sample Bayesian prediction intervals based on Type-Ⅱ hybrid censored data
,DOI:10.1080/03610926.2010.543300 [本文引用: 1]
Bayes estimators for the reliability and hazard rate functions of Topp-Leone distribution using Type-Ⅱ censored data
,DOI:10.1080/03610918.2019.1602646 [本文引用: 1]
不同损失函数下Poisson分布参数的E-Bayes估计及其E-MSE
,DOI:10.3969/j.issn.1003-3998.2019.03.023 [本文引用: 2]
E-Bayesian estimation and its E-MSE of Possion distribution parameter under different loss functions
DOI:10.3969/j.issn.1003-3998.2019.03.023 [本文引用: 2]
Bayesian one-sample prediction of future observations under Pareto distribution
,DOI:10.1080/02331880310001598837 [本文引用: 1]
/
〈 | 〉 |