自从De Finetti[1]最先提出最优红利问题以来, 众多学者对该问题作了大量的研究, 一些经典的研究参见文献[2-5], 关于近期的研究可见文献[6-15].随着金融管理和保险业务的发展, 经典风险模型的对偶模型也越来越受到重视, 参见文献[6, 16-20].由于有界红利率限制条件的合理性, 不少学者也在这一限制条件下进行了研究, 如文献[21-24].在研究红利策略时, 通常允许根据盈余情况在任何时刻分配红利, 这可能导致一个不切实际的最优红利策略.因此Albrecher等[25]提出了一个更贴近实际的想法, 他们在经典复合泊松模型中研究周期性分红问题, 在一系列的随机时刻才考虑分红事宜, 并探测公司的破产风险.关于这一思想的更多信息, 见Albrecher等[26]研究的Gamma-Omega模型. Avanzi等[16]也在复合泊松对偶模型中讨论了周期性分红问题, 其中分红决策间隔时间服从Erlang($n$)分布.随后, Avanzi等[27]在假设分红决策间隔时间服从指数分布(即Erlang(1))和超指数收益的扩散对偶模型中也考虑周期性分红问题, 并得出了周期性门槛策略是周期性策略中最优的这一结论.
以上的研究都是在连续时间模型中考虑周期性分红问题, 并且只在某些随机时刻考虑分红, 因此这些分红时刻构成了一个随机变量序列.在本文中我们考虑复合二项对偶模型(一个离散时间模型)中的周期性分红问题.在该模型中每个时间单位内都要考虑是否会发生破产, 而分红决策时刻相距$k$个时间单位, 即周期长$k$是给定的, 例如3个月或1年.关于这种周期性的红利策略也可参看文献[28].尽管固定周期长的分红策略与文献[16, 25, 27]中的策略不完全相同, 但它具有实际意义.在实际中常常是每季度进行一次分红, 我们也能发现中国的一些上市公司一年进行一次分红.另外, 在实际中我们也发现保险公司监控它的偿付能力比决定红利支付更频繁, Choi和Cheung[29]就作了相应的研究.因此, 本文有必要在模型中考虑这种现象.
在本文中, 我们在固定分红决策间隔时间的假设下讨论周期性分红问题, 并且得到了最优分红策略的性质和算法.本文的结构如下:在第2节中介绍该模型, 并且给出最优控制问题的一个严格数学表达.在第3节中讨论最优策略的特征, 并且得出了关于最优值函数的HJB方程.在第4节中通过对值函数进行变换, 得到了最优分红策略的一些性质和一个简单算法.在第5节中根据最优红利策略的一些性质得到了最优值函数的可无限逼近的上界和下界.最后, 在第6节通过几个数值计算实例来说明该算法.
在复合二项对偶模型中, $t$时刻的盈余可描述为
其中, 非负整数$u$表示初始盈余, 正整数$c$表示单位时间内支付的费用. $S(t)$表示直到$t$时刻的总收益, 它可表示为
且$S(0)=0$. $X_{i}$表示在$i$时刻可能的收入量, $X_1,X_2,X_3, \cdots$是一列独立同分布取正整数值的随机变量.在任何时间区间内, 有收入的概率为$p$ ($0<p<1$), 没有收入的概率为$q=1-p$.我们用$\xi_t=1$表示在时间区间$(t-1,t]$内有一次收入; 用$\xi_t=0$表示在时间区间$(t-1,t]$内没有收入.设$N(t)=\sum\limits_{i=1}^t \xi_i$ $(t=1,2,\cdots)$和$N(0)=0$, 则$\{N(t)\}$是一个二项序列.在不同时间区间内收入的出现是相互独立的事件, 并且序列$\{X_{t}\}$与二项序列$\{N(t)\}$相互独立.
设
是收入量的概率函数.设
我们考虑在盈余模型(2.1) 中引入红利策略.在本文中, 我们假定在$0$时刻考虑分红.设$d_t$表示在$t$时刻的红利, $t\in {\mathbf{N}}$, 其中${\mathbf{N}}=\{0,1,2,\cdots\}$.设$k$是一个固定的正整数, 称周期长为$k$的周期性红利策略是可行的, 如果它满足: (1) 在任何时刻$t\neq nk$ $(n\in {\mathbf{N}})$不考虑分红, 即$d_t=0$.只在时刻$t=nk$考虑分红; (2) 在任何时刻$t$, 分红都不会导致破产; (3) 在任何时刻$t$, 红利数量都是一个整数且都不会超过给定的上界$c_0$($c_0$为正整数); (4) 在时刻$t$的红利是$\mathcal{F}_{t}$可料的, $\mathcal{F}_{t}$是一个$\sigma$代数, $\mathcal{F}_{t}$包含了在$t$时刻及$t$以前的全部信息.由于盈余过程(2.1) 的马尔可夫性, 历史相依策略不会提高公司的价值.所以我们只需讨论一类可行策略, 该类可行策略是仅关于盈余$x$的函数.我们用$\Phi$表示这样的一个策略.那么, 在策略$\Phi$控制下的盈余过程可表述为
且$U_{\Phi}(0)=u-\Phi(u)$.我们用$\Lambda$表示非历史相依的可行分红策略全体组成的集合.对任意的$\Phi(x)\in\Lambda$, 相应的值函数定义为
其中, $U_{\Phi}(t-)=U_{\Phi}(t-1)-c+X_t\xi_t$, $r\in (0,1)$是贴现因子, ${\mathbf{E}}_u$表示初始盈余为$u$的条件下的条件期望, $\tau=\inf\{t>0; U_{\Phi}(t)<0\}$表示破产时刻(即盈余第一次成为负值的时刻).本文的优化目标是找到满足下式的最优值函数
和对应的最优策略$\Phi^*$, 使得$V^*(u)=V_{\Phi^*}(u)$.关于类似的最优控制问题也可参考文献[23].以下不发生混淆的情况下, 我们用$V(u)$表示关于策略$\Phi$的值函数, 即$V_{\Phi}(u)=V(u)$.
考虑在策略$\Phi(x)\in\Lambda$控制下的盈余过程(2.3).分别在时刻1, 2, $\cdots$, $k$考虑收入可能出现的各种情况, 运用全概率公式我们建立相应的值函数$V(u)$的如下方程
其中$V^{\langle1\rangle}(u)$满足以下递推关系
和
上式中, 当$u\in{\mathbf{N^{-}}}\doteq\{-1,-2,\cdots\}$时, 我们规定$V(u)=0$和$V^{\langle t \rangle}(u)=0 \ (t=1,2,\cdots,k-1)$.
不难发现$V^{\langle t \rangle}(u)$ $(t=1,2,\cdots,k-1)$可看作在时刻$t$开始的一个新的盈余过程的值函数.如果$\Phi$是最优分红策略, 则$(3.1)$式可写成如下的HJB方程
或
根据方程(3.5), 我们可以运用贝尔曼递归算法来计算最优值函数$V(u)$和相应的最优策略, 参看文献[30].
对任意的可行策略$\Phi(x)\in\Lambda$, 我们定义一个新的函数$W(u)$:
而当$u\in{\mathbf{N^{-}}}$时, 定义$W(u)=0$.则我们可得
在策略集$A$范围内, 如果某策略对应的由(4.1) 式定义的函数$W(u)$对任意的$\ u\in {\mathbf{N}}$都是最大的, 则称函数$W(u)$是集合$A$上最优的.我们得出了上述定义的函数$W(u)$和相应的策略的如下性质.
定理 4.1 假设$\Phi\in\Lambda$, $V(u)$是值函数, 且$W(u)$满足$(4.1)$式.如果$W(u)$在集合$\Lambda$上最优, 则
(1) 对任意的$\ u\in {\mathbf{N}}$,
(2) $\Phi$是最优红利策略.
证 (1) 根据(4.1), (3.2) 和(4.3) 式, 由函数$W(u)$的最优性可得出
显然, 在有界红利率条件下, 方程$(4.5)$等价于
比较$(4.3)$式和$(4.6)$式, 其中(4.3) 式中的$W(u)$和$\Phi$分别看成集合$\Lambda$上最优函数和相应的策略, 我们有
从$(4.7)$式可得
当$u\leq c_{0}$, $(4.8)$式等价于
当$u\geq c_{0}$, $(4.8)$式等价于
由$(4.9)$式和$(4.10)$式可得到$(4.4)$式.
(2) 根据$(4.2)$式, 当$\Phi(u)$满足$(4.8)$式时, $V(u)$是最优的.因此, $\Phi$是最优策略.
设$S$表示${\mathbf{N}}$中所有有界实值函数构成的集合, 定义集合$S$中任意两个元素$X$, $Y$之间的距离为
显然, 集合$S=(S,d)$是一个完备的度量空间.
由于在任何时刻的红利都不会超过上界$c_0$, 所以对任意分红策略$\Phi$, 值函数满足
定理 4.2 假设$0<r<1$, 存在红利率的上界$c_{0}$.则(4.1) 式定义的$W(u)$满足
证 根据$(4.3)$式, 我们有
所以
由(3.2) 式可得
根据(4.1) 式, 有
从(4.14), (4.15) 和(4.16) 式, 可得到
因此
由此, (4.13) 式得证.
类似地, 我们可得到
因此, $W(u)\in S$,$ V^{\langle t\rangle}(u) \in S$ $(t=1,2,\cdots,k-1)$.
对集合$\mathbf{N}$上任意的实值函数$Y(u)$, 定义
则方程$(4.5)$可写成
定义映射
其中, 映射${\mathbf{T}}_{0}$变换$V^{\langle1\rangle}(u)$成$(4.1)$式的右端, ${\mathbf{T}}_{t}$ $(t=1,2,\cdots,k-2)$变换$V^{\langle t+1\rangle}(u)$成$(3.2)$式的右端, ${\mathbf{T}}_{k-1}$变换$W(u)$成$(4.18)$式的右端.另外, 我们定义${\mathbf{T}}={\mathbf{T}}_{0}{\mathbf{T}}_{1}\cdots {\mathbf{T}}_{k-1}$, 则${\mathbf{T}}$是一个$S\rightarrow S$的非线性映射, 且方程$(4.1)$, $(3.2)$和$(4.18)$可简单地写成
定理 4.3 在$0<r<1$的假设下, 方程$(4.19)$有且只有一个解.
证 对任意$X,Y\in S$, 都有
其中, 对任意的$u\in{\mathbf{N^{-}}}$, 定义$X(u)=Y(u)=0$和$B_X(u)=B_Y(u)=0$.不失一般性, 假设对一给定的$u\in {\mathbf{N}}$, 有
则
因此, 容易得到
类似地, 对任意的$X,Y\in S$, 可得到
因此, 对任意的$X,Y\in S$, 下式成立
由于$0<r<1$, 所以$\mathbf{T}$是$S$上的一个压缩映射.因此方程$(4.19)$有且只有一个解.
根据定理$4.3$, 我们可以得到由方程$(4.1)$, $(3.2)$和$(4.5)$组成的方程组有唯一解, 因此以下定理成立.
定理 4.4 假设$\Phi\in\Lambda$, $V(u)$为值函数, $W(u)$由$(4.1)$式定义.对任意的$u\in{\mathbf{N}}$, 如果$(4.4)$式成立, 则$W(u)$是最大的.
根据定理4.1, 我们知道使得函数$W(u)$最大的策略就是最优策略, 并且对任意非负整数$u$, 该策略也会使得值函数$V(u)$最大.另外, 根据定理4.3可知, 该最优策略是存在的.因此, 我们可以通过求解最优函数$W^*(u)=\sup\limits_{\Phi\in\Lambda}W(u)$来达到目的.
计算最优函数$W^*(u)$ $(u\in {\mathbf{N}})$通常可以采用贝尔曼递归算法, 即任意给定一个初始函数$W_{0}(u)$, 根据如下的公式计算函数序列$W_{1}(u),W_{2}(u),\cdots $,
所以, 当$n$充分大时就可以用$W_n(u)$近似$W^*(u)$.如果$0\leq W_0(u)\leq r^kc_0/(1-r^k)$, 则它们之间的误差估计为
当每个时间区间内可能的收入不是有界的随机变量时, 递归式$(5.1)$中存在无穷项之和, 不便于数值计算.为了解决这个问题, 考虑方程
其中, $V_{1}^{\langle1\rangle^{*}}$满足递推关系
另外, 我们也考虑方程
其中, $V_{2}^{\langle1\rangle^{*}}$满足递推关系
上式中的$n_{0}$是任意正整数, $u\in {\mathbf{N}}$.对任意$x\in{\mathbf{N^{-}}}$, $i=1,2$, 定义$W_i^*(x)=0$, $V_i^{\langle k\rangle^*}(x)=0$和$B_{W_{i}^{*}}(x)=0$.
定理 5.1 对任意的正整数$n_{0}$, $u\in {\mathbf{N}}$, $W_{1}^{*}(u)$和$W_{2}^{*}(u)$分别满足方程$(5.4)$和$(5.7)$.则
证 (ⅰ)先证明$W_{1}^{*}(u)\leq W^{*}(u)$.定义映射
其中, 映射${\mathbf{\widehat{T}}}_{0}$变换$V_{1}^{\langle1\rangle^{*}}(u)$成$(5.4)$式的右端, ${\mathbf{\widehat{T}}}_{t}$ $(t=1,2,\cdots,k-2)$变换$V_{1}^{\langle t+1\rangle^{*}}(u)$成$(5.5)$式的右端, ${\mathbf{\widehat{T}}}_{k-1}$变换$W_{1}^{*}(u)$成$(5.6)$式的右端.另外, 我们定义${\mathbf{\widehat{T}}}={\mathbf{\widehat{T}}}_{0}{\mathbf{\widehat{T}}}_{1}\cdots {\mathbf{\widehat{T}}}_{k-1}$, 则${\mathbf{\widehat{T}}}$是一个$S\rightarrow S$的映射, 且
根据压缩映射定理, 方程$(5.11)$有且只有唯一解.
根据方程$(5.4)$, $(5.5)$和$(5.6)$, 可得
由$(5.12)$式可得
从$(5.13)$和$(5.14)$式, 可得
依此类推, 可得到一个有界的函数序列$\{G_{n}(u); n=1,2,\cdots \}$, 且$W^{*}(u)\geq G_{n}(u),\ G_{n-1}(u)\geq G_{n}(u)$和$ {\mathbf{\widehat{T}}}G_{n-1}(u)=G_{n}(u)$.所以
因此, $W_{1}^{*}(u)\leq W^*(u). $
(ⅱ)接下来证明$W^{*}(u)\leq W_{2}^{*}(u)$.定义映射
其中, 映射${\mathbf{\widetilde{T}}}_{0}$变换$V_{2}^{\langle1\rangle^{*}}(u)$成$(5.7)$式的右端, ${\mathbf{\widetilde{T}}}_{t}$ $(t=1,2,\cdots,k-2)$变换$V_{2}^{\langle t+1\rangle^{*}}(u)$成$(5.8)$式的右端, ${\mathbf{\widetilde{T}}}_{k-1}$变换$W_{2}^{*}(u)$成$(5.9)$式的右端.另外, 我们定义${\mathbf{\widetilde{T}}}={\mathbf{\widetilde{T}}}_{0}{\mathbf{\widetilde{T}}}_{1}\cdots {\mathbf{\widetilde{T}}}_{k-1}$, 则${\mathbf{\widetilde{T}}}$是一个$S\rightarrow S$的映射, 且
根据压缩映射定理, 方程$(5.15)$有且只有唯一解.
根据方程$(5.7)$, $(5.8)$和$(5.9)$, 可得
类似地, 根据$(5.16)$式, 可以得到$W_{2}^{*}(u)\geq W^*(u)$.证毕.
定理 5.2 对任意的$0< r< 1$, 下列不等式成立
证 由于$W_{2}^{*}(u),W_{1}^{*}(u)\in S$, 所以
易证
因此, 可得到
类似地, 对任意的$t=0,1,2,\cdots,k-2$可得
根据$(5.19)$式和$(5.20)$式可得
由(5.21) 式知结论成立.证毕.
由定理5.1可以发现:当$n_0$增大时, $W_{1}^{*}(u)$和$W_{2}^{*}(u)$能无限逼近最优函数$W^{*}(u)$.所以, 事先给定一个计算精度, 根据不等式$(5.17)$可以确定$n_0$, 再运用算子${\mathbf{\widehat{T}}}$和${\mathbf{\widetilde{T}}}$分别迭代地计算出$W_{1}^{*}(u)$和$W_{2}^{*}(u)$.最后, 将$W_{1}^{*}(u)$和$W_{2}^{*}(u)$分别代入$(4.2)$式, 可得到最优值函数$V^*(u)$的一个上界和一个下界.
在本节中, 我们举两个应用实例, 运用第4节和第5节提出的方法来计算函数$W^*$, $\Phi^*$和$V^*$.
例 1 假设$c=c_0=10$, $p=0.7$, $k=3$, 收入量服从均值为$\mu=25$的几何分布, 且概率函数为
当贴现因子$r=0.96,\ 0.97,\ 0.98$, 我们分别得到了最优红利策略, 见表 1.从表 1中, 我们能发现最优红利策略为多门槛策略.设$b_1,b_2,\cdots,b_{m}$是一个多门槛策略的由小到大依次排列的$m$个门槛, 如果在分红时刻盈余$u$到达区间$[b_i,b_{i+1})$ ($i=1,2,\cdots,m$; $b_{m+1}=\infty$), 则根据该策略一个数量为$(u-b_i)\wedge c_0$的红利应被支付; 若盈余$u$在第一个门槛$b_1$之下, 则不分红.注意, 当$m=1$时该策略是一个门槛为$b_1$的门槛策略, 它可以看作是一个退化的多门槛策略.从表 1中, 我们能发现:当$r=0.96$时门槛值为0, 10和20, 当$r=0.97$时门槛值为22和20, 当$r=0.98$时门槛值为37和40.与此同时, 我们得到了当$r=0.96$时的最优红利策略相对应的最优函数$W^*(u)$, 见表 2.
如果让分红决策间隔时间$k$首先取值为1, 然后逐渐递增, 我们发现相应的值函数$V^*(u)$ ($u\in \mathbf{N}$)逐渐减小.例如, 设贴现因子$r=0.98$, $k=1,2,3,4$, 我们分别得到了值函数$V^*(u)$的图像和相应的最优策略, 见图 1和表 3. Choi和Cheung[29]也得到了类似的结果, 见该文中的表 1-3 (观察$V_{1}(u,b^*)$值).这表明, 当时间区间长趋于$0$时, 模型(2.1) 将成为一个连续时间模型, 而最优红利策略很可能成为在一些时间区间里连续支付红利的策略.另外, 我们从表 3中可以发现, 对固定的$r$, 随着$k$的增加最小门槛值$b_{1}$会减小.在Choi和Cheung的文章[29]中也能发现最优门槛策略的类似现象:随着分红决策时刻的间隔长增加, 门槛值$b^{*}$减小.另外, 从表 1中还可发现, 固定$k=3$, $b_{1}$随着$r$的增加而增加.
例 2 假设$c=c_0=10$, $p=0.7$, $k=3$, 收入量服从均值为$\mu=25$的两个几何分布混合的分布, 且概率函数为
我们得到了最优红利策略, 见表 4.从表 4中我们可以看到, 当$r$=0.96, 0.97时, 最优策略也是多门槛策略; 当$r=0.98$时, 门槛值为40的门槛策略是最优的. 表 5给出了当$r=0.96$时的最优函数$W^*(u)$. Tan和Yang[23]在具有有界分红利率的离散时间风险模型中也得出了最优策略是门槛策略或多门槛策略.
如果固定$r=0.98$, 让$k=1,2,3,4$, 我们得到了与例1相同的结果, 见图 2和表 6.从表 6可知, 所有的策略都是门槛策略.