状态空间模型的正规核方法
Regular Kernel Method for State Space Model
通讯作者:
收稿日期: 2021-01-19
基金资助: |
|
Received: 2021-01-19
Fund supported: |
|
State space models(SSMs) provide a general framework for studying stochastic processes, which has been applied in revealing the true underlying economic processes of an economy, recognizing cellphone signals, detecting the loaction of an airplane on a radar screen, et al. In this paper, we study the Markov state space models by modeling the space transformation with reproducing kernel Hilbert space. Not only the existence and uniqueness of solutions are given, but also the error is estimate in L2 spaces. We applied our method in Visibility prediction at airport in National Post-Graduate Mathematical Contest in Modeling supported by China Academic Degrees & Graduate Education Development Center.
Keywords:
本文引用格式
王超, 李波, 王磊.
Wang Chao, Li Bo, Wang Lei.
1 介绍
这里
从通用SSM模型(1.1)可以看到, 状态转移的马尔可夫性并不是必需的, 当前状态可能依赖于状态过去的历史轨迹, 甚至整个历史过程. 类似地, 在时间节点
本文中称之为马尔可夫状态空间模型. 在此假设下, 我们致力于提供一种基于再生核希尔伯特空间方法的通用性函数重构方法. 其中, 转移噪声
本文中, 观测函数
其中, 假设
本文的主要贡献为
● 核状态空间模型极大地增加了状态转移方程的学习能力, 从而使得马尔可夫状态空间模型能够被应用到更加复杂的场景.
● 一个正则化最小二乘法被设计用来实现核状态转移方程的估计. 我们证明了该方法的解的存在性和一致性问题, 同时给出了该方法估计下的误差估计.
● 模拟数据实验被设计证明了该算法的有效性. 通过真实数据实验, 我们发现非参数状态空间模型(核状态空间模型)能够更好得适应现实状态转移规律, 相比于传统状态空间模型在机场能见度预测数据中拥有更加良好得表现.
2 主要结果
2.1 核方法
设
定义2.1 假设
称
注2.1 设
根据定义2.1, 观测点集
其中, 观测方差的矩阵
2.2 核状态空间模型
考虑以下核状态空间模型
设
定义2.2 设
一般地, 假设
其中, 最后一个等式是由于核函数的再生性, 即对任意
从而
2.3 问题求解和唯一性
设
对于该函数重构问题, 以下定理给出了求解算法和解的存在性.
定理2.1
证 注意到
记
最后一个等式为
将该优化问题关于
得到
根据
定理2.1证毕.
到此为止, 优化问题(2.6)提供了一种函数重构方法, 当
2.4 预测误差估计
设
考虑误差估计式
定理2.2 假设
假设
证 根据定理5.1, 将
注意
因此
由于我们假设了
根据
根据Markov不等式, 得到第一个误差估计的概率.
对于第二个不等式, 根据定理2.3, 假设
其中
根据
根据(2.7)式取
定理2.3 设
证明见附录.
2.5 多维状态变量问题
针对多响应回归问题, 记
其等价于通过正则化最小二乘法分别构建
能够将整体优化问题转化为分别优化
算法1. 多变量情形
1) 将原始观测数据拓展为
2) 对于每一份观测数据, 运用正则化最小二乘法求解
3) 输出多状态估计函数式
3 模拟实验
两个模拟实验被用来检验KSSM模型的有效性. 在所有实验中, 时间序列数据都来源于确定性方程, 外加混合一定的观测噪声.
例3.1 假设真实系统为
其中噪声满足
通过样本直观, 可以发现其具有明显的周期性特点. 且该系统不满足马尔可夫性, 因此尝试进行
给定适当的超参数,
例3.2 (多响应回归) 假设系统为
其中
这里, 首先考虑
取
从实验设计得到的样本案例, 可以发现核状态空间模型在周期性时间序列样本(如例3.1)和趋势性周期性时间序列样本(如例3.2)能够拥有良好的表现.
图 1
4 真实数据实验
在这一部分, 对比KSSM模型和滑动平均模型(ARMA)以及Kalman Filter(Kalman)模型. 滑动平均模型起源于自回归模型, 可以追述到Akaike(1969), 用于识别白噪声条件下的结构化参数[10, 11]. Kalman滤波是一种二次估计算法, 最先由Rudolf Kalman在1960提出[12]. 现实实验数据由中国学位研究生发展中心提供. 该实验的目的是在给定相关影响因子的前提下, 预测机场的能见度水平. 具体的, 机场气压、着陆区域最高点气压以及海平面气压都会提供. 另外, 数据测量了每分钟的温度、湿度、风速等数据. 观测持续
表 1 能见度预测, 真实数据实验对比结果
Method | MSE | SE | SS | MAPE |
Kalman | 0.00497 | 7.150 | 277.96 | 0.0257 |
ARMA( | 0.00246 | 3.545 | 277.96 | 0.0127 |
KSSM( | 0.00065 | 0.933 | 277.96 | 0.0034 |
我们对比了平均平方误差(MSE), 平方误差和以及平均绝对误差百分比(MAPE). 从表 1的对比结果, 可以看到本文提出的KSSM模型拥有更高的预测准确率. 进一步分析预测结果, 我们发现KSSM模型更加适应于规律化学习, 特别当数据具有明显的周期性时, 表现更加优秀. 这很容易理解, 是因为KSSM模型更加关注历史规则的学习. 至少在机场能见度预测数据中, 本文提出的核状态空间模型提供了更加准确的预测效果.
5 附录
命题5.1 设
如果
这在很多泛函分析的书本中都可以找到. 下面是定理2.3的证明.
证 设
设
因为
由于
因此
选择常量
其满足
设
因为
为了得到该不等式, 考虑
容易得到
从而
至此, 我们证明了先前的声明. 不等式(5.1)成立, 只要令
参考文献
A state space model for berlin house prices: Estimation and economic interpretation
,DOI:10.1023/A:1026373523075 [本文引用: 1]
State filtering and parameter estimation for state space systems with scarce measurements
,DOI:10.1016/j.sigpro.2014.03.031 [本文引用: 1]
Estimating a state-space model from point process observations
,DOI:10.1162/089976603765202622 [本文引用: 1]
On the expected discounted penalty function in a markov-dependent risk model with constant dividend barrier
,
State-space multitaper time-frequency analysis
,
Quasi-maximum likelihood estimation for cointegrated continuous-time linear state space models observed at low frequencies
,
Sequential monte carlo methods for dynamic systems
,DOI:10.1080/01621459.1998.10473765 [本文引用: 1]
The iterated auxiliary particle filter
,DOI:10.1080/01621459.2016.1222291 [本文引用: 1]
Fitting autoregressive models for prediction
,DOI:10.1007/BF02532251 [本文引用: 1]
Statistical predictor identification
,DOI:10.1007/BF02506337 [本文引用: 1]
/
〈 | 〉 |