## Electronic Seal Matching Based on Nonstationarity Measure

Lv Yang1, Ding Yiming1, Tan Qiuheng2

 基金资助: 中央高校基本科研业务费专项资金.  2017IVA073

 Fund supported: the Fundamental Research Funds for the Central Universities.  2017IVA073

Abstract

Based on nonstationarity measure, we design an electronic seal for matching by the random encryption method. The electronic seal contains time information, equipment information, content information and specific information. The electronic seal combines four parts of information into a sequence and is masked by strong noise. It is indeed an information sequence (Information plus strong noise sequences) with length of 1024. Since the nonstationarity measure is not affected by the noise distribution, the electronic seal can match with the electronic seal information security under the noise. Simulations indicate that the electronic seal achieves good performance in security, avoids key management and high match accuracy. It may have potential application in the field of information security such as authentication.

Keywords： Electronic seal ; Nonstationarity measure ; Random encryption ; Authentication

Lv Yang, Ding Yiming, Tan Qiuheng. Electronic Seal Matching Based on Nonstationarity Measure. Acta Mathematica Scientia[J], 2021, 41(3): 892-901 doi:

## 1 引言

### 2.1 稳定集合的定义与判别

$\Omega = [0, 1], X = \left \{ x_n \right \}_{n = 1}^{\infty }\subseteq \Omega$为一无穷长数据流, 称$\left \{ A_i \right \}_{i = 1}^{m} $$\Omega 的一个划分, 如果所有的集合 A_i 两两不相交, 且它们的并等于 \Omega . 由划分 \left \{ A_i \right \}_{i = 1}^{m} 出发可以诱导一个相应的 \sigma -代数. 给定Borel集 A\subseteq\Omega , 数据流进入A的频率序列可以表示为[6] $$f_k(A) = \frac{1}{k}\sum\limits_{i = 1}^{k}I_A(x_i), k = 1, 2, 3, \cdots,$$ 其中 I_A(x_i) 为取值为0或1的示性函数. 当 f_k(A) 收敛于某一常数, 我们称Borel集 A 为数据流 X 的一个稳定集合. 从遍历论的观点看, 稳定集合的多少衡量了一个数据生成过程的稳定程度的大小, 稳定集合越多, 数据生成过程越平稳; 反之, 数据生成过程越不平稳. 上述对于稳定集合的定义是在极限意义下的概念. 但实际数据中, 数据长度往往为有限, 需要通过具体的判别算法来确定. 在有限样本下, 基于概率论中大数定律和中心极限定理, 可以采用如下稳定集合判别标准: 对于序列样本 X_L = \left \{ x_i\in \Omega:i = 1, 2, \cdots , L \right \} , 已知集合 A\subseteq \Omega , 根据(2.1) 式可计算出有限频率序列 \left \{ f_k(A) \right \}_{k = 1}^{L} , 记 \widehat{p} = f_L(A) , 给定 \lambda , 定义区间序列 $$[P_L(k), P_U(k)] = [\widehat{p}-\lambda \sqrt{\frac{\widehat{p}(1-\widehat{p})}{L}}, \widehat{p}+\lambda \sqrt{\frac{\widehat{p}(1-\widehat{p})}{L}}, k = 1, 2, \cdots , L],$$ 以及 $$P_{\widetilde{C}, A}(\lambda , \widehat{p}) = \frac{ \#\left \{k:f_k(A)\in [P_L(k), P_U(k)], k = 1, 2, \cdots , L \right \}}{L}.$$ P_{\widetilde{C}, A}(\lambda , \widehat{p}) \geqslant p_0 时, 称集合 A 为该有限序列的稳定集合, 稳定集合判别标准记为 \widetilde{C}(\lambda, p_0, \widehat{p}) . 在该判别准则中, p_0 为阈值, 满足 0< p_0\leqslant 1 , p_0 选取越大, 对稳定集合的判别标准越严. \widehat{p} = f_L(A) 为位置参数, 控制着区间序列的对称中心, 它是频率序列的有效替代. \lambda 是形状参数, 控制者区间序列所形成的置信区域的宽度, P_{\widetilde{C}, A}(\lambda , \widehat{p}) 的取值范围与 p_0 相同, 表示样本所产生的频率序列位于置信带区域的百分比, 对于给定的样本, 它依赖于位置参数 \widehat{p} 与形状参数 \lambda . 当给定频率序列的参考极限值 f 时, 相应的判别方法只需要将 \widehat{p} 替换为 f 即可, 相应的判别准则记为 \widetilde{C}(\lambda, p_0, f) , 在 f 给定条件下仅依赖参数 \lambda$$ p_0$, 记为$\widetilde{C}(\lambda, p_0)$.

### 2.2 稳定信息结构(SIS: Stable Information Structure)

1) 输入序列$X$, 给定参数$\lambda $$p_0 , 确定标准 \widetilde{C}(\lambda, p_0) . 2) 选择初始划分方式(一般取等长均匀区间)将相应空间划分为 N 块, 得到 N+1 个分割点 d_i , i = 1, 2, \cdots, N+1 , 满足 0 = d_1< d_2<\cdots <d_{N+1} = 1 . A_k = [d_k, d_{k+1}],$$ k = 1, 2, \cdots, N$, 则$\left \{ A_1, A_2, \cdots, A_ N\right \} $$\Omega 的一个初始划分, 设置稳定区间集合 S 为空集. 3) 以分割点 d_1 为起始搜索节点, 在标准 \widetilde{C}(\lambda, p_0) 下向右搜索稳定区间, 将 d_1 扩充为区间 [d_1, d_2] , 判断其是否为稳定区间. 如果它是稳定区间, 则 S = S\cup \left \{ [d_1, d_2] \right \} , 然后以分割 d_2 为新的起始搜索节点, 继续向右扩展寻找稳定区间; 如果它不是稳定区间, 则扩展区间 [d_1, d_2]$$ [d_1, d_3]$, 直到得出稳定区间$[d_1, d_{1+j_1}], 1\leqslant j_1\leqslant N$, 令$S = S\cup \left \{ [d_1, d_{1+j_1}] \right \}$.

4) 若$j_1<N$, 则以$d_{1+j_1}$为起始搜索节点代替$d_1$, 在标准$\widetilde{C}(\lambda, p_0)$下向右搜索稳定区间, 将$d_{1+j_1}$扩充为区间$[d_{1+j_1}, d_{2+j_1}]$, 判断其是否为稳定区间. 如果它是稳定区间, 则$S = S\cup \left \{ [d_{1+j_1}, d_{2+j_1}]\right \}$, 令$j_2 = j_1+1$, 转入下一步; 如果它不是稳定区间, 则扩展区间$[d_{1+j_1}, d_{2+j_1}] $$[d_{1+j_1}, d_{3+j_1}] , 直到得出稳定区间 [d_{1+j_1}, d_{1+j_2}], j_1<j_2\leqslant N , 令 S = S\cup \left \{ [d_1, d_{1+j_1}] \right \} , 转入下一步. 5) 若 j_2<N , 则以 d_{1+j_2} 为搜索节点代替 d_{1+j_1} , 重复上一步骤, 直到 j_2 = N 时停止. 6) 由稳定区间集合生成稳定信息结构 \sigma(S) . 与此同时, 还可以考虑一种从右到左稳定区间搜索算法, 即从最右端节点 d_{N+1} 开始向左端搜索稳定区间, 具体步骤不再详述. 从左到右稳定区间搜索算法简单、直观, 且速度较快. 但其具有一定的局限性: 从最左端节点开始搜索稳定区间的过程中, 若某个区间的稳定性发生误判, 将会对下个区间的稳定性判别产生重要影响. 从左到右稳定区间搜索算法是基于某个分割点出发在初始划分 \left \{ A_1, A_2, \cdots , A_N \right \} 上搜索稳定区间, 从而获取稳定信息结构. 本文考虑获取有限长数据流样本在特定分割下稳定区间数量, 结合从左到右稳定区间搜索算法与从右到左稳定区间搜索算法, 以两种算法所计算出稳定区间数量的平均值作为最后结果来克服单一算法导致的局限性. ## 3 非平稳性度量指标 有了稳定集合的定义、有限样本下稳定集合判别标准 \widetilde{C}(\lambda, p_0) 、稳定信息结构的定义及其获取算法, 我们给出非平稳性度量指标定义\textsuperscript{[7]}: 在给定 \widetilde{C}(\lambda, p_0) 和初始划分的情况下, 序列 X 的Shannon熵定义为由初始划分所诱导的 \sigma -代数的所有稳定子 \sigma -代数Shannon熵的上确界, 即 $$H(X) = \sup\left \{ H({\cal F}):{\cal F}\in T_X \right \},$$ 其中, T_X$$ X$的所有稳定信息结构构成的集合.

$$$NS(X) = 1-H(X)/H_0,$$$

$AR(1)$模型

### 4.1 构造信息序列

1) 固定信息所生成的信息序列也是固定且唯一的;

2) 信息序列对于信息是敏感的, 换而言之, 相似的信息所构造出的信息序列显著不同;

3) 信息序列与图片可互相转换, 即信息序列值为正整数且取值范围在[0, 255]以内.

$$$Y = X+\varepsilon, \varepsilon \sim i.i.d,$$$

$$$Y-X' = (X-X')+\varepsilon,$$$

1) 原始信息为Inf, 对原始信息进行Hash加密映射. 这里采用MD5算法得到32位字母与数字组合的有序序列Hinf = hash(Inf);

2) 将哈希有序序列Hinf转化为ASCII编码, 得到有序序列Ainf = ASCII(Hinf). 对序列Ainf进行展开得到取值在[0, 9]的有序序列. 例: Ainf为$(52, 51, \cdots, 101, 3)$展开为序列$(5, 2, 5, 1, \cdots, 1, 0, 1, 3)$;

3) 按照序列各项值重复进行展开得到序列$(x_{i_1}, x_{i_2}, \cdots, x_{i_n}, x_j)$, $x_i\in [2, 9]$, $x_j\in [0, 1]$, $n = x_i$. 例: 序列$(5, 2, 5, 1, \cdots, 1, 0, 1, 3)$展开得到序列$(5, 5, 5, 5, 5, 2, 2, \cdots, 1, 0, 1, 3, 3, 3)$;

4) 对3) 步骤中得到的序列每一项乘以9得到序列Minf;

5) 将序列Minf重复排列, 截断为长度为256的最终信息序列X.

### 4.3 数字印章设计

1) 时间信息: 时间信息具有时效性. 对于同一数字内容, 不通的加盖时间能够有效的防止批量复制加盖;

2) 设备信息: 加盖印章所用设备为用户进行操作地点的重要依据, 对于某些具有授权的设备具有特定的权限, 不同设备也具备不同的机器指纹. 也是印章信息存储的重要载体. 获取设备信息的唯一性使这一信息匹配成为判别信息真伪的有效依据;

3) 内容信息: 内容信息包含加盖文件载体的标题、签署人、机构(单位)等. 该信息使数字印章与加盖载体相关联, 从而达到"一章一版"的效果;

4) 自定义信息: 自定义信息在信息匹配中有独特的作用. 在同一时间、同一设备以及加盖相同文章的情况下, 可对分发印章分数进行编号. 当发生文件泄漏, 可以匹配自定义信息确定泄漏源头.

### 图 6

2) 对图 6数字印章图片进行信息匹配操作. 首先由数字印章图片反向获取印章序列$Y = [72, 8, 102, \cdots , 90, 179, 153].$其次由待匹配信息("2020 01-01 12.12.12 Wen Jan") 构造信息序列($X = [9, 0, 9, \cdots , 45, 45, 45]).$根据$\varepsilon = Y-X$则可获取噪声序列$\varepsilon = [63, 8, 93, \cdots , 45, 134, 108]$. 最终计算该噪声序列NS值. 如本例中所获取的噪声序列正为构造该印章序列过程中所生成的平稳噪声序列, 其NS值为0, 即信息与数字印章匹配成功, 否则匹配失败.

 数字印章内容 试验次数 匹配准确率(单通道) 匹配准确率(三通道) 单一信息(NSi) 50 92% 100% 100 93% 100% 500 93% 100% 1000 93.2% 100% 总信息(NSsum) 50 100% 100% 100 100% 100% 500 100% 100% 1000 100% 100%

## 参考文献 原文顺序 文献年度倒序 文中引用次数倒序 被引期刊影响因子

Tang Y J , Hu Y .

A comparative study of electronic seal and the traditional seal

Archives Science Bulletin, 2006, 291, 62- 64

Masoumi M .

A highly efficient and secure hardware implementation of the advanced encryption standard

Journal of Information Security and Applications, 2019, 48, 102371

Lai Xuejia .

An analysis of international data encryption algorithm(IDEA) security against differential cryptanalysis

Wuhan University Journal of Natural Sciences, 2008, 6, 697- 701

Diffie W , Hellman M .

New direction in cryptography

IEEE Transaction on Information Theory, 1976, 6 (22): 644- 654

Xu Z F , Zeng K , Zhou F C .

Anonymous electronic voting scheme based on time-released encryption and digital signature

Computer Applications and Software, 2016, 33 (12): 325- 328

Ding Y M , Fan W T , Tan Q H , et al.

Nonstationarity measure of data stream

Acta Math Sci, 2010, 30A (5): 1364- 1376

Tan Q H. The Time Series Nonstationarity Measurement and Its Applications[D]. Beijing: Graduate School of Chinese Academy of Sciences, 2013

Lan J , Tan Q H , Dong Q J .

Selection of forecasting models for irrigation water consumption based on nonstationarity measure

Engineering Journal of Wuhan University, 2014, 47 (6): 721- 725

Tan Q H , Ding Y M .

Empirical analysis of lottery data based on non-stationarity measure

Acta Math Sci, 2014, 34A (1): 207- 216

Tan Q H , Wu L , Li B .

Decomposition of noise and trend based on EMD and non-stationarity measure

Acta Math Sci, 2016, 36A (4): 783- 794

Ding Y M, Tan Q H, Zeng Z G. A method of image encryption random double-blind confidential matching: CN201410822766.8[P]. 2015-04-29

/

 〈 〉