数学物理学报, 2021, 41(3): 892-901 doi:

论文

基于非平稳性度量的数字印章信息匹配

吕洋1, 丁义明1, 谭秋衡2

Electronic Seal Matching Based on Nonstationarity Measure

Lv Yang1, Ding Yiming1, Tan Qiuheng2

通讯作者: 丁义明

收稿日期: 2019-12-14  

基金资助: 中央高校基本科研业务费专项资金.  2017IVA073

Received: 2019-12-14  

Fund supported: the Fundamental Research Funds for the Central Universities.  2017IVA073

Abstract

Based on nonstationarity measure, we design an electronic seal for matching by the random encryption method. The electronic seal contains time information, equipment information, content information and specific information. The electronic seal combines four parts of information into a sequence and is masked by strong noise. It is indeed an information sequence (Information plus strong noise sequences) with length of 1024. Since the nonstationarity measure is not affected by the noise distribution, the electronic seal can match with the electronic seal information security under the noise. Simulations indicate that the electronic seal achieves good performance in security, avoids key management and high match accuracy. It may have potential application in the field of information security such as authentication.

Keywords: Electronic seal ; Nonstationarity measure ; Random encryption ; Authentication

PDF (684KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

吕洋, 丁义明, 谭秋衡. 基于非平稳性度量的数字印章信息匹配. 数学物理学报[J], 2021, 41(3): 892-901 doi:

Lv Yang, Ding Yiming, Tan Qiuheng. Electronic Seal Matching Based on Nonstationarity Measure. Acta Mathematica Scientia[J], 2021, 41(3): 892-901 doi:

1 引言

数字印章技术[1]以数字技术模拟传统实物印章, 其管理、使用方式符合实物印章的习惯和体验. 数字印章的具体做法是将电子文书内容的数字签名通过数字水印、加密等技术, 使其和数字印章图像进行有效的绑定. 验证数字印章真伪的过程其实就是验证数字签名的过程, 通过数字签名以及验证技术证明与数字印章相关联的电子文书是真实的, 数字印章图像才被承认是有效的. 数字印章所基于的数字签名匹配技术是信息与数据安全的核心技术之一, 可以实现身份认证、数据完整性保护、防篡改、防冒充以及不可否认性等数据传输中的需求. 随着大数据时代的到来, 数字印章技术将会在消息鉴别机制中发挥重要的作用.

数字印章基于的数字签名技术, 不关注算法的保密性, 即算法公开, 它的数据安全与密钥的保密程度有很大的关系. 所涉及的加密技术分为对称加密和非对称加密. 常见的对称加密算法有: AES(Advanced Encryption Standard)[2], IDEA(International Data Encryption Algorithm)[3]等. 对称加密具算法公开、计算量小、加密速度快、加密效率高的优点. 但每对用户每次使用对称加密算法时, 都需要使用其他人不知道的独一密钥, 这会使得收、发双方所拥有的钥匙数量巨大, 密钥管理成为双方的负担. 随着Diffie和Hellman提出公钥密码思想后[4], 已产生了基于离散对数的签名, 基于椭圆曲线的签名[5]等非对称加密技术, 在保护通信安全方面,非对称加密算法具有对称密码难以企及的优势. 但非对称加密算法比对称加密算法慢数千倍. 两种加密技术各有优劣, 我们尝试从一个新的视角来对信息进行加密并设计数字印章.

在实际生活和工作中, 人们通常通过云计算的方式来充分利用各部门的计算资源和数据资源, 这对信息安全带来了巨大的隐患. 例如政府签发文件盖章, 由于签发文件数量多, 容易出现泄密, 以及对印章进行仿造和对文件进行篡改. 出于版权保护、国家安全、犯罪追查等因素的考虑, 常常需要对数字印章信息进行保密匹配, 即把印章信息加密后进行自动匹配认证(不让操作人员看到印章信息的真实内容). 所谓的数字印章的保密匹配就是研究经过加密后的数字印章与印章信息匹配认证问题, 使用这一匹配技术的普通用户, 无法通过自身人眼或其它方法在匹配数字印章的输入和匹配结果的输出过程中辨识出图片上所展示的数据信息, 从而满足特殊场合下的保密需求. 现有的加密方法目标是为了信息在传输过程中的安全, 存在基于密钥的解密的算法, 从而保证信息在传输过程中的安全和解密后的信息质量. 由于解密算法的存在, 总存在泄密的可能(密钥丢失, 被非法窃取等). 本文提出的数字印章加密技术与现有的加密技术最大的区别是: 只加密, 不解密, 加密只是起掩盖目标信息的作用.

基于序列的非平稳性度量, 本文提出了一种新的数字印章信息随机加密和匹配技术, 旨在达到身份认证、信息加密、防篡改伪造的目的. 非平稳性是时间序列的一个重要特征, 丁义明、谭秋衡等借助遍历论、粗粒化及信息论的观点, 对时间序列的非平稳性度量进行研究, 提出了非平稳性度量指标NS[6-7], 并应用于其他领域[8-10]. 对于独立同分布时间序列, 其NS值为0或接近于0这一特点, 构造平稳噪声序列对原始数据(摘要信息)进行加密、盖章. 以及反向通过原始数据获取印章残差序列, 并计算残差序列非平稳性, 即NS值进行身份认证.

我们设计的数字印章采用服从独立均匀分布的噪声序列对原始数据信息进行掩盖. 从图像保密匹配的角度看, 它实际上是一种图像掩盖方法. 主要在图像数据中加入很强的随机噪声, 使图像难以辨认. 由于噪声强度远大于信号强度从而能够达到对于原始数据安全加密的目的. 现有的加密方法旨在传递信息, 必定对应于一个快速的依赖于密钥解密算法. 而本文中由于服从同分布的噪声序列是随机的, 对于一个原始数据信息可以产生不同的噪声序列进行加密, 生成数字印章都彼此不同. 采用的实际上是"一次一密"的加密算法思想, 加密旨在掩盖图像信息, 不需要解密. 当进行身份认证时, 仅需要根据这一原始数据信息就可以完成. 解决了传统对称加密算法中管理密钥这一问题, 使用了"一次一密"的优点, 使得破解难以一劳永逸. 相较非对称加密技术, 该数字印章技术用户操作步骤少, 减少了使用双方操作成本.

本文简要介绍时间序列的非平稳性度量的定义及近似计算方法, 将其应用到数字印章设计和匹配. 利用残差序列非平稳性度量值, 对真伪信息进行身份判别, 并通过理论和仿真实验给出判别准确率结果. 我们所设计的数据印章包含了时间信息、设备信息、文件内容信息以及自定义信息, 全面的涵盖了加盖数字印章的时空属性, 并与加盖载体具有关联性. 匹配结果能够有效准确的对真伪信息进行判别, 且准确率高, 鲁棒性好.

2 稳定集合与稳定信息结构

2.1 稳定集合的定义与判别

$ \Omega = [0, 1], X = \left \{ x_n \right \}_{n = 1}^{\infty }\subseteq \Omega $为一无穷长数据流, 称$ \left \{ A_i \right \}_{i = 1}^{m} $$ \Omega $的一个划分, 如果所有的集合$ A_i $两两不相交, 且它们的并等于$ \Omega $. 由划分$ \left \{ A_i \right \}_{i = 1}^{m} $出发可以诱导一个相应的$ \sigma $ -代数. 给定Borel集$ A\subseteq\Omega $, 数据流进入A的频率序列可以表示为[6]

$ \begin{equation} f_k(A) = \frac{1}{k}\sum\limits_{i = 1}^{k}I_A(x_i), k = 1, 2, 3, \cdots, \end{equation} $

其中$ I_A(x_i) $为取值为0或1的示性函数. 当$ f_k(A) $收敛于某一常数, 我们称Borel集$ A $为数据流$ X $的一个稳定集合. 从遍历论的观点看, 稳定集合的多少衡量了一个数据生成过程的稳定程度的大小, 稳定集合越多, 数据生成过程越平稳; 反之, 数据生成过程越不平稳. 上述对于稳定集合的定义是在极限意义下的概念. 但实际数据中, 数据长度往往为有限, 需要通过具体的判别算法来确定.

在有限样本下, 基于概率论中大数定律和中心极限定理, 可以采用如下稳定集合判别标准: 对于序列样本$ X_L = \left \{ x_i\in \Omega:i = 1, 2, \cdots , L \right \} $, 已知集合$ A\subseteq \Omega $, 根据(2.1) 式可计算出有限频率序列$ \left \{ f_k(A) \right \}_{k = 1}^{L} $, 记$ \widehat{p} = f_L(A) $, 给定$ \lambda $, 定义区间序列

$ \begin{equation} [P_L(k), P_U(k)] = [\widehat{p}-\lambda \sqrt{\frac{\widehat{p}(1-\widehat{p})}{L}}, \widehat{p}+\lambda \sqrt{\frac{\widehat{p}(1-\widehat{p})}{L}}, k = 1, 2, \cdots , L], \end{equation} $

以及

$ \begin{equation} P_{\widetilde{C}, A}(\lambda , \widehat{p}) = \frac{ \#\left \{k:f_k(A)\in [P_L(k), P_U(k)], k = 1, 2, \cdots , L \right \}}{L}. \end{equation} $

$ P_{\widetilde{C}, A}(\lambda , \widehat{p}) \geqslant p_0 $时, 称集合$ A $为该有限序列的稳定集合, 稳定集合判别标准记为$ \widetilde{C}(\lambda, p_0, \widehat{p}) $. 在该判别准则中, $ p_0 $为阈值, 满足$ 0< p_0\leqslant 1 $, $ p_0 $选取越大, 对稳定集合的判别标准越严. $ \widehat{p} = f_L(A) $为位置参数, 控制着区间序列的对称中心, 它是频率序列的有效替代. $ \lambda $是形状参数, 控制者区间序列所形成的置信区域的宽度, $ P_{\widetilde{C}, A}(\lambda , \widehat{p}) $的取值范围与$ p_0 $相同, 表示样本所产生的频率序列位于置信带区域的百分比, 对于给定的样本, 它依赖于位置参数$ \widehat{p} $与形状参数$ \lambda $. 当给定频率序列的参考极限值$ f $时, 相应的判别方法只需要将$ \widehat{p} $替换为$ f $即可, 相应的判别准则记为$ \widetilde{C}(\lambda, p_0, f) $, 在$ f $给定条件下仅依赖参数$ \lambda $$ p_0 $, 记为$ \widetilde{C}(\lambda, p_0) $.

同统计学的假设检验一样, 有限频率序列的收敛准则$ \widetilde{C}(\lambda, p_0) $有两类犯错的可能. 一个好的稳定集合判别准则应回答的是: 事件稳定时在该准则下判别为稳定的可能性是多少? 即事件"真判真"的概率是多少? 我们考虑第一类错误: 真判假. 当事件对应稳定集合时, 样本频率序列被判别不收敛, 从而稳定事件被判为不稳定事件. 把这种"弃真"错误的概率记为$ \alpha $. 因此"真判真"的概率等于$ 1-\alpha $. 从另一个角度考虑: 为保证事件的概率等于$ 1-\alpha $, 参数$ \lambda $$ p_0 $该如何取?通过Monte Carlo进行了仿真实验. 建立标准正态分布关系式$ P_\tau (-\lambda\leqslant Y\leqslant\lambda) = 1-\alpha $ (其中$ Y $服从$ N(0, 1) $)可求得$ \lambda $. 这样, 仅指定显著性水平$ \alpha $就可以去定参数$ \lambda $$ p_0 $的数值. 也就是说$ \widetilde{C}(\lambda, p_0) $仅依赖显著性水平$ \alpha $的选取.

2.2 稳定信息结构(SIS: Stable Information Structure)

对于有限长数据流样本, 在稳定集合判别准则$ \widetilde{C}(\lambda, p_0) $的基础上, 可按如下方式定义稳定信息结构: 假设$ (X, {\cal F}, P) $为一个概率空间, $ \left \{ A_i \right \}_{i = 1}^{m} $$ X $的一个初始划分, 准则$ \widetilde{C}(\lambda, p_0) $下, 以$ \left \{ A_i \right \}_{i = 1}^{m} $$ X $为基础构建新的划分$ \left \{ \widehat{A}_i \right \}_{i = 1}^{\widehat{m}} $(每个$ \widehat{A}_i $都由若干个$ A_i $求并集得到, 要求每个$ A_i $都要求被用到且仅用到1次), 使得新划分中的每个集合都平稳. 将由$ \left \{ \widehat{A}_i \right \}_{i = 1}^{\widehat{m}} $出发诱导的相应的$ \sigma $ -代数$ \sigma(\left \{ \widehat{A}_i \right \}_{i = 1}^{\widehat{m}}) $, 简记为$ \sigma $, 三元组$ (X, \sigma, P) $称为$ (X, \widetilde{C}) $的一个稳定信息结构. 下面介绍本文所用到提取稳定信息结构的近似方法: 从左到右稳定区间搜索算法.计算步骤如下:

1) 输入序列$ X $, 给定参数$ \lambda $$ p_0 $, 确定标准$ \widetilde{C}(\lambda, p_0) $.

2) 选择初始划分方式(一般取等长均匀区间)将相应空间划分为$ N $块, 得到$ N+1 $个分割点$ d_i $, $ i = 1, 2, \cdots, N+1 $, 满足$ 0 = d_1< d_2<\cdots <d_{N+1} = 1 $.$ A_k = [d_k, d_{k+1}], $$ k = 1, 2, \cdots, N $, 则$ \left \{ A_1, A_2, \cdots, A_ N\right \} $$ \Omega $的一个初始划分, 设置稳定区间集合$ S $为空集.

3) 以分割点$ d_1 $为起始搜索节点, 在标准$ \widetilde{C}(\lambda, p_0) $下向右搜索稳定区间, 将$ d_1 $扩充为区间$ [d_1, d_2] $, 判断其是否为稳定区间. 如果它是稳定区间, 则$ S = S\cup \left \{ [d_1, d_2] \right \} $, 然后以分割$ d_2 $为新的起始搜索节点, 继续向右扩展寻找稳定区间; 如果它不是稳定区间, 则扩展区间$ [d_1, d_2] $$ [d_1, d_3] $, 直到得出稳定区间$ [d_1, d_{1+j_1}], 1\leqslant j_1\leqslant N $, 令$ S = S\cup \left \{ [d_1, d_{1+j_1}] \right \} $.

4) 若$ j_1<N $, 则以$ d_{1+j_1} $为起始搜索节点代替$ d_1 $, 在标准$ \widetilde{C}(\lambda, p_0) $下向右搜索稳定区间, 将$ d_{1+j_1} $扩充为区间$ [d_{1+j_1}, d_{2+j_1}] $, 判断其是否为稳定区间. 如果它是稳定区间, 则$ S = S\cup \left \{ [d_{1+j_1}, d_{2+j_1}]\right \} $, 令$ j_2 = j_1+1 $, 转入下一步; 如果它不是稳定区间, 则扩展区间$ [d_{1+j_1}, d_{2+j_1}] $$ [d_{1+j_1}, d_{3+j_1}] $, 直到得出稳定区间$ [d_{1+j_1}, d_{1+j_2}], j_1<j_2\leqslant N $, 令$ S = S\cup \left \{ [d_1, d_{1+j_1}] \right \} $, 转入下一步.

5) 若$ j_2<N $, 则以$ d_{1+j_2} $为搜索节点代替$ d_{1+j_1} $, 重复上一步骤, 直到$ j_2 = N $时停止.

6) 由稳定区间集合生成稳定信息结构$ \sigma(S) $.

与此同时, 还可以考虑一种从右到左稳定区间搜索算法, 即从最右端节点$ d_{N+1} $开始向左端搜索稳定区间, 具体步骤不再详述. 从左到右稳定区间搜索算法简单、直观, 且速度较快. 但其具有一定的局限性: 从最左端节点开始搜索稳定区间的过程中, 若某个区间的稳定性发生误判, 将会对下个区间的稳定性判别产生重要影响. 从左到右稳定区间搜索算法是基于某个分割点出发在初始划分$ \left \{ A_1, A_2, \cdots , A_N \right \} $上搜索稳定区间, 从而获取稳定信息结构. 本文考虑获取有限长数据流样本在特定分割下稳定区间数量, 结合从左到右稳定区间搜索算法与从右到左稳定区间搜索算法, 以两种算法所计算出稳定区间数量的平均值作为最后结果来克服单一算法导致的局限性.

3 非平稳性度量指标

有了稳定集合的定义、有限样本下稳定集合判别标准$ \widetilde{C}(\lambda, p_0) $、稳定信息结构的定义及其获取算法, 我们给出非平稳性度量指标定义\textsuperscript{[7]}: 在给定$ \widetilde{C}(\lambda, p_0) $和初始划分的情况下, 序列$ X $的Shannon熵定义为由初始划分所诱导的$ \sigma $ -代数的所有稳定子$ \sigma $ -代数Shannon熵的上确界, 即

$ \begin{equation} H(X) = \sup\left \{ H({\cal F}):{\cal F}\in T_X \right \}, \end{equation} $

其中, $ T_X $$ X $的所有稳定信息结构构成的集合.

时间序列的非平稳性度量定义为

$ \begin{equation} NS(X) = 1-H(X)/H_0, \end{equation} $

其中, $ H_0 $为初始划分的Shannon熵($ H_0 = -\sum p_i \log p_i $).

$ AR(1) $模型

其中$ \epsilon $为独立同分布的零均值噪声. 对$ AR(1) $模型而言, 参数$ \rho \in [0, 1] $越大, 模型的非平稳性越强. $ \rho = 0 $对应于独立同分布的噪声$ \epsilon $的抽样, 平稳性最强, 而$ \rho = 1 $对应于具有单位根的过程, 非平稳性最强. 选取在样本长度$ L = 1100 $, 样本组数$ S = 15000 $下进行实验绘制模型$ AR(1) $的NS随参数$ \rho $变化图, NS设置: 等分位数划分$ N = 1.87(L-1)^{0.4} $, $ \lambda = 1.96 $, $ p_0 = 0.925845 $.

图 1可以看出, $ \rho $从0增大到1, 平均NS都从0 (或接近0)单调增大至1 (或接近1), 且满足

图 1

图 1   AR(1)的NS随ρ参数变化图


上述结论验证NS值是时间序列非平稳程度的一个良好刻画. 时间序列越平稳, 在给定的稳定标准和初始划分下, 得到的稳定集合越多, 稳定信息结构越精细, 从而NS值也就越小. 对于独立同分布数据, 其NS值为0或接近于0; 对于趋势性较强的数据, 其NS值为1或接近于1.

我们将利用此实验结果设计数字印章, 本文在置信水平$ \alpha = 0.1 $下稳定集合判别标准为$ \widetilde{C}(\lambda = 1.96, p_0 = 0.935068) $, 提取算法选为结合从左到右稳定区间搜索算法与从右到左稳定区间搜索算法, 采取长度为8的等长均匀初始划分.

4 数字印章生成

数字印章用以生成唯一确定的信息, 即包含加盖印章时间信息、加盖印章所用设备信息、与所加盖文章内容关联信息以及加盖用户自定义信息. 对在不同时间、设备、载体等数字媒介上进行盗用、篡改行为起到防护识别的目的.

数字印章包含两部分: 信息序列与噪声序列. 数字印章对目标信息构造信息序列, 并用以之后的匹配认证. 噪声序列一方面对信息序列加以掩盖起到加密作用, 另一方面平稳的噪声序列对数字印章的匹配, 并通过计算残差序列的NS值来判别信息真伪提供了度量标准.

4.1 构造信息序列

信息序列应满足以下三个性质:

1) 固定信息所生成的信息序列也是固定且唯一的;

2) 信息序列对于信息是敏感的, 换而言之, 相似的信息所构造出的信息序列显著不同;

3) 信息序列与图片可互相转换, 即信息序列值为正整数且取值范围在[0, 255]以内.

当信息发生微小变动或存在相似伪信息时, 所构造的信息序列应与原信息所构造的信息序列呈显著差异. 这一差异会为原本平稳的噪声序列带来冗余趋势, 使得噪声序列非平稳, 即

$ \begin{equation} Y = X+\varepsilon, \varepsilon \sim i.i.d, \end{equation} $

$ \begin{equation} Y-X' = (X-X')+\varepsilon, \end{equation} $

其中$ X $为原始信息序列, $ X' $为待验证信息序列. 当$ X = X' $$ Y-X' = \varepsilon $得到独立同分布的平稳噪声序列. 当$ X\neq X' $, $ (X-X') $使平稳的噪声序列带来趋势项. 可以看到$ (X-X') $带来趋势项越显著, 其后对于信息的匹配越有效. 我们根据这一原则对信息序列进行构造.

由于非平稳性度量指标NS的准确度依赖序列的长短, 即序列越长度量越准确, 相应计算量越大. 这里我们选择以合适的长度256来构造信息序列$ X = (x_1, x_2, \cdots, x_N) $, $ x_i\in N^{+}, $$ x_i\in[0, 81], N = 256 $. 构造步骤如下:

1) 原始信息为Inf, 对原始信息进行Hash加密映射. 这里采用MD5算法得到32位字母与数字组合的有序序列Hinf = hash(Inf);

2) 将哈希有序序列Hinf转化为ASCII编码, 得到有序序列Ainf = ASCII(Hinf). 对序列Ainf进行展开得到取值在[0, 9]的有序序列. 例: Ainf为$ (52, 51, \cdots, 101, 3) $展开为序列$ (5, 2, 5, 1, \cdots, 1, 0, 1, 3) $;

3) 按照序列各项值重复进行展开得到序列$ (x_{i_1}, x_{i_2}, \cdots, x_{i_n}, x_j) $, $ x_i\in [2, 9] $, $ x_j\in [0, 1] $, $ n = x_i $. 例: 序列$ (5, 2, 5, 1, \cdots, 1, 0, 1, 3) $展开得到序列$ (5, 5, 5, 5, 5, 2, 2, \cdots, 1, 0, 1, 3, 3, 3) $;

4) 对3) 步骤中得到的序列每一项乘以9得到序列Minf;

5) 将序列Minf重复排列, 截断为长度为256的最终信息序列X.

上述步骤1)–3)使得相似信息所构造的序列差异尽可能大, 步骤4)使序列对于加盖噪声后所得到的序列对信息的变动敏感. 构造步骤所生成的信息序列满足信息序列所应满足的性质.

4.2 构造噪声序列

噪声序列对信息序列加以掩盖, 起到对于信息加密的目的. 由于生成独立同分布的噪声具有随机性, 使得不同数字印章具有不同的噪声序列, 使得破解方法难以一劳永逸.

由于不同随机数生成器生成服从独立同分布的噪声方式不同. 那么有必要通过一种统一计算NS的方式来对生成的噪声进行约束, 其判别标准与提取算法在第三章中进行了说明. 构造平稳的噪声序列换而言之, 是对于固定长度N的序列, 产生服从独立同分布的噪声序列, 使其计算得到的NS值为0. 构造噪声序列$ \varepsilon = (\varepsilon_1, \varepsilon_2, \cdots, \varepsilon_N) $, 其中$ \varepsilon_i $在[0, 174]上服从均匀分布且$ NS(\varepsilon) = 0 $. 上述步骤所构造的噪声序列为生成的数字印章提供了一种度量标准. 另一种意义上来说, 对于异同信息可以有效的检测出残差序列的非平稳性.

4.3 数字印章设计

数字印章包含四部分内容, 下面分别进行阐述

1) 时间信息: 时间信息具有时效性. 对于同一数字内容, 不通的加盖时间能够有效的防止批量复制加盖;

2) 设备信息: 加盖印章所用设备为用户进行操作地点的重要依据, 对于某些具有授权的设备具有特定的权限, 不同设备也具备不同的机器指纹. 也是印章信息存储的重要载体. 获取设备信息的唯一性使这一信息匹配成为判别信息真伪的有效依据;

3) 内容信息: 内容信息包含加盖文件载体的标题、签署人、机构(单位)等. 该信息使数字印章与加盖载体相关联, 从而达到"一章一版"的效果;

4) 自定义信息: 自定义信息在信息匹配中有独特的作用. 在同一时间、同一设备以及加盖相同文章的情况下, 可对分发印章分数进行编号. 当发生文件泄漏, 可以匹配自定义信息确定泄漏源头.

通过4.1节与4.2节的方法对上述数字印章四部分的内容分别构造长度为256的信息序列$ X_i $与噪声序列$ \varepsilon_i(i = 1, 2, 3, 4) $. 则印章序列$ Y_i(y_{i_1}, y_{i_2}, \cdots, y_{i_n}) = X_i+e_i = (x_{i_1}+e_{i_1}, x_{i_2}+e_{i_2}, $$ \cdots, x_{i_n}+e_{i_n}), y_{i_n}\in[0, 255] $. 将每一部分印章序列按行排列转化为$ 16*16 $的灰度图即为得到的数字印章图像, 如图 2. 将四部分印章内容按一定顺序进行排列(这里转化为$ 64*4 $, $ 4*64 $的灰度图进行顺时针拼接)得到最终数字印章, 如图 3.

图 2

图 2   单部分数字印章灰度图


图 3

图 3   四部分数字印章灰度图


图 2, 图 3为数字印章灰度图像, 对于数字印章的信息匹配仅进行一次. 为提高匹配的准确性与稳健性, 对RGB三通道同一信息构造服从相同均匀分布的噪声序列, 生成彩色数字印章, 如图 4, 图 5.

图 4

图 4   单部分数字印章彩色图


图 5

图 5   四部分数字印章彩色图


5 数字印章匹配

数字印章的信息匹配本质上是对数字印章反向获取残差序列, 并计算残差序列NS值的过程. 对于给定的数字印章获取印章序列$ Y $. 并根据待匹配信息按照4.1节方法构造信息序列啊$ X $, 由$ Y-X $获取残差序列. 当代匹配信息为真实原始信息时, 残差序列为4.2所生成服从独立同分布的平稳噪声, 其NS值为0. 反之, 待匹配信息有误(伪信息用记号$ X' $表示)则所得到的残差序列必然含有$ (X-X') $的趋势项, 使得残差序列含有非平稳区间, 其NS值大于0.

4.3节中, 数字印章包含四部分内容. 针对不同内容进行四次独立信息匹配, 计算相应NS值, 记为$ NS_i, (i = 1, 2, 3, 4) $以及总NS值, 记为$ NS_{sum} = NS_1+NS_2+NS_3+NS_4 $. $ NS_i $项可以有效判别数字印章不同部分内容的真伪. $ NS_{sum} $既反应出全部信息是否匹配. 又由于进行了四次独立检验, 对于每一部分的准确率$ r_i $, 其$ NS_{sum} $的准确率能达到$ 1-\Pi _{i = 1}^{4}(1-r_i) $ (不同部分得到的序列具有很强的独立性), 使数字印章的信息匹配准确率进一步提高.

对于三通道彩色数字印章, 其匹配结果当且仅当每一通道NS值为0时, 判别原始信息为真. 如果每一通道的信号是独立的(做了Hash操作以后, 不同通道之间的关联被破坏了), 特定内容每一通道的匹配准确率记为$ r_{ik}, i = 1, 2, 3, 4, k = 1, 2, 3 $, 则其某一内容匹配准确率近似为$ 1-\Pi _{k = 1}^{3}(1-r_{ik}), i = 1, 2, 3, 4 $, 总体$ NS_{sum} $匹配准确率近似为$ 1-\Pi _{i = 1}^{4}\Pi _{k = 1}^{3}(1-r_{ik}) $. 三通道彩色数字印章具有精确的匹配准确率.

6 仿真结果

构造原始信息序列$ X_i(i = 1, 2, 3, 4) $, 生成数字印章. 选择与原始信息相似的伪信息匹配识别. 分别以单一信息与四部分总信息进行仿真实验. 计算在灰度图和三通道彩色图两种模式下不同实验次数的匹配准确率. 这里举一例对数字印章设计匹配进行说明(以单一时间信息数字印章为例).

1) 以时间信息"2020 01-01 12.12.12 Wen Jan"按照4.1节所述构造长度为256的信息序列$ X = [9, 0, 9, \cdots , 45, 45, 45]. $生成长度同为256的平稳噪声序列$ \varepsilon = [63, 8, 93, \cdots , 45, 134, 108], $其中$ NS(\varepsilon) = 0 $. 最后以该平稳噪声对信息序列加以掩盖, 得到印章序列$ Y = [72, 8, 102, \cdots , $$ 90, 179, 153]. $并按照自定义方式生成数字印章图片, 本例以横向生成的方式产生64*4的印章图片. 如图 6.

图 6

图 6   时间信息序列数字印章图片


2) 对图 6数字印章图片进行信息匹配操作. 首先由数字印章图片反向获取印章序列$ Y = [72, 8, 102, \cdots , 90, 179, 153]. $其次由待匹配信息("2020 01-01 12.12.12 Wen Jan") 构造信息序列($ X = [9, 0, 9, \cdots , 45, 45, 45]). $根据$ \varepsilon = Y-X $则可获取噪声序列$ \varepsilon = [63, 8, 93, \cdots , 45, 134, 108] $. 最终计算该噪声序列NS值. 如本例中所获取的噪声序列正为构造该印章序列过程中所生成的平稳噪声序列, 其NS值为0, 即信息与数字印章匹配成功, 否则匹配失败.

进一步实验结果见表 1.

表 1   实验仿真结果

数字印章内容试验次数匹配准确率(单通道)匹配准确率(三通道)
单一信息(NSi)5092%100%
10093%100%
50093%100%
100093.2%100%
总信息(NSsum)50100%100%
100100%100%
500100%100%
1000100%100%

新窗口打开| 下载CSV


观察表 1, 其结果与第5节得到的理论值保持一致. 数字印章检验准确率高, 效果稳定, 对于辨别真伪信息的鲁棒效果好. 较之灰度图, 彩色数字印章可以更为有效对信息进行匹配.

7 总结

本文基于非平稳性度量并利用随机加密匹配方法设计了一种数字印章. 它包含了盖章时的时间和设备信息, 以及与盖章载体相关联的内容和自定义信息. 确保不同时间空间不同内容数字印章唯一且对内容变化敏感. 数字印章选择服从独立均匀分布的零均值噪声序列对原始数据信息进行加密, 这种加密方法主要是用噪声掩盖真实信息, 要破解只能采用去噪的方法, 由于噪声很强(信噪比通常小于-5), 传统的去噪方法得不到好的结果. 我们的加密方法是难以破解的, 可以防止量子计算方法的破解. 所采用的匹配算法基于残差序列的非平稳性度量的计算, 不需要进行解密, 克服了传统对称加密算法中对于大量密钥管理的问题. 仿真实验表明该方法能够精确实现匹配认证, 匹配准确率与理论值保持一致, 达到数字印章防篡改、防盗用的目的, 在版权保护, 身份认证等安全领域中有着广泛的应用.

参考文献

唐跃进, 胡雨.

电子印章与传统印章的比较研究

档案学通讯, 2006, 291, 62- 64

URL     [本文引用: 1]

Tang Y J , Hu Y .

A comparative study of electronic seal and the traditional seal

Archives Science Bulletin, 2006, 291, 62- 64

URL     [本文引用: 1]

Masoumi M .

A highly efficient and secure hardware implementation of the advanced encryption standard

Journal of Information Security and Applications, 2019, 48, 102371

DOI:10.1016/j.jisa.2019.102371      [本文引用: 1]

Lai Xuejia .

An analysis of international data encryption algorithm(IDEA) security against differential cryptanalysis

Wuhan University Journal of Natural Sciences, 2008, 6, 697- 701

URL     [本文引用: 1]

Diffie W , Hellman M .

New direction in cryptography

IEEE Transaction on Information Theory, 1976, 6 (22): 644- 654

URL     [本文引用: 1]

徐紫枫, 曾康, 周福才.

基于时间释放加密和数字签名的匿名电子投票方案

计算机应用与软件, 2016, 33 (12): 325- 328

DOI:10.3969/j.issn.1000-386x.2016.12.076      [本文引用: 1]

Xu Z F , Zeng K , Zhou F C .

Anonymous electronic voting scheme based on time-released encryption and digital signature

Computer Applications and Software, 2016, 33 (12): 325- 328

DOI:10.3969/j.issn.1000-386x.2016.12.076      [本文引用: 1]

丁义明, 范文涛, 谭秋衡, .

数据流的非平稳性度量

数学物理学报, 2010, 30A (5): 1364- 1376

URL     [本文引用: 2]

Ding Y M , Fan W T , Tan Q H , et al.

Nonstationarity measure of data stream

Acta Math Sci, 2010, 30A (5): 1364- 1376

URL     [本文引用: 2]

谭秋衡. 时间序列的非平稳性度量及其应用[D]. 北京: 中国科学院研究生院, 2013

[本文引用: 2]

Tan Q H. The Time Series Nonstationarity Measurement and Its Applications[D]. Beijing: Graduate School of Chinese Academy of Sciences, 2013

[本文引用: 2]

兰军, 谭秋衡, 董前进.

基于非平稳度量的灌溉用水量预测模型选择

武汉大学学报(工学版), 2014, 47 (6): 721- 725

URL     [本文引用: 1]

Lan J , Tan Q H , Dong Q J .

Selection of forecasting models for irrigation water consumption based on nonstationarity measure

Engineering Journal of Wuhan University, 2014, 47 (6): 721- 725

URL     [本文引用: 1]

谭秋衡, 丁义明.

基于非平稳性度量的彩票数据实证分析

数学物理学报, 2014, 34A (1): 207- 216

URL    

Tan Q H , Ding Y M .

Empirical analysis of lottery data based on non-stationarity measure

Acta Math Sci, 2014, 34A (1): 207- 216

URL    

谭秋衡, 吴量, 李波.

基于EMD及非平稳性度量的趋势噪声分解方法

数学物理学报, 2016, 36A (4): 783- 794

DOI:10.3969/j.issn.1003-3998.2016.04.016      [本文引用: 1]

Tan Q H , Wu L , Li B .

Decomposition of noise and trend based on EMD and non-stationarity measure

Acta Math Sci, 2016, 36A (4): 783- 794

DOI:10.3969/j.issn.1003-3998.2016.04.016      [本文引用: 1]

丁义明, 谭秋衡, 曾志高. 一种图像随机加密双盲保密匹配方法:CN201410822766.8[P]. 2015-04-29

Ding Y M, Tan Q H, Zeng Z G. A method of image encryption random double-blind confidential matching: CN201410822766.8[P]. 2015-04-29

/