数学物理学报  2017, Vol. 37 Issue (6): 1176-1188   PDF    
扩展功能
加入收藏夹
复制引文信息
加入引用管理器
Email Alert
RSS
本文作者相关文章
盖彦荣
齐耀辉
陈阳舟
宋学君
高阶离散时间多智能体系统的量化一致性
盖彦荣1, 齐耀辉1, 陈阳舟2, 宋学君1     
1. 河北师范大学物理科学与信息工程学院 石家庄 050024;
2. 北京工业大学城市交通学院 北京 100124
摘要:研究高阶线性多智能体系统在有向量化链路信息拓扑下的一致性问题.首先提出了包含智能体自身与其邻居量化信息的线性一致性协议,其次利用提出的线性变换,将一致性问题转化为稳定性问题,基于稳定性理论,得到基于矩阵Schur稳定性的充要条件,并得到依赖于信息拓扑、系统动态和整个系统初始状态的一致性函数,最后,通过求解代数Riccati不等式,提出增益矩阵的设计过程.
关键词高阶离散时间线性多智能体系统(HDLMAS)    量化一致性    有向信息拓扑    一致性判据    一致性函数    
Consensus of High-Order Discrete-Time Multi-Agent Systems with Quantized Information
Ge Yanrong1, Qi Yaohui1, Chen Yangzhou2, Song Xuejun1     
1. College of Physics Science and Information Engineering, Hebei Normal University, Shijiazhuang 050024;
2. College of Metropolitan Transportation, Beijing University of Technology, Beijing 100124
Abstract: We investigate the consensus problem of high-order discrete-time linear multi-agent systems (HDLMAS) under directed information topology with quantized link in this paper. Firstly, we propose a linear consensus protocol which consists of quantized information of the agent itself and its neighbors. Secondly, we solve the quantized consensus problem by proposing a linear transformation to translate it into a stability problem. Based on stability theory, we obtain necessary and sufficient criteria in terms of Schur stability of matrices, and present an analytical expression of the consensus function, which is depended on the communication topology, the system dynamic and the initial states of the whole system. Finally, we propose a design procedure of the gain matrices in the protocol by solving an algebraic Riccati inequality.
Key words: High-order discrete-time linear multi-agent systems (HDLMAS)     Quantized consensus     Directed topology     Consensus criterion     Consensus function    
1 引言

多智能体系统的一致性问题是多智能体分布式协调控制中的典型问题之一, 得到众多领域学者的广泛研究[1-6].所谓一致性, 就是每个智能体利用自身和从其邻居得到的局部信息设计控制协议, 使得所有智能体达到某种程度的一致.文献[7-8]考虑了连续时间多智能体系统的一致性问题, 文献[9-10]研究了离散时间线性多智能体系统在可变信息拓扑和时滞情况下的一致性问题.实际上, 受到通信带宽的限制, 信息在传输前应该量化.针对不同情况, 许多文献对量化一致性问题进行了研究:一阶连续时间多智能体系统[11-14], 一阶离散时间多智能体系统[15-24], Guan等[25]研究了无向信息拓扑下二阶离散时间系统的量化一致性条件, Chen等[26]研究了有向信息拓扑下, 采样的二阶连续时间系统的量化一致性问题.

文献[27-29]研究了高阶多智能体系统的量化一致性/同步问题. Xu和Wang[27]基于量化相对状态信息, 研究了连续时间系统的同步问题, 分别导出均匀量化器和对数量化器的同步条件. Fu和Wang[28]基于内模原理, 设计了两个连续时间异构线性系统的分布式输出一致控制器, 研究了均匀量化器作用于通信信道对控制器的影响. You和Xie[29]考虑有限通信数据率, 研究了无向拓扑离散时间系统的一致性问题, 提出了动态的编码/解码方案和相应的控制协议, 结果显示只要数据率大于一个确定的下限, 经过状态反馈的可一致性可以实现.

本文主要研究高阶离散时间线性多智能体系统(high-order discrete-time linear multi-agent systems, 简称为HDLMAS)有向信息拓扑下量化一致性的分析与设计问题, 与已有的工作相比, 主要贡献描述如下:第一, 相比于一阶多智能体系统[11-24]和二阶多智能体系统[25-26], 本文所研究的高阶离散时间线性多智能体系统的量化一致性问题要困难, 同为高阶系统, 本文研究的有向信息拓扑, 要难于文献[29]的无向信息拓扑.第二, 在以前所做的研究中[8-10], 线性变换被证实是有效的工具.本文提出线性变换, 将量化一致性问题转化为相应系统的稳定性问题, 得到HDLMAS达到量化一致的充要条件, 同时给出基于多智能体系统的初始条件、信息拓扑、系统动态和控制协议的一致性函数表达式.第三, 类似于文献[29], 利用求解代数Riccati不等式, 得到控制协议中增益矩阵的设计过程.

本文结构安排如下:第2节, 介绍基本概念, 提出研究的问题; 第3节, 首先提出线性变换, 将一致性问题转化为相应系统的稳定性问题, 然后得到HDLMAS达到量化一致的充要条件, 同时给出一致性函数的表达式; 第4节, 给出一致性控制协议中增益矩阵的设计过程; 第5节, 利用数值实例, 验证理论结果; 第6节, 总结全文.

为便于描述, 给出下面的记法.上角标"T"表示实数矩阵的转置, 上角标"H"表示复数矩阵的共轭转置, 上角标" $-1$ "表示方阵的逆. ${\Bbb Z}$ 表示整数集合. ${\Bbb R}^n$ ${{\Bbb R}}^{n\times m}$ 分别代表 $n$ 维实数向量和 ${n\times m}$ 维实数矩阵. ${ {\bf I}}_{n}$ 代表 $n$ 维单位矩阵. ${ {\bf 1}}_{N}$ 代表元素都为1的 $N$ 维列向量. $0$ 代表所有元素都为零的任意维数的向量或矩阵.如果矩阵的所有特征值的模都小于 $1$ , 则该矩阵是Schur稳定的, $\rho(\cdot)$ 代表谱半径. $\|\cdot\|_1$ $\|\cdot\|_2$ 分别代表一个向量的1 -范式和2 -范式. $P > 0$ 代表对称正定矩阵. ${\rm E}\{\cdot\}$ 代表数学期望. ${\rm Pr}\{\cdot\}$ 代表概率. ${\rm Q}\{\cdot\}$ 代表量化.文献[30]中, Kronecker积定义为 $\otimes $ . Kronecker积的两个常用特性如下: $({ A}\otimes{ B})({ C}\otimes{ D})={ (AC)}\otimes{ (BD)}$ $({ A+B})\otimes{ C}={ A}\otimes{ C}+{ B}\otimes{ C}$ , 其中 $A, B, C$ $D$ 具有合适的维数.

2 问题描述

考虑 $N$ 个同构智能体构成的HDLMAS, 智能体间的通信网络为量化链路的有向信息拓扑.令 ${\cal N}_{i}$ 表示发送信息状态给智能体 $i$ 的邻居智能体集合.集合 ${\cal N}=\{{\cal N}_{i}:i=1, \cdots, N\}$ 称为系统的信息拓扑.众所周知, 可以用图 $G=(V, E, W)$ 表示信息拓扑 ${\cal N}$ , 其中 $V=\{1, \cdots, N\}$ $N$ 个智能体的集合, $E\subseteq {V\times V}$ 是描述智能体间信息交互的有向边集, 即 $(j, i)\in E\Leftrightarrow j\in {\cal N}_{i}$ .加权的邻接矩阵 ${ W}=[w_{ij}]_{N\times N}$ , 其元素定义为:当 $j=i$ 时, $w_{ij}=0$ ; 当 $j\neq i$ 时, 如果 $j\in {\cal N}_{i}$ , $w_{ij}>0$ , 否则 $w_{ij}=0$ .加权的图Laplacian矩阵 $L=[l_{ij}]_{N\times N}$ 由信息拓扑 ${\cal N}$ 导出, 其元素 $l_{ij}$ 定义为

$ l_{ij}=\left\{\begin{array}{ll} \sum\limits_{p \in {\cal N}_{i}} w_{ip}, \quad&j=i, \\[2mm] -w_{ij}, \quad \quad &j\neq i, j\in {\cal N}_{i}, \\ 0, \quad \quad \quad \quad& j\neq i, j\notin {\cal N}_{i}. \end{array}\right. $

引理2.1 如果 $L$ $N$ 个智能体的有向信息拓扑 ${\cal N}$ 对应的图Laplacian矩阵.那么, $L$ 至少含有一个零特征值, 而且所有的非零特征值都具有正实部.进一步, $L$ 仅含有一个零特征值, 其他的特征值都具有正实部当且仅当信息拓扑 ${\cal N}$ 含有一棵有向生成树.此外, $L{\bf 1}_{N} = 0$ , 而且存在非零向量 $p=[p_1, p_2, \cdots, p_N]^{{\rm T}}\in {\Bbb R}^{N}$ , 满足 $p^{{\rm T}}L=0$ $p^{\rm T}{\bf 1}_{N}=1$ .

数据在传输前, 采用和文献[25-26]相同的概率量化(Probabilistic Quantization, 简称为PQ)方案.假定数据 $\mu$ 在有界的范围 $[-D, D]$ 内取值.由于受到带宽的限制, 假定数据 $\mu$ 量化为 $l$ 位.那么会得到 $2^l$ 个量化值, 量化步长为 $\Delta= \frac{2D}{2^l}$ .数据 $\mu$ 被量化为概率方式

$ {\rm Pr}\{Q(\mu)=q\Delta\}=1-\frac{\mu-q\Delta}{\Delta}, \quad {\rm Pr}\{Q(\mu)=(q+1)\Delta\}=\frac{\mu-q\Delta}{\Delta}, \nonumber $

其中 $q\Delta\leq \mu<(q+1)\Delta$ , $q\in\{q|-\frac {D}{\Delta}\leq q\leq \frac {D}{\Delta}, q\in {\Bbb {Z}}\}$ .

概率量化方式具有下面的重要特性[25-26]

$ {\rm E}\{Q(\mu)\}=\mu, \quad E\{(Q(\mu)-\mu)^2\}\leq \frac{{\Delta}^2}{4}. $

假定HDLMAS的第 $i$ 个智能体的动态描述为

$ \begin{equation}\label{a1} { x}_{i}^{+}={ A}{ x}_i+{ B}{ u}_{i}, \quad i=1, \cdots, N, \end{equation} $ (2.1)

其中 ${ A}\in {\Bbb R}^{n\times n}$ , ${ B}\in {\Bbb R}^{n\times m}$ , $( A, B)$ 可镇定, ${ x}_{i}={ x}_{i}(k)\in {\Bbb R}^{n}$ 表示当前时刻 $k$ 的状态, ${ x}_{i}^{+}={ x}_{i}(k+1)$ 表示下一个时刻 $k+1$ 的状态, $x_i(0)=x_{i0}$ 是第 $i$ 个智能体的初始状态, ${ u}_{i}={ u}_{i}(k)\in {\Bbb R}^{m}$ 是当前时刻 $k$ 的控制输入, 又称为控制协议.

给定信息拓扑 ${\cal N}$ , 第 $i$ 个智能体控制协议的设计基于该智能体可以得到的局部信息.

$ \begin{equation}\label{a2} { u}_{i}= K\sum\limits_{j\in {\cal N}_{i}}{w_{ij} (Q({ x}_{j})-Q({ x}_{i}))}, \quad i=1, \cdots, N, \end{equation} $ (2.2)

其中 $Q({ x}_{i})$ 是智能体 $i$ 的量化状态, $Q({ x}_{j})$ 是智能体 $i$ 得到的邻居智能体 $j$ 的量化状态, ${ K}\in{\Bbb R}^{m \times n}$ 是增益矩阵.

定义2.1 给定信息拓扑 ${\cal N}$ 和初始状态 ${ x}_{i}(0), i=1, \cdots, N$ , 存在依赖于初始状态的 $n$ 维向量函数 ${ \xi}(k)$ 和满足 $\lim\limits_{\Delta\rightarrow 0}m(\Delta)=0 $ 的单调递增函数 $m(\Delta)$ , 使得 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|{ x}_{i}(k)-{ \xi}(k)\|_{2}^{2}\}}\leq m(\Delta)$ , 其中 $\Delta$ 是量化步长, 则称HDLMAS (2.1)在一致性控制协议(2.2)下可达到量化一致. ${ \xi}(k)$ 称为一致性函数.

定义2.2 给定信息拓扑 ${\cal N}$ 和初始状态 ${ x}_{i}(0), i=1, \cdots, N$ , 如果存在增益矩阵 $K$ 和满足 $\lim\limits_{\Delta\rightarrow 0}m(\Delta)=0 $ 的单调递增函数 $m(\Delta)$ , 使得 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|{ x}_{i}(k)- \xi(k)\|_{2}^{2}\}}\leq m(\Delta), i=1, \cdots, N$ , 则称HDLMAS (2.1)在一致性控制协议(2.2)下是可量化一致的, 其中 $\Delta$ 是量化步长.

本文主要研究三个方面的量化一致性问题: (ⅰ)得到量化一致的判据, 即给定信息拓扑 ${\cal N}$ 和增益矩阵 ${ K}$ , 找到HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致的条件; (ⅱ)如果HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致, 计算一致性函数 ${ \xi}(k)$ ; (ⅲ)确定增益矩阵 ${ K}$ , 使得HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致.

3 一致性分析

${ x}=[{ x}_{1}^{\rm T}, \cdots, { x}_{N}^{\rm T}]^{\rm T}$ , 得到HDLMAS (2.1)和一致性协议(2.2)的向量形式

$ \begin{equation}\label{a3} { x}^+={ \Psi}{ x}+(L\otimes (BK))\varepsilon, \quad\quad x(0)=x_0, \end{equation} $ (3.1)

其中 ${ \Psi}={ {\bf I}}_N\otimes A-L\otimes(BK)$ , $\varepsilon=x-Q(x)$ 表示满足 ${\rm E}\{\varepsilon\}=0$ ${\rm E}\{{\varepsilon}^{\rm T}{\varepsilon}\}=\frac {Nn{\Delta}^2}{4}$ 的量化误差向量.

HDLMAS (2.1)在一致性控制协议(2.2)下达到均方意义下量化一致性问题可以利用线性变换转化为相应线性系统均方意义下的稳定性问题.

受到文献[8-10]的启发, 选取线性变换矩阵 $T$

$ \begin{equation}\label{a4} { T}=\left[\begin{array}{ccccc} -1 &~~ 1~~&0&~~\cdots ~~&0 \\ -1&0&1&\cdots &0 \\ \vdots&\vdots&\ddots&\vdots&\vdots\\ -1&\cdots &0&0 &1 \\ p_1&p_2&p_3&\cdots &p_N \end{array} \right]\otimes { {\bf I}}_n := \left[\begin{array}{cccc} \widetilde{ T}_0 \\ p^{\rm T} \end{array} \right]\otimes { {\bf I}}_n, \end{equation} $ (3.2)

其中矩阵 $p$ 的描述见引理2.1.

相应的逆矩阵 $T^{-1}$

$ \begin{equation}\label{a16} { T}^{-1}=\left[\begin{array}{ccccc} -p_2 &-p_3&\cdots &-p_N&1 \\ 1-p_2 &-p_3&\cdots &-p_N&1 \\ -p_2 &~~ 1-p_3 ~~& \cdots &-p_N &1 \\ \vdots&\vdots&\ddots&\vdots&\vdots\\ -p_2&-p_3&\cdots &~~ 1-p_N~~& 1 \end{array} \right]\otimes { {\bf I}}_n := \left[\begin{array}{cccc} {\widehat{ T}}_0&\ {\bf 1}_N \end{array} \right]\otimes { {\bf I}}_n. \end{equation} $ (3.3)

利用线性变换矩阵(3.2)对系统(3.3)进行线性变换

$ \begin{equation}\label{a5} \bar{{ x}}={ T}{ x}, \end{equation} $ (3.4)

系统(3.3)变换成下面的系统

$ \begin{equation}\label{a6} \bar{{ x}}^+=T{ \Psi}T^{-1}\bar{{ x}}+T(L\otimes (BK))\varepsilon. \end{equation} $ (3.5)

$\bar{ x}=[{ y}^{\rm T}, { z}^{\rm T}]^{\rm T}$ , 其中 ${ y}=[\bar{ x}_{1}^{\rm T}, \cdots, \bar{ x}_{N-1}^{\rm T}]^{\rm T}$ ${ z}=\bar{ x}_{N}$ , 重写系统(3.5)为下面的两部分

$ \begin{eqnarray}\label{a7} \begin{array}{ll} { y}^+=A_1{ y}+B_1{ z}+C_1{\varepsilon}, \quad&{ y}\in{\Bbb R}^{n(N-1)}, \\ { z}^+=A_2{ y}+B_2{ z}+C_2{\varepsilon}, &{ z}\in{\Bbb R}^{n}, \end{array} \end{eqnarray} $ (3.6)

其中 $A_1=(\widetilde{T}_0 \otimes {\bf I}_n){ \Psi}(\widehat{T}_0 \otimes {\bf I}_n)$ , $B_1=(\widetilde{T}_0 \otimes {\bf I}_n){ \Psi} ({\bf 1}_N \otimes {\bf I}_n)$ , $C_1=(\widetilde{T}_0 \otimes {\bf I}_n )(L \otimes (BK))$ , $A_2=(p^{\rm T} \otimes {\bf I}_n){ \Psi}(\widehat{T}_0 \otimes {\bf I}_n)$ , $B_2=(p^{\rm T} \otimes {\bf I}_n){ \Psi}({\bf 1}_N \otimes {\bf I}_n)$ , $C_2=(p^{\rm T} \otimes {\bf I}_n)(L \otimes (BK))$ .

引理3.1 系统(3.6)具有下面的形式

$ \begin{eqnarray}\label{a8} \begin{array}{ll} { y}^+=A_1{ y}+C_1{\varepsilon}, \quad &{ y}\in{\Bbb R}^{n(N-1)}, \\ { z}^+=A{ z}, &{ z}\in{\Bbb R}^{n}, \end{array} \end{eqnarray} $ (3.7)

其中 $A_1= {\bf I}_{N-1}\otimes A-\widetilde{L}\otimes(BK)$ , $\widetilde{L}=\widetilde{T}_0L\widehat{T}_0$ , $C_1=(\widetilde{T}_0L)\otimes (BK)$ .

 实际上, 图Laplacian矩阵 $L$ 和线性变换矩阵 $T$ 有下面的性质: $\widetilde{ T}_0{\bf 1}_N= 0$ , $p^{\rm T}\widehat{ T}_0= 0$ , ${ L}{\bf 1}_N= 0$ $p^{\rm T}L= 0$ .利用这些性质和第1节符号记法描述的Kronecker积的两个性质, 得到 $A_1= {\bf I}_{N-1}\otimes A-(\widetilde{T}_0L\widehat{T}_0)\otimes(BK)$ , $B_1=0$ , $C_1=(\widetilde{T}_0L)\otimes (BK)$ , $A_2=0$ , $B_2=A$ $C_2=0$ .令 $\widetilde{L}=\widetilde{T}_0L\widehat{T}_0$ , 得到系统(3.7).

定义3.1[31] 对于 $\|x_0\|_2<\infty$ , 如果存在任意正数 $C$ $\alpha$ , 使得不等式 ${\rm E}\{\|y(k;k_0, x_0\|_2^2\}\leq C\|x_0\|_2^2{\rm e}^{-\alpha(k-k_0)}$ 成立, 则线性随机系统(3.7)的平衡点 $\bar{ x}=0$ 被称为均方意义下关于部分变元 $y$ 是全局指数渐近稳定的(或简称为 $y$ -稳定).

注3.1 线性系统(3.7)的状态空间 $\bar{x}$ 被分解为两个正交的子空间:相应于 $y$ 的收敛子空间和相应于 $z$ 的一致子空间.基于收敛子空间研究一致性条件, 基于一致子空间得到一致性函数.

引理3.2 给定信息拓扑 ${\cal N}$ , HDLMAS (2.1)在一致性控制协议(2.2)下达到均方意义的量化一致当且仅当系统(3.7)的平衡点 $\bar{x} (k)=0$ 是均方意义下的量化渐近 $y$ -稳定的, 即存在满足 $\lim\limits_{\Delta\rightarrow 0}m'(\Delta)=0$ 的单调递增函数 $m'(\Delta)=2m(\Delta)$ , 使得 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|y_i(k)\|_{2}^{2}\}}\leq m'(\Delta)$ , 其中 $\Delta$ 是量化步长.此外, 多智能体系统的一致性函数是 ${ \xi}(k)=z(k)=\sum\limits_{i=1}^{N}{p_i{ x}_{i} (k)}$ .

 事实上, 如果存在 ${ \xi}(k)$ $m(\Delta)$ 使得 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|{ x}_i(k)-{ \xi}(k)\|_2^2}\}\leq m(\Delta)$ , $i=1, \cdots, N$ , 可以得到存在 $m'(\Delta)$ 使得 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|y_i(k)\|_2^2}\}\leq m'(\Delta)$ , $i=1, \cdots, N-1$ , 由于 $y(k)=(\widetilde{ T}_0\otimes{\bf I}_n){x}=(\widetilde{ T}_0\otimes{\bf I}_n)(x-{\bf 1}_N\otimes \xi(k))$ , 因此, 必要性得以证明.

反之, 根据公式(3.3), 可以验证 ${ x}(k)=(\widehat{{ T}}_0\otimes {\bf I}_n)y(k)+{\bf 1}_N\otimes z(k)$ .基于 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|y_i(k)\|_2^2}\}\leq m'(\Delta)$ , $i=1, \cdots, N-1$ , 得到 $\lim\limits_{k\rightarrow\infty}{{\rm E}\{\|{ x}_i(k)-{ \xi}(k)\|_2^2}\}\leq m(\Delta)$ , $i=1, \cdots, N$ , 其中 ${ \xi}(k)=z(k)=(p^{\rm T}\otimes{\bf I}_n)x(k)=\sum\limits_{i=1}^{N}{p_i{ x}_{i} (k)}$ , 因此, 充分性得以证明.

引理3.2建立了HDLMAS (2.1)在一致性控制协议(2.2)下的量化一致性问题与线性系统(3.7)的渐近 $y$ -稳定性问题之间的桥梁.综合引理3.1和引理3.2, 得到下面的定理.

定理3.1 假定给定的信息拓扑 ${\cal N}$ 含有一棵有向生成树, HDLMAS (2.1)在控制协议(2.2)下达到量化一致的充要条件是矩阵 $A_1$ 是Schur稳定的.特别地, 如果 $\Delta\rightarrow 0$ $k\rightarrow\infty$ , 那么 ${\rm E}\{\|x(k)-{\bf 1}_N\otimes { \xi}(k)\|_2^2\}\rightarrow 0$ , 即在均方意义下 $x_i(k)-{ \xi}(k)\rightarrow 0$ , 其中 ${ \xi}(k)=(p^{\rm T}\otimes { A}^k){ x}(0)$ $\Delta\rightarrow 0$ 时的一致性函数.

 令 $s(k)={\rm E}\{y(k)\otimes y(k)\}$ , 基于系统(3.7)的第一个方程得到

$ \begin{equation}\label{a9} s(k+1)=(A_1\otimes A_1)s(k)+(C_1\otimes C_1){\rm E}\{\varepsilon(k)\otimes \varepsilon(k)\}. \end{equation} $ (3.8)

显然, $\|s(k)\|_1={\rm E}\{\|y(k)\|_1^2\}$ .根据 $\|{\alpha}\|_2\leq\|{\alpha}\|_1\leq \sqrt{n}\|{\alpha}\|_2$ , 其中 $ \alpha\in {\Bbb R}^n$ , 得到

$ \begin{equation}\label{a10} {\rm E}\{\|y(k)\|_2^2\}\leq\|s(k)\|_1 \leq (N-1)n{\rm E}\{\|y(k)\|_1^2\}. \end{equation} $ (3.9)

必要性.如果 $A_1$ 不是Schur稳定的, 即 $\rho(A_1)\geq 1$ , 那么 $\rho(A_1\otimes A_1)\geq 1$ , 意味着线性系统(3.8)是发散的, 从而HDLMAS (2.1)在一致性控制协议(2.2)下不能达到量化一致.

充分性.如果 $A_1$ 是Schur稳定的, 即 $\rho(A_1)<1$ , 那么 $\rho(A_1\otimes A_1)<1$ , 因此存在常数 $\varsigma <1$ 满足 $\|A_1\otimes A_1\|_2=\varsigma<1$ .于是

$ \|s(k+1)\|_2\leq {\varsigma}^{k+1}\|s(0)\|_2+\sum\limits_{i=0}^k{{\varsigma}^if(\Delta)}, $

其中 $f(\Delta)=\frac{\sqrt{(N-1)^3n^3}}{2}\|C_1\otimes C_1\|_2\Delta$ , $\Delta$ 是量化步长.

根据 $\varsigma < 1$ , 得到 $\lim\limits_{k\rightarrow\infty}\|s(k)\|_2\leq\frac{f(\Delta)}{1-\varsigma}$ .

基于 $\|{\alpha}\|_1\leq \sqrt{n}\|{\alpha}\|_2$ , 得到 $\|s(k)\|_1\leq \sqrt{(N-1)n}\|s(k)\|_2$ .此外

$ \begin{equation}\label{a11} \lim\limits_{k\rightarrow\infty}\|s(k)\|_1\leq \lim\limits_{k\rightarrow\infty}\sqrt{(N-1)n}\|s(k)\|_2\leq \sqrt{(N-1)n}\frac{f(\Delta)}{1-\varsigma}. \end{equation} $ (3.10)

对(3.9)式取极限, 综合(3.10)式, 得到 $\lim\limits_{k\rightarrow\infty}{\rm E}\{\|y(k)\|_2^2\}\leq\lim\limits_{k\rightarrow\infty}\|s(k)\|_1 \leq \sqrt{(N-1)n}\frac{f(\Delta)}{1-\varsigma}$ , 于是

$ \lim\limits_{k\rightarrow\infty}{\rm E}\{\|x_i(k)-x_1(k)\|_2^2\}\leq \frac{\sqrt{n}}{\sqrt{N-1}} \frac{f(\Delta)}{1-\varsigma}. $

不等式的右边满足 $\lim\limits_{\Delta\rightarrow 0}{\frac{\sqrt{n}}{\sqrt{N-1}} \frac{f(\Delta)}{1-\varsigma}}=0$ , 并且是 $\Delta$ 的一个单调递增函数.因此HDLMAS (2.1)在一致性协议(2.2)下的量化一致可以达到.

此外, 根据系统(3.7)的第二个方程, 得到

$ z(k)=Az(k-1)=A^2z(k-2)=\cdots=A^kz(0). $

$z(0)=(p^{\rm T}\otimes {\bf I}_n)x(0)$ 代入到上面的公式, 得到 $z(k)=(p^{\rm T}\otimes A^k)x(0)$ .因此基于引理3.2, 得到一致性函数 $\xi(k)=(p^{\rm T}\otimes A^k)x(0)$ .

推论3.1 假定给定的信息拓扑 ${\cal N}$ 含有一棵有向生成树, HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致的充要条件是所有矩阵 $A-{\lambda}_iBK$ 是Schur稳定的, 其中 ${\lambda}_i$ , $i=1, \cdots, N-1$ $\widetilde{L}$ 的特征值.特别地, 如果 $\Delta\rightarrow 0$ $k\rightarrow\infty$ , 那么 ${\rm E}\{\|x(k)-{\bf 1}_N\otimes { \xi}(k)\|_2^2\}\rightarrow 0$ , 即在均方意义下 $x_i(k)-{ \xi}(k)\rightarrow 0$ , 其中 ${ \xi}(k)=(p^{\rm T}\otimes { A}^k){ x}(0)$ $\Delta\rightarrow 0$ 时的一致性函数.

 令 $U$ 是使得 $J=U^{-1}\widetilde{L}U$ 为Jordan标准型的矩阵, 其中 $\widetilde{L}$ 的特征值是 $J$ 的对角元素.经过简单的计算得到

$ (U\otimes {\bf I}_n)^{-1}A_1(U\otimes {\bf I}_n)={\bf I}_{N-1}\otimes A-J\otimes (BK). $

右边的对角块具有 $A-{\lambda}_iBK$ 的形式, 其中 ${\lambda}_i$ $\widetilde{L}$ 的特征值.每一个特征值有一个对角块.因此, $A_1$ 的特征值是矩阵 $A-{\lambda}_iBK$ 的特征值, 其中 ${\lambda}_i$ $\widetilde{L}$ 的特征值.

推论3.2 如果信息拓扑 ${\cal N}$ 是有向平衡强连通的或无向连通的, 那么HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致的充要条件是所有矩阵 $A-{\lambda}_iBK$ 都是Schur稳定的, 其中 ${\lambda}_i$ , $i=1, \cdots, N-1$ 是矩阵 $\widetilde{L}$ 的特征值.特别地, 如果 $\Delta\rightarrow 0$ $k\rightarrow\infty$ , 那么 ${\rm E}\{\|x(k)-{\bf 1}_N\otimes { \xi}(k)\|_2^2\}\rightarrow 0$ , 即在均方意义下 $x_i(k)-{ \xi}(k)\rightarrow 0$ , ${ \xi}(k)=N^{-1}({\bf 1}_N^{\rm T}\otimes { A}^k){ x}(0)$ $\Delta\rightarrow 0$ 时的一致性函数.

 在定理3.1中, 如果给定的信息拓扑 ${\cal N}$ 是有向平衡强连通的或无向连通的, 则 $p=N^{-1}{\bf 1}_N$ .很容易得到一致性函数 ${ \xi}(k)=N^{-1}({\bf 1}_N^{\rm T}\otimes { A}^k){ x}(0)$ .

注3.2 矩阵 $\widetilde{L}$ 的特征值是矩阵 ${L}$ 的非零特征值.

注3.3 从推论3.1和推论3.2得到, HDLMAS (2.1)在一致性控制协议(2.2)可量化一致依赖于系统动态、给定的信息拓扑和增益矩阵 $K$ , 而一致性函数依赖于给定的信息拓扑、系统动态和系统的初始状态.

4 一致性协议设计

定理3.1表明:要使得HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致, 矩阵 $K$ 的选择要确保矩阵 $A_1$ 是Schur稳定的.进一步, 从推论3.1得到:如果信息拓扑 ${\cal N}$ 给定, 只需要设计矩阵 $K$ 使得 $N-1$ 个矩阵 $A-{\lambda}_iBK$ 都是Schur稳定的即可, 其中 ${\lambda}_i$ , $i=1, \cdots, N-1$ 是矩阵 $\widetilde{L}$ 的特征值.

引理4.1 假定矩阵 $A$ 不是Schur稳定的, 但是矩阵 $(A, B)$ 是可镇定的, 则存在值 $\delta_c\in(0, 1]$ , 对于任意满足 $0<\delta<\delta_c$ $\delta$ , 使得修正的Riccati不等式

$ \begin{equation}\label{a18} { A}^{\rm T}{ P}{ A}-{ P}-(1-\delta^2){ A}^{\rm T}{ P}{ B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}<0 \end{equation} $ (4.1)

存在正定对称解矩阵 ${ P}$ , 其中 $\delta_c$ 依赖于矩阵 ${ A} $ 的不稳定特征值.

定义两个函数 $\delta_{i}(\omega)=1-\omega\lambda_{i}$ $\delta(\omega)= \max\limits_{i\in \{1, \cdots, N-1\}}| \delta_{i}(\omega)|$ .受到文献[29]的启发, 得到下面的定理.

定理4.1 假定矩阵 $A$ 不是Schur稳定的, 但是矩阵 $({ A}, { B})$ 是可镇定的, 信息拓扑 ${\cal N}$ 包含有向生成树, 则矩阵 ${ K}=\omega({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}$ 确保HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致, 其中 $\omega$ 是满足 $\delta=\delta(\omega)<\delta_c$ 的任意常数, $\delta_c\in(0, 1]$ 是依赖于矩阵 ${ A}$ 的不稳定特征值的一个关键值, $P$ 是代数Riccati不等式(4.1)的解矩阵.

 假定信息拓扑 ${\cal N}$ 已经给定, 根据推论3.1, 只需验证矩阵 ${ K}$ , 确保所有的矩阵 ${ A}-{\lambda}_{i}{ B}{ K}$ 都是Schur稳定的, 其中 ${\lambda}_{i}$ , $i=1, \cdots, N-1$ , 是矩阵 $\widetilde{ L}$ 的特征值.

显然, 存在 $\omega>0$ , 使得 $|\delta_i(\omega)|\leq\delta(\omega)<\delta_c$ , $i=1, \cdots, N-1$ .检验下面的系统 ${ \zeta}_i(k+1)=({ A}-\lambda_{i}{ B}{ K}){ \zeta}_i(k)$ , $i=1, \cdots, N-1$ , 存在公共Lyapunov函数 $V({ \zeta}_i)={ \zeta}_i^{{\rm H}}{ P}{ \zeta}_i$ .实际上, 令 ${ K}=\omega({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}$ , 得到

$ \begin{eqnarray*} \Delta V({ \zeta}_i) &=& V({ \zeta}_i(k+1))-V({ { \zeta}}_i(k)) \\ &=& { \zeta}_i^{{\rm H}}(k)(({ A}-\lambda_{i}\omega { B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A})^{{\rm H}}{ P}({ A}-\lambda_{i}\omega { B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A})-{ P}){ \zeta}_i(k) \\ &=&{ \zeta}_i^{{\rm H}}(k)({ A}^{\rm T}{ P}{ A}-{ P} -((\lambda_{i}^{{\rm H}}+\lambda_{i})\omega+\lambda_{i}^{{\rm H}}\lambda_{i}\omega^2) { A}^{\rm T}P{ B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}){ \zeta}_i(k) \\ &=& { \zeta}_i^{{\rm H}}(k)({ A}^{\rm T}{ P}{ A}-{ P} -(1-|\delta_{i}(\omega)|^2) { A}^{\rm T}P{ B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}){ \zeta}_i(k) \\ &\leq& { \zeta}_i^{{\rm H}}(k)({ A}^{\rm T}{ P}{ A}-{ P} -(1-\delta(\omega)^2) { A}^{\rm T}P{ B}({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}){ \zeta}_i(k) \\ &<& 0, \nonumber \end{eqnarray*} $

$N-1$ 个矩阵 ${ A}-\lambda_{i}{ B}{ K}$ 都是Schur稳定的.

基于定理4.1, 得到一致性协议(2.2)中确定增益矩阵 ${ K}$ 的算法.

算法4.1 增益矩阵 ${ K}$ 的设计过程

步骤1 检验矩阵 $({ A}, { B})$ 的可镇定条件和信息拓扑 ${\cal N}$ 包含有向生成树的条件, 如果缺少其中一个条件, 终止算法.

步骤2 计算矩阵 ${ A}$ 的所有特征值:稳定的特征值 $\lambda_i^{\rm s}({ A}), i=1, \cdots, n_{\rm s}$ 和不稳定的特征值 $\lambda_i^{\rm u}( { A}), i=1, \cdots, n_{\rm u}$ , $n_{\rm s}+n_{\rm u}=n$ .

步骤3 计算关键值 $\delta_c\in(0, 1]$ .

步骤4 计算 $\omega$ $\delta(\omega)$ , 使得 $\delta(\omega)<\delta_c$ .

步骤5 选取 $\delta=\delta(\omega) $ , 解代数Riccati不等式(4.1), 得到正定解矩阵 ${ P}$ .

步骤6 计算增益矩阵 ${ K}=\omega({ B}^{\rm T}{ P}{ B})^{-1}{ B}^{\rm T}{ P}{ A}$ .

5 数值实例

考虑HDLMAS(2.1)包含4个智能体, 具体的系统矩阵如下描述, 且所有智能体的信息是量化的.

$ \begin{eqnarray}\label{a22} { A}=\left[\begin{array}{cccc} 1&0&0\\[2mm] 0 &\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2} \\[3mm] 0 &~~-\frac{\sqrt{2}}{2} ~~& \frac{\sqrt{2}}{2} \end{array} \right], \quad { B}=\left[\begin{array}{cccc} 1 \\[2mm] -{\frac{1} {2}} \\[2mm] 1 \end{array} \right]. \end{eqnarray} $ (5.1)

有向信息拓扑如图 1所示.

图 1 信息拓扑

对应的图Laplacian矩阵 $L$

$ { L}=\left[\begin{array}{cccc} 0.4&0&0&~~-0.4\\ -0.3&0.3&0 &~~ 0 \\ 0 &~~-0.6~~&0.6 &~~ 0\\ 0 &0 &-0.5&~~0.5 \end{array} \right]. $

图Laplacian矩阵 $L$ 的非零特征值为 $0.4500\pm 0.4213$ i和0.9000, 这些值也是矩阵 $\widetilde{L}$ 的特征值, 显然信息拓扑 ${\cal N}$ 包含有向生成树.经过简单的计算, 得到

$ p=[0.2632, 0.3509, 0.1754, 0.2105]^{\rm T}. $

注意到矩阵 $(A, B)$ 是可镇定的, 矩阵 $A$ 的特征值是 $0.7071\pm0.7071$ i和1.0000.根据算法4.1的步骤3和步骤4, 得到 $\delta_c=0.9091$ $\omega=1$ , 相应的 $\delta(\omega)=0.6928<\delta_c$ .修正的Riccati不等式(4.1)的解矩阵为

$ { P}=\left[\begin{array}{cccc} 1.4910&0&0\\ 0 &~~ 1.2653 ~~& 0\\ 0&0&1.2653 \end{array} \right]. $

相应的增益矩阵为 $K=[0.4444, -0.4714, 0.1571]$ .矩阵 $A_1$ 的特征值为 $0.4132\pm0.6905$ i, $0.8644\pm0.2457$ i, $0.7599\pm0.5835$ i, $0.7681\pm0.4624$ i和 $0.1244$ , 最大特征值的模为0.9581, 即所有特征值都在开单位圆内.因此, 矩阵 $A_1$ 是Schur稳定的.根据定理3.1, 给定系统的信息拓扑 ${\cal N}$ 、增益矩阵 $K$ 和系数矩阵(5.1), HDLMAS (2.1)在一致性控制协议(2.2)下达到量化一致.

假定系统的初始状态为

$ x_1(0)=[0, 0.6, 0.6]^{{\rm T}}, ~~ x_2(0)=[1.2, 1.5, 1.8]^{{\rm T}}, \\ x_3(0)=[1.8, 2.4, 2.1]^{{\rm T}}, ~~ x_4(0)=[3.0, 2.7, 3.6]^{{\rm T}}. $

$x_i(k)$ 将收敛到

$ \xi(k)=[1.3684, 2.5439{\rm sin}(0.7854k+0.7181), 2.5439{\rm cos}(0.7854k+0.7181)]^{{\rm T}} $

的小邻域内.当 $\Delta\rightarrow 0$ 时, 小邻域也趋于零. $\Delta=0.1$ 时的仿真结果如图 2所示, 从图 2可以看出:多智能体系统的状态 $x_i(k)$ 确实收敛到期望一致函数 $\xi(k)$ 的小邻域内.为了显示 $\Delta$ 对一致性误差的影响, 进一步选取 $\Delta=0.01$ , 仿真结果如图 3所示.从图 3可以看出:多智能体系统的状态 $x_i(k)$ 几乎完美地收敛到一致性函数 $\xi(k)$ , 与定理3.1完全符合.如果选取不满足定理3.1的增益矩阵 $K=[0.4525, 0.1114, 0.1382]$ , 相应的仿真结果如图 4所示, 多智能体系统不能达到一致.

图 2 $\Delta=0.1$ 时HDLMAS的状态轨迹

图 3 $\Delta=0.01$ 时HDLMAS的状态轨迹

图 4 $K=[0.4525, 0.1114, 0.1382]$ 时HDLMAS的状态轨迹
6 结论

本文主要研究高阶离散线性多智能体系统有向信息拓扑下的量化一致性问题.利用提出的线性变换方法, 把多智能体系统的一致性问题转化为相应系统的部分稳定性问题, 得到系统达到量化一致的充要条件, 同时得到期望一致函数的表达式.此外, 给出了增益矩阵的设计过程.

由于传感器的检测范围受限或存在障碍物, 使得通信链路断开或重连, 因此实际通信环境下, 信息拓扑结构会发生变化; 而且在网络环境下, 通信时延也是很普遍的现象.本文只是研究了固定信息拓扑下线性多智能体系统的量化一致性问题, 复杂通信情况下的拓展研究将是下一步的研究目标.

参考文献
[1] Lynch N A. Distributed Algorithms. San Francisco, CA: Morgan Kaufmann, 1996.
[2] Serpedin E, Chaudhari Q M. Synchronization in Wireless Sensor Networks:Parameter Estimation, Performance Benchmarks and Protocols. New York: Cambridge University Press, 2009.
[3] Li D, Kar S, Alsaadi F E, et al. Distributed Kalman filtering with quantized sensing state. IEEE Transactions on Signal Processing, 2015, 63(19): 5180–5193. DOI:10.1109/TSP.2015.2450200
[4] Zhu S Y, Soh Y C, Xie L H. Distributed parameter estimation with quantized communication via running average. IEEE Transactions on Signal Processing, 2015, 63(17): 4634–4646. DOI:10.1109/TSP.2015.2441034
[5] Olfati-Saber R, Jalalkamali P. Coupled distributed estimation and control for mobile sensor networks. IEEE Transactions on Automatic Control, 2012, 57(10): 2609–2614. DOI:10.1109/TAC.2012.2190184
[6] Ren W. On consensus algorithms for double-integrator dynamics. IEEE Transaction on Automatic Control, 2008, 53(6): 1503–1509. DOI:10.1109/TAC.2008.924961
[7] Guo W, Xiao H, Chen S. Consensus of the second-order multi-agent systems with an active leader and coupling time delay. Acta Mathematica Scientia, 2014, 34B(2): 453–465.
[8] Chen Y Z, Li W, Dai G P, et al. Consensus analysis and design of linear interconnected multi-agent systems. Acta Mathematica Scientia, 2015, 35B(6): 1305–1317.
[9] Ge Y R, Chen Y Z, Zhang Y X, et al. State consensus analysis and design for high-order discrete-time linear multi-agent systems. Mathematical Problems in Engineering, 2013, 2013, Article ID:192351
[10] Ge Y R, Chen Y Z, Zhang Y X. Average dwell-time conditions for consensus of discrete-time linear multi-agent systems with switching topologies and time-varying delay. Acta Automatica Sinica, 2014, 40(11): 2609–2617. DOI:10.1016/S1874-1029(14)60407-9
[11] Ceragioli F, De Persis C, Frasca P. Discontinuities and hysteresis in quantized average consensus. Automatica, 2011, 47(9): 1916–1928. DOI:10.1016/j.automatica.2011.06.020
[12] Frasca P. Continuous-time quantized consensus:convergence of Krasovskii solutions. Systems & Control Letters, 2012, 61(2): 273–278.
[13] Liu S, Li T, Xie L H, et al. Continuous-time and sampled-data-based average consensus with logarithmic quantizers. Automatica, 2013, 49(11): 3329–3336. DOI:10.1016/j.automatica.2013.07.016
[14] Guo M, Dimarogonasa D V. Consensus with quantized relative state measurements. Automatica, 2013, 49(8): 2531–2537. DOI:10.1016/j.automatica.2013.05.001
[15] Kashyap A, Basar T, Srikant R. Quantized consensus. Automatica, 2007, 43(7): 1192–1203. DOI:10.1016/j.automatica.2007.01.002
[16] Aysal T C, Coates M J, Rabbat M G. Distributed average consensus with dithered quantization. IEEE Transactions on Signal Processing, 2008, 56(10): 4905–4918. DOI:10.1109/TSP.2008.927071
[17] Carli R, Fagnani F, Frasca P, et al. Gossip consensus algorithms via quantized communication. Automatica, 2010, 46(1): 70–80. DOI:10.1016/j.automatica.2009.10.032
[18] Yuan D M, Xu S Y, Zhao H Y, et al. Distributed average consensus via gossip algorithm with real-valued and quantized data for 0 < q < 1. Systems & Control Letters, 2010, 59(9): 536–542.
[19] Lavaei J, Murray R M. Quantized consensus by means of gossip algorithm. IEEE Transactions on Automatic Control, 2012, 57(1): 19–32. DOI:10.1109/TAC.2011.2160593
[20] Cai K, Ishii H. Convergence time analysis of quantized gossip consensus on digraphs. Automatica, 2012, 48(9): 2344–2351. DOI:10.1016/j.automatica.2012.06.048
[21] Li T, Xie L H. Distributed consensus over digital networks with limited bandwidth and time-varying topologies. Automatica, 2011, 47(9): 2006–2015. DOI:10.1016/j.automatica.2011.05.017
[22] Yuan D M, Xu S Y, Zhao H Y, et al. Distributed dual averaging method for multi-agent optimization with quantized communication. Systems & Control Letters, 2012, 61(11): 1053–1061.
[23] Li D Q, Liu Q P, Wang X F, et al. Quantized consensus over directed networks with switching topologies. Systems & Control Letters, 2014, 65(3): 13–22.
[24] Thanou D, Kokiopoulou E, Pu Y, et al. Distributed average consensus with quantization refinement. IEEE Transactions on Signal Processing, 2013, 61(1): 194–205. DOI:10.1109/TSP.2012.2223692
[25] Guan Z H, Meng C, Liao R Q, et al. Consensus of second-order multi-agent dynamic systems with quantized data. Physics Letters A, 2012, 376(4): 387–393. DOI:10.1016/j.physleta.2011.09.023
[26] Chen W S, Li X B, Jiao L C. Quantized consensus of second-order continuous-time multi-agent systems with a directed topology via sampled data. Automatica, 2013, 49(7): 2236–2242. DOI:10.1016/j.automatica.2013.04.002
[27] Xu Y M, Wang J Z. The synchronization of linear systems under quantized measurements. Systems & Control Letters, 2013, 62(10): 972–980.
[28] Fu J J, Wang J Z. Output consensus of heterogeneous linear systems with quantized information. Journal of the Franklin Institute, 2014, 351(3): 1400–1418. DOI:10.1016/j.jfranklin.2013.11.010
[29] You K Y, Xie L H. Network topology and communication data rate for consensusability of discrete-time multi-agent systems. IEEE Transactions on Automatic Control, 2011, 56(10): 2262–2275. DOI:10.1109/TAC.2011.2164017
[30] Horn R A, Johnson C R. Topics in Matrix Analysis. Cambridge: Cambridge University Press, 1991.
[31] Vorotnikov V I. Partial Stability and Control. Basel: Birkhauser, 1998.