BP神经模糊控制器十篇

2024-09-12

BP神经模糊控制器篇1

当交通流较大时, 在保证安全的前提下, 为了提高平面交叉口的通行能力往往需要进行多相位信号控制。在一个周期内, 交叉口上某一支或几支交通流所获得的通行权称为信号相位。单交叉路口4相位信号控制如下:相位1:南北直行;相位2:南北左转及;相位3:东西直行;相位4:东西左转及方向绿灯, 所有右转方向绿灯, 方向绿灯, 所有右转方向绿灯。

单个交叉路口信号的控制算法可描述为:

⑴从相位i开始, 分别指定各相位的最短绿灯时间Gmin和最大绿灯时间Gmax;

⑵先给该相位以最短绿灯时间

⑶测得放行车道的车队长度, 设其为li;

⑷若li为0, 或, 且△li=li+1-li大于某一给定值, 或累计绿灯时间Gi=Gmax, 则将绿灯转到下一相位, 回到1执行;否则往下执行;

⑸根据li及△li值的大小来确定绿灯延长时间△G, 这可根据交警的经验及交叉口的几何形状建立模糊控制规则。设延长的绿灯时间为△G, 若, 否则, 回到3。

2 模糊逻辑控制器的设计

2.1 检测器之间的车辆数ι, 队长之差Q, 绿灯追加时间G的模糊化

两检测器之间的车辆数ι为考虑具体交叉口路况后, 折算成标准小客车单位 (pcu) 的车辆数。视为模糊变量, 论域为:{1, 3, 5, 7, 9, 11, 13, 15, 17}, 取7个语言值:

队长差Q为pcu单位的下相位两检测器之间车辆数和本相位两检测器之间车辆数的代数差, 将其看作模糊变量, 其论域为:{-9, -6, -3, 0, 3, 6, 9}, 取5个语言值:

追加绿灯时间G为模糊变量, 其论域为:{3, 6, 9, 12, 15, 18, 21, 24, 27}, 取7个语言值:。相对于论域的隶属函数为:

2.2 模糊推理

根据经验总结出控制规则如下表所示 (“-”表示不可能出现的情况) 。两输入到输出的语言控制策略由33条模糊条件语句构成:

2.3 模糊判决 (去模糊化)

本文采用最大隶属度原则去模糊化。

3 模糊逻辑控制器的BP神经网络实现

3.1 模糊—神经网络控制结构

上述模糊控制器模型可以用三个BP神经网络来实现, 该模糊—神经控制器结构如下图所示。

神经网络Ⅰ、Ⅱ分别用于生成的隶属函数。神经网络Ⅲ用于产生绿灯追加时间输出。该神经网络采用典型神经元, 其输入输出关系为Sigmoid函数, 即:

3.2 模糊控制规则的实现及控制信号的形成

采用三层神经元网络Ⅲ来实现模糊控制规则。输入层对应于神经元网络Ⅰ和Ⅱ的输出层, 即含有12个神经元;输出层为一个神经元, 即控制量输出;隐含层采用7个神经元。以表4提供的经验数据为样本进行学习, 即可获得一个模糊神经控制器。

4总结

当交叉口车辆到达率或交叉口车流到达饱和时, 模糊神经网络控制方法可以大幅度减少交叉口各方向车辆的平均延误时间。这是因为在模糊控制算法中考虑了下一相位的等待车辆数, 从而保证了模糊神经网络控制器能够协调地给各方向分配通行时间, 防止某一方向等待车辆数过多而导致整体上大的平均延误。

参考文献

BP神经模糊控制器篇2

关键词：模糊控制,BP网络,PID控制器

0 引言

PID控制以其简单、容易实现等优点被广泛应用于工业过程控制中[1],PID控制器参数的选择直接影响控制系统的控制效果。在PID控制器设计中,寻找合适的控制算法来实现Kp、Ki、Kd参数的整定至关重要。之前有人提出了用增加动量项、高斯牛顿法[2,3]、模糊控制规则[4]等改进的BP算法,但是这些学者并没有将这些改进的BP算法用到PID控制中。之后李秀改等人提出了基于BP算法的模糊自适应控制器的研究[5],将BP网络改换成一种模糊控制过程。唐锐等人又提出了基于BP网络的模糊PID控制算法的研究[6,7],将系统误差进行了模糊化处理后,再应用到PID控制中。

本研究首先用模糊规则对BP网络的参数进行调整,然后将其应用到PID控制中,利用神经网络较强的自学习能力和模糊控制在模型未知或不精确前提下的控制能力,实现PID控制参数的在线调整和优化。

1 基本的BP网络

本研究采用3层BP网络[8],其结构如图1所示。

网络输入层的输入为:

oundefined=x(j),(j=1,2,…,m) (1)

式中 m—输入变量的个数。

网络隐含层的输入/输出为:

undefined

oundefined(k)=f(netundefined(k)),(i=1,2,…,q) (3)

其中,wundefined为隐含层加权系数,上角标(1)、(2)、(3)分别代表输入层、隐含层、输出层。隐含层神经元的活化函数f取正负对称的Sigmoid函数。

网络输出层的输入/输出为:

undefined

oundefined(k)=g(netundefined(k)),(n=1,2,3) (5)

oundefined(k)=kp (6)

oundefined(k)=ki (7)

oundefined(k)=kd (8)

由于Kp,Ki,Kd不能为负值,输出层神经元的活化函数g取非负的Sigmoid函数。

性能指标函数为:

undefined

按照梯度下降法修正网络的权系数,并附加一个使搜索快速收敛全局极小的惯性项:

undefined

式中 η—学习速率;α—惯性系数。

网络输出层权系数的学习算法为:

∇wundefined(k)=α∇wundefined(k-1)+ηδ(3)noundefined(k) (11)

undefined

其中,n=1,2,3。

隐含层权系数的学习算法为:

∇wundefined(k)=α∇wundefined(k-1)+ηδundefinedοundefined(k) (13)

undefined

其中,i=1,2,…q;g′(·)=g(x)(1-g(x));f′(·)=(1-f2(x))/2。

3 对3层BP网络学习参数的模糊自适应控制

由于超曲面E(k)有时变化“缓慢”,有时变化“迅速”,或者说学习步长“大”、“小”等都是相对的模糊概念,本研究使用了模糊控制方法来调节BP网络的学习参数。

从数学分析和微分几何可知,用E(k)函数的1阶导数可以判断该函数的变化趋势。笔者定义模糊控制器的输入变量为:E(k)与dE(k)。

1阶导数:dE(k)=E(k)-E(k-1)。

并将E与dE划分为5个模糊子集(状态),“负大(NB)” 、“负小(NS)” 、“零(Z)” 、“正小(PS)” 、“正大(PB)”。为了方便,笔者选用常见的三角隶属函数。注意到,归一化后,多输入模式下均方误差在训练过程之初大约为0.5。BP网络软件应用经验表明,dE=0.01就是较大的变化。由此给出如图2、图3所示的E和dE的隶属函数曲线。同理定义模糊控制器的输出变量u为学习参数的改变量,即u=Δα、Δη。由经验表明,学习参数的调整量不宜过大,一般为0.01,因此u的三角隶属函数曲线如图4所示。

其模糊控制规则如表1所示。

(1) 由于E(k)没有负值,E(k)的模糊集为{Z,PS,PB},在学习过程的初级阶段E=PB,误差较大,若dE=Z,则需要显著加大学习步长,u=PB,此时E(k)尚未进入复杂山谷区。

(2) 此后当E=PS,误差较小,E(k)进入复杂区域,若dE=Z,E(k)暂时平坦,为谨慎起见,少量增加步长,u=PS。

(3) 当dE=PB,说明误差明显上升,即已进入超曲面复杂地形区,搜索正沿陡山而上,则应明显减小学习步长,u=NB,以免出现振荡。

(4) 当E=Z,学习过程结束,学习参数也不需要改变,即u=Z。

3 模糊BP网络整定的PID控制

经典增量式数字PID的控制算法为:

u(k)=u(k-1)+Δu(k) (15)

Δu(k)=kpx(1)+kix(2)+kdx(3) (16)

x(1)=e(k)-e(k-1) (17)

x(2)=e(k) (18)

x(3)=e(k)-2e(k-1)+e(k-2) (19)

基于模糊BP网络的PID控制器结构如图5所示。

综上所述,基于模糊BP神经网络的PID控制算法可归纳如下:

(1) 选定BP网络结构,即确定输入层节点数M和隐含层节点数Q,给出各层加权系数初值。选定学习速率η和惯性系数α,此时k=1。

(2) 采样获得rin(k)和yout(k),计算e(k)=rin(k)-yout(k)。

(3) 将e(k)输入到BP网络,利用式(9)计算E(k),再用模糊控制规则调节BP网络的学习参数。

(4) 计算改进的BP网络各层的输入输出,NN输出层的输出即为PID控制器的3个可调参数kp,ki,kd。

(5) 根据式(12)计算PID控制的输出Δu(k)。

(6) 进行神经网络的学习,在线调整加权系数wundefined(k)、wundefined(k),学习参数,实现PID控制的自适应调整。

4 仿真实验

设被控对象为非线性离散系统,其近似数学模型为:undefined,权系数初始值取区间[-0.5,0.5]上的随机数,输入为阶跃函数rin(k)=1.0。

仿真曲线如图6～图8所示。可以看出,算法改进前后虽然误差曲线没有明显的变化,但是输出超调明显减小,达到稳定的时间缩短,控制系统的鲁棒性得到了改善。

(1)—经典控制;

(2)—模糊BP的PID控制

5 结束语

采用模糊控制方法自动调节BP神经网络训练过程中的学习参数,将明显地提高收敛速度和误差精度。本研究正是将这种改进的BP算法应用于PID控制中,实现PID控制参数的在线调整和优化。仿真实验表明,其具有较强的适应性和鲁棒性,且该算法与改进前的PID控制相比较,取得了较好的效果。

参考文献

[1]ASTROMK J,HAGGLUND T.The future of PID control[J].Control Engineering Practice,2001,9(11):1163-1175.

[2]耿小庆,和金生,于宝琴.几种改进BP算法及其在应用中的比较分析[J].计算机工程与应用,2007,43(33):243-245.

[3]LEUN F HF,LAM H K,LING S H.Tuning of the struc-ture and parameters of neural network using an improved ge-netic algorithm[J].IEEE Transactions on Neural Net-works,2003,14(1):780-784.

[4]冯天瑾,陈哲,顾方方.BP网络学习参数模糊自适应算法的实现[J].青岛海洋大学学报,2000,30(1):137-141.

[5]李秀改,侯嫒彬.基于神经网络BP算法的模糊自适应控制器的研究与实现[J].电气传动自动化,2000,22(4):24-26.

[6]唐锐,文忠波,文广.一种基于BP神经网络的模糊PID控制算法研究[J].机电产品开发与创新,2008,21(2):24-26.

[7]孙小权,钱少明.基于BP神经网络的料筒温度PID控制器[J].机电工程,2008,25(5):18-20.

BP神经模糊控制器篇3

企业财务风险通常表现为企业财务状况的恶化和经营成果的降低，其结果将会直接导致企业获利能力、偿债能力、营运能力和成长能力的下降，而这四个方面能力的综合即为企业的实际经营绩效。企业财务风险的发生，最终体现为企业实际经营绩效与经营目标之间出现非预期的负偏差。通过对这种负偏差及其偏差程度的分析，来综合判断企业财务风险是否发生以及财务风险状态的严重程度。定量财务指标如表1所示：

（一）模糊综合评价进行表层分析企业经营绩效评价指标体系是一个多层次、多指标的评价体系。考虑到企业经营绩效可以从A1~A4四个能力方面来评价，每一个方面在整个评价体系中的权重系数，可以由包括专家、企业管理人员及相关技术人员在内的n类有关人员依据各自的经验和方法分别给予评价。

评价结果Wik组成模糊关系评价矩阵：W=（W1，W2，W3，W4）=W11W12W13W14W21W22W23W24……Wn1Wn2Wn3Wn4，其中：Wik=1，Wik:表示第i个专家对第k方面的评价，再利用线性加权法：AK=ai·Wik（k=1，2，3，4）得出上述四方面的权重系数。其中ai为第i类人员的加权系数。

（二）BP神经网络模型内部分析以上A1～A4四个方面整体构成评价体系的表层。然后，为克服模糊综合评价这种定性方法的局限性，对每个方面中各能力指标采用人工神经网络模型来进行深层次的定量评价。

（1）构建BP网络模型结构。把这四个方面分别构造成为四个小的人工神经网络，由于前向反馈式BP神经网络具有精度高、误差小等优势，目前大多采取BP网络。其传导结构如图1所示。

BP网络是一种单向传播的多层前向网络。它采用梯度搜索技术，以使网络的实际输出值与期望输出值的误差方值为最小。其网络结构是由输入层、输出层和隐层组成，其中隐层可以是一层，也可以是多层，前层至后层节点通过网络权值相连接，同层节点中没有任何祸合，输入层和隐层的激活函数通常为Sigmoid型。但是在隐层和输出层之间的激活函数可以是线性的。Sigmoid型传递函数表达式为：f（x）=。

（2）确定模型初始权重。采用完全随机化的初始权重确定方法，通常的初始权重值与偏差值随机化方法都是在区间（-1，l）之间取均匀分布的随机数的函数，式中i，k，j分别为输入层、隐含层和输出层神经元数，rand(m,n)为m行n列的均匀分布的随机数矩阵，I(m,n)为m行n列的全1矩阵，目的是保证权值分布在区间（-1，l）范围内。这样初始权值W与阈值B为：W1=rand（k，i）-I（k，i），W2=rand（j，k）-I（j，k），B1=rand（k，1）-I（k，1），B2=rand（j，1）-I（j，1）

该函数分为线形区和饱和区，当神经元工作于饱和区时，函数变化缓慢，需经过较长的一段时间才能跳出该区域，而工作于线形区时，由于函数的变化较快，使得神经元的自我调节容易，因而收敛速度较快。如果初始权重选择的区域过大，神经元落入饱和区的概率也就越大，其收敛速度也就会很慢，但如果区域选得过小，同样会降低神经元的活性，影响网络的收敛速度。为验证上述理论，选择了［-15，15］到［-0.001，0.001］等9个区间，产生随机权重，通过分析输出的一系列累积误差变化，得出前两者当随机权值产生区间在［-0.25，0.25］之间时，两模型的收敛速度均为最快;而后两者只有当随机权值产生区间在［-0.2，0.2］之间时，两模型收敛为最快。

（3）学习次数与精度确定。BP神经网络的学习过程是由模式的正向传播和误差的反向传播所组成。在正向传播中，输入信息经隐含单元逐层处理并传向输出层。如果输出层不能得到所期望的输出，则转入反向传播过程，将实际值与网络输出之间的误差沿原来的连接通路返回，通过修改各层神经元的连接权重使误差减小，然后再转入正向传播过程。如此反复计算，直到误差小于设定值，学习过程结束。一般来讲，网络学习次数越多，其输出结果的精度越高，但学习次数多其网络训练时间也越长，另外，如果学习样本选择不当，网络精度越高，意味着其记录的错误信息越多，也会对网络的应用效果产生不利影响。为此，通过网络训练比较，前两者模型中，网络训练次数定为15万次，而后两者网络训练次数则定为16万次为宜。

（三）利用网络输出进行模糊评价通过上述步骤得出的能力系数由输出层Oj=（1，2，3，4）输出，其结果分别为R1'、R2'、R3'、R4'，则最终得到企业经营绩效的综合评价结果:AiR'i

二、财务风险控制

利用模型进行财务风险识别之后，对于存在企业内部的风险，必须实施有效的策略加以控制，从而达到财务风险管理的最终目的。这里从风险状态转移、机制改善和企业特性优化这三个不同深度的层面，分析企业财务风险控制的基本途径。

（一）风险状态转移风险状态转移是企业财务风险控制策略最为直接的形成途径，它是对企业在某一环节或区域存在的风险因素，采取直接的纠正措施加以整治，使企业由严重风险状态逐步向较低风险状态转移。企业综合评价指数值处于风险状态区域的原因可从以上所说的四个方面来反映，那么风险状态转移策略的制定也可从这些方面来考虑。例如盈利能力指标类评价指数值及其单项指标的评价指数值过小，则说明企业的盈利能力处于风险状态，经营者应采取增加销售收入或降低生产成本的对策，以扩大企业利润边际额，增强企业盈利能力。如果运营能力处于风险状态，经营者就应注意加强原材料、在制品、产成品等企业存货及其它流动资产的管理，改善企业销售政策，促进应收帐款的及时回收，以改变企业资产周转效率太低的状态。偿债能力处于风险状态，企业经营者应设法扩大股票发行量或促进股票价格提高，以增加权益资本价值，或者缩小债务帐面价值，改善企业资本结构。如果成长能力处于风险状态，企业经营者应考虑优化企业产品结构，开辟企业新的利润增长点，从而改变企业发展缓慢或处于停滞的状态。

（二）风险机制改善改善企业风险机制相对于风险状态转移，能在更深层次上控制企业财务风险的发生与扩散，能够提高企业财务风险控制的能力。改善企业财务风险机制，应从建立结构完善的风险控制制度，促进企业管理层及员工树立正确的风险观念和掌握科学的风险控制的基本方法等方面出发。一是加强企业管理决策过程中的风险观念。财务风险是客观存在的，只要有财务活动，就必然存在着财务风险。而在现实工作中，企业管理人员对财务风险的客观性认识不足，缺乏风险意识，通常认为只要管好用好资金就不会产生财务风险。二是建立健全企业财务风险控制制度。要把风险机制引入企业管理活动中，把风险观念融入企业内部控制制度中，让企业经营管理者及其员工在市场竞争中承担风险责任。

（三）企业特性优化优化企业特性则是从根本上和战略上最大限度地防范与控制企业财务风险的发生，提高企业控制财务风险的能力和水平，保障企业的长期生存和持续发展。一般来讲，企业当前的经营成果和财务状况，是在企业过去经营成果和财务状况的基础上，由当前的企业特性因素综合影响和作用的结果；未来的经营成果和财务状况，则是过去、目前和将来的企业特性因素综合影响和作用的结果。因此，对企业特性的优化是提高企业经营成果、改善企业财务状况、控制企业财务风险的根本途径和战略措施。

参考文献：

［1］姜长生、王从庆：《智能控制与应用》，科学出版社2007年版。

BP神经模糊控制器篇4

将粒子群优化的BP神经网络作为模型,参考自适应控制系统的控制器,把参考模型输出与系统实际输出的均方误差作为PSO-BP神经网络的适应函数,通过PSO算法强大的搜索性能使自适应控制系统的`均方误差最小化.仿真实例结果表明,基于粒子群优化算法的BP神经网络自适应控制系统收敛快、精度高,有较好的网络的泛化和适应能力,能够很好地控制系统的输出跟随参考模型的输出.

作者：陈聆闫海波毛万标 CHEN Ling YAN Hai-bo MAO Wan-biao 作者单位：陈聆,CHEN Ling(成都理工大学信息管理学院,数学地质四川省重点实验室,成都,610059)

闫海波,YAN Hai-bo(新疆财经学院,乌鲁木齐,830012)

毛万标,MAO Wan-biao(西昌卫星发射中心技术部,四川,西昌,615000)

BP神经模糊控制器篇5

电加热炉在冶金, 矿山等工业领域有广泛应用, 因此对电加热炉温度控制系统的研究具有一定的理论价值。电加热炉是一个典型的多输入多输出的热工对象, 实际工业中一般采用传统的PID控制方法, 在特定的工况下具有良好的效果, 但是由于实际工况的复杂性, 炉温模型存在非线性, 参数不确定性, 仅用传统的PID控制算法很难完成温控任务, 因此, 该文将神经网络控制方法应用于电加热装置温度的控制, 以便提高在各种工况下的控制效果。

2 基于BP神经网络PID控制

2.1 BP神经网络结构

BP神经网络结构如图1所示。x和y是网络的输入、输出向量。每个神经元用一个节点表示。网络由输入层、隐层和输出层节点组成。

2.2 基于BP网络的前向算法[1]

网络输入层:

网络隐含层:

网络隐含层的输入, 输出算法如 (2) , (3) 所示:

算法 (3) 中wij隐含层加权系数, 隐含层转换函数取正负对称的sigmoid函数, 按照梯度下降法修正网络权系数, 隐含层的权值和阈值调整量:

隐层的权值和阈值的迭代计算式

通过上述计算能得到更新了的网络权值和阈值, 重复正向传输和误差反传过程, 直到满足要求的精度为止。

网络的输出层:

网络隐含层的输入, 输出算法如 (8) , (9) 所示:

算法 (9) 中Vij隐含层加权系数, 输出层转换函数取非负的sigmoid函数,

对输出层的权值和阈值调整量:

式中η为学习率, 在0~1间取值, 如η=0.2~0.5。

输出层的权值和阈值的迭代计算式:

基于BP网络的自适应PID控制系统结构[2]如图2:

控制器由两部分组成:经典的PID控制器, 直接对被控对象进行闭环控制;神经网络根据系统的运行情况, 调整PID控制器的参数以期达到性能最优。BP神经网络输入节点对应所选的系统运行状态变量, 如系统不同时刻的输入量和输出量等, 必要时进行归一化处理。输出分别对应PID控制器的三个可调参数Kp, Ki, Kd[3]。

3 前馈补偿解耦法

前馈补偿是自动控制理论中最早出现的一种克服干扰的方法, 同样适用于解耦控制系统。用了前馈矩阵补偿以后, 被控变量的传递函数变成了对角矩阵, 补偿了耦合支路的影响, 即抵消了过程的耦合, 而且耦合以后控制对象矩阵的对角元素保持不变, 即控制主通道的特性保持不变, 总之实现了解耦控制。

4 电加热炉温度控制仿真研究

设有一个电加热炉温度控制系统的控制模型为:

BP神经网络实现PID控制器仿真结构如图3:

当系统未解耦, 控制器采用传统PID结构, 输入为多阶梯波信号[4], 系统的仿真图如图4所示:

调节器PID1, 2参数均为:Kp=0.13;Ki=0.045, Kd=0。传统PID输入, 输出响应如图5所示:

当系统加入前馈解耦环节后, 控制器采用BP结构, 当BP神经网络的学习效率为0.02, 惯性系数为0.04时系统的仿真图如图6所示:

输出响应如图7所示:

5 实验结论

本文针对电加热炉温度系统这个非线性, 强耦合的控制过程, 提出了一种较为实用的神经网络解耦方案, 通过初步仿真, 方案控制系统的调节品质比传统的PID控制水平有了明显的提高。

摘要：该文选取在工业上具有广泛应用的电加热炉为对象。电加热炉系统是一个双输入双输出系统, 有耦合, 相互影响, 相互干扰。针对控制对象强耦合的特点, 设计了基于BP神经网络的参数PID控制算法, 采用前馈补偿方法实现解耦, 通过仿真研究, 结果表明该方案控制系统的调节品质比传统的PID控制水平有了明显的提高。

关键词：BP神经网络,PID,解耦,温度控制,仿真

参考文献

[1]柴天佑.多变量自适应解耦控制及应用[M].北京:科学出版社, 2001.

[2]刘金琨.先进PID控制及其MATLAB仿真[M].北京:电子工业出版社, 2003.

[3]李英春, 王孟效.基于BP神经网络PID的漂白温度控制算法的研究[J].控制工程, 2006, 22 (12-1) .

BP神经模糊控制器篇6

随着人类对海洋的开发利用逐渐增加,水下机器人技术得到了广泛的应用。但由于水下机器人各自由度之间存在较强的耦合,很难得到精确的数学模型,因此在设计控制器的时候需考虑较多的因素。

传统的AUV控制采用PID控制器,PID控制器具有响应速度快、控制精度高等特点,是目前应用最广泛的控制技术。传统的PID控制器在确定模型、固定工况和有小扰动的情况下的控制性能能够达到控制指标要求,但由于它以确定的AUV数学模型为基础,使得控制参数恰当选取比较困难,特别是当AUV在运动过程中由于海况变化产生扰动或自身的速度等特性发生变化时,PID控制器的控制鲁棒性就会变差,要解决这类问题,最好的方法就是设计非线性控制器。智能控制技术已经广泛用于不确定性、非线性等复杂控制系统的控制,从1985年开始,滑模控制、非线性控制、自适应控制、模糊控制和神经网络控制被陆续提出。1990年Yuh用一个三层BP神经网络控制器直接替代了传统控制器,将神经网络应用到AUV控制领域。神经网络是由大量的基本单元经过复杂的互相连接而成的一种高度复杂、非线性、并行处理的信息处理系统,且具有一定的自学习、自适应、非线性映射能力以及较强的容错性和鲁棒性等优点,所以神经网络在一定条件下可以逼近非线性函数。

本文重点探讨PID和动态BP神经网络在水下机器人运动控制中的应用,并设计出优良的水下机器人运动控制系统。

2 控制对象模型

建立AUV载体动力学的数学模型对于实现其控制来说是十分必要的。根据本文研究对象的尺寸、线形以及使命任务的要求,其垂直面与水平面的耦合很小,可以忽略不计。本文在AUV建模时取AUV的重心为运动坐标系的原点,根据刚体动力学理论,水下机器人空间六自由度运动的一般方程如下:

其中:

m——水下机器人的质量;

x G,y G,zG——水下机器人的重心坐标;

I x,I y,Iz——水下机器人的质量m对O x,O y,Oz轴的转动惯量;

u、v、w、p、q、r——六自由度的角速度;

u、v、w、p、q、r——六自由度的角加速度;

X、Y、Z、K、M、N——六自由度的力矩;

方程右端X、Y、Z、K、M、N表示作用在水下机器人上的作用力矩,包括:水下机器人受到的重力和浮力等静力、推进器推力、舵的力、翼的力、水下机器人运动引起的流体水动力和一些环境干扰力等。

3 神经网络PID控制方法

由于AUV结构的特殊性,很难准确得到其水动力系数,工作环境是在几米至几十米的水下,受到各种未明的干扰因素,各个自由度运动的相互耦合,任务的可变性等等,都表明水下机器人的动力学系统是强非线性、时变的。因此,对水下机器人的控制是一个困难的问题,而神经网络恰恰提供了解决的方法,应用神经网络自学习和自适应的理论方法,和对任意函数的逼近能力,以及PID良好的控制特性,使控制器能适应自身及环境的改变而自我改进、自我完善,就可实现水下机器人运动控制。

神经网络PID控制器系统结构如下图所示,控制器由BP神经网络和PID控制部分组成。

动态BP神经网络采用4-10-3三层前向网络组成,包含4 个输入神经元,10个隐含层神经元和3个输出神经元。输出接点分别对应PID控制器的3个可调参数Kp,Ki、Kd。神经网络的输入为:

输入层采用线性激活函数,隐层输入为:

隐层和输出层采用S型激活函数,计算神经网络各层的输入、输出,神经网络的输出即为PID控制器的3个可调参数Kp,Ki、Kd,然后计算PID控制器的输出u(k)。进行神经网络的学习,调整加权系数ωij和νij,实现PID控制参数的自适应整定。

4 仿真结果

在实际的航行过程中,水下机器人不可能出现频繁的加速、减速和快速的大角度转弯等情况,因此我们选取变化速度比较快的正弦函数作为响应输入信号,以验证系统的有效性。

限于篇幅,本文仅给出航向控制结果,速度和深度可以得出类似的结论。系统仿真结果如下图所示,与传统PID性能相比较,可以看出,神经网络PID的响应曲线与目标值吻合良好,超调量小,几乎无静差,达到了预期的目的,说明该控制器完全适应复杂环境下水下机器人的控制。

试验表明,本文所设计的动态BP神经网络PID控制器具有良好的适应性和灵活性,对于大时滞、强耦合环境下的水下机器人,起到了较好的控制作用。

参考文献

[1]J.Yuh.A neutral net controller for underwater robotic vehicles[J].IEEE Journal of Oceanic Engineering,1990,15(3):161-166.

[2]熊华胜,边信黔,施小成.积分变结构控制原理在AUV航向控制中的应用仿真[J].船舶工程,2005,27,(5):30-33.

[3]夏国清,汤莉.基于动态神经网络的AUV航向自适应控制[J].船舶工程,2009,31,(2):46-49.

[4]施生达.潜艇操纵性[M].北京:国防工业出版社,1995.

[5]李天森.鱼雷操纵性[M].北京:国防工业出版社,1995.

BP神经模糊控制器篇7

矿井提升机是煤矿生产中的关键大型设备,其控制系统的安全可靠性直接影响煤矿生产的正常运行。但因提升机是一种具有时变、强耦合特点的复杂系统,系统故障时的动态性能很难用传统的PID算法得到。而BP神经网络具有的在线学习能力对于跟踪动态变化有着很好地应用,容错控制是提高系统安全和可靠性的一种新方法,可对系统的性能进行动态跟踪。因此,提出一种基于BP神经网络的矿井提升机自校正容错PID控制方法,用于跟踪系统的动态性能并进行控制。

1 基于BP神经网络的PID控制原理

基于BP神经网络的PID控制器可以根据矿井提升机控制系统的运行状态,将系统故障数据输入到BP神经网络进行训练,使输出层神经元的输出状态对应于PID控制器的3个可调参数:比例系数kp、积分系数ki、微分系数kd,达到PID控制器的性能指标最优化。通过神经网络的自学习、加权系数调整,使BP神经网络输出对应于某种最优控制律下的PID控制器参数,通过这样调整的PID控制器可以使系统的输出最接近期望输出。

经典增量式数字PID的控制算法为

$\begin{array}{l} u (k) = u (k - 1) + k_{p} [e (k) - e (k - 1)] + k_{i} e (k) + \\ k_{d} [e (k) - 2 e (k - 1) + e (k - 2)] (1) \end{array}$

式中:u(k)为PID控制器的输出值;e(k)为期望输出值与实际输出值的差值。

参考文献[1,2]指出,隐含层的层数只要大于或等于1,BP神经网络就具有逼近一切非线性映射的能力。每增加1个隐含层,意味着计算时间大大增加,综合考虑BP神经网络的计算时间和网络的复杂度及对非线性系统拟合需要的精度,一般选择具有1个隐含层的BP神经网络。本文采用3层BP神经网络,有m个输入节点,q个隐含节点,3个输出节点,其结构如图1所示。

BP神经网络的学习算法采用梯度下降法。每层单元只接受前一层的输出信息并通过计算输出给下一层各单元,各节点全部通过Sigmoid型函数 $f (x) = 1 / (1 + e^{- x})$ 计算输出。

由图1可见,输入层的输入为

$o_{j}^{(1)} = x (j) ‚ j = 1, 2 ‚ \dots ‚ m (2)$

隐含层的输入、输出为

$\begin{array}{l} n e t_{i}^{(2)} (k) = \sum_{j = 0}^{m} w_{i j}^{(2)} o_{j}^{(1)} (3) \\ o_{i}^{(2)} (k) = f (n e t_{i}^{(2)} (k)), i = 1, 2 ‚ \dots ‚ q (4) \end{array}$

式中:w $_{i j}^{(2)}$ 为隐含层的加权系数;上标(1)、(2)分别代表输入层、隐含层。

输出层的3个输出分别为PID控制器的kp、ki、kd,由于kp、ki、kd不能为负值,所以输出层神经元的活化函数取非负的Sigmoid函数:

$g (x) = \frac{1}{2} [1 + \tanh (x)] = \frac{e^{x}}{e^{x} + e^{- x}} (5)$

因此,输出层的输入、输出为

$\begin{array}{l} n e t_{l}^{(3)} (k) = \sum_{i = 0}^{q} w_{l i}^{(3)} o_{i}^{(2)} (k) (6) \\ Ο_{l}^{(3)} = g (n e t_{l}^{3} (k)) (7) \end{array}$

即

${\begin{cases} Ο_{1}^{(3)} (k) = k_{p} \\ Ο_{2}^{(3)} (k) = k_{i} \\ Ο_{3}^{(3)} (k) = k_{d} \end{cases} (8)$

式中:w $_{l i}^{(3)}$ 为输出层的加权系数;上标(3)代表输出层。

2 自校正容错PID控制器

容错控制器的设计思想:首先训练1个BP神经网络作为提升机系统的回归模型,在系统运行时,在线更新BP神经网络权值来跟踪系统。并应用BP神经网络的预测功能,预测系统输出。BP神经网络PID的初始权值为回归模型的权值。由于系统双入双出,故设计2个PID控制器,相应地,与之对应的神经网络有2个。在正常状态下,BP神经网络PID控制器不更新PID参数。在故障状态下,激活BP神经网络PID控制器,通过在线学习系统的动态变化,改变PID参数的值,从而改变系统的输入,补偿系统故障,实现容错性能。故障判断依据为系统的误差大于某一阈值,这一阈值在仿真中取0.000 2。自校正容错PID控制器结构如图2所示。

由于系统输出未知,参考文献[3]采用近似的符号函数代替或是用最小二乘法来预测输出值,在正常状态下,这样的处理取得了较好的效果。但是在故障状态下,由于系统的动态性能改变较大,预测结果差强人意。本文设计了2个BP神经网络,一个用于预测,另一个用于调整PID权值,这样y(k)用BP神经网络输出的预测值代替。同时,在故障状态下,BP神经网络的权值也相应调整,能迅速跟踪系统性能。因此,无论正常还是故障状态下,本文方法预测性能都较好,更能逼近实际系统的输出。

取性能指标函数为

$E (k) = \frac{1}{2} [r (k) - y (k)]^{2} (9)$

由于

$\frac{\partial n e t_{l}^{(3)} (k)}{\partial w_{l i}^{(3)} (k)} = Ο_{i}^{(2)} (k) (10)$

则权值调整算法为

$\begin{array}{l} Δ w_{l i}^{(3)} (k) = - η \frac{\partial E (k)}{\partial w_{l i}^{(3)}} + α Δ w_{l i}^{(3)} (k - 1) (11) \\ \frac{\partial E (k)}{\partial w_{l i}^{(3)}} = e (k) \frac{\partial y (k)}{\partial u (k)} \frac{\partial u (k)}{\partial Ο_{l}^{(3)} (k)} Ο_{i}^{(2)} (k) (12) \end{array}$

式中:η为学习速率;α为惯性系数。

同时,系统设定了一个误差阈值,在误差可容忍的范围内不做调整,避免了神经网络的频繁训练造成系统速度下降。

3 仿真研究

本文选用Matlab仿真软件进行实验仿真,确定用于跟踪预测系统的BP神经网络结构为5-5-1结构,即有5个输入:闸瓦间隙、空动时间、提升速度、制动油压、制动油温,5个隐含层,1个输出,即提升加速度。其中,学习速率η为0.5,惯性系数α为0.2,选择迭代次数为400。

用于调节PID参数的神经网络结构为5-5-3。同样有5个输入:闸瓦间隙、空动时间、提升速度、制动油压、制动油温,5个隐含层,3个输出为PID的3个参数kp、ki、kd。初始参数取系统回归模型训练好的参数。系统仿真中学习速率η为0.95,惯性系数α为0.5,采样时间为0.01 s。

首先产生训练样本,给提升机系统输入一线性函数u=0.000 005t,系统不添加任何控制措施,得到系统输出。采样时间为0.1 s,即共采样2 000×5个数据,取前1 500×5个数据用于训练。

图3为BP神经网络学习性能曲线。训练后跟踪提升机的1条阶跃曲线,在0 s时系统期望输入为0.2 m/s2,100 s时期望输入变为0.3 m/s2。从图3 可看出,所选取的神经网络具有很好的曲线拟合和泛化能力。

对提升机典型的故障状态进行系统仿真,提升机在20 s时闸瓦间隙突然出现泄露故障,故障的经验表达式为

$F_{1} (t) = - c_{1} π r_{1} \sqrt{2 g x_{1} t} / A (13)$

式中:c1为采样时间;r1为经验常数,r1=7.3×10-2;g为重力加速度;x1为闸瓦间隙距中心的长度;t为故障时间;A为闸瓦间隙的面积。

提升机系统突变故障时系统响应仿真效果如图4 所示。从图4可看出,基于BP神经网络的PID控制方法能迅速地跟踪系统故障状态,在线调整PID参数,并快速将系统性能恢复到期望的性能。仿真中故障采样时间为0.01 s,即在100个采样周期内就能恢复性能,故障调节时间远小于1 s,说明基于BP神经网络的PID控制方法能很快使系统性能指标恢复,证明了方法的有效性。

4 结语

针对矿井提升机控制系统故障时动态性能难以用传统的解析方法获得的问题,提出了一种基于BP神经网络的矿井提升机自校正容错PID控制方法。仿真结果表明,该方法在提升机控制系统故障情况下能迅速地跟踪系统故障状态,在线调整PID参数,快速恢复系统性能。但应注意,采样时间对于系统容错控制性能具有非常大的影响。选取采样时间过大,系统控制效果较差,甚至有时是不稳定的;若采样时间过小,神经网络训练过于频繁,对系统处理能力要求较高,硬件实现较为困难。因此,选取一个合适的采样时间显得非常重要。

参考文献

[1]刘超彬.基于模糊神经网络的污水处理过程智能控制方法研究[D].北京:北京工业大学,2006.

[2]王凌.智能优化算法及其应用[M].北京:清华大学出版社,2001.

[3]刘金琨.先进PID控制及其Matlab仿真[M].北京:电子工业出版社,2003.

[4]戴先中.多变量非线性系统的神经网络逆控制方法[M].北京:科学出版社,2005.

[5]赵峻.基于学习方法的非线性系统主动容错控制研究[D].北京:中国矿业大学,2010.

BP神经模糊控制器篇8

随着模糊控制越来越广泛的应用,一些学者开始通过采用多种算法( 如神经网络等) 与模糊控制相结合[1],来得到适用性更强的新控制算法。张秀玲等提出了一种优化自适应模糊神经网络算法,并应用在污水处理系统中,提高了系统的稳定性,使模糊神经网络具有更高的鲁棒性[2]。赵继印等提出一种基于误差自动调节修正因子的自适应学习速率法,从而提高网络的收敛速度[3]。徐春梅等提出的权矩阵学习速率自适应调整算法, 可以取得更好的控制跟踪效果[4]。房振勇等通过调节动量因子实现学习速率的自调节,提高了学习的平稳性[5]。王玲芝和王忠民将BP网络的节点实际输出与期望输出的平均绝对值误差及其误差变化率作为自变量,并寻求学习速率与两个自变量的函数关系,对学习速率进行了动态调整,使系统具有更快的收敛速度[6]。徐雅斌和杜鹏将模糊推理方法引入到BP算法中,实现了自适应调节学习速率[7]。

在此,笔者将带有动量因子的自适应学习速率的新型BP算法应用到模糊神经网络控制器中,给出了一种基于自适应学习速率的模糊神经网络控制器,利用新型BP算法来训练模糊控制中的隶属度函数和模糊规则,采用模糊推理的方法来自适应调节学习速率,使系统具有良好的控制效果。

1问题描述

考虑如图1所示的模糊神经网络[8],该网络为五层结构,其输入为误差e和误差变化ec,输出为u。

设系统的理想输出为yd,实际输出为y,则性能指标J的计算式为[9]:

通常,模糊神经网络控制器中学习速率是常数,在学习过程中很难确定一个最佳学习速率,同时在修正权值、中心值和宽度值时,仅按当前时刻的负梯度方向修正,而不考虑以前时刻的梯度方向,会导致在学习过程中出现振荡和收敛速度慢的问题。

2基于自适应学习速率的模糊神经网络控制器

2.1参数初始化

通常,初始权值、隶属度函数的中心值和宽度值会取常数或赋一个较小的随机数,但这种初始化方法会导致网络收敛速度较慢,甚至只能收敛到局部极值上。因此,笔者采用均匀分布随机数产生权值、中心值和宽度值,使初始权值随机产生并均匀分布。

2.2带动量因子的BP改进算法

在标准的BP算法中,设 η 是学习速率,模糊神经网络控制器中的可调参数权值 ωij、中心值mij和宽度值 σij的计算式分别为:

在此,引入动量因子 β( 0≤β < 1) ,采用上一次在学习过程中的校正量来影响本次的校正量, 以加快收敛速度,即:

通过选择合适的 β 值,可避免每一步修正值过大出现的振荡现象或因BP陷入局部最小值和修正值过小的问题。

2.3自适应学习速率

由可调参数知,学习速率通常是设定的常数, 但在整个过程中,无法找到一个最合适的学习速率来满足该算法对学习速度的要求。为此,通常采用自适应调节学习速率的方法[10],即根据实际情况和网络误差来自适应调节:

其中,Et为t时刻的误差,Et + 1为( t + 1) 时刻的误差。可见,若误差变化修正方向正确,即总误差减小,则学习速率增大; 反之,则学习速率减小。 α 通常取0. 01 ~ 0. 03,虽然采用这种方法对于缩短学习时间、提高收敛速度有一定的效果,但 α 仍然是一个常数,学习速率依然是一个不变量。因此,对于学习速率的问题仍然需要研究,笔者采用模糊神经网络自调整学习速率的方法,以提高系统的收敛性。

将误差E总和误差变化 ΔE看作模糊程度,从而引入模糊推理的概念,按照E总→0和 ΔE→0的程度来更新学习速率。具体步骤如下:

a. 模糊化。求出y、E总和 ΔE,并对E总和 ΔE进行模糊化处理。

b. 模糊分割。将误差和误差变化分别分割为5个语言变量,分别为NB、NS、ZE、PS和PB; 将学习速率分割为5个语言变量,分别为ZE、PS、S、 B和PB。

c. 选取隶属度函数。笔者采用三角形作为隶属度函数,即。

d. 模糊推理。采用的语句为“IF e'是Aiand ec'是Bi,Then η'是Ci”,其中Ai、Bi和Ci为模糊语言。学习速率的模糊控制规则见表1。采用模糊的运算方法Ri= ( Aiand Bi) →Ci,其中,Ri为模糊蕴含关系,则所有规则的总模糊关系,输出模糊量 η' = ( e' and ec') R。

e. 清晰化。采用加权平均法,使清晰化后的 η 用于BP算法中的误差反传。

因此,采用模糊推理的方法来自调整学习速率,使学习速率在学习过程中适时地改变,从而提高控制系统的收敛速度。

考虑如下线性系统:

定义误差e与误差向量e珒分别为:

控制器的输出ui为:

式中kjik———实数值;

ω ———权值;

φ ———第三层的输出。

因此可以得到:

取 Ni= 2,Nr= 7。

对于给定的回归向量 ф,定义最优为:

理想控制器的输出u*为:

将式( 5) 代入式( 1) 得:

将式( 1) 和式( 6) 作差,并将式( 2) 、( 3) 代入其中,得到系统的误差方程为:

将式( 4) 、( 5) 代入式( 7) 可得:

定理对于式( 1) 的线性系统,应用基于自适应学习速率的模糊神经网络控制方法,满足的条件下,系统式( 1) 在Lyapunov意义下是稳定的。

证明P是对称正定矩阵,它满足ATP + PA = - Q,其中Q是可选的对称正定矩阵。

选取Lyapunov函数,其中。

又:

式中O( t) ———模糊神经网络的实际输出;

W ———m、σ、ω 的统称。

定义:

根据导数定义可知,,Δt必大于0,为了保证收敛,则必须满足即,通过计算满足。

因此,在时,满足,跟踪误差e收敛,故系统式( 1) 在Lyapunov意义下是稳定的。

综上,跟踪误差e收敛,表明系统式( 1) 在控制律( 4) 的作用和条件下收敛。

3仿真实验与分析

考虑如下二阶控制系统:

采样时间T = 1ms,产生49条规则,阶跃输入信号r = 1. 0、β = 0. 75,经过500次迭代,初始权值取[0,1]上的均匀随机数,初始中心值是[1. 0, 1. 6]上的均匀随机数,初始宽度值是[2. 0,2. 6] 上的均匀随机数。

对于同一受控对象,运用Matlab进行仿真, 对比并分析本方法、模糊控制和常规模糊神经网络控制方法的仿真实验结果( 图2、3) 。采用本文方法得到的学习速率变化曲线如图4所示。

实验对比结果见表2。

常规模糊神经网络的 η 取0. 30,而本文方法取 ηm= ησ= ηω,由表3可知学习速率满足系统收敛性的最大值,由图4可知学习速率可自动调节,且最高值为0. 70,满足的条件,故系统收敛。

综上所述,本文方法调整时间短、响应速度快、精确度高,能达到较好的控制水平和控制效果。

4结束语

BP神经模糊控制器篇9

递归神经网络是人工神经网络的一种即 (Recurrent Neural Networks, RNN) , 也是一种具有反馈回路的大规模的非线性动力系统, 它在模式识别、图像处理、智能控制、信号处理优化计算等领域有着广泛的运用。

模糊控制是以模糊集合为理论基础的新兴控制手段, 将模糊数学应用人工智能控制技术中。神经网络擅长从神经网络传输层的输入输出数据中学习有用的知识, 并进行取舍, 将最优秀的神经元融入到下一步的寻找最优化的过程中, 而模糊控制则擅长利用人的经验。二者的结合成为智能控制领域研究的热点。

2 T-S模糊控制

T-S模糊控制的主要思路:通过IF-THEN规则, 将高度复杂的全局非线性系统分解成简单的局部的线性系统, 再利用Lyapunov稳定性理论, 得到T-S系统的稳定性结论[1,2]。

连续的非线性模糊模型可以表达如下:

由于非线性函数al (x) 和bl (x) 已知, 在没有外界干扰时及dl (t) =0。运用反馈控制:

s (X) = (s1 (X) , …, s2 (X) ) T是神经向量, 有界且对所有的X∈R都有成立, 则将控制器ul代入公式 (1) 可得闭环误差方程为:

3 基于递归神经网络控制算法研究的应用—单连杆机器人[3]

首先考虑如下带有无刷直流电机驱动的单连杆机器人的动态模型:

其中q, 分别代表了连杆位移、速度和加速度, τ和τ觶代表了电机转角和电机转速。τd表示转矩干扰, u是用来表示电机转矩的控制输入。令, 则上述系统动态模型转化为:

设计如下控制似的系统的连杆位移y=x1跟中信号yd=sin (πt) , 选择系统参数为D=B=1, M=0.05, Km=10, H-0.5, N=10, 设计参数r=4, k1=4.5, δ1=0.08, λl=0.15, 在外部扰动τd=10e-0.15t和初始条件[x1 (0) , x2 (0) , x3 (0) , δ1 (0) , δ2 (0) ]T=[0.2, 0, 0, 0, 0]t的作用下得到如图1所示仿真结果, 结果表明输出y跟踪给定轨迹yd, 所以本文所论述的基于递归神经网络控制算法应用到无刷直流电机驱动的单连杆机器人是可以实现控制的。

参考文献

[1]F.Cuesta, F, Gordillo, J.AracilandA.Ollero.Stability analysis of nonlinear multivaxiable Takagi-Sugeno fuzzy eontrol systems.IEEETrans.FuzzySystems, 1999, 7:508-520.

[2]王芬.基于递归神经网络的模糊控制算法研究[D].武汉科技大学, 2009.

BP神经模糊控制器篇10

关键词：DMF回收,温度控制,串级控制,模糊神经网络控制器

二甲基甲酰胺 (DMF) 是一种用途广泛的化工原料, 也是一种优良的溶剂, 在合成革工业中被广泛用于合成革表面处理过程和二层皮湿法移膜表面处理工艺中。PU (聚氨酯树脂) 合成革生产系统产生的废液中含有大量仅作为溶剂而未参与化学反应的DMF, 因此DMF的回收处理很有必要。一方面可以解决含DMF的废液所带来的环境污染问题;另一方面回收的DMF可再利用为企业创造经济效应。DMF的回收属于典型的化工精馏过程, 一般采用双塔或三塔精馏。回收的原理是利用废液中各成分 (主要是水和DMF) 沸点不同 (常压下DMF沸点为152.8℃, 水沸点为100℃) , 通过对各个操作过程的温度进行控制, 形成气液分离, 从而达到提纯回收DMF的目的[1]。

笔者的研究对象为双塔式DMF回收精馏系统, DMF废液首先经过浓缩塔减压浓缩。浓缩塔塔压为负压, 由再沸器供热, 操作温度为75℃。精馏塔塔压可以为常压或略负压, 通过导热油进行供热, 操作温度为155℃。精馏塔的精馏段馏出物在冷凝器中冷凝成液体, 进入回流罐, 一部分回流到顶层塔板, 以保持塔顶温度稳定;另一部分进入脱氨塔, 进行脱酸处理, 最后得到纯度相当高的DMF[2]。

1 DMF回收温度控制策略分析 (1)

精馏过程塔的温度是影响塔内气液平衡的重要参数之一, 温度过高或过低都会影响产品的质量和生产效率。塔压的波动、进料流量和组成、回流量及再沸器的加热量等都会对塔的温度产生影响。在精馏塔温度控制系统中通过控制载热剂的流量来进行温度控制, 是目前应用较为广泛的一种调节方式。

由于被控对象 (塔温) 在不同扰动作用下具有延迟性和惯性, 仅使用单回路调节系统不能得到较好的调节品质, 所以考虑采用串级控制策略。串级控制的抗扰动性能更好, 能有效减小副回路的时间常数, 从而改善被控对象的动态性能, 而且串级控制具有一定的自适应能力, 稳态误差较小。以精馏塔为例, 其串级控制系统如图1所示。

当系统中再沸器的出口汽温θ1发生变化时, 副调节器就会通过执行机构来控制阀门, 改变导热油量W, 对汽温θ1进行粗调。主调节器通过检测灵敏板 (精馏塔塔板中温度变化最灵敏的塔板) 温度θ2与期望值比较, 对副调节器进行校正, 起到微调作用。串级系统中副回路的主要任务是迅速消除系统的各种扰动, 故一般选用纯比例调节器, 缩短控制过程的时间。主回路的任务是保持θ2的稳定, 可选用PID调节器。其控制原理如图2所示。

G1 (s) ———扰动通道传递函数;G2 (s) ———控制通道传递函数;GT1 (s) ———主调节器;GT2 (s) ———副调节器;GV (s) ———调节阀;GZ (s) ———执行机构;H1 (s) ———副回路变送器;H2 (s) ———主回路变送器;R1 (s) ———温度给定值

塔釜温度作为被控对象总是存在着比较大的延时, 易产生偏差;影响被控对象的干扰因素很多;塔釜温度随时间和塔层的不同特性也不同, 很难建立精确的数学模型。基于上述几点原因, 笔者在原有的串级控制系统基础上采用基于模糊神经网络的PID控制器, 提高对塔釜温度的控制效果[3]。

2 模糊神经网络控制器设计

神经网络和模糊系统都是非线性动力学系统, 属于无模型的控制器, 常用来处理不确定、非线性和其他不确定问题。但两者各有优缺点:模糊系统是通过模拟人的思维模式来进行知识的抽取和简单推理, 但缺乏自学习和自适应能力;神经网络可以根据相应的样本进行有效的学习, 能实现并行计算和信息分布式存储, 同时具有较强的容错能力和自适应学习功能。但它不能很好地表达基于规则的知识, 因此不能很好地利用已有的经验知识 (一般只能取初始值为零或者随机值) , 可能导致网络训练时间很长, 网络训练陷入非要求的局部极值[4]。

2.1 模糊神经网络控制器总体结构

模糊神经网络就是将模糊系统与神经网络结合在一起, 将模糊系统转换为对应的神经网络, 从而提高系统的表达能力和学习能力。笔者设计的模糊神经网络控制器如图3所示。

NNI神经网络辨识器为模糊神经网络提供一个反传的校正信号, 不断地对PID参数进行整定。PID控制器采用常规增量式PID控制器, 其参数通过模糊神经网络进行设定。神经网络选用径向基神经网络 (RBF) , RBF是一种局部逼近网络, 能以任意精度逼近任意连续函数, 在学习速度、逼近能力上都要优于常用的BP神经网络[5]。系统中的模糊神经网络为二输入三输出结构:输入为温度的误差和温度误差变化率;输出分别为PID控制器的3个参数Kp、Ki、Kd。

NNI———神经网络辨识器;r (k) ———系统给定值;y (k) ———系统实际输出;y' (k) ———NNI的输出

2.2 模糊逻辑设计

输入量的模糊化。在进行模糊推理前需要将输入的精确量转化为模糊量。设系统温度控制目标为155℃±3℃, 误差e和误差变化率ec对应的模糊语言变量为E和EC;Kp、Ki、Kd对应的模糊语言变量为ΔKp、ΔKi、ΔKd。E和EC的模糊子集均为{NB, NM, NS, ZE, PS, PM, PB}。ΔKp、ΔKi、ΔKd模糊子集均为{NB, NM, NS, ZE, PS, PM, PB}。根据线性变换法计算出实际偏差e对应的模糊值E, 再根据隶属度函数计算出E属于模糊语言的隶属度。为计算方便, 将输入输出量的模糊论域都设定为[-3, 3], 隶属度函数均取高斯型函数。

模糊控制规则。模糊控制规则的设计是模糊控制器设计的关键, 实质上是对操作工的实践操作经验的总结和利用。对于被控过程中不同的e和ec, 操作人员凭经验总结出来对于PID参数Kp、Ki、Kd整定所遵循的几个原则:当e的绝对值较大时, 取较大的Kp和较小的Kd可以使系统具有较好的跟踪性能, 同时对积分作用加以限制 (通常取Ki=0) , 可避免系统响应出现大的超调;当e的绝对值处于中等大小时, Kp取值小些, Ki的取值适当, 可使系统响应具有较小的超调, 此时Kd的取值是关键, 它对系统响应的影响最大, 若ec的绝对值较大, 则Kd取值小些, 反之Kd取值大些;当e的绝对值较小时, Kp、Ki取大些可使系统具有较好的稳定性, 同时若ec的绝对值较大, 则Kd取值小些, 反之Kd取值大些[6]。根据上述原则设计模糊规则见表1~3。

模糊推理和解模糊化。模糊推理就是根据建立好的模糊规则和输入变量推理出模糊结果。一般形式为IF…THEN…。推理得出的结果是模糊量, 需要通过解模糊化转换为清晰值。解模糊化方法有很多, 这里采用最普遍的加权平均法。得到的清晰值并不是最终的实际控制量, 还需要经过相应的尺度变换。采用线性变换法, 公式如下:

式中ku———比例因子;

u———实际输出控制值;

u0———解模糊化得到的清晰值;

umin、umax———基本论域的最小值和最大值;

zmin、zmax———模糊论域最小值和最大值。

2.3 模糊RBF神经网络结构和算法

2.3.1 网络结构

模糊RBF神经网络是四层结构, 其结构如图4所示。

第一层为输入层。该层的节点与输入量直接相连, 起着将输入量传送到下一层的作用[6]。第二层为模糊化层。这层的每个节点就代表了一个语言变量值 (如PB、ZE) 。它的作用是计算各输入分量属于各语言变量值模糊集合的隶属函数。隶属函数选用高斯型函数。第三层为模糊推理层。这层的每个节点对应一条模糊规则。它的作用是通过与模糊化层的连接完成模糊规则的匹配, 计算每对模糊节点间的激活强度。第四层为输出层。输出结果为模糊推理层与各自权值的加权和。模糊神经网路控制器主要通过调整权值、隶属函数的中心值和宽度来实现控制。

2.3.2 学习算法

模糊控制中每个输入分量的模糊分割数事先设定为7, 输入分量的隶属函数采用高斯型函数。那么需要学习的参数主要是最后一层的连接权值wij和第二层的隶属函数中心值cij及其宽度σij。设性能指标函数为:

式中t (k) ———期望输出;

y (k) ———被控对象实际输出。

每一个迭代步骤k的控制误差为:

进而可根据delta学习规则求得节点权值学习算法:

其中, η为学习速率, η>0;wj为第三层到第四层的权值 (j=1, 2…, N) 。由增量式PID算法得:

其中fi为第i层节点函数, xc为节点输入值。

考虑学习动量因子α的作用得节点权值、隶属函数中心和宽度的学习算法为:

3 仿真实验

模糊神经网络控制器的仿真实验在Matlab软件的Simulink环境下进行。首先要确定仿真对象的数学模型, 针对DMF回收精馏塔, 采用实验建模法, 拟合出主、副回路的简单传递函数模型为3/ (180s+1) 和0.2 (36s+1) 。进行阶跃响应实验, 仿真模型如图5所示[7]。设定常规PID控制副调节器参数K=3, 主调节器参数Kp=0.3、Ki=0.001、Kd=20;模糊神经网络控制器参数Kp=1.2、Ki=0.45、Kd=0.9, 学习速率为0.21, 动量因子α=0.019。量化因子初始设定为ke=50、kec=80, 比例因子初始设定为ku=0.042。

图5中的mohuRBF-pid自定义模块为用S函数编写的基于模糊RBF网络的PID控制算法。仿真的结果如图6所示。

从图6中可以看出笔者设计的控制器动态性能优于传统PID控制, 上升速度快, 超调量小, 调节时间短, 稳态误差小, 综合控制水平高, 取得了理想的效果。

4 结束语

通过仿真实验证明针对DMF回收过程中塔釜温度控制, 笔者所提出模糊RBF神经网络控制器是切实可行的, 而且与常规PID控制相比控制效果更为理想。但仍有改进之处, 例如可以考虑将串级控制和前馈控制相结合优化控制策略, 神经网络采用更优的学习算法等。

参考文献

[1]俞金寿, 顾幸生.过程控制工程[M].北京:高等教育出版社, 2012:284~292.

[2]陈曦, 何益.化工精馏塔的PLC温度控制系统设计[J].仪表技术与传感器, 2011, (11) :77~79.

[3]王孝武, 方敏, 葛锁良.自动控制原理[M].北京:机械工业出版社, 2010:35~47.

[4]李国勇, 杨丽娟.神经模糊预测控制及其MATLAB实现[M].北京:电子工业出版社, 2013:257~275.

[5]温良, 付兴武.神经网路PID在温度控制系统中的研究与仿真[J].微计算机信息, 2004, (7) :3~4.

[6]李国勇.一种新型的模糊PID控制器[J].系统仿真学报, 2003:15 (10) :1492~1493, 1496.

【BP神经模糊控制器】推荐阅读：