多变量回归八篇

2024-09-13

多变量回归 篇1

通过试验研究,可以分析脱粘机理并定量研究影响粘结强度的几何与物理变量[3—6],也通过界面相对滑移的测试来建立粘结滑移本构关系[7,8],为加固结构计算和设计奠定基础。利用断裂力学进行分析,可以确定界面断裂能等关键的失效控制参数[4]。国外,有少量的研究对已有的模型进行评估[9,10],通过评估可以了解各模型的接近程度和误差。另外就是对界面强度或有效粘接长度进行评估[11],目前有些强度模型依赖于有效粘结长度,而另外有些强度模型不依赖与有效粘结长度。文献[11]的研究表明,各种研究对有效粘结长度在数值上还存在很大差异,因此目前对粘结强度模型在机理上仍缺乏统一认识。

对现有的5 个粘结强度模型,利用文献中的355 组单剪试验数据进行评估,同时对其中原考虑柔性胶层特性的Dai模型进行修正,再利用两种非线性回归方法对数据库给出的数据进行回归分析,对所有的模型进行分析和讨论。

1 现有部分FRP-混凝土粘结强度分析模型

现有的粘结强度模型有不下20 个,其中有些模型考虑了有效粘结长度的影响,有些模型则没有考虑这一长度。下面的评估分析中主要考虑了Cheng-Teng[12],Wu-Zhou[13]模型、Seracino[14]及Dai[15]模型对整理出的文献中的实验结果进行评估。基于完整性考虑、下面给出相应的强度模型及简单分析相关的理论依据。

1. 1 Cheng-Teng模型

Cheng-Teng[12]模型也是建立在有效粘接长度的基础上,脱粘荷载( 粘结强度) 以及FRP有效粘接长度可以由下式给出

式中,P、Lf及Le分别是脱粘荷载、FRP粘结长度和有效粘结长度,bf、tf及Ef分别是FRP的宽度、厚度与弹性模量,Fc是混凝土的棱柱压缩强度,α是考虑裂缝倾斜的缩减因子,近似取0.9。

1. 2 Wu-Zhou模型

Wu-Zhou等[13]给出了层板结构基础上的基于断裂力学理论的脱粘荷载模型,该模型不涉及有效粘结长度。给出的理论结果为

式(2)中βw与式(1b)相同,而λ'=td/tf,td=3.5mm,Σ=Ef/Ec,Gcf取0.17 N/mm。

Seracino等人[14]模型给出的脱粘荷载与FRP有效粘结长度由式(3)给出。

这里,Af是FRP横截面面积,df是垂直于混凝土表面的失效平面的厚度,对外贴( EB) 情况,取1 mm,LPe是失效平面的长度,对外贴情况取2df+ bf,$f与 δf是峰值应力和相应的滑移的估算式。

1. 4 Dai等人模型

Dai等[15]模型由式( 4) 给出脱粘荷载,以下表达式隐含了假定FRP足够长,后来尽管他们给出了有效粘结长度的表达式,但文献中仍较少采用,因此可认为与有效粘结长度无关的强度模型。

1. 5 Wu ZS等模型

Wu ZS等[16]在分析非线性断裂力学的粘接强度Holzenkmpfer[17]理论公式

并利用早期的311 组实验数据的拟合提出了如下的三参数粘结强度模型:

式中kb采用的是Lu等[8]的修正系数

2 提出模型及对已有模型的修正

2. 1 多变量非线性回归模型

通过上面几个强度模型可见,决定粘结强度的影响因素是粘结系统所涉及的几何参量包括粘贴材料FRP的宽度、厚度与粘贴长度及混凝土柱体的宽度,而界面材料的力学参数包括混凝土的压缩( 拉伸) 强度以及FRP的拉伸弹性模量。而主要参量是混凝土的压缩强度及FRP的弹性模量或单位宽度的抗拉刚度( Etf) ,主要理论依据是粘结强度的理论公式( 5a) ,而其他参数都作为次要变量对该表达式进行修正。其中一个几何参数是FRP的粘贴长度对界面强度的影响,大部分模型都是通过给出有效粘结长度的表达式来对强度模型进行修正,但是由于有效粘结长度难以测量,现有的少量实验数据也存在较大的差异,且有的甚至有相差一倍以上,具体可见文献[9]与文献[11],因此可以说对有效粘结长度无论从理论上还是实验研究方面都还没有获得统一的认识。

另外上述各模型可见,粘结强度主要影响变量之间的关系都是非线性的,且为幂指数乘积的关系,受次启发,本文根据实验结果采用非线性回归方法来拟合。其原理如下。设因变量为Y受m个独立变量X1,X2,…,Xm的影响,则它们之间非线性关系可以写成如下方程

对方程( 6) 两边取对数,可以得到如下的线性方程

对上面的可以利用已有的实验数据进行非线性回归拟合,下面给出了两种拟合方法。

2. 2 七参数回归模型

将所有的几何与材料特性参量都作为独立变量,而粘结强度的实验结果作为目标变量( 因变量) 。即将剪切试验中的参数bc,fc,bf,tf,Ef,Lf都作为独立变量,而将粘结强度P作为目标变量。拟合后可得如下的非线性关系

这里各变量保持原数据库中的单位不变,即几何量的单位为mm,fc的单位为MPa,Ef的单位为GPa,P的单位为k N。

2. 3 五参数回归方法

受经典的基于Taljsten给出的断裂力学原理给出结果的启发,将Eftf作为增强板( 布) 的刚度整体为一独立变量,并将 λ1= bf/ bc及 λ2= 2Lf/ bc及fc作为另外三个独立,仍按上述方法进行非线性拟合,得到如下的回归方程

这里,把 λ10.69和 λ20.10分别称为FRP的宽度效应系数与长度效应系数。下文将讨论这两个无量纲系数的含义及分析以上两种非线性拟合的精度。

2. 4 本文修正的模型

通过计算发现( 具体结果后面给出) ,Dai模型与其他4 个模型不同,用该模型估算的粘结强度平均值约大33% ,即界面断裂能理论值偏大,因此作者最近的工作[18]中对其进行了修正,修正后的模型只要对界面断裂能的系数修正为0. 25,且不必在强度模型前加经验系数7. 4,这样便得到( 10b) 所示的强度表达式。在本文中,利用上述长度系数再进行进一步了修正,修正后的强度表达式见( 10c) 。即修正后的界面断裂能和粘接强度模型如下

另外,对Wu-Zhou[13]模型也在其粘结强度表达式中同时乘以长度系数对其进行修正,从后面的分析中我们来看粘结强度的统计变化及修正的意义。

3 实验数据来源

在本文中收集到的试验数据来自参考文献[7,19—25]。文献[7]中应用的是原文作者Ko等的实验得出17 组数据以及文献Carlo等人的14 组数据。参考文献[19]整理了共有150 组数据,由于篇幅所限没有将原作者详细列出。其他51 组数据来自文献[19—25]。另外123 组数据来自文献[26],同时为了保持数据的有效性,将该文献中的立方体压缩强度换算成了棱柱体的抗压强度fc,即将原强度乘以0. 78后所得结果编入数据库中。这里要强调的是本文所用数据大部分与文献[16]是不同的,本文所用数据大部分来自近年来资料。由于数据库数据占据篇幅较多,下面只给出数据库的概要,见表1。

4 强度模型及修正模型的评估方法

每一个强度模型的精确性依赖于模型估算值与实验值的比较。为了描述整体的精确程度,这里借助于数学中随机变量的描述方法,将单个实验值与对应的理论预测值用变量xi来表示:

式( 11) 中Pexp,i与Pth,i分别表示粘结强度的试验值与理论值,变量xi表示它们的比值。简化分析中可认为它是一随机变量,当它的均值接近于1,标准差与变异系数越小,表示该模型的准确程度越高; 当均值大于1 表示实验值总体大于理论值,是保守的估算,而当均值小于1 表示实验值整体上要小于理论值,因此估算值偏于不安全。另外,还可进行实验值与理论值的相关性评估,相关系数越大表明总体趋势上物理变量之间线性关系也好,理论预测与实验结果相关性越强。

5 结果和讨论

5. 1 粘结强度预测统计结果

利用前面所列的粘结强度评估算法,利用matlab编程可以计算355 组数据的试验值与各个模型的预测结果及统计分析结果。利用方程式( 1 ~ 5)及式( 8) ~ 式( 10) 给出的各模型界面强度实验值与预测值的平均值、方差、变异系数列于表2,几个模型的理论值与试验值的对比还可以见图2( a) ~ 2( h) ,其中的相关系数也已在图中标出。为了便于比较,在图2( b) 中将Wu-Zhou模型与本文修正的模型的预测值和试验值的关系画在同一张图中,从图可见各点更加贴近对角线,而从表2 同样可见均值更接近与1,方差变得更小,相关系数由原理的0. 76 变成了现在的0. 83; 另外将Dai等人模型及是按方程( 10b) 给出修正模型1 计算的粘结强度由图2( d) 给出,而修正模型2 即按方程( 10c) 给出的预测值与修正模型1 的对比可以通过图2( e) 及表中的计算结果来反映,从图与表2 可见本文修正后的模型平均值更接近与1,而方差变得更小,相关系数也增大了。另外,从图2( g) 和表2 可见本文给出的七参数模型具有最好的精度。

5. 2 结果分析

从以上计算可见,在目前给出的实验数据范围内,也即较准确的模型需要同时考虑将所涉及的几何( 除混凝土柱体长度外) 与相关材料的力学参数6个作为独立变量来分析,这与文献[19]神经网络建模方法是一致的,但与之不同的是这里给出的是明确的定量关系,而神经网络模型预测不能给出明确的解析关系。另外,将本文给出的五参数模型也与实验值吻合较好,同时本文给出的FRP宽度效应系数与其他文献给出的宽度效应不同、但都可以作为考虑宽度对粘结强度的影响; 而这里给出的长度效应系数可以取代已有模型中考虑有效粘结长度情况对短粘结长度情况下的强度修正,这一点从对Wu-Zhou模型的修正及Dai模型的修正2都可以反映出来,经乘以长度效应系数 λ20.10后模型预测强度与实验值更加接近,而方差、变异系数减小,而相关系数增大,而这里不需要重新定义或者说不依赖有效粘结长度。可见这一系数尽管只是通过数据拟合得到的,但在定量计算界面粘结强度时有明确意义。

6 结论

本文利用文献中的实验数据对现有的FRP/混凝土界面几个粘结强度的5 个模型进行了评估的基础上,利用非线性回归的方法得到了七参数模型与五参数模型,引进了长度效应系数和宽度效应系数概念,对Dai模型与Wu-Zhou模型进行了修正,试验结果的统计分析可以得到一下结论:

( 1) 各模型都是根据自己的试验结果与前期的一些试验结果分析主要相关变量得出的近似结果,数据都有一定的分散性,因此仍需要更精确的模型来揭示其机理;

( 2) 本文给出的七参数非线性模型具有最高的精度,可以反映FRP粘贴长度对粘结强度的影响;

( 3) 本文给出的五参数非线性模型中给出的长度效应系数可以反映FRP粘贴长度对界面粘结强度的影响,而无需借助于有效粘结长度的概念;

( 4) 论文给出的长度效应系数可以用来修正不考虑有效粘结长度影响其他近似模型。

摘要:采用文献中的FRP-混凝土粘结单剪试验的355组试验数据,对5个界面粘结强度模型进行了分析评估;对其中的两个界面粘结强度模型进行了修正和重新评估。以剪切试验中的几何参数与粘结材料的力学性能作为自变量,以试验中得到的界面粘结强度为因变量,提出了两种不同参数为独立变量方法回归模型,得到了非线性方程,提出了长度效应系数与宽度效应系数的概念。对实验数据结果及粘结强度模型计算分析表明:理论预测与试验值有不同程度的精确性;FRP粘结长度是影响粘结强度的一个独立变量,给出的非线性模型不仅有更高的精度,且无需另外定义有效粘结长度。长度效应系数可以用来修正未考虑粘贴长度影响的近似解析模型。

多变量回归 篇2

关键词:布尔代数式,多变量,卡诺图,算法

1 算法介绍

布尔代数式化简的原则是逻辑电路所用的门电路最少,各个门电路的输入端最少,表现在布尔代数式化简中就是使用尽可能少的布尔变量表示布尔代数式。使用卡诺图化简得到的最简布尔代数式可以用与或式、或与式和无反变量形式表示[1]。仅以与或式为例进行算法描述,其他两种形式可以在此基础上稍加修改。

1.1化简原理

假设需化简的逻辑表达式A中含有m个逻辑项ai(i为整数,0≤i≤m),其中ai由若干个布尔变量组成,记为x0x1…xn。例如:逻辑表达式

其中记为记为记为记为记为记为记为1010。卡诺图如图1所示。

卡诺图化简的基本原理是合并A中所有相邻项,使得布尔变量数最少。所谓相邻项是指在两个逻辑项中,除某个对应位布尔量相反外,其余对应位都相同的项[2,3]。例如,逻辑项a0=0000和a1=0001相邻,可以合并为000*,合并时相异位用“*”作标记,从组成形式上可以看出000*消去了一个逻辑变量。

1.2算法分析

根据卡诺图的标注方式和化简表达式的基本原理,算法分四个步骤实现。

(1)求出各项的相邻项。从a0开始,依次求出ai在A中出现的各相邻项。

(2)合并相邻项。首先将ai依次与其各相邻项aj合并新的逻辑项bt,此处相异位可以是0与1相异、0或1与觹相异。

其次,将ai和aj作为bt的源项。如果ai或aj本身已由其他逻辑项合并而来,则将ai或aj的源项替代ai或aj。

最后,为了与未合并项区别,将已参与合并的逻辑项ai、aj及各自源项的合并次数分别增加1。具体实现时,应考虑三种不同的情况:

(1)当ai和aj中均不含有“*”时,bt中该位直接用“*”标识,其源项为ai和aj。

(2)当ai和aj中相异位ai为“*”,aj为0或1时,取“*”作为bt中该位的值,bt的源项为ai的源项与aj的并集。

(3)当ai和aj中在其它位置均含有“*”时,bt中该位取值仍为“*”,bt的源项为ai和aj的源项的并集。

(3)重组表达式。将(2)中求得的所有bt及A中所有未合并项重新组合成新的逻辑表达式A,删去重复项后,转(1),直到A中每项均为未合并项为止。

(4)化简表达式,得最后结果。从a0开始,依次找到A中各项ai的源项。如果ai的所有源项合并次数均大于等于2,则表示ai已包含在其他逻辑项中,删去ai,得到化简后的布尔代数式。

2 算法实现

2.1数据结构设计

考虑到逻辑表达式A中各逻辑项ai具有相同的结构,所以采用结构体数组a[]来表示A,a[]中每个数组元素对应A中每个逻辑项ai,常量N表示A中逻辑变量的个数。

其中arr[]成员存放逻辑值;posi[]成员存放源项的下标值。

(2)设置int型的数组aflag[]对应a[]的合并次数。

2.2算法设计流程图

首先将逻辑表达式A中的每个逻辑项作为结构体数组a[]中的每个数组元素。然后从a[0]开始顺次找出每个a[i]的相邻项a[j],将a[i]和a[j]合并为b[t],记录b[t]的源项下标,并将a[i]和a[j]对应的合并次数aflag[i]和aflag[j]加1,直到最后一个逻辑项为止。接着,删除b[]中所有重复项,并将a[]中未合并项(aflag[]为0)加到b[]中,形成新的逻辑表达式。此时,比较新逻辑表达式和原逻辑表达式,如果aflag[]中所有数组元素aflag[i]均为0,则表示新组成的逻辑表达式与原逻辑表达式完全一样,意味着化简结束。最后删除a[]中已包含其他逻辑项的a[i]项,即aflag[]值大于1的对应a[i]项,即可得到最终化简结果。具体流程如图2所示。

2.3函数设计

根据模块化程序设计的基本思想,算法中使用三个函数分别实现不同功能。count()函数计算source结构数组中所含元素的个数,del()函数实现重复项的删除,result()函数实现相邻项的查找及合并功能。由于count()和del()函数功能实现较为简单,此处将只给出result()函数算法的伪代码。

在result()函数的代码中从第4行到第41行是最外层循环,实现了逻辑表达式A中每一逻辑项a[i]的遍历;第6行到第40行是第二层循环,用于控制逻辑项a[i]各相邻项的查找和合并,其中第8行至第19行实现了相邻项的判断和b[t].arr[]中相异位的合并,第20行到第30行实现了1.2中三种不同情况下b[t].arr[]其余位的赋值;第31和32行实现了合并次数的增加;第33行至第38行确定了b[t]posi[]源项的取值。

3 结束语

计算机具有强大的计算能力,通过相应的计算机语言实现“多变量”卡诺图的化简,不仅速度快、成本低,有利于减少工程设计中的漏洞,为设计者提供准确及时的数据资料,还可以和其他数据模型结合起来进行系统的分析,从整体上提高工程设计项目的质量。

参考文献

[1]范芸.数字逻辑设计[M].合肥:中国科学技术大学出版社,1994:32-45.

[2]泉水.格雷码及其在布尔代数化简中的应用[J].成都:信息安全与保密通信,1982-04.

多变量最值问题的求解策略 篇3

关键词:多变量;最值;策略

多变量最值问题是中学数学常见问题之一,在高考、高考模拟考试及竞赛中经常出现. 这类问题内涵丰富、知识面广、综合性强,解法灵活多变,主要考查学生运用数学基础知识、数学思想方法,灵活解决问题的能力. 学生往往难以找到解题思路,束手无策,不知从何处突破. 下面举例分析有关多变量最值问题求解的一些策略,略谈己见.

策略一 基本不等式法

例1 (2010年重庆高考题)已知x>0,y>0,x+2y+2xy=8,则x+2y的最小值是

( )

A. 3B. 4

C. D.

解:因为x+2y+2xy=8,所以8-(x+2y)=x·(2y)≤2.

整理得,

即,又,x+2y≥4,故选B.

例2 (2006年重庆高考题)若a,b,c>0,且a2+2ab+2ac+4bc=12,则a+b+c最小值是( )

A. 2B. 3

C. 2?摇?摇?摇?摇 D.

解:(a+b+c)2=a2+b2+c2+2ab+2ac+2bc≥a2+4bc+2ab+2ac =12,

因此a+b+c≥2,故选A.

评析:运用基本不等式是解决多变量最值问题的常用方法.但要注意对基本不等式灵活变形,如a+b≥2,ab≤2等.

策略二 变量分离法

例3 (江苏无锡2010年秋高三期末)不等式x+≥a-2+siny对一切实数x,y均成立,则实数a的取值范围是________.

解:变量分离得 x+-siny≥a-2. 因为x+-siny≥2-1=1,所以a-2≤1,打开绝对值得1≤a≤3. 故所求得实数a的范围为[1,3].

例4 设x>0,y>0,不等式++≥0恒成立,则实数m的最小值是________.

解:-m≤x+y+=2++. 因为++2≥4,所以-m≤4,即m≥-4.

因此m的最小值是-4.

评析:多变量问题中常用的方法之一就是将其中的某一变量分离出来,通过对一边表达式范围的确定得到另一边的范围.

策略三 变量消去法

例5 (2008年江苏高考题)设x,y,z为正实数,满足x-2y+3z=0,则的最小值是________.

解:由已知条件得y=,带入算式得

?摇 ===++≥2+=3,

所以的最小值是3.

评析:多变量问题中最基本的方法之一就是消去变量,通过减少变量的个数,转化成求函数最值或者其他多变量问题求解.

策略四 整体代换法

例6 (泰州2010年秋高三一模)已知正实数x,y,z满足2xx++=yz,则x+x+的最小值为?摇?摇?摇?摇

解:由条件可得x2+x+=,

则x+x+=x2+x++=+≥2=,所以所求最小值为.

例7 (2010年江苏高考题)设实数x,y满足3≤xy2≤8,4≤≤9,则的最大值是________.

解:因为=≤=27,所以的最大值是27.

例8 (泰州2009年秋期末题)已知实数x,s,t满足8x+9t=s,且x>-s,则的最小值为________.

解:由已知得9(x+t)=x+s,

则==x+s+=(x+s)+≥6,所以所求最小值为6.

评析:变量较多时,往往是不能单独求出各个变量,但可以把它们看成整体,不需要求出具体的变量,往往能够较易解决.

策略五 判别式法

例9 (2011年浙江高考题)设x,y为实数,若4x2+y2+xy=1,则2x+y的最大值是________.

解:设2x+y=t,所以y=t-2x;代入4x2+y2+xy=1整理得6x2-3tx+t2-1=0. 因为关于x的方程有根,所以Δ=(-3t)2-4×6×(t2-1)≥0,解得-≤t≤. 因此2x+y的最大值是.

例10 (苏北四市2010年秋高三一模)已知实数a+b+c=9,ab+bc+ca=24,则b的取值范围是________.

解:由已知得a+c=9-b,又ca=24-ab-bc=24-b(9-b)=24-9b+b2,

所以a,c是方程x2-(9-b)x+24-9b+b=0的两根.

由Δ≥0得(9-b)2-4·(24-9b+b2)≥0,解得1≤b≤5.

评析:在涉及关于某个变量的二次方程时,往往考虑方程有解,对不等式Δ≥0求解;另外在类似有关x+y,xy的式子时,有时联想到根与系数的关系,运用判别式就可以得到一个不等式,从而求出所求的范围.

策略六 重新组合法

例11 (四川2010高考题)设a>b>c>0,2a2++-10ac+25c2的最小值是( )

A. 2 B. 4 C. 2 D. 5

解:原式=a2+++(a-5c)2=a2-ab+ab+++(a-5c)2?摇=a(a-b)++ab++(a-5c)2≥2·+2+(a-5c)2≥4. 当且仅当a2(a-b)2=1,(ab)2=1,a-5c=0同时成立时,即当a=,b=,c=时,等号成立.

评析:将含有多变量的式子重新组合,然后利用基本不等式或完全平方来求解.

策略七 数形结合法

例12 (2010秋苏州调研)已知△ABC的三边长为a,b,c满足b+2c≤3a,c+2a≤3b,则的取值范围为________.

解:由已知条件及构成三角形的条件得b+2c≤3a,c+2a≤3b,a+b>c,a+c>b,b+c>a. 令=x,=y,则

原不等式等价于x+2y≤3,3x-y≥2,x-y>-1,x-y<1,x+y>1,

作出不等式所表示的平面区域,如图1所示阴影部分ABCD区域,其中B,,D,.

所以的取值范围,即x的取值范围为

评析:多变量问题中遇到有关二元一次不等式组或类似于圆、椭圆、抛物线方程有关的不等式时,运用数形结合的方法,联想到线性规划、斜率、距离等,能够相对容易地得到解决.

策略八 三角换元法

例13 已知a,b,x,y∈R,且a2+b2=1,x2+y2=4,则ax+by的最大值是_______.

解:由条件可以设a=cosα,b=sinα, x=2cosβ,y=2sinβ,

则ax+by=2cosαcosβ+2sinαsinβ=2cos·(α-β)≤2,故ax+by的最大值为2.

评析:遇到类似圆或椭圆的方程时,可以考虑用参数方程进行三角换元,根据三角函数的有界性进行求解.

策略九 “1”的代换法

例14 已知a,b,c均为正数,且a+b+2c=1,则+的最小值是______.

解:+=+(a+b+2c)=1+++2≥3+2=3+2,故最小值为3+2.

评析:已知某些式子的值为1,可以考虑“1”的代换法.

策略十 主元法

例16 (2001年全国初中数学竞赛题)求实数x,y的值,使得(y-1)2+(x+y-3)2+(2x+y-6)2达到最小值.

解:将原式展开整理成x的二次函数形式,原式=5x2+(6y-30)x+3y2-20y+46=5x+(y-5)?摇2+y-2+.

当x+(y-5)=0,y-=0, 即x=,y=时,原式取得最小值.

评析:有时将多变量问题中的某一变量看成主元,就能较易解决问题.

策略十一 放缩法

例14 已知a,b,c,d是任意正数,求+++的最小值.

解:原式=+++=+≥+===2+≥2,

当且仅当a=b=c=d时,原式取最小值2.

评析:多变量问题有时可以通过不断地放缩,求出其范围,但要注意其等号成立的条件,另外,运用放缩法还应注意放缩的范围要适中,不能过大或过小.

策略十二 导数法

例18 若不等式+≤k对于任意正实数x,y成立,则k的取值范围为________.

解:k≥,则k2≥=.

设t=>0,则k2≥.

设f(t)=,

则f′(t)=.

当t∈(0,2)时,f′(t)>0,f(t)递增;当t∈(2,+∞)时,f′(t)<0,f(t)递减,所以f(t)max=f2=,

因此k2≥.

故k的取值范围为,+∞.

评析:多变量问题通过换元后变为一个变量的问题,可以运用导数法求出其最值.

双变量线性回归的解算 篇4

双变量线性回归的解算

对于工程实践中较多存在自变量为随机变量的情形,应考虑双变量的线性回归,在总体最小二乘原则下,即n∑i=1(v2xi+v2yi)=min,推导了在此准则下的具体解算方法,得到了相应的`公式,最后并以算例加以验证与分析讨论,此方法对于工程实践的数据分析具有较大的参考价值.

作 者:周世健 鲁铁定 ZHOU Shi-jian LU Tie-ding  作者单位:周世健,ZHOU Shi-jian(江西省科学院,江西,南昌,330029;东华理工学院地测工程学院,江西,抚州,344000)

鲁铁定,LU Tie-ding(东华理工学院地测工程学院,江西,抚州,344000)

刊 名:江西科学  ISTIC英文刊名:JIANGXI SCIENCE 年,卷(期): 26(1) 分类号:P207 关键词:双变量   线性回归   总体最小二乘   随机变量  

多变量回归 篇5

传统的决策树被限制在每个节点只检验单一属性, 称之为单变量决策树。这一限制使得子树重复和有些属性在树中的某条路径上被多次检验, 而且很难体现属性之间的关联性。为此, 人们提出了多变量决策树[1]的概念, 即在树的节点上可以同时检验多个属性。

粗糙集理论是由Pawlak Z于1982年提出的。这一理论从新的视角对知识进行了定义。把知识看成是关于论域的划分。引入等价关系来讨论知识。该理论主要用于知识约简及知识相依性的分析。因此, 可以作为机器学习和复杂数据分析的工具[6]。

本文进行了构建多变量决策树的算法研究, 应用粗糙集中的相对核作为多变量结点的选择依据, 对于单个结点, 采用粗糙集中的属性重要度[5]来代替ID3的信息熵来作为属性分裂的度量。为了算法的可读性, 对于多变量结点的情况对属性个数进行了限制。

1 相关概念

粗糙集理论是一种新的处理模糊和不确定知识的数学工具。其主要思想就是在保持分类能力不变的前提下, 通过知识约简, 导出问题的决策或分类规则。

粗糙集理论把知识假定为对对象分类的能力, 知识是由人们感兴趣的领域的分类模式组成, 它提供关于现实的明显表示。同时也具有明显事实推导出模糊事实的推理能力, 粗糙集是基于知识表达系统进行推理的。知识表达系统的定义为

定义1 四元组S= (U, A, V, f) 是一个知识表达系统。其中, U为对象的非空有限集合, 称为论域;A:属性的非空有限集合, A=C∪D, C∩D=Φ, C为条件属性集, D称为决策属性集;V:undefined, Va是属性a的值域;f:U X A→V是一个信息函数, 它为每个对象的每个属性赋予一个信息值, 即:∀a∈A, x∈U, f (x, a) ∈Va。知识表达系统也称为信息系统, 通常也用S= (U, A) 来代替S= (U, A, V, f) 。

定义2 给定一个知识表达系统S= (U, A) , 对于每个子集X⊆U和一个等价关系R∈IND (S) , IND表示不可分割关系或等价关系。定义两个子集:

undefined

分别称它们为X的下近似和上近似。

实际的应用中, 一个分类相对于另一个分类的关系十分重要, 因此产生了一个分类相对于另一个分类的正域的概念。知识相对正域的概念表述为:

令P和Q为U中的等价关系, Q的P正域记为POSP (Q) , 定义为undefined。Q的P正域是U中所有根据分类U / P的信息可以准确地划分到关系Q的等价类中去的对象的集合。

定义3 设 P⊆R 是等价关系的一个族集, 关系 r∈P, 若 IND ( P) = IND ( P - { r}) , 则称关系 r 在族集 P 中是可缺的, 否则就是不可缺的, 若族集 P中的每个关系都是不可缺的, 则称族集P 是独立的, 否则就是依赖的或非独立的。

若 Q⊆P 是独立的, 且 IND (Q) =IND ( P) , 则称Q是族集P的一个约简。在族集P 中, 所有不可缺的关系集合称为族集P的核, 表示为 CORE ( P) 。

定义4 设P和Q是U上的两个等价关系族, 令:

U / IND (P) ={X1, X2, …, Xn }

undefined

称等价关系{Z1, Z2, …, Zm+1}在U上确定的等价关系为P相对于Q的泛化, 记做GENQ (P) 。

定义5 粗糙集理论中对决策属性D和条件属性C的依赖程度的定义为:

γC (D) =card (POSC (D) ) /card (U)

其中card (X) 表示集合的基数, 即X中对象的数目。

对于任意属性a∈C的重要度SGF (a, C, D) 定义为[5]:

SGF (a, C, D) =γC (D) -γC-{a} (D)

2 算法描述

构造多变量决策树的启发示函数的关键问题主要涉及两个方面:一是要充分考虑属性之间的关联性, 并以此为依据选择合适的属性组合作为结点[3]。在此, 本文以文献[3]中的相对泛化的概念作为多变量结点的检验。二是在降低树的复杂性的同时, 还要保证生成规则的可读性。为此, 限定树的内结点的条件属性至多为两个, 如要多于两个, 则用单变量检验方法进行检验。

ID3算法采用信息增益进行决策属性的选择, 信息增益是趋于那些有很多值的属性, 实验证明, 这样的属性并不一定是最重要的属性。故本算法引用粗糙集理论中的属性依赖度理论, 并定义了属性重要度的概念, 在进行属性选择的时候, 选择属性度最大的属性 (选择最重要的属性) 做为分裂依据。

算法具体如下:

(1) 计算条件属性C相对于决策属性D的核, 即CORDC (D) , 不妨设CORDC (D) ={a1, a2, …, ak}, 如果CORDC (D) =Φ, 或者k>2, 则转 (2) , 否则转 (3) 。

(2) 计算每个属性的SGF, 在属性集中选择属性重要性最大的结点;如果各个属性的重要性相等, 则选择属性信息增益最大的属性 (ID3算法) ;如果属性信息增益相等, 则选择序号靠前的属性。

(3) 令P=a1∧a2∧ …∧ak, 计算P相对于D的相对泛化GENP (D) , 将它作为该结点的检验。

(4) 在属性集C中删除已选属性, 重复 (1) ~ (3) 的步骤建树, 直到每个分类中的决策属性一致或者属性集合为空或者属性选择后不能再分类。

3 实例分析

下面以某商场的顾客是否购买电脑的数据库信息作为训练数据, 说明算法的工作流程, 然后将得到的多变量决策树与基于信息增益构建的的决策树作比较, 说明算法的可行性和优越性。

表1中, C为条件属性, P={A, B, C, D, E, F, G}, 其中, A表示是否为单身, B表示顾客身高, C表示顾客年龄, D表示顾客信用度, E表示顾客收入, F表示顾客职业, G表示外貌特征;决策属性Q={d}, 表示顾客是否购买电脑。

VA={1, 2}, 其中1 - 是, 2 - 否

VB={1, 2, 3}, 其中1 - 矮, 2 - 中等, 3 - 高

VC={1, 2, 3}, 其中1 - ≤30, 2 - 31… 40, 3 - >40

VD={1, 2, 3}, 其中1 - 一般, 2 - 较高, 3 - 非常高

VE={1, 2, 3}, 其中1 - 较低, 2 - 高, 3 - 中等

VF={1, 2, 3}, 其中1 - 蓝领, 2 - 白领, 3 - 学生

VG={1, 2}, 其中1 - 一般, 2 - 较好

Vd={1, 2}, 其中1 - 购买, 2 - 不购买

经过属性约简[2], 冗余的属性为B和G, 消去冗余属性, 得到约简后的条件属性集合R={A, C, D, E, F}。

计算知CORED (R) ={E, F}[2] , 令P=E∧F, 核属性各数小于等于2, 计算P相对决策属性d的相对泛化GEND (P) , 将它作为决策树根结点的属性选择。

U/IND (P) ={{1, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14}, {2}, {5}, {15}, {16}}

U/IND (Q) ={{1, 2, 3, 4, 6, 8, 9, 10, 12, 13, 16}, {5, 8, 11, 14, 15}}

Z1={2, 16}

Z2={5, 15}

Z3={1, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14}

GENP (Q) ={{2, 16}, {5, 15}, {1, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14}}

对于Z3, 去掉核属性E、F, 形成的子表如表2所示。

其中, R={A, C, D}, Q={d}

同理, 求核得CORED (R) ={A, C, D}, 核属性各数大于2, 按算法步骤2, 故计算各属性的重要度。

U/IND (Q) ={{1, 3, 4, 6, 8, 9, 10, 12, 13}, {7, 11, 14}}

U/IND (R) ={{1, 6}, {3, 12}, {10, 13}, {11, 14}, {4}, {7}, {8}, {9}}

POSR (Q) ={1, 3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14}

对于属性A

U/IND (R-A) ={{1, 4, 6}, {3, 12}, {7}, {8}, {9, 11, 14}, {10, 13}}

POSR-A (Q) ={1, 3, 4, 6, 7, 8, 10, 12, 13}

γR (Q) =CARD (POSR (Q) ) /CARD (U) =1

γR-A (Q) = CARD (POSR-A (Q) ) /CARD (U) =9/12=3/4

SGF (A, R, Q) =γR (Q) -γR-A (Q) =1/4

同理, SGF (C, R, Q) =1/2

SGF (D, R, Q) =1/2

C、D属性重要度相同, 计算信息增益得

Gain (C) =0.04085

Gain (D) =0.08169

Gain (D) >Gain (C) 故选择D属性作为分裂属性。

按照类似步骤进行求解, 得到基于属性重要度的多变量决策树TC如图1, 图2给出基于信息熵的多变量决策树TE, 很明显, TC比TE简单, 得到的规则也较TE简练。

再以一个客户价值指标评价信息表3为例,

去掉冗余属性4、6、7、8, 计算核属性为1、2、3、5。核属性各数大于2, 故按算法步骤2, 计算属性1、2、3、5的属性重要度得, SGF (1, C, D) =1/2, SGF (2, C, D) =1/4, SGF (3, C, D) =1/4, SGF (5, C, D) =1/4。故选择属性1做为根结点。按类似步骤求解, 得到的决策树如图3所示, 经验证, 此树也比传统方法得到的决策树要简单, 得到的规则也简练。

4 结术语

决策树是多多属性归纳学习的重要形式。ID3算法构造的单变量决策树在选择属性时具有一定的缺陷, 难以得到最佳决策树。本文以粗糙集理论为基础, 提出基于属性重要度的多变量决策树算法, 既改善了单变量决策树的缺点, 又保证了规则的可读性, 较其它算法生成的决策树质量更优。如何寻找更有效的启发示方法来选择最佳的属性组合进行多变量检验, 还有待进一步研究。

摘要:文章提出了一种基于属性重要度的多变量决策树的构造算法。基本思想是将等价关系相对泛化的概念用于多变量检验的构造, 在单变量结点的构造时, 算法倾向选择属性重要度最大的条件属性作为检验属性。实验表明, 该算法具有良好的性能, 不仅有效降低了树的高度, 而且还兼顾了分类的可读性, 是效率较高的决策树生成方法。

关键词:粗糙集,相对核,多变量决策树,属性重要度

参考文献

[1]苗夺谦, 王珏.基于粗糙集的多变量决策树构造方法.软件学报[J].1997, 8 (6) :425-431.

[2]常犁云, 王国胤, 吴渝.一种基于Rough Set理论的属性约简及规则提取方法.软件学报[J].1999, 10 (11) :1-6.

[3]沙慧新, 叶东毅.基于知识粗糙度的多变量决策树的构建.福州大学学报[J].2004, 32 (2) :138-141.

[4]罗秋瑾, 马锐.基于粗集和熵的多变量决策树的构造方法.计算机应用[J].2007, 27 (7) .

[5]王宏.基于粗糙集数据挖掘技术的客户价值分析.北京:经济出版社[M].2006.

多变量回归 篇6

线性度误差是涡轮流量传感器重要的性能指标之一,决定着涡轮流量传感器实际测量的精确程度和性能。作为工业中大量使用的一种传统流量传感器,研究者们针对涡轮流量传感器提出了多种不同的优化方案。赵学端[1]将临界雷诺数引入到对涡轮流量传感器特性曲线的评价中来,通过临界雷诺数来指导传感器结构参数的优化,扩大了仪表的量程比。吴海燕[2]提出速差因子的概念,利用速差因子来获取涡轮流量传感器的优化设计。Blows[3]通过优化涡轮流量传感器的表体来提高流量传感器的流量测量范围。Salami[4]给出了影响涡轮流量传感器测量性能的几个主要设计参数,并指出在传感器的优化设计中应当充分考虑这些参数。李刚[5]更以涡轮流量计作为标准表法流量标准装置的标准表为例,提出了一种提高装置计数精度的方法。

本文提出一种降低涡轮流量传感器线性度误差的优化设计方法,并以50 mm和25 mm口径涡轮流量传感器为例,对叶轮几何结构参数进行了定量优化设计,降低了传感器在测量单相流液体介质时的线性度误差,提高了涡轮流量传感器的测量性能。

2 叶轮的特征参数

作为涡轮流量传感器的关键部件,叶轮结构参数是否合理直接影响着流量传感器的线性度误差。涡轮流量传感器叶轮的几何形状如图1所示。

为了使优化结果具有通用性,分别对叶轮的几何参数进行无量纲化[6]。叶片顶端间隙的大小决定着间隙流体的流量,用叶片顶端间隙与管道半径之比对其进行无量纲化,如式(1)所示。

τ=Ro-RtRo×100%(1)

注:Rt——叶片顶端半径;Rh——轮毂半径;L——叶片导程;tb——叶片厚度;γ——叶片的倒角;Lh——轮毂长度;ω——叶轮旋转角速度;Ro——管道半径

轮毂半径Rh与叶轮半径Rt的比值决定着叶轮转速和传感器的特性,用无量纲参数θ来表示叶轮轮毂在叶轮横截面中所占比例的大小,如式(2)所示。

θ=RhRt(2)

叶片导程L决定了螺旋叶片不同半径位置的安装角β¯(叶片与管道轴线的夹角)。通过叶片均方根平均半径位置的叶片安装角来表示螺旋叶片的安装角。

β¯=tg-1(2πr¯L)(3)

r¯=Rt2+Rh22

叶轮叶片之间的重叠程度与叶片数目N、叶片轴向长度Lh和叶片安装角β¯有关。采用叶片顶端处叶栅具有的实度来表示叶片重叠程度,如式(4)所示。

σ=(cs)t=ΝLhDt(1πcosβ¯)(4)

式中:σ——叶片顶端处叶栅具有的实度;NLh/Dt——叶片顶端位置叶栅所具有的“实度参数”;Dt——叶片顶端的直径。

叶片顶端间隙与管道半径之比τ、轮毂半径与叶片顶端半径之比θ、叶片均方根平均半径位置的叶片安装角β¯和叶片顶端的叶栅实度σ包括了叶轮的主要几何参数。除叶片安装角β¯以外,均为无量纲变量,具有较强的通用性。

3 数学模型的建立

3.1 力矩平衡方程

涡轮流量传感器在运行稳定的条件下,其叶轮受到的力矩矢量和为零,根据此性质可建立力矩平衡方程。叶轮在流体中所受力矩如图2所示,稳定运行时其力矩平衡方程如式(5)所示。

Td-Tb-Th-Tm-Tt-Tw=0 (5)

式中:Td——叶轮的驱动力矩;Tb——轴与轴承的粘性摩擦阻力矩;Th——轮毂表面粘性摩擦阻力矩;Tm——磁电信号检出器阻力矩、轴与轴承的非流体摩擦阻力矩;Tt——叶片顶端与传感器外壳内壁之间的粘性摩擦阻力矩;Tw——轮毂端面粘性摩擦阻力矩。

作用在叶轮上的总的驱动力矩Td为:

Τd=12ρΝRhRtrVz2ccosβ(CL-tgβ∞CDS)dr (6)

式中:CL和CDS根据Schlichting[7]将粘性边界层理论应用于叶轮机械的成果获得;r——叶轮半径;Vz——叶轮出口流速在轴向上的分量;c——叶片弦长;β∞——单一叶片时无穷远处流速U∞与轴向的夹角。

依据赵学端[8]根据纳维—斯托克斯方程组对于同轴旋转圆筒间的定常流动的精确解,轴与轴承的粘性摩擦阻力矩Tb的表达式为:

Τb=4πR12R22R22-R12Lbρνω(7)

式中:R1——轴的半径;R2——轴承的半径;Lb——轴与轴承发生摩擦部分的总长度。

按照Tsukamoto [9]根据顺流放置平板表面的阻力研究结果,轮毂表面粘性摩擦阻力矩Th的表达式为:

Τh=12ρVzh2AhRhChtgβhcosβh(8)

Ah=2πRhLh-Ntbhch

Ch=1.328Reh-0.5(Reh<2.5×105)

Ch=0.074Reh-0.2(Reh>2.5×105)

Reh=Vzhchν

式中:Vzh——轮毂位置流体的轴向速度;tbh——轮毂位置叶片厚度;β∞h——轮毂位置的β∞;ch——轮毂位置叶片弦长。

Tm由磁电信号检出器结构参数和叶轮轴承的润滑效果决定。磁电信号检出器阻力矩、轴与轴承的非流体摩擦阻力矩Tm的数值基本为常数,这里取值为0[6]。

Tm=Const (9)

赵学端[8]根据同轴圆筒壁面间的摩擦力矩,建立了叶片顶端与传感器外壳内壁之间的粘性摩擦阻力矩Tt的计算公式,该表达式为:

Τt=12ρ(ωRt)2ctRttbtΝCDt(10)

CDt=2/Ret (Ret<1 000)

CDt=0.016/Re0.25t (Ret>1 000)

Ret=ωRt(Ro-Rt)/ν (11)

式中:tbt——叶片顶端的叶片厚度;ct——叶片顶部的叶片弦长。

依据Tsukamoto[9]根据纳维—斯托克斯方程组对于流体中旋转圆盘表面摩擦阻力矩的精确解,轮毂端面粘性摩擦阻力矩Tw表达式为:

Τw=12ρω2Rh5CΜ(12)

CM=3.87R-0.5w (Rw<3×105)

CM=0.146R-0.2w (Rw>3×105)

Rw=Rh2ων

式(5)~式(12)构成了涡轮流量传感器的力矩平衡数学模型,其中不含任何需要人为调整或依赖于实验数据的参数。从建立的数学模型来看,模型中含有叶轮转速ω的参量,而ω与仪表系数K有对应关系,这样通过求解ω即可求得仪表系数KK的线性度误差最小值所对应的结构参数即为优化后的结构参数值。

3.2 目标函数

根据流量检定规程中仪表线性度误差的计算公式,确定以下公式为目标函数。

J=Min{δ} (13)

δ=ΚΜax-ΚΚ×100%(14)

Κ=ΚΜax+ΚΜin2

KMax=Max{Ki} (i=1,2,…,n)

KMin=Min{Ki} (i=1,2,…,n)

式中:n——进行参数优化的流量点的数目(n=5);Ki——第i个流量点的仪表系数;KMax,KMin——各流量点仪表系数的最大值和最小值;K——流量传感器平均仪表系数;δ——线性度误差。

由目标函数J的定义可见,当δ取最小值时,传感器具有最小的线性度误差。式(13)中的仪表系数K由涡轮流量传感器数学模型计算。

目标函数中的检定点根据流量检定规程得到,其最小检定点为最小流量值Qmin,最大流量点为Qmax,其余三个流量点分别为25%Qmax、40%Qmax、70%Qmax。目标函数确立后,通过计算来获取全量程范围内仪表系数差异最小时叶轮特征参数的取值。利用理论计算得到的特征参数指导涡轮流量传感器叶轮的结构设计,完成以改善仪表系数误差为目的的结构优化。

4 优化算法与流程

目标函数属于待优化变量的非线性函数, 且含有4维不等式约束,属于4维约束非线性规划问题,因此这里采用多变量约束非线性规划的方法对叶轮的结构参数进行优化。其具体方法是采用罚函数法将约束优化问题变为无约束问题求解,罚函数法就是在原目标函数上加上由约束函数组成的一个“惩罚”项,迫使迭代点逼近可行域,即考虑求解新的函数的无约束极小值问题。这样避免了优化过程中求取目标函数的准确表达式过于繁琐的问题。

利用Matlab 优化工具箱中函数求解。Matlab优化工具箱中的fmincon () 函数是求解多变量有约束非线性函数极小值的函数,适合于本文叶轮几何参数优化的问题。优化过程中的约束条件由叶轮特征参数的经典取值来获得[6],为了确保优化计算的结果在特征参数区间内,因此对特征参数的区间进行10%的扩展,即0.005≤τ≤0.055,0.1θ0.825°β¯55°0.26σ1.4

优化流程如图3所示。

5 优化结果

以 50 mm 和25 mm口径涡轮流量传感器为例进行叶轮几何结构参数定量优化设计,对该优化设计方法的有效性进行验证。DN50和DN25涡轮流量传感器的量程范围分别为:4~40 m3/h,1~10 m3/h。采用涡轮流量传感器数学模型计算仪表系数,按照目标函数和优化流程,对现有DN50和DN25涡轮流量传感器进行叶轮几何参数优化。现有与优化后叶轮特征参数列于表1中,现有与优化后叶轮的结构参数列于表2中。

6 实验验证

水流量实验装置结构如图4所示,装置采用静态质量法对涡轮流量传感器进行了实流标定。水流量实验的流量范围分别为10~40 m3/h,1~10 m3/h。水的温度为20 ℃,密度为998.2 kg/m3,粘度为1.004 8×10-6 m2/s,实验时管道压力0.3 MPa。

图5、图6分别为两种口径下,优化前后涡轮流量传感器的仪表系数变化图。

从图中可以看出,优化后的涡轮流量传感器的仪表系数的线性度得到了改善。表3为计算后得到的不同口径流量传感器优化前后线性度误差和重复性误差,结果表明优化后传感器的线性度误差明显低于现有传感器的线性度误差,其中优化后DN50传感器线性度误差降低了38.48%,DN25传感器线性度误差降低了43.59%,而优化前后传感器的重复性误差略有改变,从而验证了该定量优化叶轮参数方法的有效性。优化后线性度误差的理论计算值与实验测量值之间存在一定误差,但优化后传感器线性度误差降低的趋势,理论计算与实验测量是一致的。

7 结 论

为了降低涡轮流量传感器测量单相液体时的线性度误差,对传感器叶轮几何参数进行了定量优化。对50 mm和25 mm两种大小不同口径的传感器叶轮优化结果表明:

(1)当50 mm口径涡轮流量传感器特征参数为τ=3.01%θ=0.55β¯=30.1°σ=0.453时,优化叶轮的传感器线性度误差为0.365 7%,比现有叶轮传感器线性度误差值降低了38.48%,重复性误差略有改变;

(2)当25 mm口径涡轮流量传感器特征参数为τ=3.8%θ=0.455β¯=43°σ=0.66时,优化叶轮的传感器线性度误差为0.283%,比现有叶轮传感器线性度误差值降低了43.59%,重复性误差略有改变。

摘要:通过对建立的数学模型求解优化了涡轮流量传感器的结构参数,减小了传感器仪表系数的线性度误差。利用叶轮的四个结构参数建立了单相流条件下涡轮流量传感器的数学模型,以仪表系数的线性度误差为约束方程,采用多变量非线性规划算法对模型求解来获取优化后的结构参数值。以50 mm和25 mm口径的涡轮流量传感器为优化对象,在水流量装置上进行了实流实验。结果表明,优化后两种口径的涡轮流量传感器的线性度误差分别降低了38.48%和43.59%,表明了理论优化分析的有效性。

关键词:涡轮流量传感器,结构参数,线性度误差,单相流

参考文献

[1]赵学端,郭亮.对双叶片轴尖式气体涡轮流量计的探讨[J].油气田地面工程,1996,15(l):56-58.

[2]吴海燕,秦永凛,秦红新.涡轮流量计转子内流动特性与仪表特性的关系[J].上海建材学院学报,1994,7(3):209-213.

[3]BLOWS L G.Towards a Better Turbine Flowmeter[C]//Pro-ceedings of the International Conference on the Advance inFlow Measurement Techniques.Coventry:University of War-wrick,1981:307-318.

[4]SALAMI L A.Towards Standardization of Turbine-typeFlowmeter[C]//Proceedings of the International Confer-ence on the Advance in Flow Measurement Techniques.Coventry:University of Warwick,1981:279-292.

[5]李刚,任金云,张涛.高准确度标准表法流量标准装置的研究[J].化工自动化及仪表,1999,26(5):39-42.

[6]孙立军.降低涡轮流量传感器粘度变化敏感度的研究[D].天津:天津大学,2004.

[7]SCHLICHTING H.Application of Boundary-layer Theory inTurbomachinery[J].Journal of Basic Engineering,1959,(12):543-551.

[8]赵学端,应启戛,沈昱明.涡轮流量计数学模型与优化设计[J].上海机械学院学报,1985,(2):1-15.

多变量回归 篇7

1 PID神经元网络

从结构角度对PID神经元网络(Neural Network)进行分析,输入层、隐含层和输出层构成了PID神经元网络的3大部分,其中个控制量的PID神经元网络由个相互并列的相同子网络构成,这几个子网络之间是相互独立的,但是也通过网络连接权值进行各自之间的联系。每个子网络的输入层由两个神经元构成,其中一个用来接收控制量的目标量,另一个用来接收控制量的当前值。每个子网络的隐含层是通过比例元、积分元和微分元3大部分组成的,其中比例元对应于PID控制器中的比例控制,积分元对应于积分控制,而微分元对应于微分控制,多个单控制量神经元网络相组合构成了多控制量PID神经元网络[3]。图1所示为多控制量PID神经元网络的拓扑结构图。

如图1所示,X11,X21,…,Xn1表示为多控制量神经元网络控制量的控制目标;X12,X22,…,Xn2表示为多控制量神经元网络控制量的当前值;Y1,Y2,…,Yn表示为多控制量神经元网络计算得到的控制律;ωij和ωjk表示为多变量PID神经元网络的网络权值。

PID神经元网络的输入层由2m个神经元构成,输出数据xsi等于输入数据Xsi,计算公式为

隐含层分别由3m个神经元部分组合而成,分别为m个比例神经元部分、m个积分神经元部分和m个微分神经元部分。这3种类型的神经元的输入值是相同的,其表达形式为

3种神经元输出的计算公式为:比例神经元

积分神经元

微分神经元

输出层是由m个神经元单元组成的,即m维神经元网络输出值,输出层的输出量是根据PID神经元网络的隐含层中全部单元的输出值通过加权和的形式所得到的,其表示形式如下

受控系统与PID神经元网络控制器相互作用组合可构成一个闭环控制系统,该闭环控制系统可以用图2的形式表示。

如图2中所示,c1,c2,…,cm为PID神经元网络闭环控制系统中的控制目标;f1,f2,…,fm为PID神经元网络闭环控制系统中的控制器控制律;s1,s2,…,sm为PID神经元网络闭环控制系统中的控制量当前值[4]。



应用PID神经元网络控制3变量输入和3变量输出的复杂耦合系统,随机产生PID神经元网络初始权值,PID神经元网络权值学习率为0.045,控制系统的控制间隔为0.001 5 s,控制量1的控制目标为0.7,控制量2的控制目标为0.4,控制量3的控制目标为0.6,应用Matlab软件进行算法仿真,3变量的PID神经元网络控制效果如图3所示,PID神经元控制算法可较好的控制由多变量输入和多变量输出构成的较复杂耦合系统,经过一段时间之后,控制量1、控制量2、控制量3最后接近于设定的目标值。不过,从控制量逼近控制目标速度和系统响应时间角度分析,该控制算法还需要进一步提高效率。由于PID神经元网络采用的是梯度学习算法,因此PID神经元网络初始权值是随机取得的,所以可从优化PID神经元网络初始权值的角度来提高PID神经元网络控制量逼近速度和系统响应时间等特性。

2 粒子群算法

为研究优化初始权值的算法以实现提高PID神经网络算法性能的目的,可以在PID神经元网络的基础上增加智能优化算法以改善权值优化搜索的能力。1995年,粒子群算法(PSO)由Eberhart和Kennedy最先提出,其是一种基于种群随机优化技术的先进智能优化算法[5]。

粒子群算法是将待解决的问题进一步转化为在维解变量空间中对最优位置粒子进行搜索的问题。在N维空间里,粒子的位置可以用一个矢量来表示,而各个粒子的飞行速度也可用一个矢量来表示。每一个粒子均有相应的适应值,该适应值是由被优化的函数所决定的,每个粒子还具有相应的速度,该速度决定了这些粒子飞行时的距离与方向。通过算法计算,各个粒子能了解自身截止当前可知的最佳位置及当前位置,这些数据作为每个粒子的飞行经验进行进一步的算法使用。与此同时,各个粒子还能了解截止当前所有群体中的粒子可发现的最佳位置,该位置被认为是粒子同伴的经验。群体中的每个粒子便是应用各自经验和粒子同伴中最好的经验进行分析,从而确定下一步所应采取的运动[6]。

最开始时,粒子群算法初始化产生一群随机粒子,紧接着种群中的各个粒子就根据目前为止的最优粒子在解空间中进行搜索,即通过迭代的方式寻求最优解。例如,假定在n维搜索空间中第j个粒子的位置是Xj=(xj,1,xj,2,xj,3,…,xj,n),第j个粒子的速度是Vj=(vj,1,vj,2,vj,3,…,vj,n),在进行每次迭代的过程中,粒子通过对两个最优解进行跟踪的方法来更新自己,其中第一个最优解就是粒子自身找到的最优解,即为个体极值pbest,pj=(pj,1pj,2,pj,3,…,pj,n);另一个就是整个种群截止当前所找到的最优解,即全局最优解gbest。当找到这两个最优值之后,粒子通过以下的两个公式对自身的速度和新的位置进行进一步的计算更新

其中,w称为惯性权因子;c1和c2称为正的学习因子;r1和r2表示0~1之间均匀分布的随机数[7]。

3 改进型PID神经元网络

应用粒子群算法优化神经元网络初始权值,粒子群算法(PSO)的初始参数为:种群规模设定为60,进化次数设定为46,同时应用自适应变异的方法来提高全种群的搜索能力,该算法的整个进化过程如图5所示。

将粒子群算法优化得到的最优初始权值引入PID神经元网络,对PID神经元网络的初始权值进行优化,再采用得到的初始权值进行PID神经元网络控制。应用Matlab对该算法进行分析,引入粒子群优化算法的3变量神经元网络控制效果如图6所示。

由图6中可看出,与图3所示的PID神经元网络算法相比较,经过粒子群算法优化的PID神经元网络控制得到了较好的控制结果,控制量1、控制量2和控制量3能够更加迅速逼近控制目标,同时系统响应时间比原PID神经元网络有所缩短。因此引入优化初始权值粒子群算法的PID神经元网络算法,相比传统的PID神经元网络算法,从控制量逼近控制目标速度和系统响应时间这两个角度看,具有较好的算法性能。

4 结束语

由于PID神经元网络的神经元系统具有动态特性,因此其在系统控制应用中,与传统的静态特性的PID控制方法相比较,能得到更加优良的控制效果。但PID神经元网络采用的学习算法是梯度学习算法,初始权值的取得具有随机性,其控制量逼近控制目标速度和系统响应时间等的性能还需进一步提高。所以,需要研究优化初始权值的算法以实现提高PID神经网络算法性能的目的。而粒子群迭代算法可较好的优化PID神经元网络初始权值,从而提高了PID神经元网络中控制量逼近控制目标的速度,减少了系统响应时间。通过Matlab软件进行算法仿真,引入粒子群算法的PID神经元网络算法相比于PID神经元网络具有较好的控制特性。

摘要:PID神经元网络具有动态特性,在系统控制应用中相比于传统的PID控制方法可取得更优的效果,但其学习算法为梯度学习算法,初始权值随机取得,为了提高其控制量逼近控制目标的速度和系统响应时间,引入粒子群算法对初始权值进行优化,最后应用Matlab软件对改进后的PID神经元网络算法进行仿真。仿真结果表明,该方法具有较好的控制性能。

关键词:PID,神经元网络,多变量控制系统,粒子群算法

参考文献

[1]舒怀林.PID神经元网络对强耦合带时延多变量系统的解耦控制[J].控制理论与应用,1998,15(6):920-924.

[2]楚彦君,巨林仓,刘军辉.PID神经网络控制器的设计及仿真研究[J].工业仪表与自动化装置,2004(2):3-6.

[3]程启明,郑勇.球磨机多模型PID型神经元网络控制系统[J].中国电机工程学报,2008,28(2):103-109.

[4]舒怀林.基于PID神经网络的倒立摆控制系统[J].机床与液压,2008,36(3):141-144,146.

[5]蔡琪,单冬红,赵伟艇.改进粒子群算法的云计算环境资源优化调度[J].辽宁工程技术大学学报:自然科学版,2016,35(1):93-95.

[6]刘衍民.粒子群算法的研究及应用[D].济南:山东师范大学,2011.

多变量回归 篇8

本文融合了历史大数据以及智能算法,对于在多变量系统中难以准确的量化相应子系统的数据模型问题,研究出了相应的有效数据以及计算优化方案。为了避免量子粒子群算法在巡优精度和收敛速度方面的不足,应用双量子粒子群算法,对原来的进化搜索方案和粒子种群编码采用量子化处理方式进行函数试验,经过优化的算法比QPSO和PSO算法的搜索能力更强。而后使用现场生产历史数据,使用D-QPSO算法估计了参数,在热力发电厂负荷控制系统的传递函数识别流程中应用了相应的解决方案,相关的研究为控制器的优化和设计提供借鉴。

2 双量粒子群算法

2.1 关于优化问题的概述

双量子粒子群的算法,主要的原理就是能够先根据量子位的概率幅值来记性粒子种群的编码,不断对其进行拓展,提升其对空间能力的粒子遍布,同时对种群进行的过程进行量子化的处理。此过程中,对方程进行简化,以实现全面的控制。根据以下步骤计算:一般来说相应的连续优化问题可以用minf(x1,…,xn)来表述,其中,n指的是优化变量的个数,f是目标函数,[ai,bi]是自变量的定义域。

2.1.2 量子化粒子的初始位置

应用量子位的概率幅值当作粒子目前位置的编码。

式子中,θij=2π×r,r是(0,1)之间随机的一个数值。i=1,2,3,4,5,…,m。

j=1,2,…,n,n是空间维数,m是种群的大小。

Pi的取值范围是[-1,1],把单位空间I=[-1,1]n映射到相应的优化问题解决空间。

2.1.3 粒子在更新流程中的量子化

通过研究量子的时空构造,可以做使用波函数来表示粒子相应量子位概率幅值的状态。下面是粒子的进化方程:

其中:是(0,1)之间随机的一个数值,m指的是种群规模,θbest指的是在量子位概率幅值的最佳中值位置,β是收缩因子,相关实验证明β如果从1.0线形缩减到0.5,那么相应的算法能够在取得较好的寻优效果。

2.1.4 粒子的变异分析

为了能够避免出现种群的早熟以及收敛等问题,必须要对算法进行优化,在其中加入一些变异因子,从而来各部量子非门实现操作的变异。

2.2 具体的算法流程分析

D-QPSO算法的具体计算过程:第一,相关参数初始化,其中包括迭代次数、变量个数和种群规模等;第二,初始种群的生成,量子化编码计算。第三,变换解空间;第四,使用适应度函数来计算相应每个粒子相应位置的适应值;第五,计算中值最佳位置θbest;第六,更新当前粒子的位置;第七,变异处理粒子;第八,采用循环计算,直到迭代数值到了最大限制或者满足相应终止条件。

3 关于经典函数数值优化的分析和实验

为证实算法的实效性,需要使用多个基准函数来测试算法,把D-QPSO算法和PSO和PSO的函数最终优化结果相互比较。

以下是关于算法参数的设置:粒子群的规模是50,寻优重复50次,最大迭代次数为500,取平均值当作最终结果。在D-QPSO中,自身因子值是2.0,惯性权重是0.5,变异概率是2.0,全局因子值是2.0。在PSO中,全局因子数值是2.0,自身因子数值是2.0,惯性权重是0.5。若最终得出的优化结果与一些条件相互符合,那么则是可以将其判断为合格,同时可以对算法的迭代进行终止。对于实验表示D-QPSO算法的寻优精度和合格次数都会得到很大程度上的提升,这样将会保证高维优化的效果。

4 对多变量系统辨识问题的分析和解决方法探究

4.1 多变量系统辨识相关问题和相应解决方案分析

如今,DCS系统得到了广泛应用,通过结合生产现场的大数据和相关的智能算法融合,而后进行系统辨识,是当前的研究重点内容。相应的辨识方式随人防止了对生产过程中产生扰动,同时也有一定的问题:系统中的相关输入变量都会改变,所以无法精确的量化相应输入变量对输出的影响大小[1]。

选取较为简单的两入一出二阶系统做例子。

其中,子系统1输入为u1(t),输出为y1(t);子系统2输入为u2(t),输出为y2(t),系统输出为y(t)。

假设相关的参数如下:T4=125,T3=20,K2=3,T2=255,T1=100,K1=2。在系统中,第一组输入是u1=rand*1,u2=rand*2,子系统的1输入记作y1,子系统的相应2输出记作y2,系统的相应输出记作y;对于第二组,输入是u3=rand*4,u4=rand*3,子系统相应的1输出记作y3,子系统相应的2输出记作y4,系统的输出记作ys;在常规的生产过程中,仅仅可以获得系统的输出输入数据,为了提升辨识结果的精准性,在实际仿真试验对比较子系统的输出。采样周期是1s,系统的仿真时间是5000s,最后得出相应的适应度函数(属于均方差函数)。

在进行系统辨识的过程中,一般都是使用一组输出输入数据来估计初始模型的参数,而后使用另一组的数验证相应的辨识结果。实验得出根据数值理论的相应计算结果来分析,如果无限制的延长辨识数据的容量,就会让辨识结果更好,同时相应的辨识过程会变得比较复杂。相应的实验结果显示,这种方案不仅具有良好的精确度,而且只需要较少的数据量。所以使用较多组不相同的输出输入数据来优化计算系统参数的方案比较可行,适合在历史大数据和智能算法融合的所变量系统模型辨识中应用[2]。

5 负荷控制系统的辨识实验探究

热力发电厂的超临界直流机组中应用的协调系统是比较典型的多变量系统,汽轮机阀门开度、总燃料量以及给水流量是系统的输入,中间点温度、主蒸汽压力以及汽轮机功率是输出。

经过分析负荷控制系统的相应机制,可以得出参考模型集的具体形式:

在式子中:k2和k1代表系统模型的增益;a是系统的逆向相应参数;d是延迟时间;n是模型阶次;T是系统相应的惯性时间。

研究对象选取我国某1000MW的超临界机组,采样机组800MW附近工况的相应数据,采样周期是5s,采样花费时间长度是50min。这样设置参数:变异概率是0.05,种群规模是50;收缩因子由1.0变成0.05。下面是模型参数的具体取值范围:a∈[0.1000],K1,K2∈[-10,10],T1,T2,…,Tn∈[0,1000],n∈{1,2,3,4,5},d∈[0,100]。

将原始数据济宁均值化处理,同时能够将其中的好一些野值进行探讨以及分辨,以此来获得其中的最佳值,如表1所示。辨识结果的相应均方差为0.788。

实验得出,实际机组的输出和辨识模型的输出,相应的均方差是0.434。根据这个结果,得出相应的辨识模型可以反映实际系统的动态特点[3]。

6 结束语

综上所述,本文通过实验分析探究,相应的历史大数据和智能算法融合的辨识方案,可以精确量化多变量系统里的所有子系统数学模型。应用双重量子粒子群算法,不仅可以拓展空间的遍历性能,而且量子化处理了粒子进化过程,利用简单的粒子进行方式以及较少的经验参数,优化了寻优过程。这种算法在寻优速度和收敛速度方面都有显著提升。

参考文献

[1]陈功贵,陈金富.含风电场电力系统环境经济动态调度建模与算法[J].中国电机工程学报,2013(10):65-66.

[2]刘自发,张伟,王泽黎.基于量子粒子群优化算法的城市电动汽车充电站优化布局[J].中国电机工程学报,2012(22):112-113.

上一篇:印刷电子设备下一篇:播种兴趣 收获成功