模糊等价矩阵三篇

2024-09-11

模糊等价矩阵 篇1

关键词:聚类算法,模糊等价矩阵,传递闭包

聚类是一种常见的数据分析工具,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同。聚类算法将数量型属性的取值划分为若干个区间,这些区间能有效地反映数据的实际分布情况,但是在对数量型属性进行区间划分时容易出现以下的问题:

1)如果区间划分过小,即区间的划分个数过多时,会造成每一个单个区间的支持度都很低,相应地也会使包含此区间的规则的置信度很低,从而造成规则产生的数量过少。

2)将值划分成区间时,总会有一些信息丢失。一些规则可能当一个数量型属性是由单个值(或一个小区间)构成时就具有最小置信度,这样信息丢失随着区间变大而增加。

3)在处理高偏度的数据时,连续属性离散化很难有效地体现出数据的实际分布情况。它倾向于将那些尽管具有典型相似性能的相邻数据因具有高支持度而被分隔开。

4)采用区间的划分存在划分边界过硬的弱点。一般来说,区间划分有两种方法:一种是将属性的定义域划分成离散的、互不重叠的区间,由于明显的区间划分将某些区间附近的一些潜在元素排斥在外,从而使有价值的关联规则却因为区间的划分不合理而无法得到。另一种方法是将属性的定义域划分成重叠的区间,这时处于边界附近的元素就有可能同时处于两个区间,由于这些元素同时对两个区间做贡献,就有可能造成过分强调这些交叉元素的作用,从而导致过分强调某些区间的意义。

因此,对数量型关联规则挖掘算法的研究就转化为如何对数量型属性定义域的合理划分问题。虽然已经有人提出使用模糊集理论来解决这些问题,但是目前还没有形成标准及统一的模型,本文亦从不同的角度进行一些尝试性地讨论,研究如何利用模糊理论更加合理的对数量型属性进行分类或者确定划分区间,其中主要运用了模糊等价矩阵的传递闭包(Fuzzy Equivalent Matrixes andTransitive Closure,FEM-TC)的相关特性。

1 基于FEM-TC聚类算法的描述

1.1 模糊关系定义

一个合适的分类应当具备下列3个条件:

1)自反性:即任何一个对象必须和自己在同一类;

2)对称性:即若对象u与对象v同类,则v与u也应同类;

3)传递性:即若对象u与对象v同类,而v与对象w同类,则u与w也应同类。

满足上述条件的关系即为一个等价关系。模糊等价关系的相关定义如下[2]:

定义2.1 设R∈f(U×U),如果I哿R,即坌u∈U,R(u,u)=1,则R称为自反的。

定义2.2 设R∈f(U×U),若RT=R,则称R为对称模糊关系;而称包含R的最小的对称模糊关系为R的对称闭包,记作S(R)。

定义2.3 设R∈f(U×U),若R莓R哿R,则称R为传递模糊关系;而称包含R的最小的传递模糊关系为R的传递闭包(TC,Transitive Closure),记作t(R)。

1.2 模糊关系的相似性与等价性

定义2.4 设R∈f(U×U),若R是自反和对称的,则称R为相似模糊关系;而称包含R的最小的相似模糊关系为相似闭包,记作a(R)。

例如,设U={u1,u2,u3},R∈f(U×U),且

则R是自反且对称的,故R为相似模糊矩阵(FSM,Fuzzy similar matrixs)。

定义2.5 设R∈f(U×U),若R满足自反性、对称性和传递性,则称R为模糊等价关系;而称包含R的最小的模糊等价关系为R的等价闭包,记作e(R)。

例如,设U={u1,u2,u3,u4,u5},R∈f(U×U),且

故R为模糊等价矩阵(FEM,Fuzzy Equivalent Matrixes)。

定理2.1 设R∈f(U×U),则

1)R为等价的当且仅当R为传递的模糊相似关系;

2)若R为模糊相似关系,则t(R)=e(R)。

定理2.2 设R,Q∈f(U×U),为两个模糊等价关系,则下列结论成立:

1)R∩Q仍为模糊等价关系;

2)若R∪Q为传递的,则R∪Q为等价的;

3)若R莓Q=Q莓R,则R莓Q为等价的。

1.3 算法描述

通过上面的有关模糊理论的基本定义及其性质的介绍,结合聚类分析的特点和需求,可以实现模糊聚类:

设被分类对象的集合为

每一个对象ui有m个特征指标(属性),即ui可由如下m维特征指标向量

来表示,其中uij表示第i个对象的第j个特征指标。则使用FEM-TC算法进行聚类的主要步骤如下:

1)建立特征指标矩阵

将集合(3.2.1)中的n个对象的所有m个特征指标构成一个矩阵,记作

称U*为U的特征指标矩阵。

2)数据规格化

由于每个对象的m个特性指标的量纲和数量级可能不一定相同,故在运算过程中可能会突出某数量级特别大的特性指标对分类的作用,从而降低甚至排除了某些数量级很小的特性指标的作用,致使对各特性指标的分类缺乏统一的尺度。为了消除特性指标单位的差别和特性指标数量级不同的影响,必须对各指标值实施数据规格化的处理,使每一个指标值统一于某种共同的数值特征范围。

3)构造模糊相似矩阵(FSM)

设数据uij(i=1,2,…,n;j=1,2,…,m)均已规格化,可以定义

其中rij=R(ui,uj)∈[0,1](i,j=1,2,…,n)。则称R为对象ui=(ui1,ui2,…,uim)和uj=(uj1,uj2,…,ujm)之间的模糊相似矩阵。

4)使用传递闭包法构造模糊等价矩阵(FEM)

上述步骤构造出的对象与对象之间的模糊关系矩阵R一般来说只是一个模糊相似矩阵,而不一定具有传递性,从而未必是模糊等价矩阵。

因此,要对被分类对象集U={u1,u2,…,un}进行分类,必须由模糊相似矩阵R出发构造一个新的模糊等价矩阵,然后以此模糊等价矩阵作为基础,进行动态聚类。根据定理3.1,模糊相似矩阵R的传递闭包t(R)就是一个模糊等价矩阵。因此,可以以t(R)为基础而进行分类(模糊传递闭包法),具体步骤为:

①利用平方自合成方法求出模糊相似矩阵R的传递闭包t(R),即

②适当选取置信水平值λ∈[0,1],求出t(R)的λ截矩阵t(R)λ,根据定理3.2,t(R)λ为U上的一个等价的Boolean矩阵。然后按t(Rλ进行分类,所得到的分类就是在λ水平上的等价分类。聚类的原则如下:

设则

对于ui,uj∈U,若,则在λ水平上将对象ui和对象uj归为同一类。当λ在[0,1]中取不同的值时,相应的分类随之改变,从而得到的模糊分类具有动态性,人们可以根据不同的要求进行分类。因此,模糊聚类分析更能反映出事物之间的内在联系。

2 算法的实现

若使用Delphi对算法进行了具体实现,则主要的功能和步骤以及对测试数据进行分析的结果如下:

第一步,用测试数据建立特征指标矩阵U*;

第二步,对U*进行规格化。规格化的方法采用的是数据标准化方法,即对特性指标矩阵U*的第j列计算

然后作变换

第三步,采用贴近度法中的最大最小法构造模糊相似矩阵R,即计算

由于得到的模糊相似矩阵的对角线均为1,并且是一个对称矩阵,因此在构造该矩阵时可以进行算法优化,即只计算和处理上三角矩阵或下三角矩阵,算法描述如下:

第四步,利用平方自合成方法求传递闭包,这是一个反复迭代的过程:

此时可以看出t(R)的对角线并非全为1,可以选取适当的置信水平值λ,按λ截矩阵t(R)λ进行动态聚类。λ值不同则聚类的结果也不同。

3 结论

经过实际数据的测试、对比和验证表明该算法是有效地。不过有关该算法还有一些值得考虑的问题:一是最佳阀值λ的确定,是否可以考虑用F统计量确定λ最佳值?二是在进行数据规格化时,通常采用数据标准化方法,此外还可以采用均值规格化、中心规格化或者最大值规格化等方法,哪一种方法更好?三是在构造模糊相似矩阵时有最大最小法,还有算术平均最小法和几何平均最小法,还可以采用相似系数法(包括数量积法、夹角余弦法等)或者距离法(包括Euclid距离法、Hamming距离法)等,这些方法分别在何时使用最佳?这些都还需要进一步去研究。

参考文献

[1]刘星沙,谭利球,熊拥军.关联规则挖掘算法及其应用研究[J].计算机工程与科学,2007(1).

[2]陆建江,张亚非,宋自林.模糊关联规则的研究与应用[M].北京:科学出版社,2008.

[3]贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007(1).

[4]李鸿吉.模糊数学基础及实用算法[M].北京:科学出版社,2005.

[5]范周田.模糊矩阵理论与应用[M].北京:科学出版社,2006.

[6]毛国君.数据挖掘原理与算法[M].2版.北京:清华大学出版社,2009.

模糊等价矩阵 篇2

关键词:模糊一致矩阵;农地释放;效益评价

中图分类号: F301.3文献标志码: A文章编号:1002-1302(2014)01-0417-03

收稿日期:2013-05-27

基金项目:国家社会科学基金(编号:07ASH010);国家哲学社会科学基金(编号:12CSH027)。

作者简介:王晨(1988—),男,山西阳泉人,硕士研究生,研究方向为工程移民与征地拆迁。E-mail:wangchenhaoran@126.com。当今社会农地资源的释放是在一定总量限度内,政府作用、企业参与、农民对自身未来考量、农地本身资源质量状况、农产品市场景气程度甚至气候环境变化等多种因素[1]导致农用土地这种在一定时期内原本固定的使用方式发生根本转变,这一转变过程可能由农地转为工程建设用地,也可能转为生态自然保护区,或者转为其他类型的使用地,笔者倾向于将这一转变过程统称为农地释放。目前,农地释放的方式与途径很多,但笔者认为大致主要包含主动与被动两大类。农民由于政府引导、个人发展或农地资源质量状况等因素主动放弃土地承包权,放弃从事农业生产,通过农转非后进入城镇生活工作,这种主动的农地释放过程相对温和,产生的释放成本基本由农民个人消化,社会成本较小;另一种农地释放方式则是在政府力量推动、企业伴随政府参与、农地或气候环境状态突变等因素作用下,农民非自愿地与农地分离,被迫放弃农业生产,其未来生计并未在这一释放过程中给予考虑,这种被动式的农地释放过程相对剧烈,并将较高的释放成本给予无法进行消化的农民,进而转嫁给社会,容易引发贫困,带来较高的社会成本。针对具体的农地释放,编制科学合理的农地释放规划,规避农地释放带来的各种风险,可使释放农地群体生产生活得以迅速恢复,实现可持续健康发展,带动整体释放效益的提高。而对农地释放综合效益的评价不仅能有效衡量农地释放规划编制与农地释放实施机构的具体工作效果,同时也能有效鉴别农地释放后存在的遗留衍生问题,进而及时为问题的解决提出合理化建议。

目前,关于农地释放效益的评价,学界研究尚处于较空白的状态,而对效益的评价研究多采用定性分析方法,往往凭借自由学识、经验、印象,缺乏相应的数据支持和科学的分析测评,评价过程注重宏观把握和审视,忽视微观和具体的数据分析,导致评估结果相对主观,难以体现农地释放效益的真实状况。同时,现实中影响具体农地释放效益的主观与客观因素较多,各个评价指标之间的关系存在一定的模糊性,没有绝对明显的评判界限。因此,笔者倾向于将定性评价与定量评价相结合,模糊一致矩阵法以模糊数学为基础,将一些边界不清、不易定量的因素定量化,具有较强的中分传递性[2],保证评价结果的科学性与合理性。

1效益评价指标体系

为建立行之有效的评价指标体系,应该保持指标的真实性和灵敏性,顾及指标的全面性,尽可能全面综合地反映农地释放效益状况,保证评价指标的有效性和指标获得的可行性,进而筛选合理、有效的指标体系[3]。农地释放效益评价指标体系是反映特定时间、地点、条件下的农地释放效果具体表现及其发展变化规律的一系列统计指标有机结合的整体。为更科学地评价重庆三峡生态屏障区农地释放效益状况,依据科学性、全面性、简约性以及可操作性等原则,根据屏障区内的实际情况,从农地释放效益的4个方面(经济效益、社会效益、政治效益以及生态效益)[4]入手,利用现有资料与数据,再次筛选出11个核心评价指标,并以此为基础构建出重庆三峡生态屏障区农地释放效益评价指标体系的3个层次、2级子系统。3个层次包含目标层、准则层、次准则层,目标层反映总体释放效益,准则层具体包括经济效益、社会效益、政治效益、生态效益4个子目标的评价结果,次准则层根据不同的子目标设置相应的评判指标,进而构成2级子系统(图1)。

2模糊一致矩阵模型的构建

若模糊矩阵R=(rij)n×n,u=1,2,3,…,l,均有 rij-riu+rju=0.5,则称该矩阵为模糊一致矩阵。现假设三峡生态屏障区有m个待评价地区Ai(i=1,2,3,…,m)构成的农地释放效益评价集,又有n个指标Bj(i=1,2,3,…,n)构成的指标集,各指标相应权重为Wk(k=1,2,3,…,s),且满足∑s1k=1Wk=1[5],则基于模糊一致矩阵理论的决策优选过程如下所示:

(1)建立模糊优先关系矩阵。由于该评价方案是m个待评价地区在n个指标下的优选排序问题,所以可以先建立n

个单指标模糊优先关系矩阵Lk=(lkij)n×n(k=1,2,3,…,s),其中lkij 为在指标Bj下Ai1对Ai2的优先关系系数,其值为

lkij=1若在指标Bj下Ai1优于Ai2

0.5若在指标Bj下Ai1与Ai2同优

0若在指标Bj下Ai1次于Ai2

(2)将模糊优先关系矩阵Lk=(lkij)n×n(k=1,2,3,…,s)改造成模糊一致矩阵Rk=(rkij)n×n,其中模糊一致矩阵中的元素为rkij=rki-rkj12n+0.5,且满足rki=∑n1j=1lki1。

(3)单指标优属度的计算。运用方根法计算方案Ai在指标Bk下的优属度ski,即ski=si1∑n1i=1si,其中 si=n1∏n1i=1rkij。

nlc202309041942

(4)综合排序。计算各方案的综合优属度Si,即Si=∑m1k=1Wk·ski(i=1,2,3,…,m),按ski(i=1,2,3,…,m)由大到小顺序可得到Ai地区在综合m个指标影响下的优劣顺序。若被评价地区所考虑的评价指标拥有若干个次级指标,在分别得到各次级指标综合优属度后,可将其分别加以综合得出上一级指标的优属度[6]。

3应用实例

3.1评价范围界定

本研究农地释放效益的评价范围仅限于三峡生态屏障区,该区域涉及三峡库区19个县(市、区)及重庆主城区,在具体实地调查中共抽取了ZG、FJ、WZ、FL 4个县(区)。随着三峡工程建设的不断推进,库区生态环境日益呈现出较明显的脆弱性与敏感性,地质灾害引发的塌岸滑坡对居民的生命财产安全与安稳致富构成严重威胁的背景下,国务院特别组织编制并通过《三峡后续工作规划》,其中要求从人们生存和长远发展出发,逐步建立三峡生态屏障区,屏障区兼具防治地质灾害、保护生态环境作用,建设过程中尽量考虑搬迁避让,通过搬迁避让改善移民群众的生产生活条件[7]。通过对生态屏障区涉及到的4个县(区)的实地调查可知,虽然此次生态屏障区农民搬迁基本采取农户自愿原则,但在实际操作中还是借助了政府行政力量来进行推动,同时当地农民在此之前也没有出现明显成规模的弃土离农现象,可见此次生态屏障规划区内农地释放是由基于生态环境变化以及政府行政力量的共同推动造成的,本质上仍属于被动释放。因此,有必要设立一套农地释放效益评价指标,运用基于模糊数学理论的模糊一致矩阵评判法对ZG、FJ、WZ及FL农地释放效益进行综合评判。

3.2评价指标权重确定

据前文所述,从农地释放效益的4个方面(即经济效益、社会效益、政治效益以及生态效益)入手,利用现有资料与数据,再次筛选出相关收入、地价、区域社会稳定等11个核心评价指标。通过向4位土地资源管理、移民与社会学领域专家咨询得到相应的指标重要性结果,采用层次分析法(AHP)计算并通过一致性检验得到相应的指标权重Wk(表1)。

3.3农地释放效益综合评价

根据模糊一致矩阵性质和基本方法,计算各县(区)农地释放效益涉及到的各层评价因素的优属度值,进而得到最终的农地释放效益综合排名。为方便行文,主要以经济效益评价指标中的次级指标——农民离土后收入提高程度的优属度计算为例。

(1)建立模糊优先关系矩阵:

(3)计算得出各县(区)农民离土后收入提高程度的优属度为S1=0.15,S2=0.28,S3=0.32,S4=0.25。按照相同原理可得经济效益指标下其余次级指标的优属度,综合其余次级评价指标优属度即可得到经济效益优属度,具体结果见表2。表1三峡生态屏障区农地释放效益评价指标权重分配

目标层1准则层1次准则层1权重三峡生态屏障区农地释放效益1经济效益1农民离土后收入提高程度10.4911土地地价增值幅度10.2011使用土地部门利润增长程度10.31[3]总和10.351社会效益1使用土地部门吸纳就业状况10.4911离土农民心理适应与稳定情况10.1611区域基础设施改善状况10.35[3]总和10.251政治效益1基本粮食与农材料供应安全10.3711农地释放区域社会稳定情况10.63[3]总和10.091生态效益1植被覆盖率10.3511地质灾害发生率10.4111水资源保护程度10.24[3]总和10.31

表2三峡生态屏障区各县(区)经济效益优属度值

地区1农民离土后

收入提高程度1土地地价

增值幅度1使用土地部门

利润增长程度1经济效益ZG10.1510.2210.2710.201 2FJ10.2810.2910.3310.287 5WZ10.3210.3010.2110.277 9FL10.2510.3910.1910.233 4

(4)同理可求得社会效益、政治效益以及生态效益3个指标的优属度,进而得出4个地区综合效益评价排名,具体见表3。

由表3可知,WZ农地释放综合评价值为0.266 29,效益最好;ZG综合评价值为0.229 24,效益最差,FJ与FL分别位居2、3位。各个子效益中FJ的农地释放经济效益最好,ZG的经济效益最差;FL社会效益最好,ZG社会效益最差;FL政治效益评价最高,ZG最低;ZG农地释放生态效益评价最高,FL最低。表3三峡生态屏障区各县(区)农地释放综合效益总体评价

地区1经济效益1社会效益1政治效益1生态效益1综合评价1排名ZG10.201 210.196 610.229 610.287 110.229 2414FJ10.287 510.230 910.249 310.253 310.259 3112WZ10.277 910.260 410.257 110.260 610.266 2911FL10.233 410.312 110.264 010.199 010.245 1713

4结束语

将评价结果与实地调查时获得的相关资料进行比对,4个地区农地释放效益排名与客观事实基本相符,WZ由于靠近重庆主城区,城镇化程度较高,经济基础比FJ、FL好,加之农地释放过程中能较好地施行惠农惠民政策等,所以其排名最高;ZG由于行政划归湖北管辖,城镇化程度较低,对于生态屏障区建设尚处于逐渐认识阶段,排名靠后。因此,对于ZG段生态屏障建设,应当加大政策宣传力度,积极按照国家政策推行惠民政策,积极鼓励本区域内屏障区建设。

经过实例验证,采用模糊一致矩阵进行农地释放效益评价,具有一定程度的科学性。但是模糊一致矩阵评价需要采集较科学准确的界定评价指标及其权重;同时,模糊一致矩阵虽能较好地评判待评价因素之间的优劣关系,但无法清晰判别各评价指标之间的优劣程度,存在一定的局限性。因此,针对同类问题,还要进一步进行方法优化,以更加科学合理地进行农地释放效益综合评价。

参考文献:

[1]苏楠,杨学军,文龙娇.农地流转多重主体博弈分析——兼论农户权益保障[J]. 中國农业资源与区划,2011(6):12-16.

[2]黄健元. 模糊一致矩阵在多层次、多因素决策方案优选中的应用[J]. 河海大学学报:自然科学版,1999,27(5):84-89.

[3]历叶红,张训. 基于模糊综合评价法的居民健康发展水平评价[J]. 求索,2010(10):54-56.

[4]王玉波,雷国平,唐莹,等. 农村居民点土地整理的效益评价方法探讨[J]. 中国农业资源与区划,2008,29(2):39-43.

[5]曲永岗,黄健元. 基于模糊优选模型的水运企业绩效综合评价[J]. 港工技术,2003(1):28-30.

[6]孙中艮,施国庆,杨文建. 基于模糊一致矩阵的水库移民安置效果评价[J]. 人民黄河,2009,31(8):110-111,113.

[7]河海大学中国移民研究中心. 三峡生态屏障区人口转移安置政策与机制研究报告[R]. 南京:河海大学中国移民研究中心,2012:26-28.王丽平,孙正清. 建立农业科技富民长效机制的思考——以江苏省淮安市为例[J]. 江苏农业科学,2014,42(1):420-422.

模糊矩阵在水质监测中的应用 篇3

模糊矩阵法评价水质级别,比单因子评价法更真实地反映水体水质级别的具体归属.结合丰、平、枯水期趋势分析,提出水质级别隶属度概念.

作 者:王峥 陈伟宇 WANG Zhen CHEN Wei-yu 作者单位:王峥,WANG Zhen(广东省水文局,佛山分局,广东,佛山,528000)

陈伟宇,CHEN Wei-yu(澜石水文站,广东,佛山,528000)

上一篇:膜动态补偿下一篇:室内联网