模糊点估计论文四篇

2024-09-12

模糊点估计论文 篇1

统计过程控制(statistical process control,SPC)是一种通过监控工序过程来保证工序能够在充分发挥其过程能力的基础上,制造出合格产品的方法。SPC的主要工具是控制图[1]。当控制图发出一个失控状态的信号时,表示生产过程发生了变化[2]。但是在确定过程变化的实际时间点时,控制图并不是很有效的工具。为了解决这个问题,有些学者提出了变点模型,但是并不能很好地处理实际应用中很普遍的可变抽样策略[3]。因此,本文基于模糊聚类理论以及统计方法,提出一种新的模糊统计聚类方法来处理实际应用中的变点问题。

1 模糊聚类与变点统计分析

1.1 聚类分析

聚类就是按照一定的要求和规律对事物进行区分和分类的过程[4]。聚类分析则是指用数学的方法研究和处理给定对象的分类,它是多元统计分析方法中的一种。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格划分到某类中,具有非此即彼的性质,因此这种类别划分的界限是分明的。而实际上大多数对象并没有严格的属性,它们在性态和类属方面存在着中介性,具有亦此亦彼的性质,因此适合进行软划分。模糊集理论的提出为这种软划分提供了有力的分析工具,并称之为模糊聚类分析。

1.2 变点统计分析

1.2.1 变点的定义

变点指的是某一时刻,在此前后的观测值或数据遵循两个不同的分布模型[5]。对于均值控制图来说,当工序过程中的均值存在一个突变时,变点模型可按下式来构造:

其中,Xi为该过程的第i个输出值。开始时,Xi服从于正态分布N(μ0,σ20),当该过程到达t点时,Xi却服从于另一个不同均值的正态分布N(μ1,σ20),其中μ0≠μ1。我们把这种在过程中引起分布变化的点t称为变点。

1.2.2 变点估计中的聚类方法

将聚类方法应用于变点估计之中,其本质就是将控制图中的观测值进行分类,以找出变点。只有将所有独立而又连续的观测值全部分为在控状态聚类和失控状态聚类这两种类别,才能准确地找出变点。这种分类在研究中又称为模式分类[6]。

使用聚类方法来估计变点,其实质也是聚类方法应用于模式识别的一个方面。在以前的研究中,经常采用变点模型来进行变点的估计,而本文采用聚类分析来找出变点,这两种方法有很多相似点[7]。

2 混合模糊统计聚类方法

2.1 混合模糊统计聚类方法概述

当控制图接受一个失控的信号时(即观测值超出控制界限),可以得出不同的聚类所确定的目标函数[7]。在基于目标函数的基础上,可以确定出最佳的两种聚类,即在控状态类和失控状态类。

假设控制图在某t时刻发出了一个失控信号,现研究的主要目的是找出均值从μ0变到μ1(μ0≠μ1)的这一点即变点t。考虑到控制图对于聚类的约束条件,将变点t之前的所有观测值都归为在控状态类,而将变点t之后的所有观测值都归为失控状态类。所有点中使得目标函数最小的那一点,就认为它是变点t

2.2 聚类的隶属函数

隶属函数是用于表征模糊集合的数学工具,它是用来刻画处于中介过渡事物对差异双方所具有的倾向性。本文讨论的问题主要是估计正态分布下连续生产过程中的均值变点问题,因此一个样本对于其所属聚类的隶属概率等于该样本所服从分布的概率。因此我们假设真正的变点发生在t时刻,于是每个样本的隶属度可按下式计算:

式中,IFC为在控状态类;OFC为失控状态类;Yi为第i个样本相适应的随机变量;f(Y;θ0)为在控状态参数为θ0的过程分布函数;f(Y;θ1)为失控状态参数为θ1的过程分布函数。

按照式(2),可以推导出正态分布下的单因素计数值控制图的具体隶属函数。先假设生产过程总体处于在控状态下,服从正态分布N(μ0,σ20),即XN(μ0,σ20)。该分布指的是生产过程中零件的个体分布,由于控制图上所研究的点为某一抽样样本的平均值x¯i(第i个样本的平均值),因此可得

Ρ(x¯1ΙFC)=Ρ(x¯iΝ(μ0,σ02ni))={2Ρ(Yx¯i|Y~Ν(μ0,σ02ni))x¯iμ02Ρ(Y-x¯i|Y~(μ0,σ02ni))x¯i>μ0(3)

其中,x¯i为控制图上的第i个点,也就是从工序过程中抽取的第i个样本中的ni个数据的平均值。

同样可以推导出失控状态下的隶属概率,它与样本点服从于正态分布Ν(μ1,σ02ni)(其中μ1≠μ0)的概率相等。因此可得

Ρ(x¯1ΟFC)=Ρ(x¯iΝ(μ1,σ02ni))={2Ρ(Yx¯i|Y~Ν(μ1,σ02ni))x¯iμ12Ρ(Y-x¯i|Y~(μ1,σ02ni))x¯i>μ1(4)

这里的μ1为该过程处于失控状态下的均值。

2.3 聚类目标函数

为了在众多可能的分类中找出合理的分类结果,要确立合理的聚类准则,即聚类的目标函数。聚类的目标函数很多,硬聚类常使用的目标函数有最小平方误差和。而模糊聚类常用的目标函数众多,如熵函数、似然函数、似然对数函数等[8]。本文采用的目标函数为

t使得该函数取得最小值时,则t最有可能为变点。该函数主要评估在控状态聚类和失控状态聚类不同组合之间的效果。

3 模拟对比试验

3.1 模糊聚类方法在固定抽样控制图下的试验

首先生成服从μ=100、σ=5(本节模拟运算中变量全用量纲一单位)的正态分布的随机数列,在t=100时,将生成服从μ=100+δ(其中δ=1,1.5,2,3)、σ=5的正态分布的随机数列。然后分别采用三种方法(模糊统计聚类法、休哈特控制图法、FCM)[9]来找出该随机数列的变点,每一种方法循环1000次并求出其平均值和标准差。抽样方法采用的固定抽样样本(n1,n2)分别为(2,2)、(4,4)、(8,8)。表1给出了该组试验的结果数据。

通过表1可以看出,本文方法显著地提高了控制图中的变点估计的精度与稳定性,说明本文方法在固定抽样样本的变点检测上显然要好于其他两种方法。

3.2 模糊聚类方法在可变抽样控制图中的试验

首先生成服从μ=100、σ=5的正态分布的随机数列,在t=100时,将自动生成μ=100+δ(其中δ=1,1.5,2,3)、σ=5的正态分布的随机数列。试验中将上警告线设置为UCL,下警告线设置为LCL,抽样策略采用(n1,n2)=(2,8)。即在前一样本点处于上警告线和下警告线之间时,取小样本n1=2进行平均运算求得样本点;如果前一样本点在上警告线和下警告线之外但又未超出上下控制线时,取大样本n2=8进行平均运算取得样本点。为了减小随机误差对试验的影响,将试验随机模拟1000次,求出最后的平均值和标准差。

由表2可以看出,本文方法对于可变抽样控制图的变点估计同样有着很高的精确性。特别是在均值变点呈小幅度变化时,这种方法的优越性更加凸显。但是另一方面,在突变幅度变得很大时,无论是本文方法还是其他方法,其应用效果都趋于一致。这主要是由休哈特控制图的性质和它们在大幅度突变时都有着良好表现的相似性而决定的[10]。

4 实例分析

某发动机缸体的制造技术标准为ϕ86.5+0.030mm。通过对生产线上的发动机缸体直径进行持续记录,并研究这些记录数据的波动来判断该生产线是否处于正常的生产状态。如果该工序过程发生异常,则通过模糊统计聚类方法来找出工序过程发生异常的变点。通过与均值控制图和比较来评价模糊统计聚类方法。

下面给出该公司2011-05-05至2011-06-01发动机缸体生产线上的全部采样数据(每天依次采集4个数据,单位为mm):

根据以上数据绘制出均值控制图,如图1所示。

1.UCL=86.521 201mm2.x¯=86.518268mm 3.LCL=86.515 370mm

由图1似乎可以得出以下结论:5月30日(即样本点为26)以前生产过程处于正常状态,5月30日控制图发出失控信号,因此生产工序过程可能在5月30日或5月31日发生了变化。但是这个结论显然是不正确的,因为控制图发出失控信号并不能代表工序过程在此时发生了异常,控制图本身并不能给出变点的确切时间。因此,下面将使用模糊统计聚类方法来对这些数据进行再一次分析,并估计其变点即工序过程发生变化的确切时间点。

将数据作为一个数列,以控制图中显示的失控点(即样本点为26)作为遍历算法的起点。通过计算每个样本点的隶属函数,可以求出所有样本点的目标函数[11]。通过对目标函数值进行比较判断,得出的结论是,当样本点为19时,即在5月23日工序过程发生了突变。这也就说明生产线发生异常变化的实际时间是5月23日,与控制图中的失控点5月30日相差很大。采集数据并进行分析的目的就是改善生产线,使之处于正常状态下,因此找出生产过程发生变化的实际点是非常重要的,图2是通过仿真后得出的聚类分析图。

1.UCL=86.521 201mm2.x¯=86.518268mm3.LCL=86.515 370mm

从以上的对比中可以发现,模糊统计聚类方法在实际应用中具有很大的意义。通过模糊统计聚类方法可以精确地找出均值或者标准差发生突变的确切时间,在仅有发生质量问题的趋势和隐患时,及时查找原因并进行整改,使生产过程回到正常水平。

5 结论

(1)将模糊聚类分析应用到控制图中,可以准确地知道均值或者标准差发生突变的确切时间,在仅有发生质量问题的趋势和隐患时,及时查找原因并进行整改,使生产过程回到正常水平。

(2)模糊聚类分析方法无论在固定抽样策略还是可变抽样策略下,对于控制图的变点估计都有着良好的效果。

(3)将模糊聚类分析方法运用于发动机缸体制造的过程控制之中,得到了满意的效果,证明该方法是有效性的、可行性的。

摘要:针对传统控制图不能解决生产过程发生变化的确切时间点即变点估计的问题,基于模糊聚类和统计学理论知识提出了变点估计的混合模糊统计聚类方法。在模拟仿真试验下,验证了该方法无论在固定抽样策略还是在可变抽样策略下,与传统的修哈特控制图法和FCM方法相比,对于控制图的变点估计都有着良好的效果。最后将该方法运用于发动机缸体制造的过程控制之中,检验了其有效性和可行性。

关键词:统计过程控制,变点估计,模糊集理论,模糊聚类,可变抽样控制图

参考文献

[1]伍爱.质量管理学[M].3版.广州:暨南大学出版社,2010.

[2]袁太平.基于成组技术的项目过程质量控制研究[D].天津:河北工业大学,2006.

[3]张公绪,孙静.新编质量管理学[M].2版.北京:高等教育出版社,2003.

[4]高新波.模糊聚类分析及应用[M].西安:西安电子科技大学出版社,2004.

[5]陈希儒.变点统计分析简介[J].数理统计与管理,1991(2):53-54.

[6]郑立伟.基于成组技术的质量控制方法与工具研究[D].天津:天津大学,2004.

[7]Zarandi M H F,Alaeddini A.A General Fuzzy-statistical Clustering Approach for Estimating theTime of Change in Variable Sampling ControlCharts[J].Information Sciences,2010,180(16):3033-3014.

[8]Alaeddini A,Ghazanfari M,Nayeri M A.A HybridFuzzy-statistical Clustering Approach for Estima-ting the Time of Changes in Fixed and VariableSampling Control Charts[J].Information Sciences,2009,179(11):1769-1784.

[9]何清.模糊聚类分析理论与应用研究进展[J].模糊系统与数学,1998,12(2):89-90.

[10]袁芳,田铮,苏晓丽,等.独立序列均值与方差变点的累积和估计及应用[J].控制理论及应用,2010,27(3):396-398.

模糊点估计论文 篇2

雇员信息表1中,每个雇员有四个属性:ID,Degree,Experience和Salary。其中有一个雇员的属性含有空值,本文将对这个空值信息进行估计。先用模糊聚类方法,将不含空值的22个雇员根据其属性进行分簇,然后将含空值的雇员划归到与他最相似簇中,最后用线性回归的方法进行计算,最终估计出空值。

因为在属性值Degree中,(Ph.D.)>(Master)>(Bachelor)。为了实验方便,我们将Ph.D.赋值为3,Master赋值为2,Bachelor赋值为1。这样的赋值对空值估计来说可以达到最佳的估计效果(Chen and Yeh 1997)。同时,将属性Salary的数值转换在0,1之间。

1 模糊聚类概述

聚类就是按照事物间的相似性进行区分和分类的过程。传统的聚类分析是一种硬划分,具有非此即彼的性质,Zadeh[7]提出的模糊理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析。模糊聚类最终将给定的样本划分成k个簇(C1,C2,…,Ck),如下:

其中1≤k≤m,Sij表示Ci中的第j个元素。

模糊聚类的实现方法主要是根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系,也就是用模糊数学的方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。这里,我们采用基于等价关系[8]的模糊聚类方法来处理,用MATLAB这一数学工具编程实现。

2 用MATLAB进行模糊聚类

MATLAB是目前国际上流行的科学计算软件,它具有强大的矩阵计算和数据可视化能力。用MATLAB模糊聚类分析过程的两大步骤:求解模糊相似矩阵和建立模糊等价矩阵。

2.1 建立模糊相似矩阵算法

用绝对值减数法[2]进行标定:,其中0≤c≤1适当选取c的值,使得rij在[0,1]中分散开来,得到模糊相似矩阵R。

基于属性值Salary,应用模糊聚类算法,将不包含空值的元组分簇。取表中的salary作为样本集合:S={S1,S2,......,S21}。

程序算法如下:

2.2 建立模糊等价矩阵

程序算法如下:

计算λ截矩阵:取λ=0.99时,算法如下:

得到相似矩阵R(略)。

2.3 聚类结果

根据矩阵得到聚类结果如表3。

此结果将表2中,把含空值以外的22个元组信息分成12个簇:(C1,C2,…,C12)。簇的中心ci可以表示成:

其中n表示Ci中元素的个数,Dij表示Ci中第j个元素Degree的属性值。Eij代表Ci中第j个元素Experience的属性值。Sij表示Ci中第j个元素Salary的属性值。

3 用线性回归求空值

用线性回归计算空值的公式如下:

是待估计的空值,Di_center,Ei_center,Si_center)是包含空值的元组被划归到的簇的中心。

βDi和βEi是属性Degree以及Experience值的单位变化对属性Salary值的偏移量,即回归系数。Wd和We是根据βDi和βEi计算的系数。

3.1 根据包含空值的元组的其它属性将其划归到最相似的簇中

用表示含空值的元组,然后计算和(Di_center,Ei_center,Si_center)之间的欧拉距离。计算公式如下:

例如含空值的与C5的中心c5的欧拉距离:Dist5=((2-1.66667)2+(0.45-0.47)2)1/2=0.333933.依此类推,算出每个Ci的Disti。如果Distp=Min(Dist1,Dist2,…,Distk),其中1≤p≤k。则将(D,E,S^)作为Ci中的元素。结果显示Dist5为Dist1,Dist2,…,Dist12中的最小值。最后将(D,E,S^)划归到簇C5中。

3.2 用回归系数来衡量其余属性值对空值属性值的影响力

计算属性Degree以及Experience值的单位变化对属性Salary值的偏移量。假设Ci中的第j个元数为(Dij,Eij,Sij),1≤j≤n,其中n代表Ci中的元素个数,则有:

如βD5和βE5计算过程和结果如下:

3.3 估计属性Salary的值线性回归公式如下:

最终估计值为0.57709×70000=40396.1

我们将提出的方法估计表中的每个元组的属性值Salary,见表4。

对空值估值算法,本文采用MAER(e^)来衡量新方法的估值准确性。定义如下:

其中为属性Salary的估计值,Sori为表中初始值,m为元组个数。

表4给出了每个估计值的误差以及和前人方法的比较结果。数据表明该方法有较低的误差率。

4 结束语

本文介绍了估计数据库空值的新方法。使用了Matlab这一数学工具编程,实现了模糊聚类分析方法。同时将得到的结果通过隶属度的加权进行了修正,得到了误差率更低的聚类结果。然后根据包含空值的元组的其它属性将其划归到最相似的簇中,最后再用线性回归法对空值进行估计。在附表4中给出了新方法与前面方法的比较结果和误差率。

参考文献

[1]苏金明,王永利MATLAB7.0实用指南[M].北京:电子工业出版社,2004:66-68.

[2]罗承忠.模糊集引论[M].北京:北京师范大学出版社,2005:105-111.

[3]Draper NR,Smith H.Applied regression analysis.Wiley,New York,NY,1998.

[4]Wang JW,Cheng CH.An efficient method for estimating null values in relational databases.Knowl Inf Syst,2006.

[5]Chen SM,Hsiao HR.A new method to esti-mate null values in relational database systems b-ased on automatic clustering techniques.Information Science.2005,169(47-69).

[6]Chen SM,Lee SW.A new method to generate fuzzy rules from relational database systems for estimating null values.Cybern Syst,2003,Int J34:33-57.

[7]Zadeh L A.Fuy sets as a basis for a theory of possibiliy.FSS,1,1978:3-28.

语文阅读教学应有点模糊性 篇3

一、 横看成岭侧成峰,远近高低各不同

《燕子》这课写了燕子的外形特点,飞行轻快以及它休息时的静态美。课文第2自然段大篇幅的描写了春天的景色,这是否多余?为何要写春天的景色?我向学生提出了个问题?

学生甲:小燕子是春天的使者,小燕子飞回来了,春天也回来了。所以要写春天的景色。

学生乙:春天不能少了轻盈的小燕子,但小燕子更离不开美丽的春天。

学生丙:红花还要绿叶配,写春天是为了衬托小燕子的美。春天越美,小燕子就越美。

这些见解是思维的火花,是学生独特的感受和体验,他们仁者见仁,智者见智,体现出不同的趣味。如果这时搬 出一个标准答案,那该多么索然无味。阅读要珍视学生独特的感受。要努力实现思想与思想的碰撞、情感与情感的交融、心灵与心灵的接轨。康得说:“模糊观念比清晰观念更富表现力。”我们应该用平等的心态与他们对话,尊重他们个性化的理解。这种独特的模糊理解更有益于他们认识的深度和广度。

二、 失之东隅,得之桑榆

学习了《最大的麦穗》这一课,学生比较难理解“追求应该是最大的,但把眼前的一穗拿在手中,这才是实实在在的。”我便让学生联系生活以及经验来理解。

学生甲:我有位叔叔大学读完出来找工作,开始找了一个岗位不满意,接着花了很多时间也找不到更好的工作。最后回头发现,原来的那个岗位也没了。

学生乙:我读过一个故事,讲一只猴子上山玩,先看见了玉米,便掰玉米;看见了桃子就扔了玉米摘桃子;看见了西瓜便扔掉桃子;最后看见了兔子便扔掉西瓜去追,结果一无所获。我们可不能像猴子那样。

学习了《山谷中的谜底》这课,我问学生,你能联系生活实际,谈谈对“弯曲不是倒下,而是为了生存和更好的发展”这句话的理解吗?

学生甲:刘备三顾茅庐,卑躬屈膝,最终感动了孔明。孔明为刘备立下汗马功劳。刘备为了国家的兴旺才委曲自己。

学生乙:勾践为了东山再起,卧薪尝胆,甚至为夫差做马车。最后,勾践收回了领土,取得了胜利。勾践忍辱负重是为了国家的生存。

学生丙:蔺相如为了国家的稳定局势,处处让着廉颇,委曲求全;廉颇深受感动,向蔺相如负请罪。蔺相如不是怕廉颇。他为了国家的发展。

这些事例让学生很好的理解了这句中心句。心理学研究表明,人的心理有清晰的一面,有难以描摹的一面,会出现“只可意会,不可言传”的现象。北大的王富仁教授认为,感受和表达不是一回事,理解的表达不出来,这也是正常现象。当学生在阅读时,言不可尽意,就要依靠自己的生活和体验,设身处地去补充还原。这样也造成了理解的模糊性。当学生不可清晰的深入理解文本信息时,可以容忍模糊,采用学生喜爱的方式来理解,获得形异而质同的理解。

三、 好读书,不求甚解

有一次听了一节公开课,教者上的是《长征》,在讲到“金沙水拍云崖暖”时,老师这样解释:“云崖暖”指的是这里的气候比较恶劣,据文献资料反映,红军是在绞平渡这个地方渡江的,这地方自古就以酷热闻名。《三国志》记载,张岱将军曾率军在此渡江,结果1500人热死。《西游记》中的火焰山据说就在附近。因此,这句不是讲金沙江水流太急了,急流把云崖都拍得发暖了。而是指这里的环境太恶劣,是诗人避开正面直叙而表现出的一种革命乐观主义精神。这个教学环节不可否认,老师下了一番苦功,但老师用自己对教材的深挖掘代替了学生的理解。学生阅读应是从模糊状态中获得一种独特体验,教者把一句话从整体中游离出来,再做“解麻雀”式的分析,显然是越爼代庖了。

儿童的年龄特点是记忆力优于理解力,我们也应降低理解的要求,不求一步到位。同时语文学习具有习得性,积累是学好语文的重要途径。“积沙成塔”“熟读唐诗三百首,不会作诗也会吟”“读书破万卷,下笔如有神”,这些古人的学习经验也告诉我们积累的重要性。儿童记忆力处于全盛时期,这是对于那些难理解或不必理解的先放一放,容忍模糊,待以后来消化。花大力气引导学生广泛读书,多积累。他们的感受很蒙眬但随着人生体验的丰富,将会逐渐清晰起来。

语文阅读教学的模糊性不是颠倒黑白,不是浮光掠影,而是原则性与灵活性的统一。容忍模糊性不是不要精确,相反,适度的模糊性是为了获得真正意义的精确。同时,语文阅读教学的模糊性也是由语文学科的特点和儿童的心理特点决定的,我们应有点模糊的情怀。

模糊点估计论文 篇4

空间成像模糊特性分析与模糊参数估计

在空间平台上的成像系统近距离拍摄空间目标时,由于目标和镜头之间以及成像系统与承载平台之间的相时运动,导致图像中目标与背景存在不同尺度的模糊,对目标的模糊参数估计以及模糊恢复造成很大的干扰.针对这种运动背景下存在运动目标的`目标图像模糊参数估计问题,本文提出了基于成像时刻航天器相对运动的先验知识的参数估计方法,取得了良好的效果.

作 者:朱怡 秦世引 ZHU Yi QIN Shi-yin 作者单位:北京航空航天大学自动化科学与电气工程学院,100083刊 名:微计算机信息 PKU英文刊名:MICROCOMPUTER INFORMATION年,卷(期):200824(30)分类号:V557+.4关键词:空间监视 运动模糊参数鉴别 轨道动力学

上一篇:真空管道运输下一篇:刮板输送