主成分分析与回归分析

2024-05-26

主成分分析与回归分析(精选8篇)

主成分分析与回归分析 篇1

主成分分析:是把几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关的一种数学降维的方法。

全成分分析:是将送检样品中的原材料、填料、助剂等进行定性定量分析。塑料原材料种类,填料种类、粒径,助剂种类都能影响对产品的性能、寿命,通常是同一种原材料、同 一种填料,因为助剂种类的不同,造成产品性能大不相同。

主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主要目的是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中变量的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。

分析步骤

数据标准化;

一、求相关系数矩阵;

二、一系列正交变换,使非对角线上的数置0,加到主对角上;

三、得特征根xi(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;

四、求各个特征根对应的特征向量;

五、用下式计算每个特征根的贡献率Vi;

Vi=xi/(x1+x2+........)

六、根据特征根及其特征向量解释主成分物理意义。

主成分分析的基本思想

主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。

主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。

主成分分析与回归分析 篇2

农业是国民经济的“母体产业”,是整个国民经济的基础,关系着国家,社会经济和政治的稳定。近几年来农民、农村、农业的问题越来越突出,“三农”问题已经作为国务院工作的重中之重。农业上市公司作为我国现阶段先进农业生产力的企业组织,它不仅能够为农业经济的发展提供人才、资金、技术、市场和管理制度,而且可以发挥支柱企业和龙头企业的带头作用,带来制度创新和技术创新,促进农业生产的深加工,提高整个农业的产业化及组织化水平。然而目前,我国农业上市公司资本结构中存在着大量问题:资产负债率水平普遍较低;融资结构失衡,内源融资比例偏小;债务结构不合理,长期负债比例偏小;股权集中程度较高。这些问题导致我国农业上市公司经营业绩不佳,发展劲头不足。因此,本文针对农业上市公司资本结构的现状,借鉴西方资本结构理论和国内外学者的研究成果,对农业上市公司资本结构的影响因素进行实证分析,希望为我国农业上市公司资本结构优化提供经验证据和理论支持,对农业上市公司的持续、健康发展有所裨益。

二、研究设计

(一)样本选取与数据来源为了保证研究结果的有效性,在样本选取上,本文遵循以下原则:(1)选择2009年12月31日之前上市的农业上市公司。新上市公司财务表现可能不太稳定,会影响研究结论的准确性,故选择上市时间较长的公司。(2)选择只发行A股的农业上市公司。本文研究的重点在于A股市场,故为了免受B股市场的影响剔除发行B股和同时发行A、B股的公司。(3)剔除ST、PT类农业上市公司。此类公司的财务状况或者处于异常情况,或者连续两年以上处于亏损状态,如果将其纳入样本会对结论的可靠性和有效性产生影响。根据以上原则,经过筛选,共有24家农业上市公司符合要求(见表1),在时间跨度上,以样本公司2010年至2012年的数据为基础进行分析。本文所需原始数据来自于巨潮资讯网和证券之星网所公开披露的各样本公司2010年至2012年的财务报告,数据分析使用EXCEL和SPSS17.0软件。

(二)变量选择本文采用资产负债率、流动资产负债率和长期资产负债率作为被解释变量对资本结构进行度量。对于解释变量,主要选择具有代表性的,对资本结构可能产生影响的微观因素,包括公司规模、盈利能力、企业成长性、非债务税盾、资产担保价值、资产结构、股权结构、偿债债能能力力和和所所得得税税率率等等99类类共共1177个个指标。涉及的变量及其说明如表2所示。

(三)模型构建第一步,对影响农业上市公司资本结构的解释变量利用主成分分析法提取若干无关的主成分。主成分分析法是利用降维的思想,将多个指标转化为少数几个不相关的综合指标,其中每个主成分都是原始变量的线性组合,这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠;第二步,对提取的若干主成分进行多元线性回归,分析哪些因素对农业上市公司的资本结构会产生影响。

其中Gi(i=l,2,…,k)为主成分因子,k为选取的主成分个数,视主成分分析结果而定,ε为随机误差项。

三、实证结果与分析

(一)主成分分析主成分分析法适用于原有变量之间具有较强的相关性,因此需要对原有变量做相关分析。本文采用KMO检验和Bartlett检验,KMO值越接近于1,意味着变量间的相关性越强,KMO值越接近于0,意味着变量间的相关性越弱,KMO>0.9时效果最佳,KMO<0.5时不宜做主成分分析;如果Bartlett检验统计值较大,且其对应的相伴概率值小于0.05的显著性水平,那么应该拒绝零假设,即原始变量之间存在相关性,适合做主成分分析。检验结果显示,KMO值为0.656大于0.5,且巴特利特值为1298.248,相伴概率p的显著性水平为0.000小于0.05,因此可以使用主成分分析法。

选取主成分时,特征值的大小说明所选主成分对原始变量的说明程度,如果特征值小于1意味着所选主成分对原始变量的解释程度还不如直接引入原始变量的解释程度大,因此,用特征值大于1的标准选取主成分。从表3可以看出,特征值大于1的主成分有6个,即这6个主成分代表了全部原始变量80.276%的方差, 提供了原始指标数据所传递的基本信息。

数据来源:样本数据运用 SPSS17.0 分析软件计算而得(下同)

根据旋转后的主成分矩阵(见表4),可以看出:

因子1:在总资产收益率、每股收益、净资产收益率和主营业务收益率的负荷量大于其他指标,这四个指标代表企业的盈利能力,将其定义为盈利能力因子(G1)。

因子2:在流动比率和速动比率的负荷量大于其他指标,这两个指标反映的是企业的偿债能力,将其定义为偿债能力因子(G2)。

因子3:在折旧资产比上有最大载荷,这个指标反映的是企业的非负债税盾,将其定义为税盾因子(G3)。

因子4;在LN总资产和LN主营业务收入的负荷量大于其他指标,这两个指标反映了公司规模的大小,将其定义为规模因子(G4)。

因子5:在流通股比重和第一股东持股比例的负荷量大于其他指标,这两个指标反映企业的股权结构,将其定义为股权结构因子(G5)。

因子6:在所得税率上有最大载荷,将其定义为所得税率因子(G6)。

(二)多元回归分析通过主成分分析得到的主成分矩阵作为新的解释变量,分别对农业上市公司的资产负债率、流动资产负债率和长期资产负债率进行多元线性回归。用SPSS17.0软件回归分析结果如表5所示。

表5是对被解释变量Y1、Y2、Y3和所有解释变量G1、G2、G3、G4、G5、G6之间的整体相关性的检验,用F值来衡量。可以看出资产负债率和流动资产负债率的F值分别为19.466和18.139,Sig均为0.000远小于0.05 (即95%的置信水平),二者都通过了回归方程的显著性检验;然而长期资产负债率的F值为1.384,Sig为0.234远大于0.05,即说明因变量与自变量间的整体相关性不显著,未通过检验。

表6主要显示Y1方程的回归结果,从t值和t值的显著程度Sig值可以判断出G1、G2、G3、G4、G5均通过了90%的显著性检验,常数项和G6未通过检验,将常数项和G6直接删去,所以回归方程表达式为:

Y1=-21.909G1-15.460G2-30.875G3+4.815G4-11.317G5

表7主要显示Y2方程的回归结果,从t值和t值的显著程度Sig值可以判断出G1、G2、G3、G4、G5均通过了90%的显著性检验,常数项和G6未通过检验,将常数项和G6直接删去,所以回归方程表达式为:

(三)研究结论根据回归结果,可以得出如下结论:

(1)盈利能力因子与资产负债率和流动资产负债率呈负相关,且效果显著。这一结果与优序融资理论相吻合。可以理解为由于盈利能力强的公司具有较强的内源融资能力,进而更容易获得权益性融资,因此负债率较低;相反,盈利能力差的公司自身的留存收益较少且较难获得股权融资的机会,因此只能依靠负债解决资金问题。

(2)偿债能力因子与资产负债率和流动资产负债率呈负相关关系,且效果显著。因为变现能力强的公司一般都能够在短时间内满足企业生产运营的资金需求,且债权融资存在一定的风险,故变现能力强的公司会在资金需求得到满足的情况下,尽可能的减少财务杠杆的使用,同时规避了财务风险;反过来,变现能力差的公司自身资金难以满足扩大生产的需求,股权融资的资金成本又高,因此只能依靠负债筹资。

(3)税盾因子与资产负债率和流动资产负债率呈负相关。这是因为折旧可以减少税前利润,具有抵税作用,若农业上市公司选择债务融资只是出于负债利息抵税效应的考虑,那么折旧可以代替负债发挥抵税作用,从而降低企业的负债率。

(4)规模因子与资产负债率和流动资产负债率存在正相关关系。这与众多学者的研究结果一致。第一,大规模企业倾向于实施多元化战略,分散经营风险,增强企业的发展与稳定性;第二,由于具有良好的发展前景和信誉,使得大公司能够较容易的获得较低成本的债务融资。对于农业上市公司而言,由于行业受季节变化影响较大,农业旺季时往往需要大量资金周转,大规模企业更是如此,因此当企业内部融资有限时就需要举借外债。

(5)股权结构因子与资产负债率和流动资产负债率呈负相关。具体地说就是流通股比重越高,第一股东持股比例越高,企业的负债率就越低。由于流通股比例越高,并购机制的作用就能够越有效的发挥,而且第一股东持股比例越高,就会更注重公司长远发展所带来的股息收入,因此负债率就越低。

(6)所得税率因子与资产负债率和流动资产负债率的关系均不显著。这可能是因为我国农业上市公司享受国家税收优惠政策,实际所得税率远远低于税法所规定25%的比例,减免了应交的各种税负后,负债的节税收益太少,导致节税收益远少于负债的破产成本,企业已经不看重负债的节税收益,而是更注重负债所带来的破产成本和破产风险。

(7)长期资产负债率未能通过回归方程的显著性检验,即所有变量均不能解释长期资产负债率的大小。这是因为我国农业上市公司长期贷款批准手续较为复杂,导致长期贷款难以获得,因此长期以来农业上市公司中流动负债比例较高,长期负债比率较低,一些原本影响长期资产负债率的因素可以忽略;另外,我国债券市场机制还不太完善,债券对资本结构的影响也不稳定。

四、结论

不同行业资本结构的影响因素是不同的,对农业上市公司而言,影响资本结构的主要因素为:盈利能力、偿债能力、非负债税盾、公司规模和股权结构。因此,农业上市公司可以从以下几方面实现资本结构的优化:第一,保持适度的负债率,使企业获得所得税的抵减和财务杠杆收益;第二,提高企业的盈利水平,增加企业的自我积累,加强抵御风险的能力,这就需要依靠农业科技,增强品牌优势,扩大市场占有率;第三,优化债务内部结构,合理安排短期、中期和长期债务,以满足生产经营中对资金不同时期的需要和避免由于各类负债出现集中还款而导致财务风险的发生;第四,完善公司治理结构,强化管理层的股权融资成本意识和债务融资的财务杠杆;第五,实现融资工具的多元化,发展企业债券融资方式和利率互换、期权等新型融资方式,增强企业多渠道、多元化的融资能力,从根本上优化企业资本结构。

摘要:本文以沪深两市农业上市公司为研究对象,运用主成分分析法与多元线性回归法对农业上市公司资本结构的影响因素进行实证分析。结果表明:农业上市公司的盈利能力、偿债能力、非负债税盾、规模和股权结构对资本结构具有显著影响,而所得税率对资本结构的影响不显著。继而对研究结果形成机理进行详细分析,提出农业上市公司要从保持适度的负债率、提高盈利水平、优化债务内部结构、完善公司治理结构和实现融资工具的多元化等方面优化资本结构的对策。

主成分分析与回归分析 篇3

摘 要 农业经济增长与农业生产自然制约条件、农业人力资本投入、农业生产资本投入、农业生产技术、农业经济的市场作用、农业生产条件制约因素等密切相关。基于此,选取反映农业经济增长的11个指标,对1980-2012年的时间序列运用主成分回归分析与其误差修正模型,研究影响我国农业长期经济增长与短期经济增长的因素。结果表明,影响我国农业长期与短期经济增长的主要因素按影响力大小依次为农业生产条件、市场作用、自然制约条件、农业生产资本、农业生产技术、人力资源。

关键词 主成分回归分析;ECM;农业经济增长弹性

中图分类号:F323.0 文献标志码:A 文章编号:1673-890X(2014)11-0-4

1 概述

农业作为国民经济的基础,为国民经济的不断发展与进步提供支撑。农业的发展很重要,然而,1952-1978年我国农业总产值年均增长率仅4.15%,农业缓慢增长。十三中全会以来,特别是改革开放30年,我国的农业总产值平均增长率为12.34%,不仅解决了人民的温饱问题,也为全面建设小康社会提供了坚实的物质保障,维护了我国社会安定、确保了整个国民经济稳定发展、稳定我国在国际竞争中应有地位方面起到了基础作用。因而,对农业进行深入的分析,不仅能够从理论上帮助我们正确认识和把握农业增长的决定力量,并且对稳固农业基础地位有着极其重要的现实意义。国内外关于农业经济增长影响因素的探究很多:Simon Kuznets对农业在国民经济发展中的地位和作用研究中开创性的提出了经济发展中农业的产品、要素、市场及外汇的四大贡献;速水佑次郎和费农﹒拉坦提出了诱导性的技术变革与资源替代论来解释农业的发展,强调任何发展中国家的成功的农业发展的技术变革的关键是有效的市场信息、研究、供给与市场需求间的有效的交互作用;Knight M首次提出在一国经济发展的某个时期人力资本可能对农业经济的增长起微弱甚至相反的作用;Paul R.Krugman等人发现区位因素对地区农业经济增长的影响显著; Kalirajan指出要素投入增长和生产率增长是促进农业经济增长的主要途径;Deininger K通过抽样调查探讨了政府土地重新分配与正式的土地使用证明对农业生产率增长与家庭(成员)退出农业行业的影响,通过正式承认土地权利证书可以鼓励农村劳动力的临时性移民;Yue Hu研究发现农业经济增长和农业集聚程度之间的具有正相关性,农业产业集中度的差异将导致不同的区域农业经济增长。国内学者从我国国情出发,来研究我国农业发展。孙敬水等通过面板模型对我国农村人力资本在农业经济增长中的作用进行实证研究,得到农村人力资本是农业经济增长的重要源泉的结论;李国璋等通过研究化农业投入要素与产出的关系,得到肥施用量与农机动力强对我国农业总产值冲击较大的结论;王汉章等在研究国家财政各项支农投入在促进农业发展中的贡献的基础上剖析了我国财政支农支出的现状;裴辉儒应用面板数据分析我国农业信贷与农业经济增长的关系发现二者之间存在明显的区域差异,不具备长期的均衡关系;陈关聚提出农业发展必须依靠提高生产效率推动农业内涵式增长,建议通过增加农田水利建设资金投入、优化农用地结构、提高农业规模化经营水平等措施,提高农业经济增长效率。本文在前人研究的基础上,通过对我国1980-2012年间农业发展的时间序列中与我国农业经济增长相关性较强的11个指标进行基于主成分回归及其误差修正模型的实证研究,分析了我国农业发展的长期影响因素与短期影响因素,最后对我国农业经济发展提供一些思路和建议。

2 指标选取与模型方法

通过研究相关研究文献,本人总结出农业经济增长与农业生产自然制约条件、农业人力资本投入、农业生产资本投入、农业生产技术、农业经济的市场作用、农业生产条件制约因素等密切相关。本文选取了与农业总产值(TVAO)相关性较强且能反映农业经济增长的10个指标,所选指标包括农业机械总动力(TPAM)、农作物总播种面积(TSA)、受灾面积(DA)、农业就业人数(AE)、国家财政农业支出(NFAE)、化肥施用量(AQCF )、有效灌溉面积(EIA)种植业占农林牧渔业的比重(PIR)、农产品生产价格指数(APPI)以及农村中学师生比(SFR)。在上述所选指标中,农作物播种面积、受灾面积反映了农业生产的自然制约条件;国家财政农业支出反映了农业生产的资本投入;农业从业人数属于农业人力资本范畴;因为农村中学师生比的变动可间接反映农业科技进步与生产效率的变化,我们将其划为农业生产技术;农产品生产价格指数、农业生产结构调整是农业经济的市场作用;而机械总动力、化肥施用量、灌溉面积属于农业生产条件制约因素。数据源自1985至2012年的《中国统计年鉴》与《中国农村统计年鉴》 。

在本文的研究中涉及大量的变量,为避免变量间可能具有的多重共线性对参数估计与分析结果的影响,通过主成分分析方法选取适当的相互独立的能够较好的反映原变量指标的综合信息的主成分,并在此基础上进行主成分回归,解决多元回归分析中的多重共线性问题。然而,主成分回归方法不能够解决异常值的问题,并且也不能及时、准确地反映时间序列的数据的变化特征与趋势。为弥补这个弊端与增加模型的估计精度,本文将主成分回归这一长期静态模型的误差项作为均衡误差,建立主成分回归的短期动态的误差修正模型,以此来修正主成分回归模型,据此来研究影响我国农业长期经济增长与短期经济增长的因素。。

3 实证分析

本文对变量进行了自然对数化处理以降低序列短期波动,更准确把握其长期变化趋势, 并在此基础上对数据标准化以消除量纲对数据结构的影响。本文所采用的计量方法均使用软件 R进行分析。

从长期看,自然制约条件对农业生产总值的弹性和为0.146,农业生产资本投入的弹性为0.133,人力资源的弹性为0.01,农业生产技术弹性绝对值为0.075,市场作用弹性绝对值和为0.275,农业生产条件制约因素弹性对值和为0.422。endprint

TVAO关于、的短期弹性分别为-0.3297、-0.0366,与主成分协整方程具有一致性的结论,即各变量对因变量的短期波动影响与长期波动影响具有一贯性。由上式知误差修正系数为负,符合其反向修正机制,当TVAO偏离长期均衡状态时,误差修正项会以27.21%的比例反向将其拉回到长期均衡线,调整力度较大。使用原变量替换后为:

误差修正模型很好的吸收了短期和长期的波动信息,全面的体现了和原变量之间的长期动态均衡机制。短期上,自然制约条件对农业生产总值的弹性和为0.142,农业生产资本投入的弹性为0.114,人力资源的弹性为0.022,农业生产技术弹性绝对值为0.057,市场作用弹性绝对值和为0.249,农业生产条件制约因素弹性对值和为0.376。

综合长、短期影响农业经济增长因素分析的结果,影响农业总产值的第一综合因素为农业生产条件,且其弹性贡献度明显大幅高于其他因素,农业生产条件中农业机械总动力、农村用电量、有效灌溉面积效用均低于化肥施用量及农药使用量的效用,说明在现有自然制约条件下我国农业增产长期过度依赖于化肥施用量与农药使用量。数据显示1980-2012年33年间我国化肥使用量由1269.4万吨上升至5838.8万吨,年均增长13.9%,此造成的生态环境的污染与破坏,不利于我国农业的健康可持续发展;农业机械总动力由14 745.7千万W增长至102 559千万W,年均增长21.1%,但现今农机、农业用能投入与发达国家比仍相对不足,具有较大上升空间。

第二综合因素为市场的作用,33年间农业占农林牧渔业的比重由0.756%减至0.524%,其每减少1%将促使农业经济长短期分别增长0.135%、0.123%,农产品生产价格指数每增加1%,仅仅刺激农业经济长短期分别增长0.14%、0.126%,这与农业生产价格指数上升造成农业部门成本增加的压力过重,利润预期的减少降低了农业从业人员进行农业生产的积极性有关。

第三综合因素为自然制约条件,其中农作物总播种面积每减少1个百分点,从长期来看,我国农业经济将萎缩0.136%,短期减产0.12%;我们发现,受灾面积对农业总产值的增加起到微弱正向作用,与我们的认知相矛盾,这可能是由于随着国家的发展,我国应对自然灾害的能力得到较大提升,灾害的负面影响被预防灾害与抗灾的日趋完善的工作体系和能力消除所造成的。

第四综合因素为农业生产资本投入,33年间国家财政农业支出由150亿元增加至12 387.6亿元,年均增长250.3%,其增加1个百分点将促进我国农业经济长期上增长0.133%和短期上增长0.114%。

第五综合因素为农业生产技术,33年间反映农业生产技术的农村中学师生比由0.053 591增加到0.099 9人,其每增长1%,长、短期上推动农业经济增长0.075%、0.057%。

第六综合因素为人力资源,我国农业从业人员一个百分点的增长,仅仅使农业总产值长、短期上分别增长0.01%、0.022%,其贡献微弱与我国农业劳动力过剩及农业部门生产效率低下有关。

4 政策启示

农业生产条件是影响我国农业经济发展的最主要因素,必须通过改善我国农业生产条件、加大先进农机设备研发投入、保障能源供给、合理化农业用能结构和布局、建立农业机械化公共服务体系及发展机械与水利配套基础设施、提升农机作业服务的组织化程度来实现我国农业生产现代化,并缩小与发达国家的差距。化肥与农药的使用虽然对农业生产有着显著的短期作用和较长的持续效应,却也严重影响了我国农业持续健康发展。据此,我国农业发展必须谨慎合理的使用化肥农药,要在增加土壤肥力、提升土壤有机质的同时,最大程度的减轻对环境的污染,并通对农业环境的治理保障我国粮食生产的安全性与可持续性,加大宣传力度,使绿色生产、绿色消费观念的深入人心。

在社会主义市场经济大背景下,农业经济部门逐渐并入市场经济体系,此对农业经济增长既是挑战亦是机遇,建立健全农业生产信息的传播机制以及完善农产品市场信息系统成为必要,以此确保市场信息的及时性与易得性,充分发挥市场的作用来稳定农产品市场价格以及优化农业产业结构。同时,要继续完善最低收购价和临时收储政策、增加国家财政农业支出用于保护农业的补偿性支出来保护和调动主产区积极性,切实保护农、牧、渔民的切身利益,维护社会稳定和整个国民经济的稳定发展。

面对我国农业生产自然制约条件,我国需要健全国家及地区间自然灾害预警与应对协调机制,加强自然灾害的防治能力,并且采取有力措施坚守耕地保护红线,划定永久保护基本农田,在扎实推进农村土地整治的同时抑制城市的无序扩张,并以此制定《中华人民共和国粮食安全法》使之成为中国粮食安全的法律保障,确保我国的粮食安全。

农业发展的出路在于稳步推进劳动密集的资源依赖型发展模式向现代化的科技知识推动型的转变。首先,国家财政支出需要增加向农村的教育、经济、农业科研与技术推广等方面的投入,不仅可以改善农村教育教学条件、提升农村教育水平,而且对提升农民素质、提高农业科学技术转化为生产力的效率和农业从业人员的创新能力与劳动生产率具有长远效应。其次,政府要切实落实强农惠农富农政策,加大培育新型经营主体的力度,稳步加快推进关键技术入户到位,鼓励发展规模经营,促进种粮水平和效益提高,进而确保我国农业经济持续增长,牢固农业基础地位。

参考文献:

[1] Population redistribution and economic growth: United States, 1870-1950[M]. American philosophical society, 1964.

[2] Hayami Y, Ruttan V W. Agricultural development: an international perspective[M]. Baltimore, Md/London: The Johns Hopkins Press, 1971.endprint

[3] Knight M, Loayza N, Villanueva D. Testing the neoclassical theory of economic growth: a panel data approach[J]. Staff Papers-International Monetary Fund, 1993: 512-541.

[4] Deininger K, Jin S, Xia F. Moving off the farm: Land institutions to facilitate structural transformation and agricultural productivity growth in China[J]. 2012.

[5] Hu Y. A study of the correlation between agricultural economic growth and agricultural agglomeration in China[J]. Journal of Chemical and Pharmaceutical Research, 2014, 6(6): 1878-1881.

[6] Awokuse T O, Xie R. Does agriculture really matter for economic growth in developing countries?[J]. Canadian Journal of Agricultural Economics/Revue canadienne d'agroeconomie, 2014.

[7] Tiao,G..C. and Box,G..E..Modeling Multiple Times Series with Applications [J]. Journal of the American Statistical Association,1981,(76).

[8] 王汉章,李上炸,刘伯恩.财政支农支出对农业GDP长期影响的实证分析.中央财经大学学报[J],2009(5).

[9] 魏朗.财政支农支出对我国农业经济增长影响的研究——对1999-2003年农业生产贡献率的实证研究[J].中央财经大学学报,2007(9).

[10] 李国璋,周琦.我国农业产值的影响因素分析.统计与决策[J],2007(22).

[11] 裴辉儒. 我国农业信贷与农业经济增长的相关性研究 [J]. 农业技术经济, 2010, 2: 31-41.

[12] 孙敬水, 董亚娟. 人力资本与农业经济增长: 基于中国农村的 Panel daa 模型分析[J]. 农业经济问题, 2006 (12): 12-16.

(责任编辑:刘昀)endprint

[3] Knight M, Loayza N, Villanueva D. Testing the neoclassical theory of economic growth: a panel data approach[J]. Staff Papers-International Monetary Fund, 1993: 512-541.

[4] Deininger K, Jin S, Xia F. Moving off the farm: Land institutions to facilitate structural transformation and agricultural productivity growth in China[J]. 2012.

[5] Hu Y. A study of the correlation between agricultural economic growth and agricultural agglomeration in China[J]. Journal of Chemical and Pharmaceutical Research, 2014, 6(6): 1878-1881.

[6] Awokuse T O, Xie R. Does agriculture really matter for economic growth in developing countries?[J]. Canadian Journal of Agricultural Economics/Revue canadienne d'agroeconomie, 2014.

[7] Tiao,G..C. and Box,G..E..Modeling Multiple Times Series with Applications [J]. Journal of the American Statistical Association,1981,(76).

[8] 王汉章,李上炸,刘伯恩.财政支农支出对农业GDP长期影响的实证分析.中央财经大学学报[J],2009(5).

[9] 魏朗.财政支农支出对我国农业经济增长影响的研究——对1999-2003年农业生产贡献率的实证研究[J].中央财经大学学报,2007(9).

[10] 李国璋,周琦.我国农业产值的影响因素分析.统计与决策[J],2007(22).

[11] 裴辉儒. 我国农业信贷与农业经济增长的相关性研究 [J]. 农业技术经济, 2010, 2: 31-41.

[12] 孙敬水, 董亚娟. 人力资本与农业经济增长: 基于中国农村的 Panel daa 模型分析[J]. 农业经济问题, 2006 (12): 12-16.

(责任编辑:刘昀)endprint

[3] Knight M, Loayza N, Villanueva D. Testing the neoclassical theory of economic growth: a panel data approach[J]. Staff Papers-International Monetary Fund, 1993: 512-541.

[4] Deininger K, Jin S, Xia F. Moving off the farm: Land institutions to facilitate structural transformation and agricultural productivity growth in China[J]. 2012.

[5] Hu Y. A study of the correlation between agricultural economic growth and agricultural agglomeration in China[J]. Journal of Chemical and Pharmaceutical Research, 2014, 6(6): 1878-1881.

[6] Awokuse T O, Xie R. Does agriculture really matter for economic growth in developing countries?[J]. Canadian Journal of Agricultural Economics/Revue canadienne d'agroeconomie, 2014.

[7] Tiao,G..C. and Box,G..E..Modeling Multiple Times Series with Applications [J]. Journal of the American Statistical Association,1981,(76).

[8] 王汉章,李上炸,刘伯恩.财政支农支出对农业GDP长期影响的实证分析.中央财经大学学报[J],2009(5).

[9] 魏朗.财政支农支出对我国农业经济增长影响的研究——对1999-2003年农业生产贡献率的实证研究[J].中央财经大学学报,2007(9).

[10] 李国璋,周琦.我国农业产值的影响因素分析.统计与决策[J],2007(22).

[11] 裴辉儒. 我国农业信贷与农业经济增长的相关性研究 [J]. 农业技术经济, 2010, 2: 31-41.

[12] 孙敬水, 董亚娟. 人力资本与农业经济增长: 基于中国农村的 Panel daa 模型分析[J]. 农业经济问题, 2006 (12): 12-16.

中国出口商品结构的主成分分析 篇4

中国出口商品结构的主成分分析

对外贸易对经济增长的推动作用是很大的,作为对外贸易的基础,出口对经济增长的推动作用更加明显.按产品附加值大小可以将出口商品划分为十类,对按结构划分的`中国出口产品进行主成分分析,可以发现中国出口数据的规律性.通过对数据分析,说明中国应扩大出口,进一步优化出口商品结构,以促进中国经济的快速发展.

作 者:蒋茂军 JIANG Mao-jun 作者单位:河北经贸大学,商学院,河北,石家庄,050061刊 名:经济与管理英文刊名:ECONOMY AND MANAGEMENT年,卷(期):200519(10)分类号:F259.23关键词:商品结构 附加值 主成分分析 累计贡献率

主成分分析与回归分析 篇5

利用主成分分析法对航天产品质量评估

航天产品系统庞大而复杂,影响质量的`因素也多种多样,量化评估一直是难题.针对航天产品在靶场测试发射时出现的质量问题进行分析研究,利用主成分分析法有效地实现了产品质量评估模型的建立和量化评估分析,对航天产品的质量快速评估有很好的实用价值.

作 者:游彦雯 张平王宇虹 郭先锋 YOU Yanwen ZHANG Ping WANG Yuhong GUO Xianfeng  作者单位:太原卫星发射中心,试验技术部,山西,太原,030027 刊 名:装备指挥技术学院学报  ISTIC英文刊名:JOURNAL OF THE ACADEMY OF EQUIPMENT COMMAND & TECHNOLOGY 年,卷(期): 19(2) 分类号:V417.7 关键词:主成分分析   航天产品   质量  

主成分分析与回归分析 篇6

主成分分析法和Fisher判别方法在汽油分类分析过程中的应用

摘要:应用主成分分析(principal component analysis,PCA)法对从90#和93#两种汽油的50个实验样所取的特征数据进行降维处理,再结合Fisher判别方法对这两种汽油进行分类,并将分类结果与不采用PCA法而直接计算数据所得出的Fisher判别结果进行比较,前者的.分类正确率达到100%,而后者却只有50%.结果说明采用PCA方法事先对数据处理可以大大的提高汽油分类的准确性.作 者:王荣辉 宗若雯 王正洲 廖光煊 WANG Rong-hui ZONG Ruo-wen WANG Zheng-zhou LIAO Guang-xuan 作者单位:中国科学技术大学火灾科学国家重点实验室,安徽合肥,230027期 刊:中国科学技术大学学报 ISTICPKU Journal:JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA年,卷(期):2006,36(12)分类号:X928.7关键词:主成分分析 Fisher判别方法 汽油

主成分分析与回归分析 篇7

电力预测是指利用历史数据来预测未来时刻的用电量,是能量管理系统(EMS)的一个重要组成部分,在我国的电力系统管理中已经成为现代化管理不可或缺的因素,在电力系统制定地区间的功率传输方案与负荷调度方案时具有重要作用。有效提高电力预测精度,有助于电力系统经济运行,是合理进行电力系统调度、用电与规划的重要依据之一。

1主成分分析算法原理

主成分分析是一种统计方法。当处理实际问题遇到多个变量之间可能存在一定的相关性,并且变量的个数较多且变量之间存在复杂的关系时,通过主成分分析可以达到降维减轻分析难度的目的。该方法原理为将原来众多具有一定相关性的变量,重新组合成为一种新的相互无关的综合变量,主要步骤如下:

(1)对原始数据进行标准化处理,若样本数据矩阵如下:

对原始数据进行标准化处理:

其中:

(2)计算样本相关系数矩阵:

(3)计算相关系数矩阵R的特征值和相应的特征向量:

特征值:λ1,λ2,…λp。

特征向量:ai=(ai1,ai2,…aip),其中i=1,2,…,p。

(4)选择重要的主成分:由主成分分析算法可以得到p个主成分,根据主成分的贡献率大小来选择前n个主成分。此处的贡献率指的是某个主成分的方差占全部方差的比重,即某个特征值占全部特征值和的比重。

(5)计算主成分得分:

具体形式如下:

其中,i=1,2,…,n;j=1,2,…,k。

(6)根据主成分分析的数据对后续问题进行评估分析。

2多元回归算法原理

多元回归是一种处理变量的统计相关关系的数理统计方法,其基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能代表它们之间关系的数学表达形式。其模型及矩阵表示如下:

随机变量y受p个非随机因素x1,x2,…,xp和随机因素ε的影响,即:

y=β0+β1x1+…+βpxp+ε

式中,y为被解释的变量;xi为解释变量;ε为不可测的随机误差,且通常假定ε~N(0,δ2)。

E(y)=β0+β1x1+…+βpxp被称为理论回归方程。

对于一个实际问题,要建立多元回归方程,首先要估计出未知参数β0,β1,…,βp。为此我们要进行n次独立观测,得到n组样本数据(xi1,xi2,…,xip;yi)。即有:

上式又可表示为:

其中:

In为n阶单位矩阵;X为n×(p+1)阶资料矩阵并为满秩。

3构建模型与预测步骤

3.1使用主成分分析的多元回归算法预测用电量

建模和预测的大致步骤如下:

(1)读取表格里的历史用电数据;

(2)形成主成分分析的样本;

(3)主成分分析计算相应权值;

(4)构成主成分因素与驱动因素的关系;

(5)重构输入空间做多元回归的输入;

(6)多元回归训练计算相应权值;

(7)构建多元回归分析模型;

(8)获取预测值;

(9)与实际值相比较进行误差分析与统计。

3.2案例分析(数据来自互联网)

采用广东电网公司2014—2016年每月数据的部分作为训练样本(表1),使用主成分分析法对数据进行预处理作为多元回归的输入进行预测。

预测结果如表2和表3所示。

由表2、表3可知主成分分析的多元回归预测方法相对误差(准确率)绝对值在2.17%~2.86%之间,其中最大误差为2.86%,最小误差为2.17%。

4结语

通过上例可以看出,主成分分析在保留电力数据主要信息的前提下,除去了数据间的相关性,达到了降维重构空间的目的,将重构的空间作为多元回归的输入不仅减少了输入量而且提高了预测的精确度,由此可见,这是一种可行和有效的预测方法。

摘要:在电力生产部门,电力预测一直是一项重要工作,通过引入多元回归算法建立相应的模型能提高电力预测的精确程度。多元回归是一种处理变量的统计相关关系的数理统计方法,现通过主成分分析来重构输入空间,以改进模型预测精度。

关键词:电力预测,主成分分析,多元回归算法,模型

参考文献

[1]程其云,王有元,陈伟根.基于改进主成分分析的短期负荷预测方法[J].电网技术,2005,29(3):64-67.

[2]牛东晓,曹树华,赵磊,等.电力负荷预测技术及其应用[M].北京:中国电力出版社,1998.

[3]李慧姣.基于主成分分析法的遗传神经网络短期负荷预测的研究[D].长沙:湖南大学,2012.

主成分分析与回归分析 篇8

关键词:白菜;种质资源;主成分分析;聚类分析

中图分类号: S634.302.4 文献标志码: A 文章编号:1002-1302(2014)03-0106-03

白菜(Brassica campestris ssp. chinensis Makino)别称青菜、小白菜,北方也称油菜,是我国重要的十字花科蔬菜,在蔬菜周年生产和供应上占有重要地位[1]。白菜在南京地区栽培历史悠久,种植面积很大,因此南京地区白菜种质资源丰富。本研究通过收集南京地区地方品种种质资源及市场上的主栽品种,分析南京地区白菜种质遗传多样性,以筛选优良种质进行保存利用。

1 材料和方法

1.1 试验材料

试验材料为江苏省南京市蔬菜科学研究所收集,来源于南京市市场销售的纯度较高的白菜品种和常见的地方品种,详见表1。

1.2 试验方法

1.2.1 试验设计 2012 年春秋2季在江苏省南京市蔬菜科学研究所试验基地直播种植,采用随机区组设计,3 次重复,每小区种植50株,施肥量、水分管理和病虫害防治等根据生产实际实施。

1.2.2 性状观察记载 在白菜采收期,每个小区随机抽取5株调查株型、株高、开展度、成叶数、叶形、叶色、叶长、叶质量、叶宽、叶柄形、叶柄色、叶柄长、叶柄上下宽、叶柄质量等性状,然后将质量性状赋值以进行分析[2],具体赋值见表2。

1.2.3 数据处理方法 采用SPSS 19.0进行数据分析。首先将数量性状和质量性状的数据进行标准化,再进行主成分分析,获得特征值和特征向量,以欧氏距离为聚类统计量,采用最远距离法进行主成分聚类分析并形成树状图。将聚类结果转换为协表征矩阵,用Macomb程序对聚类结果和相似系数矩阵之间的相关性进行Mantel检验[3]。

2 结果与分析

2.1 形态性状的多样性分析

表3表明,不同的种质之间存在很大的变异,各性状在不同材料之间表现出了不同程度的多样性。在观察的15个性状中,平均变异系数为30.35%,其中叶柄长的变异系数最大,为58.48%;其次为株型、叶柄质量和叶形;变异系数最小的是开展度,仅为12.30%。变异系数的大小与性状的变异范围成正相关,即变异系数越大,表明性状的变异范围越大。当然,表型性状的变异系数是在赋值后计算出来的,因此不同性状之间赋值的差异也影响着变异系数的大小[4]。

2.2 主成分分析

表4表明,前4个主成分的贡献率依次为35.656 1%、20871 4%、15.339 2%和8.538 6%,累计贡献率为 80.405 3%,可以用来进行聚类分析。第1主成分中叶长、叶宽和叶质量绝对值较大,表明第1主成分反映的主要是叶片指标;第2主成分中叶柄宽和叶柄质量的绝对值较大,表明第2主成分反映的是叶柄指标;第3主成分中株型和株高的绝对值较大,表明第3主成分反映的是外形指标;第4主成分中叶色和叶柄色的系数绝对值较大,表明第4主成分反映的是颜色指标。因此,本研究中对白菜种质进行分类依次考虑的指标分别为植株叶片、叶柄、植株外形和颜色等4个指标。

2.3 聚类分析

根据主成分表达式计算出各个品种的4个主成分值进行聚类分析(图1)。供试的50份种质在遗传距离为17.5时,能够分为三大类:第一大类为夏播品种。包含20份种质,分为2个亚组,第1亚组以华冠为代表的耐热杂交白菜品种,株型美观,商品性好;第2亚组包含黄心菊3份种质。第二大类为秋播品种。包含26份种质,同样可以分为2个亚组,其中第1亚组包含矮脚黄等11份种质,以地方品种为主,品种外观一般;第2亚组包含精华等15份种质,是市场上的杂交秋播品种,具有叶片卵圆、叶色浅、株型美观的特点。第三大类为腌制品种。包含高梗白等4份种质,是当地常用的腌制品种,具有植株高、叶柄多的特点,其中高梗白和箭杆白叶片少,中其白和无锡白叶片多[5]。

将聚类结果转换为协表征矩阵,对协表征矩阵和相似系数矩阵的相关性进行Mantel检验,结果表明2种矩阵极显著相关,相关系数为0.80,说明聚类结果能很好地体现种质之间的遗传关系[6]。

3 结论与讨论

以表型性状作为形态学标记进行种质资源的遗传分析,是其他分析手段的基础,也是目前许多不具备分子标记分析手段植物的主要分析方法,通过主成分分析能够对表型性状作进一步的分析,以便可以在不损失或很少损失原有形态性状信息的前提下,将原来的多个性状转换为个数较少而且不相关的综合指标,从而简化表型性状的分类工作[7],减少聚类分析的误差。

本研究中的50份种质能够分为3类,其中第1类具有较强的耐热性,包括具有一定耐热性的五月慢、四月慢等前期耐寒、后期耐热的耐抽薹品种,但是本研究中并没有进行耐热性检验,表明目前新品种选育中存在相互模仿,甚至造成异名同种或者同名异种等破坏市场秩序的行为,这与市场实际情况相符合。同时,这类包含2个具有耐寒性的黄心菊品种,因此有必要进一步检验黄心菊种质的耐热特性。本研究中的聚类分析结果与种质比较明显的特征植株颜色关系不大,颜色对种质资源的分类不具有决定性作用。

随着现代分子生物技术的快速发展,尤其是分子标记技术的成熟应用,结合形态学标记,能够准确地研究种质之间的遗传关系。但是分子标记技术的大规模利用还主要集中在一些模式植物中,在许多蔬菜作物中目前还没有条件开展分子水平的研究。利用杂种优势、开发适合现代农业产业发展要求的新品种同样迫切[8],因此,作为育种研究的基础,种质资源的保存、研究及利用都是现代育种工作的一部分。利用相对传统的形态学标记,结合有效的生物学统计方法能够提供一条可行的研究道路,从而提高育种效率,为地方种质资源的保护等工作构建基础、提供依据。

参考文献:

[1]成素云. 不结球白菜雄性不育新种质P70-203的研究及杂交种指纹图谱鉴定[D]. 南京:南京农业大学,2009.

[2]孔秋生. 萝卜种质资源多样性和亲缘关系的研究[D]. 武汉:华中农业大学,2003.

[3]韩建明. 不结球白菜种质资源遗传多样性和遗传模型分析及bcDREB2基因片段克隆[D]. 南京:南京农业大学,2007.

[4]孙 继,叶利勇,陶月良.芜菁种质资源形态性状的多样性分析[J]. 浙江农业科学,2007(3):248-251.

[5]曹寿椿,李式军. 白菜地方品种的初步研究 Ⅲ. 主要生物学特性的研究[J]. 南京农业大学学报,1981(1):40-48.

[6]于爱霞. 三色堇自交系遗传多样性评价及化学去雄的初步研究[D]. 武汉:华中农业大学,2012.

[7]赵德新,孙治强,任子君,等. 茄子形态学性状主成分分析及聚类分析[J]. 河南农业大学学报,2009,43(4):393-397.

[8]王胜军,陆作楣,万建民. 采用表型和分子标记聚类研究杂交籼稻亲本的遗传多样性[J]. 中国水稻科学,2006,20(5):475-480.

上一篇:电站电站安全生产目标管理下一篇:未来“亚盟“的探讨论文