主成分分析及因子分析在股指中的应用
摘 要
股价指数一直以来被称为国民经济的晴雨表。近年来,我国证券市场发展迅速,指数化投资规模日益扩大,但股价指数的开发相对滞后,投资者对指数缺乏深刻认识,限制了指数型产品的创新。因此,对股价指数进行定量分析显得尤其重要。很多机构在编制股价指数时,常常把成分股纳入四大分类指数:金融指数、地产指数、工商指数和公用指数。本文通过对这四大指数进行主成分分析、因子分析,来判断不同时期股价指数的整体情况,再采用协整分析法来表明各股价指数间的均衡关系。
主成分分析是将多个指标化为少数指标的一种统计方法。本文首先对四大指数进行主成分分析,在SPSS主成分分析结果中,可以看出,累计贡献率在95.485%的特征值有两个,即前两个主成分已经表达四大指数所反应的信息。通过初始因子载荷矩阵可以计算出两个主成分的特征向量,从而得到这两个主成分的表达式。
在对四大指数进行因子分析时,采用方差极大化正交旋转,确定了两个具有经济意义的公因子:基本上支配了金融、地产、工商三大指数的盈利因子和基本上支配了公用指数的公用因子。根据主成分的得分系数矩阵,可以得到股价指数的因子得分模型,以表明各个主成分的评价得分。进行因子分析后,由因子得分和各因子的方差贡献率的比重作为权重进行加权汇总,得出各时段股价指数的综合得分表达式。
在研究时间序列之间的关系时,对明显的非平稳序列之间做回归,将会出现错误的结论即“伪回归”问题,本文采用协整分析法来确定非平稳时间序列之间的关系。首先对四大股价指数进行单位根检验,得出四大指数都是一阶单整序列。再采用最小二乘法进行协整检验,因为检验的残差序列具有平稳性,因此,四大股价指数之间是协整的,即它们之间存在长期均衡关系。
关键词:主成分分析 因子分析 协整分析
Principal Component Analysis and Factor Analysis of The Stock
Abstract
Stock price index has always been playing the role of barometer of national economy. In recent years, with the rapid development of securities market, the scale of investment is getting larger. However, the innovation process of index products is still restricted because of comparable slow development of stock price index and inventors’ inadequate knowledge about index. Therefore, quantitative analysis upon stock price index is very vital and indispensible. Many institutions take component-shares as one of the four indices which are financial index, estate index, commercial index and public index. This paper aims to figure out the general situations of stock price index during different periods by analyzing both main components and factors of the four indices. Then shows the balance relations among stock price indices by using Co-integration analytical method.
Main-component analysis is a statistic method that changes several indices into fewer indices. In this paper, main-component analysis of the four indices will firstly be given. From the main-component analysis results of SPSS, we can see there are two eigenvalue whose accumulate contribution rates are at 95.485%, which means former two main components have already indicate all information that the four indices want to show. And expressions of the two components can be worked out after knowing their eigenvectors which may be gained through original gene-load matrix.
When analyze the factors of the four indices, we will obtain two common factors which owns economical effects by the means of variance maximum orthogonal rotation. One is a profitable factor that basically dominates financial index, estate index and commercial index, three of the four indices. The other is a common factor that basically controls the public index. According to the main-component scoring coefficient matrix, we can get the factor scoring model of stock price index so as to show evaluating score of separate main component. After the analysis towards factors, taking the proportion of factor scoring and separate variance contribution rate as standard to evaluate generally, we can finally figure out a general scoring expression of stock price index during every period.
During the process of research the relation between time sequences, making regresses between apparent unstable sequences will be ended up wrong conclusion, which might be “false regress”. This paper adopts Co-integration analytical method to assure the connections between unstable sequences. First of all, make an inspection towards unit roots of the four stock price indices in order to prove that they are all Integration Process sequences. Then make full use of least-two multiplication to Co-integration inspection. For those inspected residual sequences boast stability, the four stock price indices are Co-integrated. That is to say that there are long-term balanced relations among them.
Keywords:Principal component analysis; Factor Analysis; Co-integration
目 录
摘 要 1
Abstract 2
目 录 4
第一章 绪论 1
1.1 研究动机和目的 1
1.2 研究的背景 1
1.2.1 股价指数发展现状 1
1.2.2 股指的分类和功能 2
1.2.3 我国的指数体系 2
1.2.4 我国股价指数在指数化投资中的应用 2
1.3 研究方法与系统描述 3
1.3.1 主成分分析法 3
1.3.2 因子分析法 3
1.3.3 协整分析 4
1.4 论文内容概述 4
第二章 主成分分析 5
2.1 主成分分析法 5
2.1.1 主成分分析法的定义 5
2.1.2 主分成分析原理 5
2.1.3 主成分分析数学模型 5
2.1.4 进行主成分分析主要步骤如下: 6
2.2 主成分分析法关于股指联系的实例研究 6
2.2.1 变量与数据的选取 6
2.2.2 结合SPSS的运行结果进行主成分分析 6
第三章 因子分析 9
3.1 因子分析法 9
3.1.1 因子分析的定义 9
3.1.2 因子分析的原理 9
3.1.3 因子分析数学模型 9
3.1.4 行主成分分析主要步骤如下: 10
3.2 因子分析法关于股指联系的实例研究 10
第四章 协整分析 13
4.1 伪回归 13
4.2 协整分析法 14
4.2.1 单位根过程 14
4.2.2 协整(Cointegration)过程 15
4.3 协整分析法关于股指联系的实例研究 15
4.3.1 单位根检验 15
4.3.2 协整分析 16
第五章 结论 17
致 谢 18
参考文献 19
第一章 绪论
1.1 研究动机和目的
指数开发和指数化投资实践之间的相互促进源于指数化策略的兴起。在海外市场,随着股价指数数量的膨胀,指数化投资在20世纪90年代以来大行其道。我国04年出现指数基金产品至今,指数基金规模年均增长率超过380%,但股价指数的开发相对滞后,投资者对指数缺乏深刻认识,限制了指数型产品的创新[1]。目前市场上的指数主要源于专业化指数服务商或研究、资讯机构。在这一背景下,我们对07年以来新发基金的业绩基准进行统计却发现业绩基准相当集中,从侧面反映出业内对指数缺乏系统认识和评价。
股价指数反映股份上市公司整体的股价,也就是公司的市值。而一个国家的主要经济支柱就是那些大型的股份上市公司,这些公司的状况直接反映这国家的核心实力。从某种意义上来说,股价指数是国民经济的晴雨表。因此,研究股价指数具有重要意义。
股价分类指数就是对某个行业的全体股票进行加权平均的指数,比如金融指数、地产指数。很多机构在编制股价指数时,常常把成分股纳入四大分类指数:金融指数、地产指数、工商指数和公用指数。本文通过对这四大指数进行主成分分析、因子分析,来判断不同时期股价指数的整体情况,又通过协整分析来表明各股价指数间的均衡关系。
1.2 研究的背景
1.2.1 股价指数发展现状
股价指数的内涵并非始终如现在一样丰富,在人们关注于指数化投资带来的收益机会之前,任何市场的指数体系都缺乏足够的生命力。我们都知道历史悠久的道琼斯工业平均指数(DJIA)和S&P 500指数,也因为科技股泡沫而了解纳斯达克指数,但所有人都不曾想像,如今这些指数,只是美国股票市场庞大指数系统的冰山一角;股价指数早已迈出多样化的步伐。
首先,股价指数的多样化表现为分类细致、数量繁多。现在,在股票价格指数体系最为复杂的美国,股指数量异常庞大,分类极为细致。以道琼斯指数公司为例,其每天计算和发布的指数就包括20多个系列,数量超过2万条。这些指数覆盖了全球各主要市场,既可以从行业角度进行细分,也可以从公司市值、投资风格等角度进一步分解。
其次,股价指数的开发走向商业化。股价指数已经不再从交易所表征市场的需要进行开发,第三方机构逐渐取代了交易所的地位,股指开发渐渐走向商业化。如今,法兰克·罗素(Frank Russell)、威尔希尔(Wilshire Associate)、道琼斯、标准普尔、MSCI和晨星已成为美国市场上主流的指数供应商。
最后,指数的爆发增长和指数产品的兴盛相互促进。与指数数量几何增长,指数公司快速发展相对应的是指数化产品的极大丰富:指数基金、ETF、指数期货和期权、指数联动型债券、指数联动型存款等金融创新层出不穷。
1.2.2 股指的分类和功能
正如我们看到的那样,如今的股价指数体系已经极为丰富。以美国为例,其股价指数体系涵盖了全球指数、区域指数、细分行业指数、风格指数,以及衍生于不同特征的混合指数。这既是指数化投资在美国盛行的原因,也是指数化策略推动的结果。
中国的指数可分为两类:一类为综合指数,一类为成份指数。 简单地讲,前者是把所有的股票即刻价格加权平均,后者是把某些有代表性的股票的即可价格加权平均。前者有沪市的上证指数,深市的综合指数,后者有沪市的30指数,深市的成份指数。分类指数就是对某个行业的全体股票进行加权平均的指数,比如金融指数、地产指数。
除了传统的市场表征功能,股价指数还逐渐衍生出投资性和可交易性。我们通常只看到指数的标尺功能,但指数的可交易性和可投资性才是其更核心的内容。从这两个维度出发,股指分为交易性指数和投资性指数。其中,可交易性侧重于描述指数用于开发金融衍生产品的特征,关注于指数成分股的流动性、指数的抗操纵能力,以及指数编制主体的独立性和客观性;对可投资性的挖掘主要是出于指数化投资的需要,因此关注于指数成分的成长性、稳定性、可复制性,并且注重指数编制方案的透明性。
1.2.3 我国的指数体系
我国指数型产品发行较晚,这与国内指数体系的粗放局面有一定关系。中证指数公司成立之前,我们熟悉的股价指数几乎全部源于交易所编制的市场基准指数。2014年ETF产品诞生之后,这种局面逐渐改善。我们看到,随着金融创新的深入,更多的指数已经开始进入投资者的视野。
目前,我国股票市场现有的股价指数主要源于两类机构:一类是专业化指数提供商或研究、咨询机构,如中证指数有限公司、中信标普指数信息服务(北京)有限公司、摩根斯坦利国际资本公司、新华富时指数有限公司、申银万国证券研究所、道琼斯指数公司和Wind资讯。第三方机构编制的指数从数量上来看已经成为主体。另一类机构是上海和深圳证券交易所。由于历史原因,交易所编制的指数依然深入人心。在这种局面下,新编制的指数很难推广,在一定程度上挫伤了指数开发的积极性。
1.2.4 我国股价指数在指数化投资中的应用
在我国,股价指数长期来仅限于交易所指数,第三方机构(包括国内券商、咨询机构、指数公司,以及国外指数公司)编制的指数数量有限并且推广不力;2014年以后,随着指数基金的推出,尤其是ETF产品的开发,股价指数的编制逐渐形成了以第三方机构为主的格局。但到目前为止,我们的金融工具依然比较匮乏,指数期货尚未推出,指数也仅用于作为基金业绩基准,或开发ETF。尽管近年来从不同的方法、不同的角度推出了许多指数,但普遍认同度不高,很难有效推广,这也反过来限制了指数的发展。
一部分指数已经被广泛用于基金业绩评价,或者开发指数化产品。按照2017年年报公布的数据统计了以不同指数为业绩比较基准的189只股票型基金的总市值,及其投资于股票的市值规模,结果发现无论从数量来看,还是从覆盖的市值规模来看,沪深300指数、新华富时A600指数、中信标普300指数和新华富时A201指数是目前我国大部分股票型基金的业绩比较标准。以这四只指数为业绩基准的股票型基金覆盖了股票型基金64.99%的总市值,集中度非常高。这反映了两个方面的问题:第一,业绩基准集中表明基金管理人认识到市场上好的基准指标寥寥可数,指数的开发还存在很大空间;第二,我们通过与基金的交流也发现,在业绩基准的选择上,基金还缺乏相应的标准。结果大家选择业绩基准很可能扎堆,结果投资品种又出现同质化的倾向,这样将增大市场风险。
1.3 研究方法与系统描述
1.3.1 主成分分析法
主成分分析是将多个指标化为少数指标的一种统计方法。它是多元统计分析的重要组成部分,是著名的美国心理学家、统计学家斯丕曼(Chales Spearman)于1904年发明的[2]。它使各个测量相同本质的变量归入一个因子,使分散而复杂的测量,趋向整体和简单化。同时,便于掌握各个测量要素背后隐含的内在因素,从而找出各复杂因子的主要成分,实现指标的简化。抓住有代表性的少数指标去进行评价,达到指标筛选的科学化。本文通过对金融、地产、工商四大股价指数进行主成分分析,结合SPSS主成分分析结果得到主成分的表达式。
1.3.2 因子分析法
因子分析的目的,从理论上讲,是研究原始变量的内部关系,简化原变量的协方差结构,分析变量中存在的复杂关系;从应用上讲,是寻找众多变量的公共因子,即探讨多个能直接测量且有相关性的指标是如何受少数几个不能直接测量的相对独立的因子支配的[3]。因子分析法根据相关性的大小把变量分组,使得同组内的变量间相关性(共性)较高,而不同组的变量相关性较低。于是,从实际意义上说,每组代表一个方面(因子);从统计学上说,每组代表原协方差结构的一个基本结构。本文通过对金融、地产、工商四大股价指数进行因子分析,结合SPSS因子分析结果得到因子得分模型和股价综合得分表达式。
1.3.3 协整分析
协整理论是用来分析经济变量之间的长期关系的,其基本思想是,尽管许多经济变量随时间呈现很强的非平稳性,但一组变量在某段时间间隔内有保持一组线性关系的趋势,那么协整就有助于去发现这种趋势[4]。本文首先对各变量进行单位根检验,如果发现各变量均有单位根,且有同次差分变成了平稳系列,就根据最小二乘法进行协整检验,以确认各变量之间是否有长期均衡关系,最终得到四个股价指数的协整模型。
1.4 论文内容概述
第一章:绪论
股价指数的研究动机与目的、研究背景、研究方法与系统描述和论文內容概述。
第二章:主成分分析
先详细介绍主成分分析法的定义、原理、数学模型和主要分析步骤,再结合SPSS主成分分析结果对四大股价指数进行实例分析,最后得到主成分表达式。
第三章:因子分析
先详细介绍因子分析法,再结合SPSS因子分析结果对四大股价指数进行实例分析,最后得到股价指数的因子得分模型和综合得分表达式。
第四章:协整分析
先对伪回归现象进行论述,引出需要采用协整方法对股价指数间的关系进行分析,再结合EVIEWS协整分析结果后对股价指数进行实例分析,最后得到四个股价指数的协整模型,表明它们之间存在长期均衡关系。
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 11-28
- 10-02
- 05-04
- 05-15
- 07-13
- 05-22
- 09-14
- 03-13
- 08-12
- 07-28
- 05-19