样本选择与数据采集
本章主要介绍拟在其后各章节使用到的研究样本及其选择依据,并对样本数据做规范性分析和预处理,所得结果将成为后文实证研究的基础。对这些数据的具体使用方法将在各相关章节中专门介绍。
如无特别说明,本书使用的数据均主要来自聚源数据库、国泰安数据库(CSMAR)、Wind资讯终端、天天基金网等。数据预处理使用Excel 2003,数据分析使用Eviews 6.0、SPSS 17.0、R语言等。
第一节 大盘指数数据采集与分析
应第二章关于EMH与FMH的讨论,本章首先考察大盘指数的波动特征,进一步从逻辑分析和数理统计上揭示市场运行的真实现状和内在规律。本节的目的在于还原我国开放式基金的生存环境。正如本书在随后章节展示的那样,该现实环境既是开放式基金投资能力不足的原因,同时也是开放式基金投资能力不足导致的结果。
如果市场是强式有效的,则指数收益率应服从正态分布。此时,指数的波动是连续的、温和的,超出某一范围的概率比较小。但在现实中,股市的暴涨暴跌常常发生,造成投资者的持仓或投资组合市值在短期内快速下跌,甚至可能引发诸如2007~2008年的全球金融危机,从而给整体经济带来灾难。
国内在实证研究时通常采用上证指数(SSE)作为我国A股指数的大致替代。上证指数是借鉴美国、日本、中国香港、中国台湾等国家和地区的股指编制方法而编制成的。它依据派氏加权指数编制原理[1],采用市价总值加权方法得到,权数为股票发行量,计算公式为
上证指数自1990年12月19日开始编制,基期点数