|
||||
——2013年A股市场量化策略动态监测
·上证综指预测:2013年A股市场整体有望“震荡上行”,其中3月可能震荡调整,4、5月有望迎来年内第二波上涨行情,但上涨动能会弱于去年12月以来的这轮反弹;6、7月市场可能再次进入调整阶段;8、9月市场有望在上攻过程中出现阶段性机会。2013年经济企稳回暖信号基本明确,为A股市场的弱复苏态势形成有力支撑。
·行业配置:超配商业贸易、信息服务、信息设备、采掘、有色金属行业。
·股票配置:推荐中国联通、同方股份、苏宁电器、攀钢钒钛、紫金矿业、鹏博士、亿阳信通、厦门国贸、国投新集、中金岭南等个股。
一、模型选择
1.神经网络模型
人工神经网络简称神经网络,是一种模仿生物神经网络结构和功能的数学模型或计算模型。我们采用的BP网络是一种按误差逆传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,无需事前揭示描述这种映射关系的数学方程。神经网络具有良好的容错性和优良的非线性逼近能力,特别适合处理自变量和因变量之间无已知方程、结果预测比逻辑关系解释更重要的情形。对于上证综指与行业指数的预测,我们无法了解未来指数与历史数据、其他因素的具体关系,所以神经网络比较适合处理该方面的问题。当前借助神经网络预测股票指数的研究也比较成熟,其预测效果均比较理想。不过神经网络容易产生局部最优化导致训练失败的情形,在预测之后需要人工加以筛选。
2.多因子模型
多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票买入,不满足的则卖出。一般而言,多因子选股模型主要通过打分法来进行判断。打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,再根据总分对股票进行筛选。各种多因子模型核心的区别一是在因子的选取上,二是在如何用多因子综合得到一个最终的判断。在最终判断方面,多因子选股模型以打分法为主。
3.模型的选择
神经网络模型使用灵活,对数据的要求不高,且预测精度较高,故采用此模型进行上证指数的预测。由于多因子模型在业内有比较广泛的应用,同时根据检测表明,逐步回归—多因子模型选股有比较稳健的超额收益,故选股时采用此模型。
二、上证综指预测
1.模型设计
我们收集2008-2013年上证综指的月收盘价,并添加对指数变化有影响的相关指标。在指标选取方面,相对同行业,我们在估值、业绩等传统西方经济学分析工具基础上增加了对政策、供求关系、群体心理等政治经济学和行为金融学方面的考量,以求更加科学全面的分析解构及预测A股市场。具体步骤为,首先通过构建政策—业绩—供求—估值—心理五因素模型,再通过逐步回归法筛选显著的指标。
2.历史检验
我们使用前三年的指数历史数据与前一年的宏观指标数据进行预测,采用三层结构的神经网络,隐含层神经元个数为12,得到下一年的预测结果,并与真实的指数进行比对,得到基于遗传算法的神经网络改进模型在2003-2012年的回测检验。结果该预测指数的相对误差为15.37%,预测指数的标准差为691.21,真实指数的标准差为793.60。可以发现,对2007年这种大幅波动的情形模型预测效果欠佳,但在波幅比较缓和情形下模型大致能够预测出上证指数的趋势。
3.一季度行情预测
利用一季度的数据进行预测显示,上半年上证综指可能存在M型走势,下半年有望迎来新一波上涨行情,并更看好后市机会。
4.2013年市场展望
预测显示,2013年A股市场有望“震荡上行”。其中,3月份可能出现震荡调整;4、5月份有望迎来年内第二波上涨行情,但动能可能弱于去年12月以来的第一轮反弹,上半年整体呈M型走势;6、7月份市场可能开始调整;8、9月份市场有望再次上行,投资者可把握这次阶段性机会。
从近期的一系列经济数据来看,2013年经济企稳回暖态势已基本确立,证监会也表态将启动发行与退市改革。在政策、业绩、估值、供求的相互加持下市场信心有望逐步恢复,再加上快速调整后市场自身也有技术性反弹需要,二季度行情值得期待。量化预测也表明,市场有望在3月份左右结束现阶段调整,并在4、5月份出现反弹。需要提醒投资者的是,此次反弹力度可能会明显弱于去年12月份以来的第一轮反弹,震荡幅度可能较大。
三、行业配置
1.模型设计
我们采用行业指数前三年的历史数据来预测未来数据发展,同时考虑一个行业发展会受到该行业内企业盈利能力、偿债能力、成长能力等指标的影响。
2.模型检验
采用遗传算法BP神经网络模型(GABP)将前三年的指数历史数据、前一年的行业指标数据作为输入层,当年指数数据作为输出层,建立输入层与输出层的映射关系。然后将当前阶段输入层数据代入映射,得到下一期的输出层数据,即预测指数数据。我们对2008-2012年5年的行业收盘价进行预测,发现行业指数的误差大于上证综指的误差,很难预测准确。由于预测模型可能产生的误差较高,我们采用多次预测方法来提高准确度。我们分别进行10次预测,计算每次预测后的行业月均收益率并进行排名,选取排名前12的行业,最后根据各行业排名进12的频数选取排名持续靠前的行业。根据这种方法选取2008-2012年5年内排名靠前的行业,并将其月均收益率与大盘比较。经统计,有55.10%的行业超越大盘。
3.选取结果
经过模型运算,我们推荐的2013年3月至2014年2月的行业配置是:信息服务、信息设备、商业贸易、采掘、有色金属。
四、股票配置预测
1.模型设计
多因子模型建立过程包括候选因子的选取、候选因子数据的预处理、逐步回归法的建立,采用逐步回归法以达到筛选股票的目的。
候选因子的选取:候选因子的选取主要分为财务指标、行情指标和估值指标,这样分类选取的原因主要是考虑到市场经验和经济逻辑,以增强模型信息捕获能力,提高模型收益。另外,提供多维度的有效因子也可以降低由于因子的高度相关关系而产生的多重共线性。
2.历史检验
我们依照以下流程筛选股票:
(1)在选取股票之前先对股票进行第一轮筛选,在考虑风险因素与成长性情况下剔除ST股票以及市盈率小于0大于100的股票。
(2)对数据进行预处理,通过逐步回归法建立当期因子数据与下期收益率的回归方程,再利用因子数据预测下期个股的收益率,并对行业所有股票收益率进行排名。
(3)选取排名前5的股票建立等权组合,与行业指数收益率作对比,以检测该组合是否具有稳定的超额收益。
由于行业较多,选取股票数较多的通用机械行业进行比较。该行业2008年12月至2012年10月的回测检验结果显示,所选取的个股组合累计收益率优于行业平均水平。
3.选股结果
我们筛选推荐行业中的优质股票,依收益率排名如下表所示。
采用“逐步回归—多因子模型”的选股结果一览
信息服务行业信息设备行业商业贸易行业采掘行业有色金属行业
中国联通同方股份苏宁电器攀钢钒钛紫金矿业
鹏博士亿阳信通厦门国贸国投新集中金岭南
软控股份方正科技深赛格海油工程方大炭素
东方明珠廊坊发展合肥百货永泰能源西部矿业
博瑞传播中天科技华联股份中国石油南山铝业