扎堆效应的识别:以股东户数变动为例——开源量化评论(66)-20221122
1、股东户数信息的披露大致经历了三个阶段
A股股东户数信息的披露大致经历了低、中、高三个阶段。第一阶段股东户数信息披露并不完善,缺失值较多;第二阶段股东户数信息主要源于定期财报的公布;第三阶段受益于投资者互动平台的搭建,股东户数信息的获取更加及时。
虽然整体而言上市公司增大了最新股东户数的披露频率,但披露集中在少数上市公司之中,大部分上市公司依然较少在定期财报之外进行股东户数信息的披露。
2、股东户数相关因子具有稳健的选股能力
在因子构建层面,我们提出了间隔选取多期后再进行时序标准化处理的方法,其能够有效避免相邻月份数值相同导致求解变动比例时产生过多零值而无法有效分组的问题。
股东户数变动(SNC)因子在测试期内具有优异表现,RankIC均值为4.5%,RankICIR为2.50,RankIC为正次数占比约74%。
人均持股占比变动(PCRC)因子在多空对冲稳定性上表现优异,最大回撤仅为-2.9%,收益波动比达到2.6。
综合而言,当选取间隔较短时(Gap<3),滚动窗口适宜选取长一些;选取间隔较长时(Gap>3),则滚动窗口不宜过长,累计跨度在两年左右时,因子表现较优。
局部最优参数下PCRC因子单调性有所改善,不同分组的走势区分度更加凸显。多头端年化收益率达到14.5%,RankIC为4.58%,RankICIR为2.63。
3、PCRC因子在中证1000指数上具有优异的增强表现
PCRC因子的表现好坏与所选股票池的市值大小存在一定的关联度,所选股票池平均市值越低,选股稳定性越高。
PCRC因子在沪深300指数成分股中表现相对较弱,测试期内RankIC均值为2.19%,RankICIR约为0.93,弱于全市场下的选股表现;在中证1000指数成分中因子显著性最强,RankIC均值达到4.88%,年化超额收益率为9.08%,收益波动比1.508,胜率约66%。
风险提示:模型基于历史数据统计,未来存在失效风险。
本文源自券商研报精选