> **来源:[研报客](https://pc.yanbaoke.cn)** ### 研究结论 本报告提出一种基于异构图神经网络(Heterogeneous Graph Neural Network)的股票关联因子挖掘方法,用于增强股票收益预测模型。研究结合空间(GNN)与时间(RNN)维度,采用两阶段训练(GNN+XGBoost)优化因子表现,回测结果显示综合模型RankIC、ICIR、夏普值及多头超额年化收益均有显著提升。 --- #### 针对GNN模型的核心创新 1. **异构图多维度融合**: - 将股票的量价因子作为节点特征,行业归属、基金共同持仓和分析师共同覆盖作为边特征,构建异构图模型。 - 针对图神经网络特征稀释问题,引入残差连接保留中心节点原始特征。 - 通过两阶段训练(GNN提取弱因子 + XGBoost排序优化),提升预测精度和泛化能力: - GNNXGB因子:RankIC=0.125,ICIR=3.19,夏普值=2.95,年化超额收益=210%。 --- #### RNN与GNN融合 模型结合GNN和RNN提取股票的时空特征,并直接叠加两个模型的因子生成综合因子: - 综合因子(GNNXGB + RNNXGB)表现更强:RankIC=0.131,ICIR=3.36,夏普值=3.40,年化超额收益=254%。 - 在中证1000指数增强策略回测中,年化超额收益达127%,最大回撤10.1%。 --- #### 模型与数据 - 数据:63个日频量价因子为节点特征;行业、基金持仓、分析师覆盖作为边特征。 - 训练验证:采用“5+1+1”的滚动训练窗口,按年更新模型权重。 - 风险提示:模型存在量化失效风险及极端市场冲击风险。 --- #### 总体亮点 1. 异构图有效聚合多源股票关联数据,提升因子信息维度。 2. 残差连接缓解了GNN中特征稀释问题。 3. XGBoost的两阶段训练优化了弱因子挖掘。 4. 时间(RNN)与空间(GNN)维度融合,增强了因子整体表现。 --- ### 回测结果摘要 - **GNNXGB因子**:IC均值0.125,ICIR 3.19,年化超额210%。 - **RNNXGB因子**:IC均值0.131,ICIR 3.36,年化超额254%。 - **综合因子**:IC均值0.131,ICIR 3.36,夏普值3.40,夏普值3.40,年化超额254%。 - **指数增强组合**:年化超额127%,最大回撤10.1%。 --- ### 风险与局限 1. 模型依赖历史市场数据,存在失效风险。 2. 极端市场环境可能削弱模型效果。 3. 图模型结构有待优化,如GCN聚合方式及动态图鲁棒性。 " 金融工程 | 专题报告 "