固收深度研究:固收量化入门指南

张继强/殷超/方翔宇 2024-09-24 13:48:11
机构研报 2024-09-24 13:48:11 阅读

报告核心观点

    当下借助量化手段研究固收问题越来越普遍,而我们试图在本专题中构建一个基本的固收量化框架。但固收量化与权益量化仍有明显区别:1、固收量化更聚焦宏观变量和时序分析;2、固收量化的任务主要是择时和捕捉交易信号;3、利率债、信用债、转债等资产各有侧重点。我们认为,固收量化应以“问题界定→数据处理→特征工程→模型设计→任务评估”五大工程为基本构架,但要避免“学术炫技”、“伪量化”、“过度挖掘”等问题。并且,在固收研究的细节上,还要特别注意强化:1、对宏观环境甚至时代变量的刻画;2、对机构行为的刻画;3、对债券品种相对性价比的刻画。

    从“权益量化”到“固收量化”

    量化研究(Quantitative Research)是通过数学模型、统计分析和计算机等数量工具来探讨或验证市场规律的过程。相比于传统逻辑分析,量化研究更强调对现象的数理刻画、因果推理以及实证。量化研究最广泛的应用就是在股票投资上。传统的股票量化主要有基本面多因子选股、事件驱动选股、高频交易/CTA 等。而固收量化比权益量化至少有三方面不同:一是固收更注重对宏观变量分析,譬如GDP、PPI 等指标或重要会议、央行行为等事件;二是利率债更侧重择时和捕捉交易信号,择券任务则是少数。三是债券资产大部分时候都是同涨同跌,涨跌幅主要来自久期差异。

    量化工程的基本构架:五大工程

    量化研究往往起于某个问题,依照工程思维去解决,最后再评估与应用。我们将量化研究的过程总结成五大工程:1、问题或任务的界定。主要考虑问题是否适合量化解决;2、系统化的数据处理,包含数据清洗、数据规范化以及数据平滑,以获得“干净”数据;3、数据特征的扩展,以应对数据量不足情形。可用的方法主要有低频数据转高频、文本数据等,当然也可利用遗传算法等技术衍生数据;4、量化模型的选择,主流仍以多因子以及机器学习为主;5、量化模型评估准则,数据端重点关注是否有未来数据。多因子模型可关注IC 等指标,机器学习则更依赖测试集以及实践检验。

    案例一:神经网络和因果推断在利率择时中的尝试“利率择时”是固收量化研究者相对容易开展的工程。涉及利率择时问题,需要四大类数据:基本面、货币政策与资金面、供求以及情绪指标。择时研究思路主要有两类:1、利率走势归因。可以利用因果推断模型对10 年期国债收益率归因。得出的结论是:全部时期下,隐含税率、存款准备金率、通胀(核心CPI)以及短期资金面因素与10 年期国债收益率有较强因果性。

    2、预测利率值。使用LSTM 神经网络,预测10 年期国债收益率走势。预测走势与实际相似,但绝对值差距仍有20BP 左右,实战效果可能略有不佳。

    后续或可通过增加数据、更换模型等方式进一步改进。

    案例二:转债“双低策略”的回炉重造

    “双低策略”是一个经典的转债择券方法,且在过去很长时间都获得了不错的回报特征。但策略缺乏理论支撑、指标未清洗、逻辑过于单一,且未考虑信用资质、流动性等指标。因此我们基于双低策略,改良并构建更优的转债多因子模型。核心是利用中性化、标准化后的股性因子(平价溢价率)和债性因子(YTM)进行择券。改进后策略不仅表现远超传统双低策略,更是在2024 年的转债弱市中获得正回报。当然,因子方向仍有不少可以改进:1、股债性并不是最完美指标,或有指标择券效果更好;2、最大回撤难以控制;3、信用风险控制并不足;4、条款博弈结合相对较少。

    风险提示:历史数据不一定适用于未来;市场环境变化可能使模型失效。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。