投资策略研究:上市公司债券信用风险识别模型

股票资讯 阅读:7 2025-01-08 14:40:27 评论:0

  传统的债券违约模型主要分为线性模型和非线性模型。线性模型如AltmanZ-score 通过财务比率得出综合风险评分,简便易用,但财务指标有限,可能无法全面反映债务人状况。非线性模型如Merton 模型基于期权定价理论,能够更好地捕捉资产波动,但对参数依赖较大,且忽视跳跃性事件。与之相比,机器学习在债券违约风险评估中具有优势,能够通过自动化数据分析挖掘复杂的非线性关系,处理大规模数据和缺失值,并实时适应市场变化。机器学习的强大自适应性和精确性使其成为传统违约模型的重要补充,提高了预测准确性并应对市场复杂性。上市公司债券信用风险识别不仅有助于债券市场的投资,同样能够作为一个良好的股票筛选因子。

      在数据集的时间区间划分上,为了确保训练集和测试集比例接近7:3,我们选择2022Q1 的财报数据作为训练集,并使用2024Q2 的财报数据作为测试集。同时,为了提高样本的针对性,在正常样本中仅保留公司债和可转债两类,从而降低数据异质性,优化模型的泛化性能。特征选取方面,综合考虑企业运营与债券特性,报告选取了财务、债券本体以及股票交易三大类指标。

      针对数据不平衡问题,报告中采用的欠采样策略不仅有效平衡了数据分布。

      通过这种处理方法,模型在数据集中对少数类(如违约样本)的识别能力显著增强。同时,在样本数量有限的情况下,尽量保留了重要的异质性信息,确保模型能够捕捉到关键的风险特征。

      我们使用了逻辑回归、随机森林、支持向量机、XGBoost 以及LightGBM 五个分类模型。由于支持向量机必须使用统一量纲后的数据,在检验五个模型的情况后我们发现统一量纲的操作将会显著提高每个模型的召回率,而这有可能是由于引入未来数据导致的。为了避免未来函数的问题,我们将不再考虑支持向量机作为信用风险识别模型。在剩余的四个模型中,随机森林不论是在AUC 还是召回率上都具备明显的优势,AUC 达到0.90,召回率达到0.84。

      使用随机森林作为预测最新一期债券信用风险的模型,选取2024 年11 月1日至2024 年12 月20 日的信用风险样本以及2024Q3 截面的正常样本构成验证集,对于已经产生的信用风险事件,随机森林均给出了相对准确的分类(预测概率均大于50%),并且调整概率均大于50%。对于截面上存续的可转债,共有11 支可转债的违约调整概率超过50%。

      风险提示:数据选取未使用全部数据,可能导致样本偏差;特征选取存在一定主观性;数据不平衡采样方法可能导致信息丢失;历史数据无法完全预测未来结果;模型存在失效可能性。

机构:长城证券股份有限公司 研究员:汪毅/丁皓晨 日期:2025-01-08

*免责声明:文章内容仅供参考,不构成投资建议

*风险提示:股市有风险,入市需谨慎

声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。