1 min read

解耦表征与风险控制:信用卡欺诈检测的一条可行路径

信用卡欺诈检测是金融风控的经典场景,长期面临三个现实难题:交易数据极端不平衡、欺诈手段持续迭代、漏检与误判的成本差异极大。多数现有模型要么侧重提升检测指标,要么只做启发式的不确定性估计,很难同时兼顾预测性能与可验证的风险约束。

近期发表在《Decision Support Systems》上的 DISCO 框架,提出了 “表征学习与风险控制解耦” 的思路:先用深度度量学习构造鲁棒的交易嵌入空间,再通过共形风险控制给假阴性率加上可证明的统计边界。读完这篇工作,有几个偏顶层的思考,整理如下。

一、解耦架构:性能与可信不必在同一模型里妥协

传统风控模型通常把特征拟合、分类决策、风险权衡封装在同一个模型内,比如用代价敏感学习把错分成本直接写进损失函数。但表征学习和风险控制的优化逻辑并不一致:前者追求判别性和泛化能力,后者追求统计边界的严格可控。把两类目标放在同一个模型里优化,往往容易出现双向妥协,两边都达不到最优。

DISCO 的架构思路,是承认两个任务的独立性,让各自用最适配的技术方案:深度度量学习负责构造判别性强的嵌入空间,共形风险控制负责叠加统计风险约束。两个模块前后衔接、互不干扰,既保留了表征模型的性能优势,又补上了可验证的风险管控能力。这种解耦的思路,不止适用于欺诈检测,也可以推广到其他高风险决策场景。

二、类别不平衡:从补丁式修正,到空间层面的天然适配

处理类别不平衡是欺诈检测的老问题。常见的做法大多是 “补丁式修正”:数据层面做过采样、欠采样,模型层面加损失权重、做代价敏感学习。这些方法都没有改变分类器依赖类别先验分布的本质,只是在原有框架上做补偿,各自都有局限 —— 过采样可能引入不真实的合成样本,欠采样会丢失多数类的信息,代价敏感学习则依赖提前设定准确的成本矩阵。

这篇工作提供了另一种思路:如果嵌入空间本身由样本间的相对距离关系定义,而不是由类别标签的分布拟合,那么空间的判别性就天然对类别比例不敏感。深度度量学习通过拉近同类样本、推远异类样本的方式学习表征,在极端不平衡的数据上也能学到稳定的区分边界。相当于从根源上降低了不平衡带来的负面影响,比后续叠加修正方案更底层。

三、风控的实际诉求:比起平均指标,更需要可量化的单边风险边界

学术研究里常用 AUCPR、F1 这类综合指标评价模型好坏,但真实的风控业务有明确的单边倾向:漏检一笔欺诈的损失,远高于误拦一笔正常交易的影响。监管和合规层面,也要求模型风险可量化、可追溯。

传统的平均指标只能描述模型的历史平均表现,没法给未来的风险给出严格上界。DISCO 把假阴性率作为核心约束目标,通过共形风险控制给出了分布无关的统计保证 —— 用户设定可接受的假阴性率上限,模型就能在统计意义上满足这个约束。这个转变的意义在于,让 AI 模型从 “提供参考分数” 变成 “提供可承诺的风险边界”,更贴合金融风控的实际业务逻辑。

四、交易关系建模:未必只能依赖重型图神经网络

业界有个常见的路径依赖:只要做交易关系建模,就会上图神经网络。但图模型的大图构建、消息传递会带来很高的推理延迟和算力开销,在实时高吞吐的支付场景里,落地成本很高。

这篇工作只用了持卡人和商户两个 ID 特征,通过孪生网络加对比损失的度量学习,就捕捉到了交易关系里的欺诈模式,效果超过了多款图神经网络基线,推理速度还快了一到两个数量级。这说明交易欺诈的核心信号,很多时候蕴含在实体交互的关系模式里,不一定需要高阶的图邻接信息。在对实时性要求高的场景里,轻量的度量学习方案,是比重型 GNN 更务实的选择。

五、可信 AI 落地:后装式风险层,是存量改造的低成本方案

很多可信 AI 技术,比如贝叶斯网络、深度集成,都需要改动模型结构和训练流程,对工业界已经上线的存量风控系统来说,改造成本很高,落地难度大。

共形风险控制属于后处理式的模块:它不关心前端用什么模型,只要模型能输出分类概率或者分数,就能在外面叠加一层可证明的风险约束。DISCO 的两段式架构正好体现了这种可插拔的特性 —— 前端的表征和分类器可以替换成任意存量模型,后端的 CRC 模块独立完成风险管控。这种 “后装式” 的风险层,不用推翻原有系统,就能补上可信能力,对工业落地更友好。

总结

总的来说,DISCO 这篇工作的价值,不止是提出了一个效果更好的欺诈检测模型,更重要的是给出了 “高性能 + 可证风险” 的完整落地范式。它没有追求单一指标的极致,而是从架构层面回应了金融风控的真实痛点:既要能打,也要可信。

当然这套方案也有局限,比如对全新的冷启动实体表征效果有限,时序自适应校准也还有优化空间。但整体来看,解耦的思路、度量学习处理不平衡的方式、后装式风险控制的落地路径,都对风控 AI 的技术选型和系统设计,有不错的参考意义。

参考文献

Zhu, R., Zhang, X., Wang, T., Liao, J., Chung, S.-H., & Zhang, X. (2026). DISCO: Decoupling representation learning and risk control for reliable credit card fraud detection. Decision Support Systems, 208, 114717. https://doi.org/10.1016/j.dss.2026.114717