支付风控：电诈场景的特征与样本选择

支付场景中，电信网络诈骗相关的风险识别，对动态交易行为特征的依赖度，高于静态用户属性标签。

一、静态主体特征的适用边界

静态人口属性标签，包括年龄、收入区间、房产状态等，仅能反映群体层面的受骗概率分布，无法捕捉用户实时的被诱导状态。刷单类诈骗的受害群体，集中在中等收入区间；交友类诱导代付的受害群体，集中在年轻男性。这类群体分布规律，仅可用于离线客群分层与触达，无法作为单用户实时风险判断的核心依据。在新用户无历史行为数据的冷启动场景中，这类标签可作为兜底防控的补充维度。

二、电诈风险场景的特征应用边界

电诈风险场景中，两类核心特征均能发挥一定识别作用，但在最棘手的头部高风险样本识别上，仍存在明显难度，效果有限。

第一，交易关联的收益地址、手机号等信息的黑产关联度，确实能有效区分交易与黑产的关联程度，对全量电诈样本的风险区分具备实际价值，但针对头部高风险样本的召回能力不足，识别难度较大。头部欺诈行为会刻意使用未被标记的全新地址与手机号，通过分散操作降低单主体的黑产关联度，以此规避基于历史标记的识别逻辑，该现象在刷单、交友诱导、仿冒客服等各类电诈场景中均普遍存在。

第二，以用户是否发起客诉作为辅助任务的多任务学习，在电诈风险识别中也能起到一定辅助作用，但同样难以应对头部高风险样本的识别需求，甚至对头部高风险样本的召回存在负向影响。电诈受害用户的客诉意愿与风险等级存在负向关联，该规律适用于各类电诈场景：小额被骗用户维权成本高于损失，客诉意愿低；被深度诱导的用户不认为自身操作存在风险，不会发起客诉；大额被骗用户可能因羞于启齿、担心追责等原因不选择客诉。高频客诉的主体多为风险等级更低的交易纠纷用户，与电诈核心风险无强关联，导致这类辅助特征难以捕捉头部高风险。

三、训练集的样本治理逻辑

模型训练的效果，受训练集样本质量的显著影响。历史代付时长较长的用户，不可直接统一标记为白样本纳入训练集。这类群体包含两类差异显著的主体，一类是正常亲友代付、个人分期代付的低风险用户，另一类是职业代付、黑产试探、交易纠纷高发的高风险用户。将高风险用户作为白样本纳入训练集，会导致模型学习到错误的特征关联，干扰对核心风险的识别。对这类样本，需先完成分层标记，仅移除高风险的伪白样本，保留正常低风险样本，避免训练集的样本分布与线上真实流量出现偏差。

四、多风险域合并建模的判断标准

支付风控体系中，不同风险域常采用独立建模的方式，对应的维护成本较高。不同风险域能否合并建模，取决于是否存在可复用的稳定共性特征。盗号与手机丢失场景，共性为非本人操作的账户行为，核心特征集中在设备、IP异常，操作行为与历史基线的偏离度。赌博与诱导转账场景，共性为资金流向非历史关联的高风险账户，核心特征集中在资金流转速度、交易对手关联度。这类存在稳定共性特征的场景，可合并建模，降低维护成本。二次放号、电诈中的代付场景，欺诈手法迭代速度快，样本特殊性高，单独建模的识别效果更优。

五、刷单类电诈的核心风险信号

刷单类诈骗是电诈场景中占比较高的类型，受害用户的核心特征为存在额外收入需求，对灰色收益存在接受度，与用户注册时长、是否开通信用服务无直接关联。对应的核心风险信号，集中在动态交易行为，包括开通信用付服务后短时间内出现大额代付、团购场景与代付的组合交易、短时间内代付频次异常升高、支付账号与下单账号不一致。这类动态特征，可直接反映用户当前的异常交易状态，是实时风险识别的主要依据。

电诈相关的支付风险识别，需匹配场景特性选择对应特征，明确不同特征的适用边界，同时保障训练集的样本质量，在模型维护成本与识别效果之间找到平衡。

支付风控：电诈场景的特征与样本选择

支付风控系列导航

一、静态主体特征的适用边界

二、电诈风险场景的特征应用边界

三、训练集的样本治理逻辑

四、多风险域合并建模的判断标准

五、刷单类电诈的核心风险信号

支付风控系列导航

支付风控：电诈场景的特征与样本选择

支付风控 系列导航

一、静态主体特征的适用边界

二、电诈风险场景的特征应用边界

三、训练集的样本治理逻辑

四、多风险域合并建模的判断标准

五、刷单类电诈的核心风险信号

支付风控 系列导航

支付风控系列导航

支付风控系列导航