2 min read

风控建模:算法规则挖掘(2)选择性逻辑算子

RNS(Rule Network with Selective logical operators)是面向可解释分类任务设计的神经网络架构,可在训练过程中自适应选择AND/OR逻辑运算符,自主挖掘数据对应的最优逻辑规则结构,在分类任务中可兼顾模型性能、规则质量与运行效率。

一、规则学习的现存问题

在金融风控、医疗诊断等对决策透明度有明确要求的场景中,规则学习是可解释AI的核心实现路径。现有规则学习相关模型存在三类主要问题:

  1. 逻辑结构固定,需人工预设规则范式,无法自适应匹配数据底层逻辑;

  2. 多采用0/1二进制编码与乘法类激活函数,训练过程中易出现梯度消失,模型收敛难度高;

  3. 生成规则冗余度高,可解释性不足,难以直接落地到合规要求严格的业务场景。

二、RNS核心架构设计

RNS架构以可解释性为核心设计原则,通过层级化结构实现逻辑规则的自动学习。

1. 输入与预处理

所有输入特征需完成二值化处理,转换为±1格式。连续特征通过分箱操作转换为二值化字面量,分类特征通过独热编码完成转换。否定层(Negation Layer)为每个输入特征生成对应的否定形式,保障模型逻辑表达的完备性。

2. 逻辑选择层(LSL,Logical Selection Layer)

逻辑选择层是RNS的核心组件,模型通过堆叠两层逻辑选择层实现规则的自动生成。单层内的每个神经元仅可选择一种逻辑算子,即AND或OR,不可在单神经元内混用两种算子。

• 第一层逻辑选择层:以二值化特征与对应否定形式为输入,学习生成多组纯逻辑的基础规则,单条基础规则仅包含纯AND或纯OR逻辑;

• 第二层逻辑选择层:以第一层输出的基础规则为输入,再次通过选择逻辑算子完成规则组合,最终生成符合规范的逻辑范式。

3. 单层逻辑不混用的设计原则

RNS强制单层内仅使用单一逻辑算子,不允许在单条基础规则中混用AND与OR。若允许单层混用,会生成A ∧ B ∨ C ∧ D这类混合逻辑结构,无法对应业务决策逻辑,难以拆解、审计,也无法落地为风控策略,使模型回归黑箱属性。采用单层纯逻辑、双层嵌套组合的设计,可在表达复杂逻辑的同时,保持规则的人类可读性,满足合规要求。

4. 规则范式的自动生成与业务意义

通过两层逻辑选择层的堆叠,模型可自动生成两类核心规则范式,适配金融风控场景:

• DNF(析取范式,Disjunctive Normal Form)= 抓黑

结构为多组AND规则通过OR算子组合,命中任意一条风险规则即可判定为风险,应用场景包括欺诈识别、拒贷、交易拦截、止损处置。

• CNF(合取范式,Conjunctive Normal Form)= 排白

结构为多组OR规则通过AND算子组合,需全部条件组均满足方可判定为可信,应用场景包括用户准入、授信通过,白名单放行。

模型无需人工预设范式类型,可通过训练自主选择适配数据的最优结构。

三、梯度消失问题的解决方案

1. 传统乘法逻辑的梯度消失原理

现有规则学习网络多采用乘法模拟AND/OR逻辑。反向传播中,乘法的梯度为其余特征项的乘积,激活值多处于(0,1)区间,梯度随特征维度增加呈指数级衰减。 示例:特征值均为0.9时

• 5项相乘:0.9⁵≈0.59

• 10项相乘:0.9¹⁰≈0.35

• 20项相乘:0.9²⁰≈0.12

• 50项相乘:0.9⁵⁰≈0.005

高维场景下梯度趋近于0,出现梯度消失,模型无法学习复杂规则。

2. RNS min/max逻辑的原理与优势

RNS采用min/max函数替代乘法实现逻辑运算,编码规则为+1代表真,-1代表假:

• AND等价于取最小值:全部输入为+1时结果为+1,存在-1时结果为-1;

• OR等价于取最大值:存在+1时结果为+1,全部输入为-1时结果为-1。

min/max仅关注输入极值,梯度不随维度增加衰减,从根源避免梯度消失,支持高维复杂规则学习。

3. 梯度传播机制优化

模型采用STE(Straight-Through Estimator,直通估计器)处理非可微操作的梯度传播,对min/max激活函数采用梯度均匀分配策略,提升优化稳定性。同时采用±1编码替代0/1编码,消除0值带来的梯度归零问题,保障梯度传播有效性。

四、规则生成逻辑与业务落地价值

RNS训练完成后,可通过层级权重与算子选择结果直接提取可读规则,无需事后解释。规则提取分为三步:

  1. 读取第一层逻辑选择层结果,提取基础规则;

  2. 读取第二层逻辑选择层结果,组合生成完整范式规则;

  3. 转换为业务可直接使用的规则语句。

在金融风控场景中,CNF用于准入规则构建,DNF用于风险拦截规则构建,生成规则可直接用于策略审计与合规校验。

五、两层嵌套的可解释性:抓黑与排白示例

RNS采用两层嵌套结构,不仅是为了表达复杂逻辑,更重要的是提升规则的可解释性。通过分层设计,每层逻辑的含义明确,便于业务人员理解和审计。

1. DNF(析取范式)= 抓黑规则示例

以交易欺诈识别为例,模型生成的DNF规则可能如下:

规则结构:

(大额交易 OR 频繁交易 OR 异地交易) OR (深夜交易 OR 新设备登录)

第一层逻辑选择层(OR):生成基础规则

  • 规则A:大额交易 OR 频繁交易 OR 异地交易

  • 规则B:深夜交易 OR 新设备登录

第二层逻辑选择层(OR):组合基础规则

  • 最终规则:规则A OR 规则B

可解释性优势:

第一层: 看被哪个条件击中

  • 如果交易是"大额交易",立即命中规则A的第一项

  • 如果交易是"深夜交易",立即命中规则B的第一项

  • 交易员一眼就能看到:这个订单是因为哪个具体特征被拦截的

第二层: 看内部哪些条件共同命中

  • 规则A内部:三个条件满足其一即可,但交易员可以看到具体是哪个条件触发的

  • 规则B内部:同理,可以快速定位触发因素

业务价值:

  • 运营人员可以快速回复客户:“您的交易因大额支付被拦截”(精确到具体原因)

  • 审计人员可以追踪每笔拦截订单的具体触发条件

  • 支持规则调优:如果"异地交易"误伤率高,可以单独优化这一项

2. CNF(合取范式)= 排白规则示例

以用户准入为例,模型生成的CNF规则可能如下:

规则结构:

(身份认证 OR 手机验证) AND (无负面记录 OR 征信良好) AND (非黑名单 OR 非高风险区域)

第一层逻辑选择层(OR):生成基础规则

  • 规则A:身份认证 OR 手机验证(满足其一即可)

  • 规则B:无负面记录 OR 征信良好(满足其一即可)

  • 规则C:非黑名单 OR 非高风险区域(满足其一即可)

第二层逻辑选择层(AND):组合基础规则

  • 最终规则:规则A AND 规则B AND 规则C(全部满足)

可解释性优势:

第一层: 每组条件满足其一即可

  • 规则A:用户通过了"身份认证"或"手机验证",任一方式都算满足

  • 规则B:用户"无负面记录"或"征信良好",任一条件都算满足

  • 规则C:用户"非黑名单"或"非高风险区域",任一条件都算满足

第二层: 所有条件组均需满足

  • 必须同时满足规则A、规则B、规则C,才能通过准入

  • 审核人员可以清楚看到:用户是否在每个维度的条件上都满足要求

业务价值:

  • 审核人员可以快速判断:用户通过了哪些验证方式,在哪些维度上有优势

  • 拒绝时可以明确告知:“您因征信不良被拒绝”(精确到具体不满足的规则组)

  • 支持灵活配置:规则A内部可以随时增加新的验证方式(如人脸识别),不影响整体逻辑

3. 两层嵌套的核心优势

单层混用AND/OR会生成复杂难以解释的结构,如:

A ∧ B ∨ C ∧ D ∧ E ∨ F

这种结构无法拆解为"被哪个条件击中",也无法快速定位触发原因。

两层嵌套设计的优势在于:

  1. 分层清晰: 每层逻辑单一,要么全是AND,要么全是OR

  2. 追踪容易: 从外层到内层,逐步缩小范围,精准定位触发因素

  3. 业务友好: 规则结构与业务决策逻辑高度一致,易于理解和落地

  4. 审计便利: 每层都可以单独审计,便于合规检查

通过分层设计,RNS在保持模型性能的同时,实现了真正的业务可解释性。

参考文献

Wei, B., & Zhu, Z. (2026). Interpretable classification via a rule network with selective logical operators. arXiv preprint arXiv:2408.11918.