RNS(Rule Network with Selective logical operators)是面向可解释分类任务设计的神经网络架构,可在训练过程中自适应选择AND/OR逻辑运算符,自主挖掘数据对应的最优逻辑规则结构,在分类任务中可兼顾模型性能、规则质量与运行效率。
一、规则学习的现存问题
在金融风控、医疗诊断等对决策透明度有明确要求的场景中,规则学习是可解释AI的核心实现路径。现有规则学习相关模型存在三类主要问题:
-
逻辑结构固定,需人工预设规则范式,无法自适应匹配数据底层逻辑;
-
多采用0/1二进制编码与乘法类激活函数,训练过程中易出现梯度消失,模型收敛难度高;
-
生成规则冗余度高,可解释性不足,难以直接落地到合规要求严格的业务场景。
二、RNS核心架构设计
RNS架构以可解释性为核心设计原则,通过层级化结构实现逻辑规则的自动学习。
1. 输入与预处理
所有输入特征需完成二值化处理,转换为±1格式。连续特征通过分箱操作转换为二值化字面量,分类特征通过独热编码完成转换。否定层(Negation Layer)为每个输入特征生成对应的否定形式,保障模型逻辑表达的完备性。
2. 逻辑选择层(LSL,Logical Selection Layer)
逻辑选择层是RNS的核心组件,模型通过堆叠两层逻辑选择层实现规则的自动生成。单层内的每个神经元仅可选择一种逻辑算子,即AND或OR,不可在单神经元内混用两种算子。
• 第一层逻辑选择层:以二值化特征与对应否定形式为输入,学习生成多组纯逻辑的基础规则,单条基础规则仅包含纯AND或纯OR逻辑;
• 第二层逻辑选择层:以第一层输出的基础规则为输入,再次通过选择逻辑算子完成规则组合,最终生成符合规范的逻辑范式。
3. 单层逻辑不混用的设计原则
RNS强制单层内仅使用单一逻辑算子,不允许在单条基础规则中混用AND与OR。若允许单层混用,会生成A ∧ B ∨ C ∧ D这类混合逻辑结构,无法对应业务决策逻辑,难以拆解、审计,也无法落地为风控策略,使模型回归黑箱属性。采用单层纯逻辑、双层嵌套组合的设计,可在表达复杂逻辑的同时,保持规则的人类可读性,满足合规要求。
4. 规则范式的自动生成与业务意义
通过两层逻辑选择层的堆叠,模型可自动生成两类核心规则范式,适配金融风控场景:
• DNF(析取范式,Disjunctive Normal Form)= 抓黑
结构为多组AND规则通过OR算子组合,命中任意一条风险规则即可判定为风险,应用场景包括欺诈识别、拒贷、交易拦截、止损处置。
• CNF(合取范式,Conjunctive Normal Form)= 排白
结构为多组OR规则通过AND算子组合,需全部条件组均满足方可判定为可信,应用场景包括用户准入、授信通过,白名单放行。
模型无需人工预设范式类型,可通过训练自主选择适配数据的最优结构。
三、梯度消失问题的解决方案
1. 传统乘法逻辑的梯度消失原理
现有规则学习网络多采用乘法模拟AND/OR逻辑。反向传播中,乘法的梯度为其余特征项的乘积,激活值多处于(0,1)区间,梯度随特征维度增加呈指数级衰减。 示例:特征值均为0.9时
• 5项相乘:0.9⁵≈0.59
• 10项相乘:0.9¹⁰≈0.35
• 20项相乘:0.9²⁰≈0.12
• 50项相乘:0.9⁵⁰≈0.005
高维场景下梯度趋近于0,出现梯度消失,模型无法学习复杂规则。
2. RNS min/max逻辑的原理与优势
RNS采用min/max函数替代乘法实现逻辑运算,编码规则为+1代表真,-1代表假:
• AND等价于取最小值:全部输入为+1时结果为+1,存在-1时结果为-1;
• OR等价于取最大值:存在+1时结果为+1,全部输入为-1时结果为-1。
min/max仅关注输入极值,梯度不随维度增加衰减,从根源避免梯度消失,支持高维复杂规则学习。
3. 梯度传播机制优化
模型采用STE(Straight-Through Estimator,直通估计器)处理非可微操作的梯度传播,对min/max激活函数采用梯度均匀分配策略,提升优化稳定性。同时采用±1编码替代0/1编码,消除0值带来的梯度归零问题,保障梯度传播有效性。
四、规则生成逻辑与业务落地价值
RNS训练完成后,可通过层级权重与算子选择结果直接提取可读规则,无需事后解释。规则提取分为三步:
-
读取第一层逻辑选择层结果,提取基础规则;
-
读取第二层逻辑选择层结果,组合生成完整范式规则;
-
转换为业务可直接使用的规则语句。
在金融风控场景中,CNF用于准入规则构建,DNF用于风险拦截规则构建,生成规则可直接用于策略审计与合规校验。
五、两层嵌套的可解释性:抓黑与排白示例
RNS采用两层嵌套结构,不仅是为了表达复杂逻辑,更重要的是提升规则的可解释性。通过分层设计,每层逻辑的含义明确,便于业务人员理解和审计。
1. DNF(析取范式)= 抓黑规则示例
以交易欺诈识别为例,模型生成的DNF规则可能如下:
规则结构:
(大额交易 OR 频繁交易 OR 异地交易) OR (深夜交易 OR 新设备登录)
第一层逻辑选择层(OR):生成基础规则
-
规则A:大额交易 OR 频繁交易 OR 异地交易
-
规则B:深夜交易 OR 新设备登录
第二层逻辑选择层(OR):组合基础规则
- 最终规则:规则A OR 规则B
可解释性优势:
第一层: 看被哪个条件击中
-
如果交易是"大额交易",立即命中规则A的第一项
-
如果交易是"深夜交易",立即命中规则B的第一项
-
交易员一眼就能看到:这个订单是因为哪个具体特征被拦截的
第二层: 看内部哪些条件共同命中
-
规则A内部:三个条件满足其一即可,但交易员可以看到具体是哪个条件触发的
-
规则B内部:同理,可以快速定位触发因素
业务价值:
-
运营人员可以快速回复客户:“您的交易因大额支付被拦截”(精确到具体原因)
-
审计人员可以追踪每笔拦截订单的具体触发条件
-
支持规则调优:如果"异地交易"误伤率高,可以单独优化这一项
2. CNF(合取范式)= 排白规则示例
以用户准入为例,模型生成的CNF规则可能如下:
规则结构:
(身份认证 OR 手机验证) AND (无负面记录 OR 征信良好) AND (非黑名单 OR 非高风险区域)
第一层逻辑选择层(OR):生成基础规则
-
规则A:身份认证 OR 手机验证(满足其一即可)
-
规则B:无负面记录 OR 征信良好(满足其一即可)
-
规则C:非黑名单 OR 非高风险区域(满足其一即可)
第二层逻辑选择层(AND):组合基础规则
- 最终规则:规则A AND 规则B AND 规则C(全部满足)
可解释性优势:
第一层: 每组条件满足其一即可
-
规则A:用户通过了"身份认证"或"手机验证",任一方式都算满足
-
规则B:用户"无负面记录"或"征信良好",任一条件都算满足
-
规则C:用户"非黑名单"或"非高风险区域",任一条件都算满足
第二层: 所有条件组均需满足
-
必须同时满足规则A、规则B、规则C,才能通过准入
-
审核人员可以清楚看到:用户是否在每个维度的条件上都满足要求
业务价值:
-
审核人员可以快速判断:用户通过了哪些验证方式,在哪些维度上有优势
-
拒绝时可以明确告知:“您因征信不良被拒绝”(精确到具体不满足的规则组)
-
支持灵活配置:规则A内部可以随时增加新的验证方式(如人脸识别),不影响整体逻辑
3. 两层嵌套的核心优势
单层混用AND/OR会生成复杂难以解释的结构,如:
A ∧ B ∨ C ∧ D ∧ E ∨ F
这种结构无法拆解为"被哪个条件击中",也无法快速定位触发原因。
两层嵌套设计的优势在于:
-
分层清晰: 每层逻辑单一,要么全是AND,要么全是OR
-
追踪容易: 从外层到内层,逐步缩小范围,精准定位触发因素
-
业务友好: 规则结构与业务决策逻辑高度一致,易于理解和落地
-
审计便利: 每层都可以单独审计,便于合规检查
通过分层设计,RNS在保持模型性能的同时,实现了真正的业务可解释性。
参考文献
Wei, B., & Zhu, Z. (2026). Interpretable classification via a rule network with selective logical operators. arXiv preprint arXiv:2408.11918.