引言
“复杂"一词在不同学科语境中具有截然不同的内涵。在线性代数框架下,系统的"复杂"表征为独立变量维度的高阶性,即满秩状态;而在描述真实世界系统时,“复杂"往往指向信息结构的不可逆性与不可还原性。这种语义分歧的核心在于"秩”(rank)这一数学概念的状态差异。
一、满秩系统:数学意义上的复杂性
在线性代数理论中,矩阵的秩定义为该矩阵行向量(或列向量)所张成空间的维度,亦即系统中独立信息方向的数量。
满秩系统的基本特征包括:
- 变量间相互线性无关,不存在冗余维度
- 信息映射保持完整性,无损失或折叠
- 输入与输出之间存在一一对应关系,系统具有严格可逆性
此类系统的"复杂"体现为计算层面的困难性:变量规模庞大、约束条件繁复、求解过程耗费认知资源。然而,其结构具有内在完美性——给定充分计算能力,系统状态可被完整还原,演化路径可被精确追溯。
二、降秩系统:真实世界的复杂性
真实系统往往经历从高维满秩向低维降秩的演化过程:
高维满秩的潜在状态 → 多对一映射的涌现 → 维度压缩与信息丢失 → 降秩(rank-deficient)结构的形成
降秩系统的核心特征表现为:
- 多重历史路径收敛于单一现存状态
- 逆向推导的不可能性:由当下无法唯一确定过去
- 信息维度的不可逆压缩
此处的"复杂"并非源于变量数量的多寡,而是源于信息结构的纠缠性——历史信息被固化于系统结构之中,无法被拆解、还原或逆序重构。
三、两种复杂性的概念辨析
| 维度 | 数学复杂性(满秩) | 真实复杂性(降秩) |
|---|---|---|
| 秩的状态 | 秩取最大值,满秩 | 秩低于最大值,降秩 |
| 信息属性 | 完整守恒 | 损失与折叠 |
| 映射性质 | 可逆 | 不可逆 |
| 结构特征 | 变量关联紧密但清晰 | 信息纠缠,结构固化 |
| 还原能力 | 可分解、可回退 | 不可拆解、不可逆溯 |
“复杂等于秩高"的理解对应于理想化的数学世界;而"复杂源于不可逆"的论断则指向降秩的、残缺的真实世界。
四、不可逆性作为复杂性的生成机制
不可逆性并非系统的缺陷或故障,而是结构信息发生纠缠与固化的自然结果。其典型生成机制包括:
- 多对一映射:多重前态收敛于单一现态,逆向路径不唯一
- 维度压缩:高维信息被投影至低维空间,原始细节永久性丧失
- 非线性折叠:状态空间发生拓扑形变,回归路径被阻断
上述机制的共同特征在于:系统变量未必增加,但信息结构发生本质性"搅浑”。
进一步而言,不可逆性并非单纯的结构残缺,而是世界生成稳定形态、形成历史记忆、建立秩序框架的必要条件。若无不可逆性的存在,系统将无法维持固定形态,历史记忆无从积累,任何具有持久性的存在皆不可能。
五、认知系统的底层约束
人类文明的认知过程,受到三重刚性约束。第一是神经系统约束,人类意识层面的工作记忆仅可同时处理少量变量,无法并行处理高维耦合信息。第二是语言系统约束,作为思想传递的核心载体,语言的线性结构需要将多维关系压缩为顺序叙述,天然限制可表达的维度上限。第三是社会传播约束,包含过多变量的模型难以完成规模化传递与代际留存,可长期存续的解释框架,通常维持较低的维度水平。
系统的状态复杂度随维度数量呈指数级增长,这一现象被称为维度灾难。维度上升会带来数据需求、计算成本的快速上升,同时降低模型的可解释性。任何存在资源约束的认知系统,都无法无限制处理高维信息。
六、低秩结构与因果理论的构建
对描述系统关系的矩阵做奇异值分解后,可得到代表不同结构方向重要性的奇异值。多数现实系统中,奇异值呈现快速衰减的特征,系统的主要行为集中在少数结构方向上。这类系统的理论维度可能较高,但有效维度处于较低水平,即存在可提取的低秩结构。
低秩结构的存在,意味着系统的行为可通过少数核心变量进行解释。这类系统可通过核心变量的提取,构建可解释的因果理论,完成对系统行为的预测与干预。
七、无低秩结构下的统计处理路径
当系统的奇异值无明显衰减,不存在可提取的低秩结构时,系统的行为无法通过少数核心变量完成解释。针对这类系统,常用的处理方式为统计化逼近——放弃对个体行为的精准描述,转向对系统整体分布规律的捕捉。这类处理方式可得到变量间的相关关系,相关关系无法直接对应因果逻辑,仅可实现对系统宏观行为的概率性预测。
两种处理路径均为对高维复杂度的适配,核心目标是将高维系统转化为可处理的形式,不会穷尽系统的所有细节。
八、升维与降维的学习逻辑
低维特征的学习局限
原始输入特征仅能呈现数据的基础属性,非线性关联信息会被压缩在低维空间中,模型难以区分不同类别的数据分布。线性模型的拟合能力有限,无法捕捉特征间的复杂交互关系,直接影响模型的拟合效果与泛化表现。
升维的核心作用
升维是将低维空间中混杂的信息拆解为多维度独立特征,让非线性可分问题转化为线性可分问题。该操作无需人工设计复杂规则,通过维度拓展暴露数据的隐藏规律,适配线性模型的学习模式,提升模型对复杂数据的适配能力。
SVM核函数的隐式升维
支持向量机(SVM)通过核函数实现隐式升维,核函数可直接计算样本在高维空间的相似度,无需显式构建高维特征向量。常用的高斯核(Gaussian kernel)可将原始特征映射至高维空间,依托样本间的相似度完成分类边界构建。
随机特征的显式化实现
随机特征是核技巧的轻量化近似方案,通过随机生成参数构建映射函数,将原始特征转换为高维显式特征。以随机傅里叶特征为例,通过cos(w·x + b)的映射形式,用有限维特征内积近似核函数的计算结果,其中w与b为符合分布要求的随机参数。该方案将核方法的计算复杂度从O(|D|³)降至O(M²|D|+M³),M为随机特征数量,可通过参数调整平衡精度与计算效率。
九、训练过程的秩动力学
机器学习模型的训练过程,遵循秩的动力学典型路径。
训练前期:升秩。 模型通过扩展自身的自由度,捕捉训练数据中的结构和规律。这一阶段,模型的表达能力逐渐增强,能够拟合越来越复杂的模式,相当于一个探索特征空间的过程。
训练后期:降秩。 随着训练的深入,有效信息逐渐被压缩,冗余和噪声被剔除,模型向一个稳健的低秩状态收敛。这个过程类似于正则化通过驱动力,将奇异值谱向更集中的方向引导,使模型从过拟合的高秩态,走向泛化稳健的低秩吸引子。
正则化项的本质,是压缩势的工程实现。它通过约束模型的参数空间,引导奇异值分布集中化,让模型在保持表达能力的同时,具备更好的泛化能力。这一过程可以由有效秩与谱演化的动态来定量刻画。
十、认知处理的双路径框架
针对高维系统,认知处理的路径选择,由系统是否存在可提取的低秩结构决定。对于存在低秩结构的系统,优先通过核心变量提取,构建因果理论完成降维处理。对于不存在低秩结构的系统,通过统计方法捕捉整体分布规律,完成对系统行为的概率性描述。
文明的认知能力存在资源与结构层面的双重上限。认知过程的核心,是在高维现实中识别可处理的结构,适配自身的认知约束。可理解性的边界,由系统自身的结构特征与认知系统的约束共同决定。
参考文献
吾不識且不知. (2026, 4月18日). 结构缺陷:为什么世界会出现不可逆复杂性. 微信公众号. https://mp.weixin.qq.com/s/6ZXwjSj13tPhWU2HblL8ng
TCEEDGE. (2026, 3月14日). 可理解性的边界:文明能够理解多少维度. 微信公众号. https://mp.weixin.qq.com/s/262-rdJtXwH38ymboUCx3w
吾不識且不知. (2026, 4月22日). 秩的动力学:结构如何随时间演化. 微信公众号. https://mp.weixin.qq.com/s/Z5qZ7MZjY05hcica0XKgrg