当前位置:首页 行业动态 正文

AI会自我进化吗?

2026-06-11

Anthropic真正讨论的,不是安全,而是增长极限

 

2026年6月,Anthropic发布了一篇题为《When AI Builds Itself》的文章。相比Claude代码生成能力提升、工程师效率增长等已经被市场反复讨论的话题,这篇文章真正值得关注的地方并不在于Claude已经能够完成超过80%的代码合并工作,也不在于工程师生产效率提升了数倍,而在于它提出了一个更深层的判断:随着AI逐渐接管软件开发流程本身,模型未来可能具备设计、训练和优化下一代模型的能力,而当这种能力形成闭环之后,AI的发展速度将不再受制于人类研究人员的研发效率,而是进入一种由AI推动AI发展的递归自我改进阶段。

 

这一判断实际上构成了当前大量AI安全讨论的底层逻辑。

 

无论是关于超级智能的担忧、关于控制权丧失的讨论,还是关于全球监管机制的设计,其背后都隐含着同一个前提:模型能力将持续增长,并最终突破某个关键阈值,从而具备创造比自己更强模型的能力。

 

Anthropic担忧的并不是今天的Claude。

 

他们担忧的是未来某个时刻出现的Claude N+1。

 

但问题在于,整个推论链条建立在一个尚未被证明的假设之上——模型能够真正创造出新的能力边界。

 

而这恰恰是当前AI行业最容易被忽视的问题。

 

因为如果模型本质上只能在已有知识空间中进行压缩、重组和预测,那么所谓的递归自我改进,很可能只是递归优化,而不是递归进化。

 

这两个概念之间的差异,决定了AI未来几十年的发展路径。

 

AI行业正在把假设当成结论

 

过去几年,大模型领域形成了一种颇为特殊的现象:许多原本属于研究假设的命题,正在逐渐被包装成无需证明的行业共识,而越来越多的投资决策、技术路线乃至监管讨论,也开始建立在这些假设之上。

 

“压缩即智慧”是其中之一。

 

“Scaling Law持续有效”是其中之一。

 

“更大的模型自然会产生更高层次的智能”同样如此。

 

这些观点并非完全错误。事实上,它们都能够解释过去几年已经发生的部分现象。但问题在于,能够解释历史并不意味着能够预测未来,更不意味着能够揭示底层机制。

 

以“压缩即智慧”为例。

 

这一观点最核心的逻辑是,如果一个模型能够更准确地预测下一个Token出现的概率,那么它在信息压缩过程中就能够获得更高的压缩效率,因此更好的压缩能力意味着更高的智能水平。

 

这个推论听上去深刻,但仔细分析会发现,它本质上更接近一种定义,而不是一种解释。

 

因为压缩率本来就是由预测能力决定的。

 

它告诉我们性能更好的模型拥有更好的预测能力,却没有解释为什么预测能力能够产生推理能力;它解释了谁更优秀,却没有解释优秀从何而来;它描述了现象,却没有揭示机制。

 

真正的问题其实始终没有被回答:

 

为什么大模型能够在语言空间中表现出接近甚至超越人类的能力,却依然无法像人类一样创造新的知识体系?

 

为什么模型能够写出牛顿的著作,却无法成为牛顿?

 

为什么模型能够复现爱因斯坦,却无法创造新的相对论?

 

这些问题的答案,决定着递归自我改进是否可能发生。

 

模型不是知识,模型只是知识的载体

 

为了理解这个问题,我们不妨进行一个思想实验。

 

假设我们把今天最先进的大语言模型完整地带回中世纪。

 

这里带回去的不是训练好的权重,而是Transformer架构、训练方法、推理框架以及构建现代大模型所需要的全部技术知识。假设中世纪的人完全能够理解这些设计,并按照我们的方案搭建出一台与今天完全相同的机器。

 

那么会发生什么?

 

答案或许并不像很多人想象的那样震撼。

 

这台机器当然能够学习中世纪世界里的所有文本。

 

它能够熟练讨论神学。

 

能够模仿经院哲学家的辩论方式。

 

能够续写骑士文学。

 

能够总结阿拉伯数学家的著作。

 

但它不可能知道牛顿力学。

 

因为牛顿力学尚未出现。

 

它不可能理解相对论。

 

因为描述时空的数学体系尚未建立。

 

它不可能讨论量子力学。

 

因为量子力学赖以存在的概念体系还没有被创造出来。

 

换句话说,即便拥有完全相同的模型能力,它依然无法获得未来几百年才会出现的知识。

 

因为模型并不是知识本身。

 

知识存在于编码之中。

 

存在于数学符号之中。

 

存在于科学理论之中。

 

存在于人类创造出来的概念体系之中。

 

模型能够学习这些编码、利用这些编码、重组这些编码,但它本身并不创造编码。

 

而真正推动文明前进的,从来不是预测能力,而是新的编码体系的诞生。

 

人类文明的进步,本质上是一场编码革命

 

如果回顾过去几千年的历史,我们会发现一个有趣的规律。

 

文明的重大飞跃,往往并不是因为人类突然变得更聪明,而是因为人类创造出了新的编码体系。

 

文字的出现,使经验能够跨代传承。

 

数字的出现,使数量能够被精确描述。

 

代数符号的出现,使抽象关系能够被计算。

 

微积分的出现,使连续变化能够被表达。

 

概率论的出现,使不确定性能够被量化。

 

计算机语言的出现,使机器能够执行复杂逻辑。

 

每一次重大突破,本质上都是一种新的编码被创造出来。

 

牛顿发明微积分,并不是因为他的参数规模比别人更大。

 

爱因斯坦建立相对论,也不是因为他拥有更多训练数据。

 

他们之所以能够推动知识边界向前扩张,是因为他们创造了新的描述世界的方式。

 

而新的描述方式并不是从已有文本中压缩出来的。

 

它来自人与现实世界的碰撞。

 

来自实验失败。

 

来自工程限制。

 

来自观察与验证。

 

来自人类不断尝试解释现实过程中产生的新需求。

 

因此知识增长的源头并不在模型内部。

 

而在模型之外。

 

模型能够加速知识传播。

 

能够加速知识组合。

 

能够加速知识应用。

 

但知识本身的进化机制,来自人与世界之间持续不断的互动。

 

这也是为什么直到今天,人类文明的发展速度依然受到科学实验、工程实践和社会反馈的限制,而不仅仅取决于计算资源。

 

因为真正稀缺的从来不是计算。

 

而是新的编码。