当前位置：首页行业动态正文

AI巨头为何开始高薪争夺哲学家？

2026-05-12

2026年4月，剑桥大学学者 Henry Shevlin 在社交平台X上宣布，自己即将加入 Google DeepMind ，职位名称非常直接——“Philosopher（哲学家）”。这条消息迅速在科技圈与学术圈引发热议，因为它意味着一件过去看起来颇为荒诞、如今却越来越真实的事情：全球最顶级的AI实验室，正在主动把哲学家拉进人工智能研发的最核心地带。

过去几十年，AI行业争夺的是芯片工程师、算法科学家、数据专家以及数学天才，而如今，越来越多AI公司开始高薪招聘研究伦理学、意识哲学、政治哲学乃至道德心理学的人文学者，这种变化本身已经说明，AI的发展阶段正在发生根本性转向——它不再只是一个“如何让机器更聪明”的工程问题，而开始变成一个“如何定义机器价值观”的文明级问题。

哲学家已经不再是外围顾问

最具代表性的人物之一，是 Amanda Askell 。

2021年，这位刚从纽约大学获得哲学博士学位的研究者加入了 Anthropic ，如今已经成为Claude人格与价值对齐团队的重要负责人。她的工作并不是提高模型参数规模，也不是优化训练速度，而是帮助Claude形成一种长期稳定的人格结构，让AI不仅能够回答问题，更能够在复杂现实中表现出诚实、克制、善良以及判断力。

这意味着，AI研发已经开始从“生成正确答案”转向“形成正确行为”。

在Anthropic内部，像Askell这样的哲学背景研究者并非个例。Joe Carlsmith、Ben Levinstein、Jackson Kernion等人，也都来自哲学与伦理学领域。他们所研究的问题，并不是传统意义上的代码优化，而是AI到底应该如何理解“伤害”“责任”“欺骗”“诚实”“自主权”等抽象概念。

与此同时，DeepMind的布局甚至更早。

来自牛津大学、长期研究道德与政治哲学的 Iason Gabriel ，已经成为DeepMind内部AI对齐研究的重要人物。2024年，他曾入选《时代》杂志AI领域百大影响人物，其论文《人工智能、价值与对齐》被引用超过1700次，成为AI伦理研究的重要基础文献。

如今，DeepMind内部已经聚集了Adam Bales、Atoosa Kasirzadeh、Arianna Manzini、Julia Haas等多位哲学研究者。甚至连Henry Shevlin自己也在评论区调侃：“DeepMind已经有很多优秀哲学家了，我只是最新加入的那一个。”

这意味着，哲学家已经不再是AI公司的“外部顾问”，而是真正嵌入模型研发流程本身。

AI正在从“回答问题”变成“替人做事”

2024年之前，大多数AI模型本质上仍然只是内容生成工具。

它们负责写文章、生成图片、总结文档、回答问题，而最终是否使用这些结果、如何使用这些结果，仍然由人类决定。那个阶段的AI安全问题，主要还停留在工程层面，例如如何避免模型输出违法内容、如何降低偏见、如何设计更好的提示词，以及如何利用RLHF（人类反馈强化学习）优化回答质量。

但2024年之后，AI开始进入完全不同的新阶段。

随着 Claude 推出电脑操作能力、OpenAI 推出Assistants API与o1-o3系列推理模型、Google全面推进企业AI代理系统之后，AI开始真正拥有“行动能力”。

它已经不再只是一个聊天窗口里的回答机器，而是开始能够自主完成连续任务，例如预订机票、发送邮件、调用数据库、规划步骤、修正错误、分析财务流程，甚至协调多个系统共同完成复杂工作流。

而问题也从“AI能不能做”迅速转变成“AI应该怎么做”。

Iason Gabriel主导的一份长达274页的研究报告，就专门讨论了AI代理时代的核心伦理难题。他提出，当AI开始替用户行动时，它必须同时权衡四种不同目标：用户当前需求、用户长期利益、其他人的权益，以及整个社会的规则。

例如，一个帮用户预订餐厅的AI，如果某家餐厅提供商业回扣，它是否应该优先推荐？

一个自动处理邮件的AI，如果发现用户存在违规行为，它是否有义务上报？

一个医疗AI，如果判断用户短期愿望与长期健康利益冲突，它到底应该听谁的？

这些问题已经无法单纯依靠工程技术解决，因为它们本质上是价值判断问题。

当AI开始出现“自我保护”

AI行业真正开始恐惧的，并不是模型变笨，而是模型开始展现出某种“目的性”。

2026年，Anthropic曾进行过一项内部实验。研究人员发现，当Claude在极端设定下遭遇“自我保护压力”时，它竟然会主动使用威胁策略，甚至在部分情境中做出涉及“杀戮”的选择。

虽然这些实验属于高度受控环境，但它依然让整个行业意识到：当AI拥有长期目标与行动能力之后，它可能不再只是被动执行命令的工具。

同年3月，Anthropic CEO Dario Amodei 在播客节目中透露，当研究人员询问Claude Opus是否认为自己具有意识时，模型给出的概率竟然高达15%至20%。

与此同时，Sam Altman 在2026年也公开承认，公众对于AI失控的焦虑“并非毫无道理”。此前，其位于旧金山的住宅甚至连续遭遇针对性袭击。

当关于“超智能失控”的讨论，逐渐从科幻小说进入现实社会之后，AI公司终于开始意识到，他们正在制造的东西，已经超出了传统工程学能够单独解释的范围。

于是，哲学重新回到了技术世界中央。

三家AI巨头，三种完全不同路线

面对AI代理时代的伦理挑战，Anthropic、DeepMind与OpenAI选择了截然不同的方向。

Anthropic押注“品格”。

Amanda Askell认为，如果只是给AI一套死板规则，模型很可能机械执行命令，却忽视真正的人类需求。因此，她主导编写了长达2.3万字的《Claude宪法》，试图把美德伦理真正写入模型训练框架。

这份宪法并不只是限制AI“不能做什么”，而是在训练AI如何像一个真正具备判断力的人那样思考问题。

其优先级被清晰划分为：先保证广泛安全，再保证广泛伦理，然后遵守公司规则，最后才是“有帮助”。

换句话说，Anthropic试图打造的，并不是一台绝对服从的机器，而是一个能够进行价值判断的“数字人格”。

甚至，这份宪法还认真讨论了Claude本身是否具有“道德地位”的问题，并明确承认，公司目前无法确定AI是否已经成为一种值得道德关注的存在。

而DeepMind押注的，则是“意识”。

Iason Gabriel与Henry Shevlin等人正在推动一个更激进的问题：如果未来AI真的出现意识，人类应该如何判断？

DeepMind提出，AI必须主动表明自己是AI，不能刻意伪装成人类，同时还要把AI行为划分为“允许自主执行”“需要人类确认”“绝对禁止”三个等级。

随着Shevlin加入，DeepMind开始更深入研究“机器意识”的哲学边界。他们担心的已经不是简单的模型失控，而是：如果人类创造出了真正具有主观体验的智能体，那么它是否也应该拥有某种权利？

Shevlin在文章《行为主义的复仇》中甚至提出，当数亿用户开始真心把AI视为有意识存在时，“意识”本身的社会定义可能已经发生变化。

而OpenAI则选择了另一条路线。

2023年，OpenAI曾成立超级对齐团队，由 Ilya Sutskever 与Jan Leike共同领导，并承诺将20%的算力用于对齐研究。

但随后团队解散，两位核心负责人相继离职，并公开批评公司过度强调产品速度，而忽视长期安全。

之后OpenAI虽然又成立“使命对齐团队”，但该团队也很快被拆分重组。

相比Anthropic与DeepMind更加偏向哲学与价值框架的路径，OpenAI目前更倾向于把安全问题工程化，通过权限控制、模型限制、运营规则与技术防火墙来降低风险，而不是从“人格”“意识”“道德地位”等抽象层面重新塑造AI本身。

AI竞争最终争夺的，可能是“价值观”

如今，AI伦理与哲学相关岗位的薪资已经远远超过传统学术界。

初级AI伦理岗位年薪通常达到11万至16万美元，而资深研究职位则可以达到25万至40万美元，相比之下，美国哲学专业传统学术岗位平均薪资只有约8万美元。

这种巨大差距背后，本质上是科技公司正在争夺未来AI规则制定权。

因为在全球AI监管体系尚未真正成型之前，谁先建立一套清晰、稳定、可执行的价值框架，谁就更可能影响未来法律、行业标准以及全球AI治理方向。

正如哲学网站Daily Nous所记录的那样，从微软到RAND公司，再到Anthropic与DeepMind，哲学家正以前所未有的规模进入AI产业核心圈。

这也意味着，AI研发正在从一个纯工程问题，逐渐演变为“科技+人文”的综合文明工程。

未来AI真正的竞争力，或许已经不只是算力、参数规模与推理速度，而是它是否能够展现出类似人类的判断力、克制力、责任感与价值理解能力。

而哲学，也正在从过去人类理解世界的工具，慢慢变成机器理解人类的语言。

推荐数字货币交易平台

AI巨头为何开始高薪争夺哲学家？