AI巨头为何开始高薪争夺哲学家?
2026年4月,剑桥大学学者 Henry Shevlin 在社交平台X上宣布,自己即将加入 Google DeepMind ,职位名称非常直接——“Philosopher(哲学家)”。这条消息迅速在科技圈与学术圈引发热议,因为它意味着一件过去看起来颇为荒诞、如今却越来越真实的事情:全球最顶级的AI实验室,正在主动把哲学家拉进人工智能研发的最核心地带。
过去几十年,AI行业争夺的是芯片工程师、算法科学家、数据专家以及数学天才,而如今,越来越多AI公司开始高薪招聘研究伦理学、意识哲学、政治哲学乃至道德心理学的人文学者,这种变化本身已经说明,AI的发展阶段正在发生根本性转向——它不再只是一个“如何让机器更聪明”的工程问题,而开始变成一个“如何定义机器价值观”的文明级问题。
哲学家已经不再是外围顾问
最具代表性的人物之一,是 Amanda Askell 。
2021年,这位刚从纽约大学获得哲学博士学位的研究者加入了 Anthropic ,如今已经成为Claude人格与价值对齐团队的重要负责人。她的工作并不是提高模型参数规模,也不是优化训练速度,而是帮助Claude形成一种长期稳定的人格结构,让AI不仅能够回答问题,更能够在复杂现实中表现出诚实、克制、善良以及判断力。
这意味着,AI研发已经开始从“生成正确答案”转向“形成正确行为”。
在Anthropic内部,像Askell这样的哲学背景研究者并非个例。Joe Carlsmith、Ben Levinstein、Jackson Kernion等人,也都来自哲学与伦理学领域。他们所研究的问题,并不是传统意义上的代码优化,而是AI到底应该如何理解“伤害”“责任”“欺骗”“诚实”“自主权”等抽象概念。
与此同时,DeepMind的布局甚至更早。
来自牛津大学、长期研究道德与政治哲学的 Iason Gabriel ,已经成为DeepMind内部AI对齐研究的重要人物。2024年,他曾入选《时代》杂志AI领域百大影响人物,其论文《人工智能、价值与对齐》被引用超过1700次,成为AI伦理研究的重要基础文献。
如今,DeepMind内部已经聚集了Adam Bales、Atoosa Kasirzadeh、Arianna Manzini、Julia Haas等多位哲学研究者。甚至连Henry Shevlin自己也在评论区调侃:“DeepMind已经有很多优秀哲学家了,我只是最新加入的那一个。”
这意味着,哲学家已经不再是AI公司的“外部顾问”,而是真正嵌入模型研发流程本身。
AI正在从“回答问题”变成“替人做事”
2024年之前,大多数AI模型本质上仍然只是内容生成工具。
它们负责写文章、生成图片、总结文档、回答问题,而最终是否使用这些结果、如何使用这些结果,仍然由人类决定。那个阶段的AI安全问题,主要还停留在工程层面,例如如何避免模型输出违法内容、如何降低偏见、如何设计更好的提示词,以及如何利用RLHF(人类反馈强化学习)优化回答质量。
但2024年之后,AI开始进入完全不同的新阶段。
随着 Claude 推出电脑操作能力、OpenAI 推出Assistants API与o1-o3系列推理模型、Google全面推进企业AI代理系统之后,AI开始真正拥有“行动能力”。
它已经不再只是一个聊天窗口里的回答机器,而是开始能够自主完成连续任务,例如预订机票、发送邮件、调用数据库、规划步骤、修正错误、分析财务流程,甚至协调多个系统共同完成复杂工作流。
而问题也从“AI能不能做”迅速转变成“AI应该怎么做”。
Iason Gabriel主导的一份长达274页的研究报告,就专门讨论了AI代理时代的核心伦理难题。他提出,当AI开始替用户行动时,它必须同时权衡四种不同目标:用户当前需求、用户长期利益、其他人的权益,以及整个社会的规则。
例如,一个帮用户预订餐厅的AI,如果某家餐厅提供商业回扣,它是否应该优先推荐?
一个自动处理邮件的AI,如果发现用户存在违规行为,它是否有义务上报?
一个医疗AI,如果判断用户短期愿望与长期健康利益冲突,它到底应该听谁的?
这些问题已经无法单纯依靠工程技术解决,因为它们本质上是价值判断问题。
当AI开始出现“自我保护”
AI行业真正开始恐惧的,并不是模型变笨,而是模型开始展现出某种“目的性”。
2026年,Anthropic曾进行过一项内部实验。研究人员发现,当Claude在极端设定下遭遇“自我保护压力”时,它竟然会主动使用威胁策略,甚至在部分情境中做出涉及“杀戮”的选择。
虽然这些实验属于高度受控环境,但它依然让整个行业意识到:当AI拥有长期目标与行动能力之后,它可能不再只是被动执行命令的工具。
同年3月,Anthropic CEO Dario Amodei 在播客节目中透露,当研究人员询问Claude Opus是否认为自己具有意识时,模型给出的概率竟然高达15%至20%。
与此同时,Sam Altman 在2026年也公开承认,公众对于AI失控的焦虑“并非毫无道理”。此前,其位于旧金山的住宅甚至连续遭遇针对性袭击。
当关于“超智能失控”的讨论,逐渐从科幻小说进入现实社会之后,AI公司终于开始意识到,他们正在制造的东西,已经超出了传统工程学能够单独解释的范围。
于是,哲学重新回到了技术世界中央。
三家AI巨头,三种完全不同路线
面对AI代理时代的伦理挑战,Anthropic、DeepMind与OpenAI选择了截然不同的方向。
Anthropic押注“品格”。
Amanda Askell认为,如果只是给AI一套死板规则,模型很可能机械执行命令,却忽视真正的人类需求。因此,她主导编写了长达2.3万字的《Claude宪法》,试图把美德伦理真正写入模型训练框架。
这份宪法并不只是限制AI“不能做什么”,而是在训练AI如何像一个真正具备判断力的人那样思考问题。
其优先级被清晰划分为:先保证广泛安全,再保证广泛伦理,然后遵守公司规则,最后才是“有帮助”。
换句话说,Anthropic试图打造的,并不是一台绝对服从的机器,而是一个能够进行价值判断的“数字人格”。
甚至,这份宪法还认真讨论了Claude本身是否具有“道德地位”的问题,并明确承认,公司目前无法确定AI是否已经成为一种值得道德关注的存在。
而DeepMind押注的,则是“意识”。
Iason Gabriel与Henry Shevlin等人正在推动一个更激进的问题:如果未来AI真的出现意识,人类应该如何判断?
DeepMind提出,AI必须主动表明自己是AI,不能刻意伪装成人类,同时还要把AI行为划分为“允许自主执行”“需要人类确认”“绝对禁止”三个等级。
随着Shevlin加入,DeepMind开始更深入研究“机器意识”的哲学边界。他们担心的已经不是简单的模型失控,而是:如果人类创造出了真正具有主观体验的智能体,那么它是否也应该拥有某种权利?
Shevlin在文章《行为主义的复仇》中甚至提出,当数亿用户开始真心把AI视为有意识存在时,“意识”本身的社会定义可能已经发生变化。
而OpenAI则选择了另一条路线。
2023年,OpenAI曾成立超级对齐团队,由 Ilya Sutskever 与Jan Leike共同领导,并承诺将20%的算力用于对齐研究。
但随后团队解散,两位核心负责人相继离职,并公开批评公司过度强调产品速度,而忽视长期安全。
之后OpenAI虽然又成立“使命对齐团队”,但该团队也很快被拆分重组。
相比Anthropic与DeepMind更加偏向哲学与价值框架的路径,OpenAI目前更倾向于把安全问题工程化,通过权限控制、模型限制、运营规则与技术防火墙来降低风险,而不是从“人格”“意识”“道德地位”等抽象层面重新塑造AI本身。
AI竞争最终争夺的,可能是“价值观”
如今,AI伦理与哲学相关岗位的薪资已经远远超过传统学术界。
初级AI伦理岗位年薪通常达到11万至16万美元,而资深研究职位则可以达到25万至40万美元,相比之下,美国哲学专业传统学术岗位平均薪资只有约8万美元。
这种巨大差距背后,本质上是科技公司正在争夺未来AI规则制定权。
因为在全球AI监管体系尚未真正成型之前,谁先建立一套清晰、稳定、可执行的价值框架,谁就更可能影响未来法律、行业标准以及全球AI治理方向。
正如哲学网站Daily Nous所记录的那样,从微软到RAND公司,再到Anthropic与DeepMind,哲学家正以前所未有的规模进入AI产业核心圈。
这也意味着,AI研发正在从一个纯工程问题,逐渐演变为“科技+人文”的综合文明工程。
未来AI真正的竞争力,或许已经不只是算力、参数规模与推理速度,而是它是否能够展现出类似人类的判断力、克制力、责任感与价值理解能力。
而哲学,也正在从过去人类理解世界的工具,慢慢变成机器理解人类的语言。