当前位置:首页 行业动态 正文

Claude进军电脑操控 AI自动化竞赛升温

2026-03-25

在AI能力不断向“行动层”延伸的当下,Anthropic近日为Claude推出的计算机使用(Computer Use)功能,标志着大模型正从“能说会写”的工具,进一步进化为可以直接操控操作系统、执行复杂任务的智能体,这一变化不仅重塑了人机交互的边界,也让此前依赖第三方实现的自动化方案面临被系统级能力替代的压力。

 

3月24日,Anthropic正式宣布在其AI协作工具Claude Cowork以及编程工具Claude Code中上线该功能,使得用户可以通过简单指令,让Claude直接接管电脑操作流程,无论是打开应用、浏览网页、填写表格,还是执行更复杂的开发任务,理论上都可以由模型代为完成,其核心逻辑在于:只要是人类坐在电脑前可以完成的操作,Claude都可以通过模拟鼠标、键盘以及界面交互来复现。

 

更值得关注的是,这一能力并非孤立存在,而是与此前推出的Dispatch功能形成叠加效应,后者允许用户通过手机远程向Claude下达任务指令,从而实现“人不在电脑前,AI仍在持续工作”的使用场景,这种从本地控制到远程调度的能力延伸,本质上是在将个人电脑转化为一个随时可被调用的自动化执行节点,而Claude则成为这一节点的调度与执行核心。

 

不过,从官方表述来看,这一功能仍处于早期研究预览阶段,目前仅对Claude Pro和Max订阅用户开放,且暂时仅支持macOS系统,Windows版本尚在开发中,同时其执行效率仍明显低于人类操作,这意味着其现阶段更适合作为能力验证工具,而非完全替代人工操作的生产力基础设施。

 

在具体执行机制上,Claude会优先调用已有连接器来完成任务,例如对接Slack或谷歌日历等服务,而在缺乏接口支持的情况下,则会直接接管用户的浏览器与操作界面,通过滚动、点击、输入等方式逐步推进任务流程,并在关键操作前请求用户授权,这种“半自动化+可控授权”的设计,在提升效率的同时,也试图在安全性与可控性之间取得平衡。

 

从实际应用场景来看,这一能力已经展现出较强的通用性,例如在用户时间紧迫时,Claude可以自动导出文档并添加至会议邀请,在开发流程中帮助启动服务、截取界面截图并发送结果,甚至在图像处理等重复性任务中完成批量操作与格式转换,这些原本需要多步骤手动完成的流程,被压缩为一句自然语言指令,从而大幅降低了操作门槛。

 

与此同时,Claude在执行过程中还会实时反馈自身进度,例如当前正在打开应用、定位页面或执行截图等,这种“可解释的执行路径”在一定程度上缓解了用户对自动化系统的不信任感,也为后续优化提供了观察窗口。

 

随着Dispatch功能的加入,这种能力进一步延伸至移动端场景,使用户可以在通勤或外出过程中,通过手机远程指挥Claude完成电脑端任务,例如自动整理邮件、生成日报、运行代码测试甚至推进项目进度,这种跨设备协同的自动化模式,正在逐步改变传统的工作方式,使“人在不在电脑前”这一限制变得不再重要。

 

当然,Anthropic也明确强调了潜在风险与局限性,由于该功能仍处于早期阶段,其在复杂环境中可能出现错误操作,同时在涉及敏感数据或关键系统时,仍需要用户保持高度谨慎,因此官方建议用户优先在可信应用环境中进行尝试,并避免赋予过高权限。

 

从行业视角来看,Claude此次能力升级与此前爆火的OpenClaw形成了直接对标关系,两者都试图让AI从对话工具升级为能够自主操作桌面的智能体,但关键差异在于实现路径:OpenClaw依赖开源社区与本地部署,虽然灵活但门槛较高且存在安全隐患,而Anthropic则将这一能力内置于官方产品体系之中,通过统一的权限管理与安全护栏实现“开箱即用”的体验,这种从“民间方案”向“平台级能力”的迁移,往往意味着行业进入标准化阶段。

 

也正因如此,尽管当前仍有用户调侃“Claude杀死了OpenClaw”,但从实际能力与成熟度来看,这一结论尚为时过早——在执行速度、稳定性以及开放程度等方面,Claude的计算机使用功能仍有明显提升空间,其真正的竞争力,或许要等到全面开放并完成性能优化之后,才能得到验证。

 

从更宏观的角度来看,这一进展的意义在于,它预示着AI正从“辅助决策”走向“直接执行”,即从提供建议的工具,转变为可以独立完成任务的行动主体,而当这一能力与远程调度、权限控制以及多应用协同进一步融合时,一个以AI为核心的个人自动化操作系统,正在逐步成形,而这或许才是这场“谁杀死谁”的竞争背后,更值得关注的真正趋势。