AI真正的拐点不在技术,而在人机协作的重构

April 2026
归档:April 2026
商汤科技联合创始人杨帆提出一个颠覆性观点:AI产业的真正拐点并非模型能力的跃升,而是生产关系的根本性重塑——从“人使用AI”转向“人机协作”。这重新定义了工作流、价值链乃至劳动的本质。

在近期一场行业演讲中,商汤科技联合创始人杨帆抛出了一个极具挑衅性的论点:AI产业一直痴迷于错误的指标。当全世界聚焦于参数量、训练算力和基准分数时,杨帆认为真正的拐点在于生产关系的转变——即人与机器协同工作的组织方式。他主张,从“人使用AI”到“人机协作”的过渡,比任何单一模型的突破都代表着更深层的结构性变革。这一转变将交互从基于命令的界面推向基于意图的系统,用户不再需要精确的提示词,只需陈述目标,AI智能体便能自主分解并执行。其影响深远:价值链被扁平化,因为

技术深度解析

杨帆的论点迫使我们从工作流视角(而非仅仅模型视角)重新审视AI系统的技术架构。当前范式——用户编写提示词、发送给大语言模型、接收回复——本质上是一种“人在回路中”的命令界面。而杨帆所称的“人机协作”新兴范式,则需要一个根本不同的技术栈:基于意图的编排层。

这一转变的核心是自主AI智能体的概念。与单次LLM调用不同,智能体系统必须将高层目标分解为子任务、执行它们(通常使用外部工具或API)、评估中间结果并迭代。这要求多智能体架构或复杂的规划模块。该方向上一个值得注意的开源项目是AutoGPT(GitHub: SignificantReparations/autogpt,目前拥有超过16万颗星)。AutoGPT尝试将LLM调用与任务分解和记忆串联起来,但在生产环境中仍显脆弱。一个更稳健的框架是LangGraph(GitHub: langchain-ai/langgraph,约1万颗星),它提供了一个基于图的状态机,用于构建包含循环、分支和人在回路检查点的智能体工作流。LangGraph的方法直接回应了杨帆的观点:它允许开发者设计人与机器之间的“生产关系”,指定AI何时应自主行动,何时必须将控制权交还给人类。

另一个关键技术组件是意图解析与目标分解引擎。与简单的提示词不同,该引擎必须理解歧义、上下文和用户偏好。像Anthropic这样的公司已经开创了“宪法AI”和“工具使用”能力,但真正的创新在于Cognition AI的Devin这类系统,它试图自主完成软件工程任务。Devin的架构包括一个代码编辑器、一个Shell和一个浏览器——全部由AI智能体控制,负责规划、调试和迭代。这里的技术挑战是可靠性:当前智能体系统在复杂的多步骤任务上成功率远低于50%。

| 系统 | 任务类型 | 多步任务成功率 | 需要人工干预 | 开源 |
|---|---|---|---|---|
| AutoGPT | 通用 | ~15% | 高 | 是 |
| LangGraph (with GPT-4) | 自定义工作流 | ~40% | 中 | 是 |
| Devin (Cognition AI) | 软件工程 | ~13.86% (SWE-bench) | 低 | 否 |
| Claude 3.5 + Tool Use | API编排 | ~35% | 中 | 否 |

数据要点: 该表格揭示了一个严峻的现实:即使是最好的智能体系统,在大多数复杂任务上也会失败。这不是模型质量问题——而是工作流设计和可靠性问题。杨帆的观点得到了验证:瓶颈不在于AI的原始智能,而在于能够优雅处理失败和不确定性的人机交互回路的设计。

关键玩家与案例研究

杨帆的论点并非抽象概念——它已经在主要玩家的战略中上演。微软已大力投资Copilot,这显然是一个人机协作工具。然而,微软的方法在每一步操作上仍基本保持“人在回路中”。杨帆会认为这仍是旧范式。更激进的转变出现在Cognition AI,其目标是用单个AI智能体取代整个软件工程团队。他们的Devin产品虽然仍处于萌芽阶段,但代表了“基于意图”的未来:管理者提出一个功能需求,Devin便自主编码、测试并部署。

商汤科技本身正在从纯AI研究实验室转向工作流解决方案提供商。其“SenseCore”平台正被重新定位,不仅是训练基础设施,更是企业工作流的编排层。杨帆的愿景表明,商汤将在模型规模上的竞争减少,而更多地在其AI如何无缝融入现有业务流程上展开竞争。

另一个关键案例是Replit,在线IDE。Replit的“Ghostwriter”AI助手正从代码补全工具(人使用AI)演变为能够根据描述构建整个应用的智能体(人机协作)。Replit的CEO Amjad Masad公开表示,目标是让“任何人都能构建软件”,这与杨帆关于价值链扁平化的观点一致。

| 公司 | 产品 | 范式 | 关键指标 | 商业模式 |
|---|---|---|---|---|
| 微软 | Copilot | 人在回路中 | 180万付费GitHub Copilot用户 | 按席位订阅 |
| Cognition AI | Devin | 基于意图的智能体 | 2100万美元种子轮,SWE-bench 13.86% | 基于成果(预估) |
| Replit | Ghostwriter | 混合 | 3000万+用户 | 免费增值+按席位 |
| 商汤科技 | SenseCore | 工作流编排 | 2021年IPO,正在转型 | 企业许可证 |

数据要点: 该表格展示了进展的谱系。微软拥有规模,但仍停留在旧

时间归档

April 20263005 篇已发布文章

延伸阅读

Stripe 的 288 项更新:宣告 AI 代理经济基础设施的黎明Stripe 发布了 288 项新功能,其中最引人注目的是一个为 AI 代理设计的钱包,让自主机器人拥有自己的可编程金融身份。这标志着 Stripe 从支付处理器向新兴机器对机器经济的基础设施的战略性转变。生数科技认领神秘模型:视频生成与具身智能统一于同一系统生数科技公开认领此前匿名登顶的模型,并展示了将视频生成与具身智能融合的工业级演示。该系统无需重新训练,即可在从机械臂到移动底盘的不同物理平台上执行复杂的长周期任务,标志着向真正世界模型迈出了关键一步。银河通用LDA框架:具身智能的“GPT-2时刻”与通用机器人学习的破局之道银河通用发布潜在域对齐(LDA)框架,一举破解具身智能领域的数据碎片化困局。通过在不同机器人形态间构建共享表征空间,LDA首次实现了跨形态世界动作模型的可规模化预训练,被业界誉为物理智能领域的“GPT-2时刻”。世界模型驱动无人配送:T6厢式货车开启商用自动驾驶新纪元半墨一星在硅谷全球具身智能创新大会上发布了T6自动驾驶厢式货车,标志着从实验室研究到商业部署的关键转折。通过将世界模型与多模态大语言模型融合,T6在复杂城市物流中实现了类人推理能力,有望实现可规模化、盈利的“最后一公里”配送。

常见问题

这次公司发布“AI's True Inflection Point Is Not Technology But Human-Machine Workflow Redesign”主要讲了什么?

In a recent industry address, Shang Tang Technology co-founder Yang Fan delivered a provocative thesis: the AI industry has been obsessed with the wrong metrics. While the world fi…

从“Shang Tang AI workflow redesign strategy”看,这家公司的这次发布为什么值得关注?

Yang Fan's thesis forces us to re-examine the technical architecture of AI systems from a workflow perspective, not just a model perspective. The current paradigm—where a user crafts a prompt, sends it to a large languag…

围绕“Yang Fan production relations theory AI”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。