微软Copilot Cowork正式上线：DeepSeek V4或成低成本黑马

本周，微软发布了两项看似常规的产品与定价更新，实则揭示了AI行业一次悄然但战略性的转向。Copilot Cowork现已全面可用，将AI从被动的建议引擎转变为主动的执行者——一个能自主浏览Outlook邮件、Teams会议和Excel电子表格以完成复杂工作流的代理。超过一半的财富500强公司已在预览阶段部署了它，表明对主动完成任务型AI的需求远超预期。但更具深意的是定价模式的转变：微软放弃了僵化的每月30美元订阅制，转而采用按用量计费，这直接承认了AI推理成本的可变性。

技术深度解析

Copilot Cowork代表了早期AI助手的重大架构飞跃。与主要提供建议并在单一应用内生成内容的Microsoft 365版Copilot不同，Cowork是一个跨应用编排多步骤任务的代理系统。其核心技术挑战在于跨Outlook、Teams和Excel维护持久上下文，不仅理解单个指令，还要理解复杂工作流背后的意图。例如，用户可以要求Cowork“找出所有关于Q3营销预算的邮件，总结关键点，在Excel中创建表格，并在Teams中安排评审会议”。这要求系统解析自然语言、跨邮件档案执行检索增强生成（RAG）、执行代码操作Excel单元格，并与Teams日历API交互——同时保持连贯的状态。

微软尚未公布完整的架构细节，但该系统很可能依赖多代理框架。一个中央编排代理将用户请求分解为子任务，分派给专门代理（如邮件代理、电子表格代理），然后综合结果。这让人联想到开源项目AutoGen（GitHub上超过30,000星），它提供了构建多代理对话的框架。另一个相关仓库是LangChain（超过90,000星），它提供了将LLM调用与外部工具和API链式连接的工具。不过，微软的实现很可能更为健壮，拥有针对企业数据的专有微调以及与Microsoft Graph API的深度集成。

一个关键技术障碍是延迟和成本。每个子任务可能需要单独的LLM调用，复杂工作流可能涉及数十次调用。这正是按用量计费模式的技术意义所在。微软决定按“操作”收费（例如，每处理一封邮件、每编辑一个单元格），而非固定费用，直接反映了可变成本结构。因此，评估DeepSeek V4既是技术决策也是商业决策。由中国AI实验室DeepSeek开发的DeepSeek V4，其基准测试成本仅为GPT-4o的零头。根据公开数据：

| 模型 | 参数 | MMLU分数 | 每百万输入token成本 | 每百万输出token成本 |
|---|---|---|---|---|
| GPT-4o | 约200B | 88.7 | $5.00 | $15.00 |
| Claude 3.5 Sonnet | — | 88.3 | $3.00 | $15.00 |
| DeepSeek V4 | 约200B | 86.5 | $0.50 | $2.00 |

数据要点： 与GPT-4o相比，DeepSeek V4的输入token成本降低了90%，输出token成本降低了87%，同时MMLU分数仅低2.2分。对于高吞吐量的企业工作流，这一成本差异具有变革性。

然而，成本并非唯一因素。DeepSeek V4的架构采用混合专家（MoE）方法，每个token仅激活部分参数，从而降低计算负载。这使其在推理时天然更高效，尤其是在多代理环境中进行大量小型并行调用时。微软可能会将DeepSeek V4用于低风险任务——如总结常规邮件或格式化电子表格——同时将GPT-4o保留给复杂推理或敏感数据处理。这就在单一产品内创建了分层模型生态系统。

关键玩家与案例研究

微软此举并非孤例。多家公司已在尝试多模型策略。OpenAI尽管是微软的主要合作伙伴，但也在通过GPT-4o mini推动自身成本削减叙事，其每百万输入token成本为0.15美元。然而，DeepSeek V4的成本甚至比这低三倍。Anthropic的Claude 3.5 Sonnet专注于安全性和长上下文窗口，但其定价仍高于DeepSeek。

一个值得注意的案例是开源社区对DeepSeek模型的采用。DeepSeek-V4仓库在GitHub上已获得超过15,000星，开发者称赞其在代码生成和数学推理方面的效率。包括Cursor和Continue.dev在内的多家初创公司已将DeepSeek模型集成为代码补全的高性价比替代方案。这种草根层面的采用很可能引起了微软的注意。

另一个关键玩家是谷歌，它拥有自己的Gemini模型。谷歌的Workspace套件（Gmail、Docs、Sheets）是Microsoft 365的直接竞争对手，谷歌一直在将Gemini集成到其生产力工具中。然而，谷歌尚未为其AI功能采用按用量计费模式，而是坚持固定订阅费。如果Cowork的定价对可变工作负载更具吸引力，这给了微软一个潜在竞争优势。

| 公司 | 产品 | 定价模式 | 关键差异化因素 |
|---|---|---|---|
| 微软 | Copilot Cowork | 按用量计费（待定） | 跨应用自主代理 |
| OpenAI | GPT-4o | 按token计费 | 高性能通用模型 |
| 谷歌 | Gemini for Workspace | 固定订阅费 | 深度集成谷歌生态 |
| Anthropic | Claude 3.5 Sonnet | 按token计费 | 安全性与长上下文 |

时间归档

延伸阅读

常见问题

这次模型发布“Microsoft Copilot Cowork Goes Live: DeepSeek V4 Could Be the Low-Cost Dark Horse”的核心内容是什么？

This week, Microsoft dropped two announcements that, on the surface, appear to be routine product and pricing updates. In reality, they reveal a quiet but strategic pivot in the AI…

从“DeepSeek V4 vs GPT-4o cost comparison enterprise”看，这个模型发布为什么重要？

Copilot Cowork represents a significant architectural leap from earlier AI assistants. Unlike Copilot for Microsoft 365, which primarily offered suggestions and generated content within a single app, Cowork is an agent s…

围绕“Microsoft Copilot Cowork usage-based pricing breakdown”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。