DeepSeek 74亿美元融资:中国AI联盟重塑全球竞争格局

Hacker News June 2026
来源:Hacker NewsDeepSeekAI infrastructure归档:June 2026
DeepSeek完成创纪录的74亿美元A轮融资,成为亚洲最大单笔AI投资。本轮融资由省级AI产业基金、顶级互联网集团及国家级战略投资者共同参与,标志着中国AI行业从碎片化初创模式向协同化联盟体系的战略转型。这笔资金将用于下一代大语言模型、共享GPU集群以及面向制造、医疗等垂直领域的AI智能体开发。

DeepSeek的74亿美元A轮融资不仅是资本里程碑,更是一份战略宣言:中国AI产业正在国家主导的联盟模式下加速整合。投资者阵容前所未有——省级AI产业基金、腾讯和阿里巴巴等领先互联网平台,以及国家级战略投资工具悉数入局。这一联盟将DeepSeek定位为生态系统的锚定模型,负责统一调度算力、数据和人才资源。技术层面,资金将加速开发对标GPT-5级多语言推理与代码生成的下一代大语言模型。更关键的是,联盟机制使成员企业能够共享高端GPU集群和专有训练数据集,从而系统性地构建起应对西方技术封锁的防御体系。

技术深度解析

DeepSeek的74亿美元资金正被精准部署。首要技术目标是开发一款暂命名为DeepSeek-V5的新旗舰模型,目标是在多语言推理和代码生成方面达到GPT-5级能力。内部评估的早期基准显示,DeepSeek-V4在HumanEval(代码生成)上已达92.3%,在MMLU-Pro(多语言推理)上达89.1%,而GPT-4o分别为88.7%和88.3%,Claude 3.5分别为88.3%和86.2%。

| 模型 | MMLU-Pro 得分 | HumanEval 得分 | 训练算力 (FLOPs) | 每百万Token成本 |
|---|---|---|---|---|
| DeepSeek-V4 | 89.1 | 92.3 | 2.1e25 | $0.80 |
| GPT-4o | 88.7 | 87.5 | 1.8e25 | $5.00 |
| Claude 3.5 Sonnet | 88.3 | 86.2 | 1.6e25 | $3.00 |
| Gemini 1.5 Pro | 87.9 | 84.1 | 2.0e25 | $3.50 |

数据要点: DeepSeek-V4在关键推理和编程基准上已持平或超越顶级西方模型,而推理成本仅为后者几分之一。V5的目标是进一步扩大这一差距,同时保持成本效率。

架构方面,DeepSeek采用混合专家(MoE)设计,总参数量达1.8万亿,每个Token激活370亿参数,与DeepSeek-V2(已在GitHub上以`deepseek-ai/DeepSeek-V2`开源,目前获得超过18,000颗星)的方法类似。关键创新在于一种新颖的“自适应路由”机制,可根据输入复杂度动态分配专家容量,相比静态MoE路由将推理延迟降低40%。训练基础设施包括一个由10,000个华为昇腾910B芯片组成的定制集群,通过专有高速互联网络实现每节点800 Gbps的带宽——这是对美国对NVIDIA H100/B200 GPU出口管制的直接回应。

共享算力池是一大变革。联盟成员——包括腾讯、阿里巴巴及多家省级AI实验室——将其未充分利用的GPU容量贡献给由DeepSeek管理的联邦集群。这一池化资源估计相当于15万块H100 GPU,根据优先级动态分配给训练任务。该系统使用基于Kubernetes的调度器,并配备用于GPU内存超分的自定义插件,实现了85%的利用率,而行业平均水平仅为60%。

关键参与者与案例研究

投资者联盟堪称战略协同的典范。来自广东、浙江和江苏的省级AI产业基金贡献了约28亿美元,各自肩负加速本地制造业和医疗AI应用落地的使命。腾讯和阿里巴巴分别投资15亿美元和12亿美元,并非作为被动财务投资者,而是作为共享算力和数据生态系统的锚定租户。国家集成电路产业投资基金(即“大基金”)贡献了19亿美元,标志着国家层面的背书。

| 投资者类型 | 金额(十亿美元) | 战略角色 |
|---|---|---|
| 省级AI基金 | 2.8 | 区域部署、数据获取 |
| 腾讯 | 1.5 | 算力共享、消费级AI集成 |
| 阿里巴巴 | 1.2 | 云基础设施、电商数据 |
| 国家“大基金” | 1.9 | 政策协同、芯片供应链 |
| 其他(风投、主权基金) | 1.0 | 人才引进、全球扩张 |

数据要点: 74亿美元并非一张支票,而是围绕四大战略支柱的协同部署:区域部署、算力共享、云集成和政策协同。这种多元化降低了风险,并确保所有利益相关方都深度参与。

DeepSeek的垂直AI智能体战略直接借鉴了成功的西方企业平台,但针对中国国家主导的行业进行了调整。在制造业领域,DeepSeek正在开发“FactoryMind”——一款与西门子和SAP系统集成的AI智能体,用于优化生产调度、预测性维护和质量控制。在富士康深圳工厂的早期试点中,该智能体将停机时间减少了23%,缺陷率降低了15%。在医疗领域,“MediAssist”已在50多家省级医院部署,负责医疗记录摘要、药物相互作用检查和初步诊断建议,在中国医疗数据集上的内部测试中准确率达到94%,而GPT-4o为91%。在金融领域,“FinGuard”针对国有银行的风险评估和合规监控,在中国工商银行的试点中,误报欺诈警报减少了30%。

行业影响与市场动态

本轮融资从三个根本层面重塑了竞争格局。首先,它构建了一个“围墙花园”生态系统,DeepSeek的模型成为联盟成员的默认选择,从而分割了此前百度文心、阿里巴巴通义千问和腾讯混元激烈竞争的中国AI市场。其次,它将商业模式从基于API的消费转向基础设施捆绑。DeepSeek正向国有企业提供“AI即基础设施”合同,客户支付固定年费(范围从……)

更多来自 Hacker News

FERNme重写智能体记忆:零LLM调用,类脑图谱架构颠覆传统构建强大AI智能体的竞赛遭遇了根本性瓶颈:记忆。传统方法依赖反复调用大语言模型来压缩、总结和更新上下文窗口,每次交互消耗数千Token,且常引发幻觉或遗忘关键细节。新开源项目FERNme提出了一条截然不同的路径。它不再将记忆存储为文本块,而Agentic AI 一键生成完整游戏营销战役,独立开发者迎来公平竞技场多年来,游戏行业一直存在一个结构性矛盾:最具创意的独立作品往往因开发者缺乏营销预算而湮没于噪音之中,而大型发行商则凭借雄厚财力垄断流量。如今,一套基于大语言模型之上多智能体编排层构建的 Agentic AI 系统,正在打破这一僵局。该系统接参数悖论:Opus 4.8与GPT-5.5如何宣告AI从规模竞赛转向效率革命AI行业的两大前沿实验室——Anthropic与OpenAI,刻意隐瞒了其最新旗舰模型Opus 4.8和GPT-5.5的参数数量。这绝非疏忽或简单的商业机密保护,而是一次精心策划的举动,暴露了一场更深层的变革:多年来主导AI进步的缩放定律正查看来源专题页Hacker News 已收录 4996 篇文章

相关专题

DeepSeek72 篇相关文章AI infrastructure310 篇相关文章

时间归档

June 20262050 篇已发布文章

延伸阅读

DeepSeek估值450亿美元:中国AI自主信号重塑全球竞赛格局DeepSeek正以450亿美元估值启动首轮外部融资,标志着这家机构从低调的研究实验室向商业巨头的决定性转型。在北京推动AI自主化的大背景下,这一举动不仅挑战了前沿模型开发中资本密集型的传统模式,更加速了中国完全自主AI技术栈的构建进程。腾讯与宁德时代联手押注DeepSeek:AI成为连接云与能源的桥梁DeepSeek最新一轮融资吸引了腾讯与宁德时代作为战略投资者,二者目标截然不同:腾讯欲将DeepSeek的大语言模型嵌入其云生态作为原生AI核心,而宁德时代则希望将其改造为实时电池与电网优化的智能能源仪表。这标志着AI已不再仅仅是数字工具深度求索首轮融资:中国AGI理想主义者拥抱商业现实深度求索启动首次外部融资,标志着中国AI发展叙事迎来分水岭。此举意味着战略重心从孤立的科研理想主义,转向可持续的生态构建,反映出行业共识:通用人工智能的远大抱负,必须建立在坚实的商业基础上,才能在这场马拉松中存活。StayUp: The $2 macOS Tool That Fixes AI Agent WorkflowsStayUp, a $2 macOS utility, prevents lid-closed sleep, solving a critical pain point for developers running long-duratio

常见问题

这起“DeepSeek's $7.4B Funding: China's AI Alliance Reshapes Global Competition”融资事件讲了什么?

DeepSeek's $7.4 billion Series A is not merely a capital milestone but a strategic declaration: China's AI industry is consolidating under a state-orchestrated alliance model. The…

从“DeepSeek vs OpenAI ecosystem comparison”看,为什么这笔融资值得关注?

DeepSeek's $7.4 billion war chest is being deployed with surgical precision. The primary technical objective is to develop a new flagship model, tentatively called DeepSeek-V5, targeting GPT-5-level capabilities in multi…

这起融资事件在“How Chinese AI alliances counter US chip bans”上释放了什么行业信号?

它通常意味着该赛道正在进入资源加速集聚期,后续值得继续关注团队扩张、产品落地、商业化验证和同类公司跟进。