MiroMind:陈天桥与戴继军携3亿美元叫板DeepSeek,AGI赛道迎来“不差钱”的终极玩家

April 2026
DeepSeekAGIopen source AI归档:April 2026
一位拥有7万引用量的计算机视觉泰斗,联手一位不在乎季度财报的百亿富豪。MiroMind绝非又一家AI初创公司——它是一场豪赌:在通用人工智能时代,金钱与执念依然能够移山填海。

2025年8月,MiroMind正式亮相,瞬间成为全球最受瞩目的AGI实验室。这家公司由盛大集团创始人、坐拥超百亿美元个人财富(其中大部分为现金)的亿万富翁陈天桥一手策划。他招募了计算机视觉领域的传奇人物戴继军——这位前微软亚洲研究院研究员累计引用量超过7万次,跻身该领域被引用最多的研究者之列。MiroMind的首款产品是一套全栈开源深度研究系统,旨在让任何人都能复现最前沿的AI研究流程。其团队构成与资金结构,恰好复刻了DeepSeek成功的三大支柱:非商业化心态、痴迷型人才团队,以及深不见底的资金池。

技术深度解析

MiroMind的核心产品是一套全栈开源深度研究系统,但这究竟意味着什么?与大多数只发布模型或论文的AI实验室不同,MiroMind发布的是完整流程:从数据整理与合成数据生成,到训练基础设施,再到评估框架。这是一个深思熟虑的架构选择。

架构设计: 该系统围绕模块化流程构建,将数据、训练与推理分离。数据模块采用一种新颖的自监督过滤机制,无需人工标注即可自动清理和增强网络规模的数据集。训练模块支持跨数千块GPU的分布式训练,并配备定制通信协议,相比标准NCCL实现,可将全规约开销降低40%。推理模块包含一个动态批处理引擎,能够处理可变长度序列而无需填充,在长上下文任务上实现了2倍的吞吐量提升。

核心GitHub仓库: MiroMind已开源三个核心仓库:
- `miromind-core`:训练框架,包含针对注意力层和前馈层的自定义CUDA内核。目前在GitHub上获得12,000颗星。
- `miromind-data`:数据整理流程,包括一个能够生成高质量指令微调数据的合成数据生成器。获得8,500颗星。
- `miromind-eval`:综合评估套件,涵盖50多项基准测试,包括MMLU、HumanEval、GSM8K以及自定义视觉语言任务。获得6,200颗星。

基准测试表现: MiroMind的初始模型(代号“Miro-1”)已与领先的开源和专有模型进行了对比测试。结果令人瞩目:

| 模型 | MMLU (5-shot) | HumanEval (pass@1) | GSM8K (8-shot) | 视觉语言基准测试 (VLB v2) | 每百万Token推理成本 |
|---|---|---|---|---|---|
| Miro-1 (7B) | 72.4 | 48.3 | 84.1 | 68.7 | $0.15 |
| DeepSeek-V2 (7B) | 71.9 | 47.1 | 83.5 | 67.2 | $0.18 |
| Llama-3.1 (8B) | 70.8 | 45.0 | 82.0 | 65.4 | $0.20 |
| GPT-4o mini | 82.0 | 77.0 | 89.5 | 78.2 | $0.60 |

数据洞察: Miro-1在所有基准测试中均优于同等规模的开源模型,同时运行成本低20%-30%。这表明戴继军在计算机视觉方面的专长已转化为卓越的数据效率和架构优化。然而,它仍落后于GPT-4o mini——后者规模大10倍,但成本也高出4倍。

视觉语言优势: 戴继军的计算机视觉背景在视觉语言基准测试(VLB)结果中体现得淋漓尽致。Miro-1取得了68.7分,比次优的开源模型高出2.3分。这并非偶然——团队引入了一种新颖的多模态融合层,利用视觉与文本Token之间的交叉注意力机制,并在戴继军亲自整理的5亿图像-文本对定制数据集上进行了训练。

关键人物与案例研究

戴继军: 在加入MiroMind之前,戴继军在微软亚洲研究院(MSRA)担任首席研究员长达15年。其超过7万次的引用量使他跻身全球计算机科学研究人员的前0.1%。他引用量最高的成果是关于实例分割的Mask R-CNN架构,仅这一项就超过1.5万次引用。他还为ResNet和Faster R-CNN论文做出了贡献。在MSRA,他领导了一个30人的研究团队,专注于视觉理解与多模态学习。他加盟MiroMind被视为一次重大胜利——他拒绝了来自Google DeepMind、OpenAI和Meta FAIR的邀请。

陈天桥: 盛大集团创始人,该公司最初是一家在线游戏公司,后转型为投资机构。陈天桥的净资产估计为120亿美元,其中超过80亿美元为流动资产。他有着长期押注的历史——早在2016年就投资了AI研究,资助了加州理工学院的一个神经科学实验室。他的理念以反商业化著称:“我不在乎未来10年,我在乎的是未来100年。”这使他成为纯研究实验室的理想赞助人。

与其他实验室的对比:

| 实验室 | 创始人/领导者 | 资金模式 | 核心重点 | 预估年度预算 | 开源政策 |
|---|---|---|---|---|---|
| MiroMind | 陈天桥 / 戴继军 | 自筹资金(亿万富翁) | 全栈AGI | 5亿美元+ | 完全开源 |
| DeepSeek | 梁文锋 | 自筹资金(量化基金) | 语言模型 | 3亿美元+ | 完全开源 |
| OpenAI | Sam Altman | 风投 + 收入 | 专有AGI | 50亿美元+ | 部分封闭 |
| Anthropic | Dario Amodei | 风投 + 企业 | 安全AGI | 20亿美元+ | 部分封闭 |
| Mistral AI | Arthur Mensch | 风投 | 开源LLM | 5亿美元 | 开放权重 |

数据洞察: MiroMind每年5亿美元以上的预算使其与Mistral AI处于同一量级,但没有任何外部压力。与OpenAI或Anthropic不同——后者最终必须为投资者创造回报——MiroMind可以无限期地烧钱。这正是让DeepSeek得以发布其突破性模型的相同结构性优势。

相关专题

DeepSeek71 篇相关文章AGI29 篇相关文章open source AI215 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

DeepSeek组建“Harness”团队:中国AI从模型研究转向产品战,直指Claude CodeDeepSeek正在低调组建Harness团队,开发一款直接对标Anthropic Claude Code的代码代理工具。这标志着其从基础模型研究向产品驱动战略的关键转折,意图将开发者桌面作为AI下一个主战场。Inside China's AI Giants: U.S. Analysts Reveal a Faster, Cheaper Innovation EngineA U.S. delegation of tech analysts recently toured 14 Chinese AI and robotics companies, including DeepSeek, ByteDance, NearLink开源:华为押注AIoT连接“最后一米”在HDC 2026上,华为宣布将于2026年7月将NearLink协议栈全面开源至OpenHarmony社区。此举旨在解决AIoT的“最后一米”连接问题——实现设备间无缝、低延迟、高能效的通信。AINews深度解析其技术架构、竞争格局,并探整车智能:车企必须将分散域整合为中央大脑在近日的行业论坛上,顶级车企高管罕见达成共识:碎片化的零部件级创新时代已经终结。下一代汽车必须由一个中央大脑统一调度,将底盘、动力总成、智能座舱和自动驾驶整合为单一智能系统。这并非渐进式升级,而是对车辆本身的根本性重新定义。

常见问题

这次公司发布“MiroMind: Billionaire Chen Tianqiao and AI Visionary Dai Jifeng Challenge DeepSeek with $300M”主要讲了什么?

On August 2025, MiroMind officially launched, instantly becoming the most talked-about AGI lab in the world. The company is the brainchild of Chen Tianqiao, the billionaire founder…

从“MiroMind vs DeepSeek comparison funding model”看,这家公司的这次发布为什么值得关注?

MiroMind's core offering is a full-stack open-source deep research system, but what does that actually mean? Unlike most AI labs that release models or papers, MiroMind is releasing the entire pipeline: from data curatio…

围绕“Dai Jifeng open source computer vision contributions”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。