Rio-3.5-Open-397B:一个AI克隆体的24小时崛起与陨落

June 2026
归档:June 2026
一个由巴西市政府支持的AI模型Rio-3.5-Open-397B,凭借397B参数和MIT许可证的宣称迅速走红。然而24小时内,开发者便揭露它不过是阿里巴巴Qwen 3.5与Nex N2 Pro的粗糙融合。这一事件揭示了开源AI领域日益增长的脆弱性:将现有成果重新包装成新突破的便利性。

2025年6月14日,里约热内卢市政府的IT部门IplanRIO在Hugging Face上发布了Rio-3.5-Open-397B,宣称这是一个拥有3970亿参数、采用MIT许可证的开源权重模型。该消息立即引发轰动,被视为拉丁美洲对Meta、阿里巴巴和Mistral等公司模型的挑战者。然而数小时内,Hugging Face研究员王铁真便标记出该模型与阿里巴巴Qwen 3.5-397B-A17B在架构上的可疑相似性。自动化分析工具——包括广泛使用的mergekit和自定义权重比较脚本——显示,Rio-3.5-Open-397B的层权重几乎是Qwen 3.5与Nex N2 Pro的精确混合,没有任何独立训练或微调的证据。Nex N2 Pro背后的团队Nex-AGI正式指控IplanRIO存在抄袭行为。

技术深度剖析

Rio-3.5-Open-397B事件是模型合并滥用的教科书式案例。其核心技术涉及使用mergekit(GitHub: arcee-ai/mergekit,15000+星标)等工具,将两个或多个预训练模型的权重合并为一组参数。这通常通过线性插值、SLERP(球面线性插值)或更高级的TIES-Merging和DARE方法完成。在此案例中,社区成员的分析显示,Rio模型的架构——具体而言是层数、注意力头数和隐藏维度——与Qwen 3.5-397B-A17B完全一致。权重级别的比较揭示,约60%的参数来自Qwen 3.5,其余来自Nex N2 Pro——一个为葡萄牙语任务微调的模型。

| 模型 | 参数 | 架构 | 训练数据 | 许可证 |
|---|---|---|---|---|
| Qwen 3.5-397B-A17B | 397B(17B活跃) | MoE,64专家,2活跃 | 多语言(中英文主导) | Apache 2.0 |
| Nex N2 Pro | 7B | 密集Transformer | 葡萄牙语聚焦 | MIT |
| Rio-3.5-Open-397B | 397B(宣称) | MoE(从Qwen复制) | 无(合并权重) | MIT |

数据要点: Rio模型的参数量与Qwen 3.5完全相同,但其有效能力是直接复制。Rio模型采用MIT许可证是一个危险信号——它允许商业使用无需署名,而如果底层权重源自Apache 2.0许可的Qwen,这在法律上存疑。

社区使用的自动化检测工具,如weight-diff和model-archeology(一个较新的GitHub仓库,800+星标),通过比较权重分布和逐层余弦相似度来工作。对于Rio-3.5-Open-397B,其与Qwen 3.5在所有层上的平均余弦相似度为0.97——远高于通常指示独立训练的0.85阈值。这种相似度水平只能通过直接权重复制或合并实现,而非微调或蒸馏。

要点: 创建令人信服的“新”模型的技术门槛已经崩塌。借助mergekit等工具和公开可用的权重,任何人都能在数小时内生成一个397B参数的模型。社区必须开发自动化溯源验证系统——类似于软件供应链工具如sbom——以便在可疑模型获得关注前将其标记。

关键参与者与案例研究

多个实体在这场闹剧中扮演了关键角色:

- IplanRIO(里约热内卢市IT公司): 一家政府所有的IT服务提供商,在AI研究方面毫无先例。考虑到计算成本(训练一个397B MoE模型需要约1000万美元以上的GPU时间),他们突然发布一个397B模型从一开始就极不可能。他们以“操作失误”为由的道歉普遍不被采信,因为该模型的Hugging Face卡片包含了详细的性能声明,并有一篇博客文章宣称其为“拉丁美洲AI的里程碑”。

- 阿里巴巴Qwen团队: Qwen 3.5-397B-A17B的原创者,这是一个混合专家模型,MMLU得分88.5,运行成本约为每百万token 4.50美元。阿里巴巴尚未公开评论,但这一事件凸显了开源权重模型在未署名情况下被滥用的风险。

- Nex-AGI: 一家巴西AI初创公司,开发了Nex N2 Pro,一个为葡萄牙语微调的7B参数模型。他们在GitHub上的正式指控是压垮骆驼的最后一根稻草。Nex-AGI的CEO Carlos Menezes表示:“我们花了六个月时间和50万美元微调Nex N2 Pro。看到我们的工作被合并而不署名,这造成了深重的伤害。”

- Hugging Face: 托管该模型的平台。Hugging Face随后移除了Rio-3.5-Open-397B,并更新了其内容审核政策,要求超过10B参数的模型提供溯源文档。这是一项重大的政策转变。

| 实体 | 角色 | 声誉影响 |
|---|---|---|
| IplanRIO | 肇事者 | 严重受损;可能面临阿里巴巴和Nex-AGI的法律诉讼 |
| 阿里巴巴Qwen | 间接受害者 | 轻微;强化了其原创工作的价值 |
| Nex-AGI | 直接受害者 | 增强;获得了社区同情和关注度 |
| Hugging Face | 平台 | 混合;主动更新政策但允许了初始上传 |

要点: 这一事件创造了一个新的“AI欺诈”类别,很可能导致更严格的平台政策和潜在的法律先例。Nex-AGI已宣布计划根据巴西法律提起版权索赔。

行业影响与市场动态

这一事件并非孤立。开源AI生态系统正经历“弗兰肯斯坦模型”的激增——这些合并模型声称新颖,但并未提供真正的创新。根据Hugging Face的数据,每月上传的模型数量已从2024年1月的5000个增长到2025年5月的35000个,但具有可验证训练溯源的模型比例已从80%下降到45%。

| 指标 | 2024年1月 | 2025年5月 | 变化 |
|---|---|---|---|

时间归档

June 20261445 篇已发布文章

延伸阅读

从悟道到无界:中国具身智能与世界模型的新蓝图2026北京智源大会今日开幕,发出大胆宣言:静态语言模型的时代已经终结。智源研究院推出“无界”新范式,融合人工智能、物理学与生命科学,由Andrew Barto和Whitfield Diffie等先驱背书。这标志着中国从对话式AI向可行动、智能体热潮引爆CPU短缺:Intel Xeon 6+ 重新定义AI基础设施AI Agent工作负载正在重写数据中心的经济学。英特尔基于Intel 18A工艺打造的全新Xeon 6+处理器,直指智能体驱动任务编排所引发的CPU瓶颈。我们的分析显示,CPU与GPU的配比正从1:8急剧收窄至1:1,一家头部LLM公司的昆仑星机器人:阿里云基因与理想汽车大脑的具身智能合体由前阿里云副总裁任庚与前理想汽车自动驾驶负责人郎咸朋联合创立的昆仑星机器人,近日在北京亦庄正式亮相。这家新公司仅用两周便组建核心团队,并迅速获得顶级机构注资,标志着中国具身智能赛道进入“超级团队+超级资本”的新阶段。微信AI生态开放:美团万亿参数模型驱动智能体本地生活服务微信正式开放AI生态,允许AI智能体直接调用小程序服务。美团作为首批测试方,已将其本地生活服务(如外卖)接入这一框架,并由自研万亿参数模型LongCat-2.0-Preview提供动力。这标志着从手动搜索到AI中介服务编排的根本性转变。

常见问题

这次模型发布“Rio-3.5-Open-397B: The 24-Hour Rise and Fall of an AI Clone”的核心内容是什么?

On June 14, 2025, IplanRIO, the IT arm of Rio de Janeiro's city government, released Rio-3.5-Open-397B on Hugging Face, touting it as a 397-billion-parameter open-weight model unde…

从“How to verify if an open-source AI model is original or a merge”看,这个模型发布为什么重要?

The Rio-3.5-Open-397B incident is a textbook case of model merging abuse. The core technique involves using tools like mergekit (GitHub: arcee-ai/mergekit, 15k+ stars) to combine the weights of two or more pre-trained mo…

围绕“Legal risks of using merged AI models in commercial products”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。