Rio-3.5-Open-397B：一个AI克隆体的24小时崛起与陨落

2025年6月14日，里约热内卢市政府的IT部门IplanRIO在Hugging Face上发布了Rio-3.5-Open-397B，宣称这是一个拥有3970亿参数、采用MIT许可证的开源权重模型。该消息立即引发轰动，被视为拉丁美洲对Meta、阿里巴巴和Mistral等公司模型的挑战者。然而数小时内，Hugging Face研究员王铁真便标记出该模型与阿里巴巴Qwen 3.5-397B-A17B在架构上的可疑相似性。自动化分析工具——包括广泛使用的mergekit和自定义权重比较脚本——显示，Rio-3.5-Open-397B的层权重几乎是Qwen 3.5与Nex N2 Pro的精确混合，没有任何独立训练或微调的证据。Nex N2 Pro背后的团队Nex-AGI正式指控IplanRIO存在抄袭行为。

技术深度剖析

Rio-3.5-Open-397B事件是模型合并滥用的教科书式案例。其核心技术涉及使用mergekit（GitHub: arcee-ai/mergekit，15000+星标）等工具，将两个或多个预训练模型的权重合并为一组参数。这通常通过线性插值、SLERP（球面线性插值）或更高级的TIES-Merging和DARE方法完成。在此案例中，社区成员的分析显示，Rio模型的架构——具体而言是层数、注意力头数和隐藏维度——与Qwen 3.5-397B-A17B完全一致。权重级别的比较揭示，约60%的参数来自Qwen 3.5，其余来自Nex N2 Pro——一个为葡萄牙语任务微调的模型。

| 模型 | 参数 | 架构 | 训练数据 | 许可证 |
|---|---|---|---|---|
| Qwen 3.5-397B-A17B | 397B（17B活跃） | MoE，64专家，2活跃 | 多语言（中英文主导） | Apache 2.0 |
| Nex N2 Pro | 7B | 密集Transformer | 葡萄牙语聚焦 | MIT |
| Rio-3.5-Open-397B | 397B（宣称） | MoE（从Qwen复制） | 无（合并权重） | MIT |

数据要点： Rio模型的参数量与Qwen 3.5完全相同，但其有效能力是直接复制。Rio模型采用MIT许可证是一个危险信号——它允许商业使用无需署名，而如果底层权重源自Apache 2.0许可的Qwen，这在法律上存疑。

社区使用的自动化检测工具，如weight-diff和model-archeology（一个较新的GitHub仓库，800+星标），通过比较权重分布和逐层余弦相似度来工作。对于Rio-3.5-Open-397B，其与Qwen 3.5在所有层上的平均余弦相似度为0.97——远高于通常指示独立训练的0.85阈值。这种相似度水平只能通过直接权重复制或合并实现，而非微调或蒸馏。

要点： 创建令人信服的“新”模型的技术门槛已经崩塌。借助mergekit等工具和公开可用的权重，任何人都能在数小时内生成一个397B参数的模型。社区必须开发自动化溯源验证系统——类似于软件供应链工具如sbom——以便在可疑模型获得关注前将其标记。

关键参与者与案例研究

多个实体在这场闹剧中扮演了关键角色：

- IplanRIO（里约热内卢市IT公司）： 一家政府所有的IT服务提供商，在AI研究方面毫无先例。考虑到计算成本（训练一个397B MoE模型需要约1000万美元以上的GPU时间），他们突然发布一个397B模型从一开始就极不可能。他们以“操作失误”为由的道歉普遍不被采信，因为该模型的Hugging Face卡片包含了详细的性能声明，并有一篇博客文章宣称其为“拉丁美洲AI的里程碑”。

- 阿里巴巴Qwen团队： Qwen 3.5-397B-A17B的原创者，这是一个混合专家模型，MMLU得分88.5，运行成本约为每百万token 4.50美元。阿里巴巴尚未公开评论，但这一事件凸显了开源权重模型在未署名情况下被滥用的风险。

- Nex-AGI： 一家巴西AI初创公司，开发了Nex N2 Pro，一个为葡萄牙语微调的7B参数模型。他们在GitHub上的正式指控是压垮骆驼的最后一根稻草。Nex-AGI的CEO Carlos Menezes表示：“我们花了六个月时间和50万美元微调Nex N2 Pro。看到我们的工作被合并而不署名，这造成了深重的伤害。”

- Hugging Face： 托管该模型的平台。Hugging Face随后移除了Rio-3.5-Open-397B，并更新了其内容审核政策，要求超过10B参数的模型提供溯源文档。这是一项重大的政策转变。

| 实体 | 角色 | 声誉影响 |
|---|---|---|
| IplanRIO | 肇事者 | 严重受损；可能面临阿里巴巴和Nex-AGI的法律诉讼 |
| 阿里巴巴Qwen | 间接受害者 | 轻微；强化了其原创工作的价值 |
| Nex-AGI | 直接受害者 | 增强；获得了社区同情和关注度 |
| Hugging Face | 平台 | 混合；主动更新政策但允许了初始上传 |

要点： 这一事件创造了一个新的“AI欺诈”类别，很可能导致更严格的平台政策和潜在的法律先例。Nex-AGI已宣布计划根据巴西法律提起版权索赔。

行业影响与市场动态

这一事件并非孤立。开源AI生态系统正经历“弗兰肯斯坦模型”的激增——这些合并模型声称新颖，但并未提供真正的创新。根据Hugging Face的数据，每月上传的模型数量已从2024年1月的5000个增长到2025年5月的35000个，但具有可验证训练溯源的模型比例已从80%下降到45%。

| 指标 | 2024年1月 | 2025年5月 | 变化 |
|---|---|---|---|

时间归档

延伸阅读

常见问题

这次模型发布“Rio-3.5-Open-397B: The 24-Hour Rise and Fall of an AI Clone”的核心内容是什么？

On June 14, 2025, IplanRIO, the IT arm of Rio de Janeiro's city government, released Rio-3.5-Open-397B on Hugging Face, touting it as a 397-billion-parameter open-weight model unde…

从“How to verify if an open-source AI model is original or a merge”看，这个模型发布为什么重要？

The Rio-3.5-Open-397B incident is a textbook case of model merging abuse. The core technique involves using tools like mergekit (GitHub: arcee-ai/mergekit, 15k+ stars) to combine the weights of two or more pre-trained mo…

围绕“Legal risks of using merged AI models in commercial products”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。