技术深度剖析
Rio-3.5-Open-397B事件是模型合并滥用的教科书式案例。其核心技术涉及使用mergekit(GitHub: arcee-ai/mergekit,15000+星标)等工具,将两个或多个预训练模型的权重合并为一组参数。这通常通过线性插值、SLERP(球面线性插值)或更高级的TIES-Merging和DARE方法完成。在此案例中,社区成员的分析显示,Rio模型的架构——具体而言是层数、注意力头数和隐藏维度——与Qwen 3.5-397B-A17B完全一致。权重级别的比较揭示,约60%的参数来自Qwen 3.5,其余来自Nex N2 Pro——一个为葡萄牙语任务微调的模型。
| 模型 | 参数 | 架构 | 训练数据 | 许可证 |
|---|---|---|---|---|
| Qwen 3.5-397B-A17B | 397B(17B活跃) | MoE,64专家,2活跃 | 多语言(中英文主导) | Apache 2.0 |
| Nex N2 Pro | 7B | 密集Transformer | 葡萄牙语聚焦 | MIT |
| Rio-3.5-Open-397B | 397B(宣称) | MoE(从Qwen复制) | 无(合并权重) | MIT |
数据要点: Rio模型的参数量与Qwen 3.5完全相同,但其有效能力是直接复制。Rio模型采用MIT许可证是一个危险信号——它允许商业使用无需署名,而如果底层权重源自Apache 2.0许可的Qwen,这在法律上存疑。
社区使用的自动化检测工具,如weight-diff和model-archeology(一个较新的GitHub仓库,800+星标),通过比较权重分布和逐层余弦相似度来工作。对于Rio-3.5-Open-397B,其与Qwen 3.5在所有层上的平均余弦相似度为0.97——远高于通常指示独立训练的0.85阈值。这种相似度水平只能通过直接权重复制或合并实现,而非微调或蒸馏。
要点: 创建令人信服的“新”模型的技术门槛已经崩塌。借助mergekit等工具和公开可用的权重,任何人都能在数小时内生成一个397B参数的模型。社区必须开发自动化溯源验证系统——类似于软件供应链工具如sbom——以便在可疑模型获得关注前将其标记。
关键参与者与案例研究
多个实体在这场闹剧中扮演了关键角色:
- IplanRIO(里约热内卢市IT公司): 一家政府所有的IT服务提供商,在AI研究方面毫无先例。考虑到计算成本(训练一个397B MoE模型需要约1000万美元以上的GPU时间),他们突然发布一个397B模型从一开始就极不可能。他们以“操作失误”为由的道歉普遍不被采信,因为该模型的Hugging Face卡片包含了详细的性能声明,并有一篇博客文章宣称其为“拉丁美洲AI的里程碑”。
- 阿里巴巴Qwen团队: Qwen 3.5-397B-A17B的原创者,这是一个混合专家模型,MMLU得分88.5,运行成本约为每百万token 4.50美元。阿里巴巴尚未公开评论,但这一事件凸显了开源权重模型在未署名情况下被滥用的风险。
- Nex-AGI: 一家巴西AI初创公司,开发了Nex N2 Pro,一个为葡萄牙语微调的7B参数模型。他们在GitHub上的正式指控是压垮骆驼的最后一根稻草。Nex-AGI的CEO Carlos Menezes表示:“我们花了六个月时间和50万美元微调Nex N2 Pro。看到我们的工作被合并而不署名,这造成了深重的伤害。”
- Hugging Face: 托管该模型的平台。Hugging Face随后移除了Rio-3.5-Open-397B,并更新了其内容审核政策,要求超过10B参数的模型提供溯源文档。这是一项重大的政策转变。
| 实体 | 角色 | 声誉影响 |
|---|---|---|
| IplanRIO | 肇事者 | 严重受损;可能面临阿里巴巴和Nex-AGI的法律诉讼 |
| 阿里巴巴Qwen | 间接受害者 | 轻微;强化了其原创工作的价值 |
| Nex-AGI | 直接受害者 | 增强;获得了社区同情和关注度 |
| Hugging Face | 平台 | 混合;主动更新政策但允许了初始上传 |
要点: 这一事件创造了一个新的“AI欺诈”类别,很可能导致更严格的平台政策和潜在的法律先例。Nex-AGI已宣布计划根据巴西法律提起版权索赔。
行业影响与市场动态
这一事件并非孤立。开源AI生态系统正经历“弗兰肯斯坦模型”的激增——这些合并模型声称新颖,但并未提供真正的创新。根据Hugging Face的数据,每月上传的模型数量已从2024年1月的5000个增长到2025年5月的35000个,但具有可验证训练溯源的模型比例已从80%下降到45%。
| 指标 | 2024年1月 | 2025年5月 | 变化 |
|---|---|---|---|