技术深度剖析
本轮市场修正的核心,在于大语言模型军备竞赛中不可持续的经济模式。主流策略一直是训练越来越大的模型,相信仅凭规模就能解锁通用智能并主导市场。这直接导致了计算成本危机。
计算成本螺旋
训练一个前沿模型(如GPT-4或Gemini Ultra)的预估成本在1亿至10亿美元之间,而推理成本还要再添一笔重负。例如,在高阶模型上处理一次查询的成本,可能是传统搜索查询的10到100倍。这造成了根本性的单位经济问题:对许多AI初创公司而言,交付产品的成本超过了其能产生的收入。
规模收益递减
包括DeepMind和斯坦福大学在内的最新研究已证明,规模定律并非免费的午餐。虽然增加模型规模、数据和计算量最初能带来可预测的性能提升,但收益正在递减。在许多基准测试中,70B参数模型与200B+参数模型之间的差距正在缩小,尤其是在采用微调和检索增强生成(RAG)技术后。这意味着,更小、更高效的模型往往能以极低的成本,在特定任务上取得可媲美的结果。
开源挑战
开源生态进一步瓦解了闭源模型的优势。Meta的Llama 3.1 (405B) 和 Mistral的Mixtral 8x22B 等项目已证明,开放权重模型足以与闭源巨头抗衡。GitHub上的ollama仓库(已获超10万星标)让开发者能轻松在本地运行这些模型,从而绕过昂贵的API调用。基础模型层的这种商品化,正是投资者质疑那些仅封装LLM的公司护城河的关键原因。
基准测试现实检验
| 模型 | 参数规模 | MMLU (5-shot) | HumanEval (Pass@1) | 每百万Token输入成本 |
|---|---|---|---|---|
| GPT-4o | ~200B (估) | 88.7 | 90.2 | $5.00 |
| Claude 3.5 Sonnet | — | 88.3 | 92.0 | $3.00 |
| Gemini 1.5 Pro | — | 85.9 | 84.1 | $3.50 |
| Llama 3.1 405B | 405B | 87.3 | 89.0 | $2.50 (通过Together AI) |
| Mixtral 8x22B | 141B (活跃) | 82.5 | 74.4 | $1.20 (通过Together AI) |
数据要点: 最昂贵的闭源模型与更便宜的开源替代品之间的性能差距正在缩小。对许多企业用例而言,成本差异已无法用微小的性能提升来合理化,这正推动市场转向更具成本效益的解决方案。
关键玩家与案例分析
本轮市场修正正根据一个单一标准——可验证的商业吸引力——来清晰划分赢家和输家。
输家:“AI洗白”公司
几家公开上市的公司,在未拿出相应产品或营收故事的情况下,将自己重新包装为“AI优先”,其股价已腰斩甚至更多。一个典型例子是C3.ai,尽管围绕其“AI平台”进行了大规模营销推广,但其营收增长持续放缓,亏损却在扩大。其股价已较2021年高点下跌超过60%。类似地,BigBear.ai虽赢得了一些政府合同,但缺乏可扩展的产品,其股价已遭受重创。这些公司代表了AI炒作周期中那些未能挖出真正金矿的“卖铲人”。
赢家:基础设施与应用层
相反,拥有成熟商业模式和明确产品价值的公司正在抵御风暴。NVIDIA仍不可或缺,但即便其股价也因投资者担忧潜在需求放缓而出现回调。真正的亮点在于应用层。
- Palantir Technologies: 曾被视为小众政府承包商,Palantir的AIP(人工智能平台)已成为其商业收入的主要驱动力。其“本体论”方法将LLM与企业现有数据集成,使其美国商业收入实现了环比30%的增长。这是一个典型案例,展示了如何将AI作为解决特定问题(例如为石油公司优化供应链)的方案来销售,而非作为通用工具。
- Tempus AI: 在医疗健康领域,Tempus构建了庞大的基因组和临床数据库,并利用AI为肿瘤学家提供临床决策支持工具。其营收同比增长65%,得益于在药物发现和患者匹配方面取得的切实成果。这是AI在高风险领域创造真实价值的直接例证。
AI应用策略对比
| 公司 | 领域 | 核心产品 | 收入模式 | 近期增长(同比) | 主要风险 |
|---|---|---|---|---|---|
| Palantir | 企业/国防 | AIP (AI平台) | 订阅+部署 | 20% | 对政府依赖 |
| Tempus AI | 医疗健康 | AI驱动的临床分析 | 数据许可+SaaS | 65% | — |