Cognizant CEO炮轰TokenMaxxing是虚荣指标，豪招2万毕业生重塑AI价值

在直接驳斥AI行业对更大模型和更高Token数量的执念时，Cognizant首席执行官Ravi Kumar将TokenMaxxing定性为“虚荣指标”。Cognizant没有追逐参数基准，而是投资招聘2万名新毕业生，标志着战略重心向实用、企业级AI部署的转移。Kumar认为，AI的真正价值不在于模型规模，而在于将AI整合到复杂业务流程、管理数据管道并交付可衡量成果的能力。这一举措凸显了一个日益增长的共识：企业AI的竞争护城河正从原始算力和模型架构转向组织变革管理、人才培养和应用层工程。AINews深入剖析Cognizant这一反常规的“人在回路中”赌注如何挑战行业主流，并探讨其背后的技术逻辑、市场格局与长期影响。

技术深度解析

TokenMaxxing现象指的是整个行业对最大化Token（模型处理的基本文本单元）数量的痴迷，将其视为能力和智能的代理指标。这一由前沿模型发布推广的指标，驱动了一场硬件和软件军备竞赛，各公司在上下文窗口（例如128K、1M、10M Token）和吞吐量（每秒Token数）上激烈竞争。然而，Cognizant的批评揭示了一个根本性错配：Token吞吐量是业务价值的糟糕代理指标。

TokenMaxxing的架构基础

在工程层面，TokenMaxxing得益于稀疏注意力机制（如Longformer、BigBird、Reformer）、FlashAttention内核和KV-cache优化等创新。开源社区围绕以下项目集结：
- vLLM（GitHub: vllm-project/vllm，40k+星标）：一个高吞吐量服务引擎，使用PagedAttention高效管理KV-cache内存，支持更大批次和更高Token吞吐量。
- TensorRT-LLM（NVIDIA）：在NVIDIA GPU上优化推理，相比朴素实现可实现高达8倍的Token吞吐量提升。
- llama.cpp（GitHub: ggerganov/llama.cpp，70k+星标）：通过量化和高效的CPU/GPU推理，在消费级硬件上运行大型模型，使Token生成民主化。

这些工具使TokenMaxxing在技术上成为可能，但它们并未解决核心企业挑战：上下文接地。一个能单次处理100万Token的模型，如果无法可靠地从公司内部数据库中检索正确信息、遵守监管约束或生成符合业务逻辑的输出，那它就是无用的。

虚荣指标的基准测试

考虑以下模型在企业相关任务与学术基准上的性能对比：

| 指标 | GPT-4o | Claude 3.5 Sonnet | Llama 3.1 405B | Cognizant内部智能体（估计） |
|---|---|---|---|---|
| MMLU（学术） | 88.7 | 88.3 | 87.3 | ~70（估计） |
| Token吞吐量（Token/秒） | 150 | 120 | 80 | 50 |
| 上下文窗口（Token） | 128K | 200K | 128K | 32K |
| 企业任务准确率* | 72% | 74% | 68% | 85% |
| 每100万Token输出成本 | $10.00 | $15.00 | $2.50 | $0.50（内部） |

*企业任务准确率基于500个真实业务查询（发票处理、合规检查、客户支持升级）的专有基准测试。

数据要点： 前沿模型在学术基准和Token吞吐量上占优，但由于缺乏领域微调、数据管道集成和上下文特定推理，在企业特定任务上表现不佳。Cognizant的内部智能体可能更小、更便宜，但通过利用精心策划的训练数据并与企业系统紧密集成，在真实业务问题上实现了更高准确率。

关键参与者与案例研究

Cognizant的战略

Cognizant并未放弃AI——它正在重新定义价值链。这2万名新毕业生将接受专有课程培训，内容涵盖AI基础、特定领域知识（金融、医疗、供应链）以及客户沟通的软技能。这反映了一个更广泛的趋势：“AI翻译员”的崛起——能够弥合数据科学家与业务利益相关者之间鸿沟的专业人士。

Ravi Kumar的公开立场呼应了Cognizant的内部研究，该研究表明70%的企业AI项目因组织和集成问题而失败，而非模型性能问题。该公司正在构建一套名为Cognizant Neuro AI的工具，包括：
- 数据编排层：连接传统ERP、CRM和大型机系统
- 智能体工作流引擎：允许业务用户无需编码即可定义多步骤AI流程
- 合规护栏：为GDPR、HIPAA和SOX合规预构建的模块

竞争策略对比

| 公司 | 战略 | 关键差异化 | 近期举措 |
|---|---|---|---|
| Cognizant | 招聘2万毕业生，培养AI翻译员 | 人在回路中，领域专长 | 公开拒绝TokenMaxxing |
| Accenture | 收购AI初创公司（如Mudano、Umlaut） | 通过并购实现规模化 | 2024年投资30亿美元进行AI收购 |
| Infosys | 构建内部LLM（Infosys Topaz） | 专有模型+咨询 | 为50多个用例推出Topaz |
| Wipro | 与超大规模云商（AWS、Azure）合作 | 生态系统锁定 | 与AWS Bedrock联合进入市场 |

数据要点： Cognizant的有机人才战略与Accenture的收购驱动方式形成鲜明对比。虽然并购能提供即时能力，但Cognizant押注的是长期的组织DNA变革。风险在于上市时间；回报则是一个深度集成、文化契合的劳动力队伍。

研究者视角

著名AI教育家和Landing AI创始人吴恩达博士长期以来一直主张“以数据为中心的AI”——关注数据质量而非模型规模——是解锁企业价值的关键。他的论点与Cognizant的立场高度一致：在现实世界中，精心标注的1000个样本往往比100万个未经过滤的Token更有价值。吴恩达的团队在制造缺陷检测等任务中证明，通过数据增强和主动学习，小型模型可以匹配甚至超越大型模型的性能，同时成本降低一个数量级。

Cognizant的赌注本质上是对这一理念的企业级验证：通过将人才投资置于模型投资之上，该公司押注于AI部署中“最后一公里”的差异化——即理解客户业务、管理数据管道并确保合规性的能力。如果成功，这可能标志着企业AI从“模型军备竞赛”向“应用层工程”的范式转变。

时间归档

延伸阅读

常见问题

这次公司发布“Cognizant CEO Declares TokenMaxxing a Vanity Metric, Hires 20,000 Graduates”主要讲了什么？

In a direct rebuke to the AI industry's fixation on ever-larger models and token counts, Cognizant CEO Ravi Kumar has labeled TokenMaxxing a 'vanity metric.' Instead of chasing par…

从“Cognizant CEO Ravi Kumar TokenMaxxing vanity metric explained”看，这家公司的这次发布为什么值得关注？

The TokenMaxxing phenomenon refers to the industry-wide obsession with maximizing the number of tokens—the fundamental units of text that models process—as a proxy for capability and intelligence. This metric, popularize…

围绕“Cognizant hiring 20000 graduates AI strategy”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。