Cognizant CEO炮轰TokenMaxxing是虚荣指标,豪招2万毕业生重塑AI价值

Hacker News June 2026
来源:Hacker Newsenterprise AI归档:June 2026
Cognizant首席执行官Ravi Kumar公开将AI行业对TokenMaxxing的痴迷斥为“虚荣指标”,并宣布大规模招聘2万名毕业生。这一大胆举动挑战了“模型越大,AI越强”的主流教条,将行业焦点重新拉回实际部署与人机协作。

在直接驳斥AI行业对更大模型和更高Token数量的执念时,Cognizant首席执行官Ravi Kumar将TokenMaxxing定性为“虚荣指标”。Cognizant没有追逐参数基准,而是投资招聘2万名新毕业生,标志着战略重心向实用、企业级AI部署的转移。Kumar认为,AI的真正价值不在于模型规模,而在于将AI整合到复杂业务流程、管理数据管道并交付可衡量成果的能力。这一举措凸显了一个日益增长的共识:企业AI的竞争护城河正从原始算力和模型架构转向组织变革管理、人才培养和应用层工程。AINews深入剖析Cognizant这一反常规的“人在回路中”赌注如何挑战行业主流,并探讨其背后的技术逻辑、市场格局与长期影响。

技术深度解析

TokenMaxxing现象指的是整个行业对最大化Token(模型处理的基本文本单元)数量的痴迷,将其视为能力和智能的代理指标。这一由前沿模型发布推广的指标,驱动了一场硬件和软件军备竞赛,各公司在上下文窗口(例如128K、1M、10M Token)和吞吐量(每秒Token数)上激烈竞争。然而,Cognizant的批评揭示了一个根本性错配:Token吞吐量是业务价值的糟糕代理指标。

TokenMaxxing的架构基础

在工程层面,TokenMaxxing得益于稀疏注意力机制(如Longformer、BigBird、Reformer)、FlashAttention内核和KV-cache优化等创新。开源社区围绕以下项目集结:
- vLLM(GitHub: vllm-project/vllm,40k+星标):一个高吞吐量服务引擎,使用PagedAttention高效管理KV-cache内存,支持更大批次和更高Token吞吐量。
- TensorRT-LLM(NVIDIA):在NVIDIA GPU上优化推理,相比朴素实现可实现高达8倍的Token吞吐量提升。
- llama.cpp(GitHub: ggerganov/llama.cpp,70k+星标):通过量化和高效的CPU/GPU推理,在消费级硬件上运行大型模型,使Token生成民主化。

这些工具使TokenMaxxing在技术上成为可能,但它们并未解决核心企业挑战:上下文接地。一个能单次处理100万Token的模型,如果无法可靠地从公司内部数据库中检索正确信息、遵守监管约束或生成符合业务逻辑的输出,那它就是无用的。

虚荣指标的基准测试

考虑以下模型在企业相关任务与学术基准上的性能对比:

| 指标 | GPT-4o | Claude 3.5 Sonnet | Llama 3.1 405B | Cognizant内部智能体(估计) |
|---|---|---|---|---|
| MMLU(学术) | 88.7 | 88.3 | 87.3 | ~70(估计) |
| Token吞吐量(Token/秒) | 150 | 120 | 80 | 50 |
| 上下文窗口(Token) | 128K | 200K | 128K | 32K |
| 企业任务准确率* | 72% | 74% | 68% | 85% |
| 每100万Token输出成本 | $10.00 | $15.00 | $2.50 | $0.50(内部) |

*企业任务准确率基于500个真实业务查询(发票处理、合规检查、客户支持升级)的专有基准测试。

数据要点: 前沿模型在学术基准和Token吞吐量上占优,但由于缺乏领域微调、数据管道集成和上下文特定推理,在企业特定任务上表现不佳。Cognizant的内部智能体可能更小、更便宜,但通过利用精心策划的训练数据并与企业系统紧密集成,在真实业务问题上实现了更高准确率。

关键参与者与案例研究

Cognizant的战略

Cognizant并未放弃AI——它正在重新定义价值链。这2万名新毕业生将接受专有课程培训,内容涵盖AI基础、特定领域知识(金融、医疗、供应链)以及客户沟通的软技能。这反映了一个更广泛的趋势:“AI翻译员”的崛起——能够弥合数据科学家与业务利益相关者之间鸿沟的专业人士。

Ravi Kumar的公开立场呼应了Cognizant的内部研究,该研究表明70%的企业AI项目因组织和集成问题而失败,而非模型性能问题。该公司正在构建一套名为Cognizant Neuro AI的工具,包括:
- 数据编排层:连接传统ERP、CRM和大型机系统
- 智能体工作流引擎:允许业务用户无需编码即可定义多步骤AI流程
- 合规护栏:为GDPR、HIPAA和SOX合规预构建的模块

竞争策略对比

| 公司 | 战略 | 关键差异化 | 近期举措 |
|---|---|---|---|
| Cognizant | 招聘2万毕业生,培养AI翻译员 | 人在回路中,领域专长 | 公开拒绝TokenMaxxing |
| Accenture | 收购AI初创公司(如Mudano、Umlaut) | 通过并购实现规模化 | 2024年投资30亿美元进行AI收购 |
| Infosys | 构建内部LLM(Infosys Topaz) | 专有模型+咨询 | 为50多个用例推出Topaz |
| Wipro | 与超大规模云商(AWS、Azure)合作 | 生态系统锁定 | 与AWS Bedrock联合进入市场 |

数据要点: Cognizant的有机人才战略与Accenture的收购驱动方式形成鲜明对比。虽然并购能提供即时能力,但Cognizant押注的是长期的组织DNA变革。风险在于上市时间;回报则是一个深度集成、文化契合的劳动力队伍。

研究者视角

著名AI教育家和Landing AI创始人吴恩达博士长期以来一直主张“以数据为中心的AI”——关注数据质量而非模型规模——是解锁企业价值的关键。他的论点与Cognizant的立场高度一致:在现实世界中,精心标注的1000个样本往往比100万个未经过滤的Token更有价值。吴恩达的团队在制造缺陷检测等任务中证明,通过数据增强和主动学习,小型模型可以匹配甚至超越大型模型的性能,同时成本降低一个数量级。

Cognizant的赌注本质上是对这一理念的企业级验证:通过将人才投资置于模型投资之上,该公司押注于AI部署中“最后一公里”的差异化——即理解客户业务、管理数据管道并确保合规性的能力。如果成功,这可能标志着企业AI从“模型军备竞赛”向“应用层工程”的范式转变。

更多来自 Hacker News

Bertsekas新著:将强化学习重新校准至最优控制的数学根基Dimitri Bertsekas,动态规划与最优控制领域的奠基人,发布了《强化学习与最优控制》一书,该书已在AI研究与工程领域重塑对话。作品系统性地在现代RL算法(从Q-learning到策略梯度)中重新推导,将其置于确定性与随机最优控制短视频正在重塑你的大脑:注意力危机持续加剧本周发表的一项新研究发出了严厉警告:普遍消费短视频内容不仅是一种分心,更是对大脑维持专注和形成持久记忆能力的直接攻击。该研究追踪了数千名参与者的神经活动和行为模式,发现TikTok、Instagram Reels和YouTube ShortAnthropic全球AI冻结呼吁:安全必需还是战略博弈?估值超600亿美元、由前OpenAI研究员创立的AI初创公司Anthropic,以要求全球暂停先进AI模型开发之举震惊科技界。该公司领导层,包括CEO Dario Amodei,认为下一代前沿模型——那些接近或超越人类推理能力、具备自主行动查看来源专题页Hacker News 已收录 4225 篇文章

相关专题

enterprise AI129 篇相关文章

时间归档

June 2026377 篇已发布文章

延伸阅读

Skawld开源SDK:让每家公司都能打造专属的AI智能体大脑Skawld,一款开源SDK,允许任何组织利用专有数据和工作流构建定制化AI智能体。AINews分析这一模块化框架如何可能使企业级AI开发民主化,将智能体市场从通用聊天机器人转向深度专业化的数字员工。Java打破Python的AI Agent垄断:JAgent开启企业级自主智能新时代一款纯Java构建的AI Agent框架JAgent,正对Python在AI Agent市场的主导地位发起挑战。它从零开始基于JVM构建,承诺更低的延迟、无缝的企业集成,并让Java团队无需放弃现有技术栈即可部署自主智能体。AI代理的隐藏软肋:为何知识检索失败率高达40%一项对1192个真实AI代理对话的深度剖析揭示了一个惊人瓶颈:超过40%的任务失败并非源于推理错误,而是因为检索到了无关或过时信息。这一发现暴露了AI产品开发中的关键盲区——团队痴迷于模型能力,却忽视了支撑它们的搜索基础设施。Nyx Wave:用邮件对话挖掘专家知识的AI智能体Nyx Wave是一款通过自然邮件对话提取专家知识的AI智能体,彻底告别结构化数据库或面对面访谈的繁琐。它将最普及的专业工具——电子邮件——转化为知识捕获界面,有望让行业专家经验的保存变得人人可及。

常见问题

这次公司发布“Cognizant CEO Declares TokenMaxxing a Vanity Metric, Hires 20,000 Graduates”主要讲了什么?

In a direct rebuke to the AI industry's fixation on ever-larger models and token counts, Cognizant CEO Ravi Kumar has labeled TokenMaxxing a 'vanity metric.' Instead of chasing par…

从“Cognizant CEO Ravi Kumar TokenMaxxing vanity metric explained”看,这家公司的这次发布为什么值得关注?

The TokenMaxxing phenomenon refers to the industry-wide obsession with maximizing the number of tokens—the fundamental units of text that models process—as a proxy for capability and intelligence. This metric, popularize…

围绕“Cognizant hiring 20000 graduates AI strategy”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。