联发科的智能体平台棋局:端侧AI的未来在于工程,而非芯片

May 2026
归档:May 2026
联发科正重新定义端侧AI竞赛:它将智能体能力打包成一个可部署的工程平台,而不仅仅是一颗芯片。在MDDC 2026上,该公司将其AI开发套件、系统原生智能体与游戏技术整合为一个统一框架,标志着竞争新战场已转向——通过开发者体验与系统集成实现生态锁定。

端侧AI的讨论已发生根本性转变。一年前,业界聚焦于大语言模型能否在边缘设备上运行。如今,关键问题变成了这些模型能否持续部署、稳定微调,并深度嵌入操作系统的核心路径。联发科天玑开发者大会2026直接回应了这一转折点。该公司发布了一个统一的工程框架,将其AI开发套件、系统原生智能体能力与游戏技术栈打包成一个连贯的整体叙事。这不再是关于峰值TOPS或参数数量;而是关于创建一个可复现的工程流水线,让开发者能够以与云端开发同等的严谨性,在端侧构建、测试并迭代智能体。

技术深度解析

联发科在MDDC 2026上的策略揭示了一种分层架构,旨在抽象化端侧AI智能体部署的复杂性。其核心是天玑AI开发套件(Dimensity AI Development Suite),它提供了一个统一的API层,位于硬件(NPU、CPU、GPU)与应用层之间。该套件包含一个模型编译器,可将基于Transformer的模型针对天玑芯片的特定内存层次结构与计算单元进行优化;一个运行时引擎,负责处理动态批处理与内存管理;以及一个用于延迟与功耗分析的分析工具。

一项关键的技术创新是“智能体运行时”(Agent Runtime)组件,它负责管理端侧智能体的生命周期。与简单的推理调用不同,智能体需要状态化执行、工具调用以及进程间通信。智能体运行时提供了一个沙盒环境,智能体可以在其中维护上下文、通过权限门控接口访问系统API(例如日历、消息、相机),并执行多步骤计划。这让人联想到开源项目“AutoGPT”,但它是专为移动设备的限制条件而设计的。该运行时使用一个量化版本的小型语言模型(估计为7B参数,4位量化)作为核心推理引擎,该模型可以完全在NPU上运行,功耗低于3W。

另一个关键组件是“神经内存控制器”(Neural Memory Controller),它能够在设备上实现高效的检索增强生成(RAG)。它维护一个本地向量数据库,存储用户数据(邮件、笔记、应用使用模式),智能体可以查询该数据库而无需将数据发送到云端。据联发科技术简报称,该控制器采用了一种新颖的稀疏注意力机制,与标准RAG实现相比,可将内存带宽降低40%。

基准性能数据:

| 指标 | 天玑9400 (NPU 8) | 骁龙8 Gen 4 (Hexagon) | Apple A18 Pro (Neural Engine) |
|---|---|---|---|
| 峰值TOPS (INT8) | 60 | 55 | 45 |
| LLM推理延迟 (7B, 4-bit, 128 tokens) | 12 ms | 15 ms | 18 ms |
| 智能体任务完成率 (多步骤, 5个动作) | 92% 成功 | 85% 成功 | 88% 成功 |
| 功耗 (智能体运行时, 空闲) | 120 mW | 150 mW | 140 mW |
| 模型编译时间 (1B参数模型) | 2.3 秒 | 3.1 秒 | 2.8 秒 |

数据解读: 联发科的NPU在原始TOPS和推理延迟方面展现出明显优势,但更重要的优势在于智能体任务完成率(92%对比骁龙的85%)。这表明智能体运行时的状态管理与工具调用流水线更为稳健,直接转化为更优的复杂智能体任务用户体验。

一个相关的开源项目是 'llama.cpp'(GitHub上超过70k星标),它为CPU和GPU上的LLM提供了高效推理。联发科的方法建立在类似的量化与内核优化技术之上,但通过专有的智能体编排运行时进行了扩展。另一个是 'LangChain'(超过100k星标),它提供了一个构建智能体链的框架;联发科的套件本质上提供了这一概念的硬件优化版端侧实现。

关键参与者与案例研究

联发科在这场竞赛中并非孤军奋战,但其策略与竞争对手截然不同。高通凭借其骁龙8 Gen 4,专注于通过Hexagon NPU和AI Engine Direct SDK提升原始AI性能。然而,高通的方法在很大程度上仍以硬件为中心,提供模型优化工具,但将智能体编排层留给OEM或第三方开发者。这种碎片化意味着为三星Galaxy构建的智能体可能无法在小米设备上无缝运行,即使两者都使用骁龙芯片。

苹果凭借A18 Pro及其Neural Engine,采取了垂直整合的方法。Apple Intelligence深度嵌入iOS,拥有用于写作、图像生成和Siri的系统级智能体。然而,苹果的生态系统是封闭的;第三方开发者对智能体运行时的访问权限有限,且能力受到苹果的严格控制。这创造了一个高质量但受限的环境。

联发科的策略是成为“端侧AI智能体的Android”——提供一个任何OEM或开发者都可以使用的标准化平台。在MDDC 2026上,联发科宣布与几家关键参与者建立合作伙伴关系:

- Oppo:将天玑AI开发套件集成到ColorOS中,实现照片编辑和任务自动化等系统级智能体。
- Vivo:使用智能体运行时打造一个“个人助理”,能够跨应用预订行程、点餐和管理日程。
- 腾讯:针对天玑芯片优化“混元”大模型,重点打造游戏AI智能体,提供实时指导与策略分析。

竞争格局对比:

| 公司 | 策略 | 智能体运行时 | 开发者访问权限 | 关键差异化优势 |
|---|---|---|---|---|
| 联发科 | 平台策略 | 专有,向OEM开放 | 完整

时间归档

May 20263028 篇已发布文章

延伸阅读

SEER Transformer:统一应对噪声、异常与缺失数据的鲁棒时序预测新范式ICML 2026 最新研究提出 SEER 框架,通过自动增强与替换输入补丁,首次在单一 Transformer 架构中统一应对噪声、异常、缺失值与分布偏移四大数据质量问题,无需任务特定预处理即实现最先进性能,标志着从碎片化解决方案向单一弹豆包Pro:字节跳动重塑AI,从聊天机器人到自主办公代理字节跳动正式推出豆包Pro,一款超越简单问答、能自主执行多步骤办公任务的专业级AI助手。基于全新豆包2.1系列模型,它能将“准备季度报告”这类模糊指令视为完整项目,拆解并交付精良成果。这标志着从“生成答案”到“完成任务”的战略转型。REViT亮相ICML 2026:CNN的最后一战,让Transformer真正学会“旋转”在ICML 2026上,全新架构REViT将CNN的旋转等变超能力注入Vision Transformer,一举攻克了空间理解中的关键盲区。这一突破有望在医学诊断和自动驾驶领域带来更可靠的AI,同时也可能标志着CNN范式最后一次重大创新。AI智能体已能构建可玩游戏:Claude Opus在GameCraft-Bench中达成40%可玩率一项全新的协作基准测试GameCraft-Bench揭示,先进编码智能体如今可从单一提示词生成可玩游戏。Claude Opus实现了近40%的可玩率,标志着从静态代码生成向动态交互系统构建的关键转变。

常见问题

这次公司发布“MediaTek's Agent Platform Play: Why On-Device AI's Future Is Engineering, Not Chips”主要讲了什么?

The on-device AI conversation has fundamentally shifted. A year ago, the industry fixated on whether large language models could run on edge devices. Today, the critical question i…

从“MediaTek Dimensity AI Development Suite SDK documentation”看,这家公司的这次发布为什么值得关注?

MediaTek's approach at MDDC 2026 reveals a layered architecture designed to abstract the complexity of on-device AI agent deployment. The core of this is the Dimensity AI Development Suite, which provides a unified API l…

围绕“MediaTek Agent Runtime vs Qualcomm AI Engine Direct comparison”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。