AI智能体走向终端，需要哪些芯片？

公司新闻

AI智能体走向终端，需要哪些芯片？

2025-10-22 14:01:42

点击数 259

【导(dǎo)语(yǔ)】2025年(nián)被(bèi)视(shì)为(wèi)AI智(zhì)能(néng)体(tǐ)元(yuán)年(nián)，在(zài)“2025骁(xiāo)龙(lóng)峰(fēng)会(huì)·中(zhōng)国(guó)”上(shàng)，“智(zhì)能(néng)体(tǐ)”成(chéng)焦(jiāo)点(diǎn)。芯(xīn)片(piàn)供应商与终端OEM联合研发，推动智能体走向终端。高通第五代骁龙8至尊版等新品，以异构计算矩阵等满足(zú)智(zhì)能(néng)体(tǐ)多(duō)元需求；荣耀、小米、金山办公等企业展示智能体创新应用。AI浪潮下，高通与中国伙伴携手，开启智能新时代。

2025年被视为AI智能体（Agent）的元年，也是智能体走向终端(duān)设(shè)备(bèi)、提(tí)升(shēng)应(yīng)用(yòng)普(pǔ)及(jí)的(de)时(shí)间(jiān)窗(chuāng)口(kǒu)。在(zài)近(jìn)期(qī)举(jǔ)办(bàn)的(de)“2025骁(xiāo)龙(lóng)峰(fēng)会(huì)·中国”上，“智能体”被芯片供应商、手机OEM、PC OEM及广大AI技术解决方案提供商频频提及。荣耀终端股份有限公司产品线总裁方飞在峰会现场表示，2025年将开启“手机智能体与性能的引擎时代”；小米AI产品经理李豪杰向《中国电子报》记者表示，小米的个性化端侧AI除了让智能体更懂用户，生成内容的时候可以不需要输入之外，还具备感知能力；金山办公生态合作总经理张宁介绍了基于WPS灵犀的“原生Office办公智能体”。

芯片是终端设备的算力引擎。智能体要走入硬件配置（相对云端）受限的终端侧，不仅对芯片的性能参数和架构设计提出了新的要求，也推动芯片供应商与终端OEM进行更加精细的联合研发、底层调优及功能开发，加速解锁更多的功能特性与用户体验。

“2025骁龙峰会·中国”Demo体验区

从算力、内存到感知，智能体全方位考验终端芯片能力

根据谷歌云的定义，AI智能体可以同时处理文本、语音、视频、音频、代码等多模态信息，执行复杂的多步骤操作，实现自主学习、适应并独立做出决策。相比AI助理，智能体不再被动响应用户的要求，而是以目标为导向，自主、主动地执行任务。

AI智能体、AI助理、聊天机器人的特征（来(lái)源(yuán)：谷(gǔ)歌(gē)云(yún)）

智(zhì)能(néng)体(tǐ)的(de)功(gōng)能(néng)很(hěn)大(dà)程(chéng)度(dù)上(shàng)得(de)益(yì)于(yú)生(shēng)成(chéng)式(shì)AI和(hé)AI基(jī)础(chǔ)模(mó)型(xíng)的(de)多(duō)模(mó)态(tài)功(gōng)能(néng)。而(ér)多(duō)模(mó)态(tài)的多元数据类型和多样算力需求，需要以NPU为核心且NPU、CPU、GPU协同工作的异构计算矩阵。高通本次发布的第五代骁龙8至尊版搭载了异构AI引擎，包含作为通用加速单元的自研Oryon CPU和Adreno GPU，以及作为引擎核心的全新Hexagon NPU，三个加速单元各有侧重又协同工作。比如Oryon CPU负责即时响应任务，包含独立显存的Adreno GPU能够加速AI负载并实现更快的推理响应，Hexagon NPU专注于持续运行的大语言模型和复杂推理任务。此外，该AI引擎还集成了高通传感器中枢，在保护数据隐私的基础上,围绕用户构建更加深入、个性化的个人知识图谱。

Al工作负载主要包括由标量、向量和张量数学组成的神经网络层计算以及非线性激(jī)活(huó)函(hán)数(shù)。Hexagon NPU提(tí)供(gōng)了(le)三(sān)种(zhǒng)硬(yìng)件(jiàn)加(jiā)速(sù)单(dān)元(yuán)，分(fēn)别(bié)对(duì)应(yīng)标(biāo)量(liàng)、向(xiàng)量(liàng)、张(zhāng)量(liàng)三(sān)种(zhǒng)常(cháng)见(jiàn)数(shù)据(jù)类(lèi)型(xíng)及(jí)相(xiāng)应(yīng)的(de)工(gōng)作(zuò)负(fù)载(zài)。其(qí)中(zhōng)，12个(gè)标(biāo)量(liàng)加(jiā)速(sù)器(qì)用(yòng)于(yú)处(chù)理(lǐ)图(tú)像(xiàng)识(shi)别(bié)、音(yīn)频(pín)分(fēn)析(xī)等(děng)经(jīng)典AI任务，同时支持大语言模型推理；8个向量加速器用于加速复杂的像素级图像模型，并在大语音模型场景上支持更长的上下文窗口；张量加速器用于加速更大、更复杂的多媒体用例以及LVM（视觉大模型）。

同样值得注意的是，内存带宽对大模型的端侧部署至关重要，直接影响大模型的训练效率和推理速度。面向大模型的内存带宽瓶颈，第五代骁龙8至尊版首次支持64位内存架构，使NPU可访问超过4GB RAM，从而更高效地支持更大参数的端侧模型部署。此外，第五代骁龙8至尊版支持的LP DDR5x内存频率达到5.2GHz，进一步提升了大模型的推理速度。

降低内存占用同样是部署AI大模型——尤其是本地化、轻量化部署的重中之重。量化成为解决这一问题的关键技术，通过降低模型参数精度，减少内存需求，并保持模型的大部分准确性。最新一代的Hexagon NPU支持INT2和FP8精度，为开发者提供更加灵活的模型部署方式。其中FP8在加快计算速度的同时降低内存占用，使大模型走向边缘设备成为可能，越来越成为大模型技术团队的主流选择。

“在三十亿参数的大语言模型上，我们（第五代骁龙8至尊版的NPU）的出字速度最快能够达到220token/s以上。”高通技术公司产品市场总监万卫星在峰会现场表示。

高通全新Hexagon NPU可实现最快220Tokens每秒以上的出字速度

在AI智能体所需的异构计算架构中，CPU和GPU的作用同样关键。第五代骁龙8至尊版搭载了当前业界最快的移动端CPU和具备独立显存的GPU，为AI负载提供更加全面的算力支撑。

其中，第三代Qualcomm Oryon CPU是迄今全球最快的移动端CPU，采用4.60GHz的超级内核和3.62GHz的性能内核，以及每簇12MB的缓存，支持矩阵加速，使第五代骁龙8至尊版的单核性能提升20%，多核性能提升17%，CPU能效提升35%。

而新一代高通Adreno GPU在性能提升23%、光追性能提升25%、能效优化20%的基础上，首次引入独立高速显存。这一18MB的专用图形缓存，不仅带来10%的整机功耗降低和最多38%的游戏性能提升，也为GPU上运行的其他用例带来性能和功耗上的收益，比如实时分析视频、识别关键瞬间、相册增强等一系列AI影像功能，并实现更快的推理响应。

除了智能手机，AI PC也是AI智能体的重要落点。本次骁龙峰会上，高通发布了面向PC平台的骁龙X2 Elite Extreme和骁龙X2 Elite。其中，骁龙X2 Elite Extreme集成了3nm制程的第三代Qualcomm Oryon CPU，拥有12个超级核心、6个性能核心，是首款主频达到5GHz的ARM兼容CPU。该处理器还搭载了面向笔记本电脑的全球最快NPU，支持80TOPS AI处理能力，可在Windows 11 AI+ PC上支持并发AI体验。

“为了支持生成式AI和智能体AI，我们（骁龙X2 Elite Extreme）配备了全新的强大NPU，能够提供80TOPS的推理性能。”高通技术公司产品管理副总裁Nitin Kumar表示。

骁龙X系列产品组合中的全新一代旗舰平台，提供高达80TOPS的AI处理能力

芯片厂商与OEM深度协同，共同推动底层技术创新

面向终端平台的用户需求与限制因素，手机、PC等终端OEM与高通团队联合研发，使旗舰产品更充分地发挥芯片能力，解锁更多功能特性与用户体验。而AI智能体的部署要求，使OEM与高通的合作更加紧密，在硬件设计、交互框架、技术部署、功能开发、底层调优等方面取得诸多进展，并在骁龙峰会带来了多项首发技术与体验。

“智能体的核心是模型。”荣耀终端股份有限公司产品线总裁方飞表示。在峰会现场，荣耀展示的图像AI追色功能引发现场观众阵阵惊呼。其背后是荣耀与高通联合研发的高效能端侧AI模型方案。

首先，荣耀与高通团队通过端侧低bit量化技术，使端侧模型存储空间节省30%、推理速度提升15%、推理功耗下降20%。通常来说，低bit量化技术在端侧落地，将显著优化功耗、内存、性能等模型体验，但也会导致对应的精度损失增大。荣耀与高通携手，在最新旗舰芯片上实现了(le)垂(chuí)域场(chǎng)景(jǐng)的(de)2-bit量(liàng)化(huà)商(shāng)用(yòng)准(zhǔn)出(chū)，在(zài)精(jīng)度(dù)达(dá)标(biāo)的(de)前(qián)提(tí)下(xià)，进(jìn)一(yī)步(bù)降(jiàng)低(dī)内(nèi)存(cún)占(zhàn)用(yòng)、提(tí)升(shēng)推(tuī)理(lǐ)性(xìng)能(néng)并(bìng)减(jiǎn)少(shǎo)推(tuī)理(lǐ)功(gōng)耗(hào)，推(tuī)动(dòng)量(liàng)化(huà)技(jì)术(shù)从(cóng)单(dān)纯(chún)的(de)软件压缩，演变为与硬件设计深度耦合的计算范式。

其次，双方推出了新一代向量化检索技术，通过将文本、图像、视频等数据编码为稠密向量，构建语义层的高效索引，推动检索性能提升400%。

再次，双方一起构建端侧多模态感知能力，使个人知识库的构建更加便捷高效。采用低比特量化技术的多模态模型，能够高效、精准地理解手机端的文本、图片、视频等各类数据，将其转化为结构化的信息与知识，在提升效率的同时进一步降低计算和存储开销。

基于双方多个技术层面的联合研发，荣耀首发了“智能体驱动的图像AI追色”功能。在现场展示中，方飞通过语音指令，让荣耀智能体YOYO将一张电影海报保存为追色模板“爱乐之城”，并找到“周末在故宫拍摄的照片”。YOYO基于低bit量化存储和向量检索技术，即刻完成对指定图片的搜索。随着方飞说“把这张图片追色成‘爱乐之城’模板”，YOYO将故宫照片的风格色调变成了“爱乐之城”的海报风格。

方飞演示“智能体驱动的图像AI追色”功能

而PC作为更具生产力属性的终端，正在通过AI能力衍生出跨文件、跨应用的全局检索和信息整理能力，并基于多模态大模型重构人机交互体验。

金山办公生态合作总经理张宁表示，过去半年，金山办公与高通工程师团队紧密合作，基于骁龙AI PC进行架构适配，以充分发挥骁龙X系列平台性能。在个人办公方面，根据金山办公9月的预发布版本，WPS Office已经在骁龙平台上实现显著的性能提升，启动速度相比竞品提升20%，打开15MB Excel速度领先10%，打开10MB PPT速度领先10%。金山办公将于今年12月底正式交付面向骁龙AI PC的WPS Office，届时中国用户将能作为首批用户感受更流畅、跨平台的统一办公体验。企业协作方面，金山办公于今年7月发布了WPS AI 3.0版本——WPS灵犀。

“有了WPS灵犀，用户(hù)只(zhǐ)需(xū)通(tōng)过(guò)自(zì)然(rán)语(yǔ)言(yán)、多(duō)轮(lún)对(duì)话(huà)即(jí)可(kě)完(wán)成(chéng)文档(dàng)创(chuàng)作(zuò)、演(yǎn)示(shì)文稿(gǎo)生(shēng)成(chéng)及(jí)语(yǔ)音(yīn)助(zhù)手(shǒu)等(děng)功(gōng)能(néng)，是(shì)真(zhēn)正(zhèng)意(yì)义(yì)上(shàng)的(de)原生Office办公智能体。我们相信，未来WPS灵犀与骁龙AI PC的硬件能力有更深的合作机会，形成协同增效的办公生态。”张宁说道。

2025年是高通成立四十周年，也是其在华发展的第三十年，而AI将是高通与中国合作伙伴下一个三十年的重中之重。高通中国区董事长孟樸在展望高通与中国生态伙伴合作前景时表示：“站在AI与连接重构终端、重塑体验并开启全新智能时代的新起点，让我们以创新引领方向，以合作汇聚力量，共同开创下一个更加辉煌的三十年。”高通公司首席运营官兼首席财务官Akash Palkhiwala表示，高通将携手中国合作伙伴，在智能手机上实现更多AI赋能的功能和优化，将智能体AI的体验引入更多终端；同时与中国的AI模型提供商和开发者合作，共同推动更多AI应用案例的探索与落地。

上一条

ICCAD Expo 2025将于11月在成都举办

下一条

安世中国：荷兰安世半导体现任管理层散布不实信息，中国实体将保障客户生产连续性

列表

- 专业PCB设计平台 20年专业经验

关于

公司简介

发展历程

企业文化

招贤纳士

资质专利

新闻动态

公司新闻

行业新闻

业务范围

PCB设计

PCB制板

SMT贴片

元件采购

SI 仿真

技术中心

技术文章

技术支持

资料下载

联系我们

QQ

120568531

微信

留言

电话

400-7650 8329

邮件

pocketGames@ynzhjc.com

News

公司新闻

公司新闻

AI智能体走向终端，需要哪些芯片？

上一条

下一条

120568531

400-7650 8329

pocketGames@ynzhjc.com

关于 公司简介 发展历程 企业文化 招贤纳士 资质专利

新闻动态 公司新闻 行业新闻

业务范围 PCB设计 PCB制板 SMT贴片 元件采购 SI 仿真

技术中心 技术文章 技术支持 资料下载

联系我们

QQ

120568531

微信

留言

电话

400-7650 8329

邮件

pocketGames@ynzhjc.com

News

公司新闻

公司新闻

AI智能体走向终端，需要哪些芯片？

上一条

下一条

关于

公司简介

发展历程

企业文化

招贤纳士

资质专利

新闻动态

公司新闻

行业新闻

业务范围

PCB设计

PCB制板

SMT贴片

元件采购

SI 仿真

技术中心

技术文章

技术支持

资料下载