新闻中心

News center
首页 / 新闻中心 / 正文
    LEWIN乐玩-当Token飙到天文数字,高通用「计算连续体」重搭智能体新基建
    时间:2026-06-05 14:05:20

    这几天,全世界科技圈的眼光投向了 COMPUTEX。

    昨天是 COMPUTEX 正式最先的第一天,英伟达、高通的重磅主题演讲激起了行业的强烈热闹会商。

    英伟达开创人黄仁勋又一次夸大 AI Agent 是将来重点发力标的目的,专为智能体打造的 CPU 也正式发布;而高通 CEO 安蒙于《智能体之年》(Year of the Agents)的主题演讲中,开释出了一个清楚的旌旗灯号:其正于为已经经开启的智能体 AI 时代铺设底层硬件及体系基建。

    作为 2026 上半年 AI 范畴绕不开的要害词,智能体再次成为 COMPUTEX 上科技巨头叙事的中央。这次,这条主线进一步落到了 AI 硬件及基础举措措施层面。从 AI PC、呆板人到数据中央,各家掀起了一场关在智能体算力、毗连与终端部署的竞逐。

    如今,智能体已经经率先于手机、PC 端最先落地。比拟之下,呆板人、可穿着、XR 装备、车载、边沿等其他硬件虽然想象空间一样很年夜,但受限在硬件成本、场景繁杂度及生态成熟度,离真正年夜范围部署仍有很年夜的间隔。

    怎样让智能体进入更多终端成为这次安蒙演讲的重点。

    对于在高通如许的硬件厂商,这已经经不但单是把 AI 塞进更多装备的问题了,更多磨练的是把芯片、毗连、体系软件及生态能力构造起来,提供一套能支撑起智能体永劫间运行、低功耗相应、跨终端协同的基建。

    高通给出了本身的战略选择:用「计较持续体」(Compute Continuum)把包括可穿着、手机、PC、汽车、呆板人、边沿装备及数据中央于内差别层级的计较节点毗连起来,让智能体按照使命需求运行于最适合的位置上。

    根据这一逻辑,将来及时交互及隐私敏感使命更多地留于端侧,现场化、低延迟使命交给边沿装备,更繁杂的年夜范围推理则由数据中央负担。

    经由过程这场演讲,安蒙真正想讲清晰的是,智能体走向更广漠的实际世界所需要的新型基础举措措施:从个性化体验到年夜范围推理,从端侧能效到云端算力,高通但愿借助「计较持续体」把所有须要的能力串起来。

    为何智能体 AI 时代需要「新基建」?

    安蒙于演讲最先抛出了一个要害判定:今天的装备其实不是为智能体体验设计的。手机、PC、操作体系及运用,持久以来都是缭绕人类自动操作构建的。

    不外,跟着智能体成为年夜模子运用的重要形态,它会连续运行、保留上下文、自动计划、多步履行,还有可能于后台挪用多个办事。这就带来了一系列新的体系要求:

    起首,装备需要常驻智能。

    各人回忆一下之前是怎么用 AI 的:打开对于话框,发问,等候回覆,末了关失。人是倡议者,AI 是应对者,一切缭绕单次交互举行。智能体的呈现转变了这套逻辑,它们要于后台连续运行,理解日程、使命、情况、位置、装备状况等上下文,并针对于及时指令举行反馈。这些对于当地传感器、低功耗计较及隐私掩护提出了更高要求。

    其次,端云需要协同。

    智能体履行使命时,不成能所有计较都放于云端,也不成能全数塞进终端装备。安蒙想要的不是简朴的「端侧 AI」或者「云端 AI」二选一,应该遵照漫衍式部署逻辑:使命按照时延、功耗、隐私、成本,于装备、边沿及云之间动态路由。

    末了,装备需要更强的异构计较。

    智能体其实不是跑一次模子、给一个谜底就竣事了,它要连续理解用户用意,拆解使命,挪用东西,处置惩罚上下文,还有要判定哪些计较留于当地,哪些交给边沿或者云端。使命越繁杂,装备内部的计较分工也就越主要。

    这恰是安蒙尤其夸大 CPU、NPU 及 GPU 共同的缘故原由。CPU 不仅卖力通用计较,也要负担使命编排及体系调理;NPU 及 GPU 则卖力于当地高效运行模子,处置惩罚语音、图象、感知及部门推理使命。

    基在上述判定,安蒙认为,智能体走向下一阶段,要害于在可否真正进入装备,并于真实使命中不变高效地跑起来。高通给出的谜底是:计较持续体。对于在将来的智能体,一套串起终端、边沿及云真个漫衍式部署系统成为必选项。

    用计较持续体,拼出新基建邦畿

    用一句话总结,计较持续体可以理解为「一套横跨小我私家终端、边沿装备及数据中央的 AI 计较系统」。更详细来说,高通的能力已经经笼罩从毫瓦级的小我私家音频装备,一起到到千瓦级的数据中央体系。

    先来说小我私家终端,这是智能体最切近用户之处。

    安蒙重复夸大的一点是,智能体正于代替传统的运用步伐及操作体系,成为用户数字体验的新中央。换句话说,用户纷歧定老是自动打开某个 运用,取而代之的是由智能体于差别装备之间理解场景、接办使命。

    手机、PC、AI 眼镜、可穿着装备将从零丁的硬件进口酿成智能体毗连人的端点。高通于这些范畴的结构早已经经放开了。

    于手机侧,第五代骁龙 8 至尊版强化个性化端侧 AI,负担更多当地推理、上下文感知及即时交互使命;于 PC 侧,骁龙 X2 Elite 系列面向 Windows AI PC,承接更多永劫间、多窗口、多东西的智能体使命;AI 眼镜及可穿着装备将智能体推到更切近人的位置,可穿着平台骁龙 Wear Elite 撑持最年夜 20 亿参数 AI 模子的端侧运行,为康健、运动、糊口记载、语音交互及自动提示等连续场景提供更佳体验。

    接下来是边沿与物理世界。

    智能体不只存于在手机、PC 等小我私家终端,汽车、呆板人、工业装备一样是智能体进入物理世界的主要端点。好比于呆板人侧,高通此次值患上存眷的是初次表态的跃龙 IQ10 RRD 全栈呆板人参考设计。

    先来看一波参数,它基在跃龙 IQ10 处置惩罚器,最高可提供 700 TOPS AI 算力,配备 18 个 Oryon CPU 焦点、多核 NPU 及 GPU,方针是于呆板人当地完成感知、计划及推理。

    差别在简朴地给呆板人厂商一颗芯片,高通是把高机能计较、多传感器接入、收集毗连、及时节制及呆板人软件栈放到了一套参考体系里,让厂商少做底层适配及体系拼接,把更多精神放于感知、导航、操作及使命履行自己。对于在高通自身而言,这也是其把挪动端 AI 堆集迁徙到物理世界的要害一步。

    而数据中央补上了计较持续体的末了一块拼图。

    安蒙官宣了全新数据中央营业品牌高通飞龙(Dragonfly),并暗示公司已经经于与超年夜范围云办事商及全世界互助伙伴推进现实部署。更多线路图会于本月尾的投资者日上宣布。跟着它的推出,高通的漫衍式部署邦畿也从端侧补齐到了云端,使「计较持续体」叙事越发完备。

    末了还有有被低估的协调层。

    大都人会商 AI 时只看算力,轻忽毗连。但智能体的素质是协作,多个智能体之间需要低延迟、高靠得住的通讯来连结协调。于这方面,高通正致力在推进 AI 原生的 6G。

    于安蒙看来,6G 具备三根支柱:毗连、漫衍式计较及感知。这个表述很要害,它象征着 6G 再也不只是把数据从一个处所传到另外一个处所,它成了将来漫衍式 AI 体系的一部门。于智能体 AI 时代,收集脚色发生了变化:它不仅卖力毗连装备,也帮忙装备协同计较,甚至介入对于物理世界的感知。

    智能体越普和,越需要一套能把装备、边沿、云端及收集构造起来的基础举措措施。6G 于此中负担的,除了了「连患上更快」,也要「让计较被更合理地分配」。

    以上组成了高通计较持续体的完备邦畿。智能体越日后成长,竞争越不会只逗留于某一颗芯片、某一个终端,端、边、云、网的共同愈加剧要。高通要讲清晰的正于在此:用一套横跨全场景的漫衍式部署系统,承接智能体 AI 时代不停增加的感知、推理及履行需求。

    TCO(总拥有成本),成为新的胜败手

    智能体带来的变化,不只是交互方式变了,暗地里的成本布局也于变。智能体的运行方式象征着它耗损 token 的速率较着加速。

    安蒙提到,从单轮对于话,到多轮推理,再到多步调智能体使命,token 耗损呈数目级上升。一个繁杂的智能体事情流,可能就患上百万 token 。「到 2030 年,token 总耗损量将到达惊人的 4.0148×10^18。」

    这暗地里对于应的是一个很是实际的问题:假如所有使命交给云端完成,成本、延迟、隐私及能耗迅速酿成压力。对于小我私家用户来讲,体验可能变慢;对于企业来讲,成本会变高;对于呆板人、汽车及工业装备来讲,许多使命不克不及等云端往返相应。

    以是,高通夸大漫衍式部署是于回覆一个现实的问题:甚么使命留于装备当地,甚么使命交给边沿节点,甚么使命值患上送到云端。

    这恰是计较持续体的贸易价值地点:能于当地完成的就削减云端挪用,需要低延迟的就接近现场处置惩罚,真正繁杂的年夜模子推理才交给数据中央。

    安蒙于演讲及第了两个例子:于 Claude Code 的一次真实使命中,计划器把部门计较留于当地,只把须要内容交给云端处置惩罚,末了于成果稳定的环境下罕用了约 140 万 token,成本降落 60%。

    于另外一个网页天生 demo 里,使命一样于端侧及云端之间分配,token 用量削减 30%,成本降到本来的四分之一。

    对于在高通而言,已往于挪动装备上持久解决的是统一个问题:怎样于有限的电池、散热及体积里尽可能开释更多算力。到了智能体 AI 时代,每一瓦特征能的晋升将酿成端边云协同的成本上风。

    漫衍式部署,高通有哪些上风?

    于 Computex 2026 舞台上,谈智能体的不只有高通。英伟达、联发科、英特尔也于缭绕智能体做文章。问题于在,一样是押注智能体,为何高通更夸大计较持续体?它的上风于哪里?

    咱们可以总结为如下几点:

    一是,笼罩海量终真个生态进口。

    智能体终极要进入用户天天利用的手机、PC,也要进入汽车、工业装备及更多边沿场景。高通的上风很较着,智能手机是其传统主场,PC 是近几年较着加快的标的目的,汽车营业已经经有比力深的堆集,呆板人及工业装备是它往外扩的新空间。

    是以,高通其实不是忽然最先讲智能体。更正确地说,它是于把已往几年堆集下来的挪动计较、毗连、汽车及边沿计较能力,从头放到智能体这个新框架中。

    二是,CPU、GPU、NPU、传感器及毗连能力的体系集成。

    智能体落到真实装备里,不只看 CPU、GPU、NPU 强不强,还有要看这些计较单位能不克不及与传感器、毗连、体系软件共同起来。

    这一样是高经由过程去持久堆集之处,它缭绕 SoC、通讯、传感器接口、软件栈及生态伙伴,构建起了一整套面向差别终端装备的平台能力。安蒙于演讲中重复提到端边云协同,素质上也是于夸大这类体系级能力。

    三是,多元化营业护城河,从小我私家计较到物理 AI。

    智能体正于把装备之间的界限从头打开。对于高通来讲,这象征着 AI 的时机再也不只缭绕小我私家计较装备睁开,会依托计较持续体延长到更广漠的真实世界。

    汽车是一个典型的例子。已往几年,高通于智能座舱、辅助驾驶、车载毗连及边沿计较上连续投入。这些能力放到智能体 AI 时代,正好可以转化为车内交互、门路感知及当地决议计划的一部门。呆板人及工业装备也是近似逻辑,它们都需要当地计较、传感器接入、不变毗连及持久运行能力,这些偏偏是高通一直于补的拼图。

    素质上来讲,高通于汽车、呆板人及工业范畴的结构,是于提早盘踞智能体进入物理世界的更多要害进口。

    从卖芯片,到铺智能体底座

    咱们把前面的线索串起来会发明,高通于 Computex 2026 上不只是别离于 PC、呆板人或者数据中央标的目的寻觅新增量。更深条理的变化于在:它于用「计较持续体」把这些看似分离的营业,从头构造到统一套叙事里。

    已往外界理解高通,起首想到的是芯片及通讯。它为手机、PC、汽车等硬件装备提供计较与毗连平台,这是高通最认识的位置。如今,智能体 AI 的呈现转变了这一传统分工,它们的能力开释与运行模式自然需要跨装备协同。

    这时候,单颗芯片的机能已经经不是独一问题。企业、开发者及装备厂商有了更体贴的方针,好比智能体于差别装备间的不变运行,智能体于端侧、边沿及云端之间的顺畅接力等。

    于这类变化下,高通的价值也必需往上走。领先的芯片能力仍是底座,但需要及软件栈、参考设计、开发东西、毗连能力以和端边云部署方案放于一路看。如许的体系化进级要求高通从头界说本身,计较持续体的意义正于在此。

    于这个历程中,高通想要夸大的上风变患上越发清晰:低功耗计较、毗连能力、终端生态,以和正于补齐的边沿及数据中央能力。高通想争夺的不单单是更年夜的芯片市场份额,更要成为智能体 AI 落地进程中底层计较及毗连系统的要害支撑者。

    这对于应了 AI 财产竞争重心的变化。将来的竞争不会只于模子参数上,也不会只缭绕某一个进口睁开。智能体周全进入一样平常糊口、企业出产及更广漠的物理世界,必需运行于一张更繁杂的计较收集里。装备、边沿、云、毗连、软件及生态,每一一层都决议着它们可否真正落地。

    高通此刻做的,就是把本身从这张收集里的芯片供给商,进级为「体系级 AI 基础举措措施提供者」。这差别在简朴的营业界限扩张,是高通对于自身于 AI 财产链中的位置举行了一次重塑。

    -LEWIN乐玩
    热点推荐