
“当AI原生设备成为Agent新物种主力,底层力也正在加速重构。”
作者丨包永刚
编辑丨林觉民
把台能运行122B大模型的AI主机塞袋,需要付出什么代价?
过去大半年,端侧AI硬件的逻辑正在发生变化。
两个月前,国内掀起场现象的本地部署Agent热潮,大量AI好者开始“养虾”,让原本偏小众的Mac mini意外出圈,度出现溢价和缺货。在硬核的开发者圈子里,三四万元的DGX Spark同样热度不低,因为它已经能够在本地运行千亿参数模型。
Mac mini和DGX Spark同时走红,背后其实指向的是同个趋势:Agent正在迅速抬端侧AI硬件的门槛。
奥力斯 pvc管道管件胶批发 联系人:王经理 手机:15226765735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
此前,40TOPS别的AI PC,仅能完成对话、生成等轻量任务。但进入Agent时代后,开发者开始追求大的模型、长时间的本地理,以及真正能够承担生产力任务的端侧AI设备。
问题随之出现。Mac mini足够安静、低功耗,却很难支撑大的本地模型;DGX Spark拥有强悍能,但价格、功耗与散热,又很难真正走向大众化。大力、低功耗与小体积之间,似乎始终难以兼得。
Agent时代真正缺少的,不再只是台强的AIPC,而是种能够7×24小时运行、低功耗、安静,并具备本地执行能力的新终端。
种介于AI PC与AI工作站之间的Agent Computer出现了。近发布的联想AI主机P7,仅300克、30W功耗的设备,拥有190TOPS端侧AI力,能在本地运行122B参数模型。
01
AI 2.0时代,
需要怎样的Agent Computer?
传统AI多还是问答式交互江西保温护角专用胶厂家,任务结束后,模型也随之停止运行。但Agent不同,它需要长期在线、持续调用模型、自主拆解任务,并在本地完成记忆、理、执行等整套过程。
这意味着Agent设备比拼的,不再只是瞬时能,而是长期稳定运行能力。
换句话说,AI 2.0时代真正需要的不是AIPC的简单升版,而是种介于AI PC与AI工作站之间的新终端,它既要具备运行大模型的能力,又须兼顾低功耗、静音、小体积,以及7×24小时持续工作的稳定。
联想AI主机P7,正是在AI 2.0需求下诞生的Agent Computer新物种。它既尝试接近DGX Spark的大模型生产力能力,又保留了类似Mac mini的低功耗与静音特。
P7拥有190TOPS异构AI力(dNPU+SoC),其中160TOPS来自后摩漫界M50 dNPU,30TOPS来自此芯P1 SoC。整机支持122B参数模型本地部署,可配置80GB RAM,并支持128K上下文窗口。
在网环境下,P7本地自主理速度可达50 Tokens/s,可以实现7×24小时连续执行Agent任务。
围绕Agent长期在线需求,P7的机身只有手掌大小,重量约300克,甚至可以直接通过充电宝供电运行。为了在小体积下实现持续稳定运行,P7还将整机功耗控制在30W以内,并将运行噪音压低至35分贝以下。
这意味着,联想AI主机P7已经开始真正具备本地生产力价值。
重要的是,与传统PC+AI的思路不同,P7并不是在原有设备中增加AI,而是围绕Agent场景重新定义终端逻辑。
例如,P7采用了机双模设计,在智能体模式下,本地运行天禧Claw,将复杂任务尽可能留在本地执行;在大模型模式下,则通过开放API Key接入各类AI应用与智能体,直接承担本地理与Token生成能力。
P7的出代表着过去只有功耗工作站才能承担的大模型本地理能力,开始有机会进入低功耗、低成本的小型设备。
而只有当大模型理能够在低功耗、小体积条件下长期运行,Agent才有可能真正从少数开发者设备,逐渐走向广泛的消费与行业终端场景。
支撑这种Agent Computer形态成立的,是P7背后套不同于传统GPU路线的新力案。
02
千亿模型装袋之后,
力逻辑也变了
联想在P7立项初期就已经明确江西保温护角专用胶厂家,要做台能放袋、又能本地运行大模型的AI主机。这意味着它的芯片须同时满足三个几乎互斥的条件:大力、低功耗、小体积。
传统AI芯片很难同时兼顾这些需求,核心在于数据搬运——计单元与存储单元物理分离,数据在两者之间频繁流动,带来额外的能耗与延迟。
AI芯片行业因此不断探索新的架构路径,其中个正在被越来越多厂商探索的向就是存体,保温护角专用胶存体让数据在存储侧就近完成计,从而减少搬运开销,提升整体能。
联想选择引入存体架构芯片,作为P7的主要AI力来源,也就是dNPU(Discrete NPU),它类似于立GPU的定位,拥有强的AI能。
这颗dNPU,正是后摩智能在2025年出的存体AI芯片——后摩漫界M50。
后摩漫界M50采用存体架构设计,具备160TOPS物理力,配备48GB内存与153.6GB/s带宽,典型功耗仅10W,能达到传统架构芯片的5~10倍。
雷峰网了解到,M50在设计阶段就针对大模型部署进行了优化,通过SRAM与48GB LPDDR5的组案,在兼顾能的同时,提升了千亿参数模型的可部署与成本可控。
真正的挑战不止于芯片,而是如何让千亿参数模型在台300克别的设备上长期稳定运行。这需要联想与后摩智能在本地Agent系统、理框架以及软硬件协同层面进行度配。
尤其是在Agent执行链路、模型调度与端侧资源管理上,联想需要套全新的系统能力来支撑持续运行的AI任务。
从2025年下半年项目正式启动开始,联想与后摩智能组建联团队,围绕硬件设计、软件适配与理框架展开了长达十多个月的联攻坚,终实现了在后摩漫界M50上运行千亿参数大模型。
目前,P7已经支持千问、智谱、DeepSeek等主流模型,并可实现新模型的Day0适配,即模型发布当天即可完成运行支持。对于用户而言,这使得P7不再只是演示型设备,而是台可长期运行Agent任务的本地AI终端。
从芯片到系统,再到Agent执行能力,联想与后摩智能正在共同验证种新的AI主机形态。
随着端侧大模型持续演进,这种兼顾能、功耗与长期运行能力的Agent Computer,正在成为AI 2.0时代具现实落地潜力的终端向之。
03
Agent 浪潮重构硬件规则,
存体迎来理黄金时代
AI芯片的竞争逻辑,正在发生场静默的翻转。
过去几年,行业的核心指标是峰值力,比拼的是谁能训练大的模型,GPU也因此成为整个AI时代的核心基础设施。
但当AI从1.0时代的生成次回答走向2.0时代的长期运行、持续执行任务的Agent形态后,芯片的评价体系开始变化:能比、持续理能力、本地执行复杂任务的稳定,逐渐与峰值力同等重要。
这变化并不是传统AI芯片的优势所在,却为新的架构路径开了窗口。
个明显的信号来自行业巨头。英伟达重金收购初创公司 Groq 核心技术资产,将其 LPU (Language Processing Unit)语言处理单元用于能理场景。后摩智能与Groq都是存体技术路线,都是基于SRAM设计产品,减少数据搬运、提升理能,只是产品叫法不同。
后摩智能在成立之初就注于存体技术的研发与产业化,2024年出针对大模型理优化的后摩漫界M30,支持运行60亿参数模型,并获得了移动等客户。
目前,基于后摩漫界M50,后摩智能已经搭建起M.2卡、DM.2卡、Pcie卡, 640TOPS 力的完整产品矩阵,并完成了从技术原型到规模化商用的关键跨越。如今后摩漫界M50已落地联想AI主机P7、 AI PC、桌面机器人、Agent Box、智能语音终端、AI 网关等多元端边场景。
后摩智能也在研发下代芯片,目标是进步提升能比与大模型理能力,以适配未来复杂的Agent时代。
这是个标志的转折点,GPU 定义了大模型训练时代,而 Agent 的爆发,正将力竞争从云端训练中心,向海量的端侧、边缘理节点。在这场力格局迁移中,以存体为代表的 AI 原生架构,不再只是 GPU 的补充或替代,在逐步建立端侧 Agent 时代的全新硬件标准。
随着Agent开始向多本地设备渗透,行业对于低功耗、能端边理芯片的需求也会持续增加。
未来,围绕端侧大模型理,还会出现多新的芯片形态与架构路线。
在这场Agent驱动的AI硬件范式切换中,AI原生的芯片成为竞争的关键,像后摩智能这样率先完成存体商业化落地的公司,正在进入大的增长通道。
多关于理时代力需求的度交流欢迎添加作者微信BENSONEIT。
相关词条:铁皮保温施工 隔热条设备 锚索 离心玻璃棉 万能胶生产厂家1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》江西保温护角专用胶厂家,以此来变相勒索商家索要赔偿的违法恶意行为。
