江西保温护角专用胶厂家台手掌大小、300克的AI主机，为什么能跑122B模型？

新闻资讯 | 2026-05-27 09:11

“当AI原生设备成为Agent新物种主力，底层力也正在加速重构。”

作者丨包永刚

编辑丨林觉民

把台能运行122B大模型的AI主机塞袋，需要付出什么代价？

过去大半年，端侧AI硬件的逻辑正在发生变化。

两个月前，国内掀起场现象的本地部署Agent热潮，大量AI好者开始“养虾”，让原本偏小众的Mac mini意外出圈，度出现溢价和缺货。在硬核的开发者圈子里，三四万元的DGX Spark同样热度不低，因为它已经能够在本地运行千亿参数模型。

Mac mini和DGX Spark同时走红，背后其实指向的是同个趋势：Agent正在迅速抬端侧AI硬件的门槛。

奥力斯 pvc管道管件胶批发联系人：王经理手机：15226765735（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

此前，40TOPS别的AI PC，仅能完成对话、生成等轻量任务。但进入Agent时代后，开发者开始追求大的模型、长时间的本地理，以及真正能够承担生产力任务的端侧AI设备。

问题随之出现。Mac mini足够安静、低功耗，却很难支撑大的本地模型；DGX Spark拥有强悍能，但价格、功耗与散热，又很难真正走向大众化。大力、低功耗与小体积之间，似乎始终难以兼得。

Agent时代真正缺少的，不再只是台强的AIPC，而是种能够7×24小时运行、低功耗、安静，并具备本地执行能力的新终端。

种介于AI PC与AI工作站之间的Agent Computer出现了。近发布的联想AI主机P7，仅300克、30W功耗的设备，拥有190TOPS端侧AI力，能在本地运行122B参数模型。

AI 2.0时代，

需要怎样的Agent Computer？

传统AI多还是问答式交互江西保温护角专用胶厂家，任务结束后，模型也随之停止运行。但Agent不同，它需要长期在线、持续调用模型、自主拆解任务，并在本地完成记忆、理、执行等整套过程。

这意味着Agent设备比拼的，不再只是瞬时能，而是长期稳定运行能力。

换句话说，AI 2.0时代真正需要的不是AIPC的简单升版，而是种介于AI PC与AI工作站之间的新终端，它既要具备运行大模型的能力，又须兼顾低功耗、静音、小体积，以及7×24小时持续工作的稳定。

联想AI主机P7，正是在AI 2.0需求下诞生的Agent Computer新物种。它既尝试接近DGX Spark的大模型生产力能力，又保留了类似Mac mini的低功耗与静音特。

P7拥有190TOPS异构AI力（dNPU+SoC），其中160TOPS来自后摩漫界M50 dNPU，30TOPS来自此芯P1 SoC。整机支持122B参数模型本地部署，可配置80GB RAM，并支持128K上下文窗口。

在网环境下，P7本地自主理速度可达50 Tokens/s，可以实现7×24小时连续执行Agent任务。

围绕Agent长期在线需求，P7的机身只有手掌大小，重量约300克，甚至可以直接通过充电宝供电运行。为了在小体积下实现持续稳定运行，P7还将整机功耗控制在30W以内，并将运行噪音压低至35分贝以下。

这意味着，联想AI主机P7已经开始真正具备本地生产力价值。

重要的是，与传统PC+AI的思路不同，P7并不是在原有设备中增加AI，而是围绕Agent场景重新定义终端逻辑。

例如，P7采用了机双模设计，在智能体模式下，本地运行天禧Claw，将复杂任务尽可能留在本地执行；在大模型模式下，则通过开放API Key接入各类AI应用与智能体，直接承担本地理与Token生成能力。

P7的出代表着过去只有功耗工作站才能承担的大模型本地理能力，开始有机会进入低功耗、低成本的小型设备。

而只有当大模型理能够在低功耗、小体积条件下长期运行，Agent才有可能真正从少数开发者设备，逐渐走向广泛的消费与行业终端场景。

支撑这种Agent Computer形态成立的，是P7背后套不同于传统GPU路线的新力案。

千亿模型装袋之后，

力逻辑也变了

联想在P7立项初期就已经明确江西保温护角专用胶厂家，要做台能放袋、又能本地运行大模型的AI主机。这意味着它的芯片须同时满足三个几乎互斥的条件：大力、低功耗、小体积。

传统AI芯片很难同时兼顾这些需求，核心在于数据搬运——计单元与存储单元物理分离，数据在两者之间频繁流动，带来额外的能耗与延迟。

AI芯片行业因此不断探索新的架构路径，其中个正在被越来越多厂商探索的向就是存体，保温护角专用胶存体让数据在存储侧就近完成计，从而减少搬运开销，提升整体能。

联想选择引入存体架构芯片，作为P7的主要AI力来源，也就是dNPU（Discrete NPU），它类似于立GPU的定位，拥有强的AI能。

这颗dNPU，正是后摩智能在2025年出的存体AI芯片——后摩漫界M50。

后摩漫界M50采用存体架构设计，具备160TOPS物理力，配备48GB内存与153.6GB/s带宽，典型功耗仅10W，能达到传统架构芯片的5～10倍。

雷峰网了解到，M50在设计阶段就针对大模型部署进行了优化，通过SRAM与48GB LPDDR5的组案，在兼顾能的同时，提升了千亿参数模型的可部署与成本可控。

真正的挑战不止于芯片，而是如何让千亿参数模型在台300克别的设备上长期稳定运行。这需要联想与后摩智能在本地Agent系统、理框架以及软硬件协同层面进行度配。

尤其是在Agent执行链路、模型调度与端侧资源管理上，联想需要套全新的系统能力来支撑持续运行的AI任务。

从2025年下半年项目正式启动开始，联想与后摩智能组建联团队，围绕硬件设计、软件适配与理框架展开了长达十多个月的联攻坚，终实现了在后摩漫界M50上运行千亿参数大模型。

目前，P7已经支持千问、智谱、DeepSeek等主流模型，并可实现新模型的Day0适配，即模型发布当天即可完成运行支持。对于用户而言，这使得P7不再只是演示型设备，而是台可长期运行Agent任务的本地AI终端。

从芯片到系统，再到Agent执行能力，联想与后摩智能正在共同验证种新的AI主机形态。

随着端侧大模型持续演进，这种兼顾能、功耗与长期运行能力的Agent Computer，正在成为AI 2.0时代具现实落地潜力的终端向之。

Agent 浪潮重构硬件规则，

存体迎来理黄金时代

AI芯片的竞争逻辑，正在发生场静默的翻转。

过去几年，行业的核心指标是峰值力，比拼的是谁能训练大的模型，GPU也因此成为整个AI时代的核心基础设施。

但当AI从1.0时代的生成次回答走向2.0时代的长期运行、持续执行任务的Agent形态后，芯片的评价体系开始变化：能比、持续理能力、本地执行复杂任务的稳定，逐渐与峰值力同等重要。

这变化并不是传统AI芯片的优势所在，却为新的架构路径开了窗口。

个明显的信号来自行业巨头。英伟达重金收购初创公司 Groq 核心技术资产，将其 LPU （Language Processing Unit）语言处理单元用于能理场景。后摩智能与Groq都是存体技术路线，都是基于SRAM设计产品，减少数据搬运、提升理能，只是产品叫法不同。

后摩智能在成立之初就注于存体技术的研发与产业化，2024年出针对大模型理优化的后摩漫界M30，支持运行60亿参数模型，并获得了移动等客户。

目前，基于后摩漫界M50，后摩智能已经搭建起M.2卡、DM.2卡、Pcie卡， 640TOPS 力的完整产品矩阵，并完成了从技术原型到规模化商用的关键跨越。如今后摩漫界M50已落地联想AI主机P7、 AI PC、桌面机器人、Agent Box、智能语音终端、AI 网关等多元端边场景。

后摩智能也在研发下代芯片，目标是进步提升能比与大模型理能力，以适配未来复杂的Agent时代。

这是个标志的转折点，GPU 定义了大模型训练时代，而 Agent 的爆发，正将力竞争从云端训练中心，向海量的端侧、边缘理节点。在这场力格局迁移中，以存体为代表的 AI 原生架构，不再只是 GPU 的补充或替代，在逐步建立端侧 Agent 时代的全新硬件标准。

随着Agent开始向多本地设备渗透，行业对于低功耗、能端边理芯片的需求也会持续增加。

未来，围绕端侧大模型理，还会出现多新的芯片形态与架构路线。

在这场Agent驱动的AI硬件范式切换中，AI原生的芯片成为竞争的关键，像后摩智能这样率先完成存体商业化落地的公司，正在进入大的增长通道。

多关于理时代力需求的度交流欢迎添加作者微信BENSONEIT。

相关词条:铁皮保温施工隔热条设备锚索离心玻璃棉万能胶生产厂家

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》江西保温护角专用胶厂家，以此来变相勒索商家索要赔偿的违法恶意行为。

上一篇：三门峡泡沫板专用胶厂塞尔维亚驻华大使：度赞赏企业贡献期待双边作再上新台阶

下一篇：益阳保温护角专用胶：美军在伊朗实施“自卫”击旨在以促谈，施压伊朗开放海峡

新闻资讯

江西保温护角专用胶厂家 台手掌大小、300克的AI主机，为什么能跑122B模型？

江西保温护角专用胶厂家台手掌大小、300克的AI主机，为什么能跑122B模型？