12月11日面壁智能宣布公司完成新一轮数亿元融资,本轮融资后,面壁智能将进一步提速以端侧AI为代表的高效大模型商业化布局,面壁智能CEO李大海表示,更高知识密度的小模型和端侧智能,成为大模型发展的新阶段。如今,因为端侧智能发展的深刻影响,主流消费电子和新兴硬件正演变成一个个在不同场景、执行特定任务的超级智能体,成为新一轮科技创业大风口。

随着AI PC和AI手机的推出以及Apple Intelligence等产品不断改进,以及其他在小型语言模型上运行的应用程序正在形成,一部分AI查询会在边缘或设备上进行处理,Barclays最新的一篇AI推理计算的未来发展趋势报告指出,边缘查询从2024年总查询的1%上升到2025年的10%。估计到2026年,将有15%的查询在终端设备上进行,到2028年约为25%,一些专家估计,未来端侧AI的占比预计会增长至50%。

随着大模型能力持续增强,应用场景持续突破,大模型应用架构也逐渐清晰,其中在应用层中agent成为业内关注的焦点,智能体是大模型能力的扩展,弥补大模型在操作和执行方面的不足,具备记忆、搜索、规划、决策、执行等能力。

Barclays的最新报告认为,目前AI行业发展的处于Chatbot及Copilot时代,2025—2026年即将迎来agent时代。12月11日谷歌发布最新模型Gemini 2.0的同时推出了一系列agent,智能体正成为大模型的下一站。

端侧大模型和智能体正成为AI的新阶段,未来AI算力需求或将迎来新变化。Barclays的最新报告认为推理计算将逐渐主导AI算力需求。随着像GPT-5这样的大型语言模型和新的AI基础设施(如NVIDIA Blackwell GPU)的出现,AI应用,尤其是agent系统,将迎来爆发式增长,消费者和企业人工智能市场可能会真正开始腾飞。

报告预测,随着agent系统推出,很大一部分计算可能会转移到对这些服务的推理上,约占推理市场的30%。随着采用的增加,整体推理可能会超过训练计算,报告预测,到2026年,如果消费者AI采用率超过10亿DAU,agent在企业任务渗透率超过5%,那么所需的总计算量约为1500亿EFLOPs,其中推理计算将占近75%,训练计算占25%。

基于企业级agent的采用估计,企业推理需求的计算量在2026年约为50亿EFLOPs,随着B200从明年开始安装,H100应该用于企业推理,报告估计只有未满足的30亿EFLOPs企业推理需求需要在2026年使用新芯片。

企业推理需求的计算量在2026年约为 50亿EFLOPs

企业推理需求的计算量在2026年约为 50亿EFLOPs

NVIDIA GPU目前占据推理市场约80%的份额,但到2028年这一比例将下降至约50%,主要原因是最大型的超大规模云服务商都在定制构建定制ASIC(亚马逊的Inferentia、Meta的MTIA、谷歌TPU v6、Grok和其他),报告预测ASIC芯片市场份额将持续增长,到2028年,这些ASIC可以处理高达40%的消费者推理计算。

定制ASIC芯片上推理工作负载比例的增加,预计将进一步降低每token的单位成本,推理单元成本(每百万tokens)正以每18个月超过90%的速率持续下降。不过,报告指出,单位成本的降低并没有导致产能过剩,而是带来了更多的使用,刺激了更多AI产品的开发和应用,从而增加了对算力的总需求。

定制ASIC芯片上推理工作负载比例的增加

定制ASIC芯片上推理工作负载比例的增加

此外,市场对算力相关资本支出的估计过低,Barclays的半导体研究团队预测,到2026年,仅AI芯片相关的资本支出就需要近3000亿美元,这比市场共识预测高出370%以上,如果将其他计算和数据中心资产的资本支出考虑在内,总资本支出可能高达7000亿美元。

到 2026 年,仅 AI 芯片相关的资本支出就需要近 3000 亿美元

到 2026 年,仅 AI 芯片相关的资本支出就需要近 3000 亿美元

端侧大模型算力需求方面,报告认为,虽然端侧AI可以处理一部分AI查询,但占比相对较小,由于设备的算力、内存和功耗限制,大型语言模型难以在端侧有效运行,云端数据中心仍将是满足AI算力需求的主力军。

明年端侧大模型和AI智能体将会迎来怎样的发展,agent时代将如何重塑计算需求?11月19日,第十九届中国IDC产业年度大典,中国工程院院士邬贺铨将带来《端侧大模型与AI智能体》的主旨演讲。大会聚焦“智算崛起”“赋能协同”“环球布局”“谁主沉浮”“算力新十年”几大议题模块,欢迎扫描以下二维码即可报名。

“多元重构 算力跃迁” 第十九届中国IDC产业年度大典 报名二维码

“多元重构 算力跃迁” 第十九届中国IDC产业年度大典 报名二维码

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-03-12 10:43:07
国际资讯 “星际之门”重要进展:即将安装6.4万张GB200
2025年3月10日,预算高达5000亿美元的“星际之门“项目传来新消息:Nvidia将为位于美国德克萨斯州阿比林市的“星际之门”一号站提供64,000个GB200 AI芯片。这些芯片将分阶 <详情>
2025-03-12 10:22:00
国内资讯 智算中心还是不够——两会热议AI,落点还在算力
理所当然的,AI成为了今年两会上最热门的产业话题。诸位代表各抒己见,从不同角度提出了高瞻远瞩的建言。但无论如何发展,AI的发展还是离不开算力的支撑,也是当前我国AI产 <详情>
2025-01-26 15:22:18
国际资讯 投资1000亿美元 开建10大智算中心 美国官宣“星际之门”项目
公司初期将获得1000亿美元的初始投资,并预计在未来四年内可能会增长到 5000 亿美元。 <详情>
2025-01-26 15:22:18
全球视野 投资1000亿美元 开建10大智算中心 美国官宣“星际之门”项目
公司初期将获得1000亿美元的初始投资,并预计在未来四年内可能会增长到 5000 亿美元。 <详情>
2025-01-15 15:59:00
国内资讯 总算力10EFLOPS 中国移动长三角(苏州)汾湖智算中心一期投运
据苏州日报,日前中国移动长三角(苏州)汾湖智算中心项目一期已经正式投入运行。项目建成后可提供总算力将达到10EFLOPS。 <详情>
智算中心面临“分水岭”:施耐德电气以四维创新驱动价值破局
2025-04-24 14:35:25
上海市启动2024年度全市算力资源摸底工作通知
2025-04-24 13:44:00
聚焦投资、技术与可持续发展——中国—东南亚数字基础设施合作论坛圆满举行
2025-04-23 17:54:00
从算力变革到AI生产力创新 首届酒仙桥论坛丨AIDC创新驱动生产力新变革论坛成功举办
2025-04-22 10:19:00
Rambus 通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护
2025-04-16 10:55:15
油城算力攀“新峰” 丝路云网架“金桥” ——克拉玛依市算力产业发展纪实
2025-04-15 10:57:00
筑AI生产力底座 酒仙桥论坛丨AIDC创新驱动力新变革专场将于4月16日隆重举行
2025-04-11 18:26:00
26亿!普洛斯中国首支数据中心基金完成募集 AI驱动算力资产升温
2025-04-07 16:10:47
科智咨询:寒冬将尽,春山可望!AI引领中国IDC市场进入新一轮增长周期
2025-04-03 12:04:48
原创|中国智算中心建设“过剩论”的另一面
2025-04-02 11:38:00
AI重塑云基础设施 亚马逊云科技获评IDC全球IaaS评估报告双第一
2025-04-01 19:48:00
中信集团在港成立人工智能科创中心 助力香港发展新质生产力
2025-04-01 19:36:00
普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
2025-04-01 18:19:39
投资20亿元、2000P,华池中科超级云智算中心一期项目开工
2025-04-01 14:13:15
“全球重点区域算力产业考察年度行”活动之——走进张家口:把脉算力新高地
2025-04-01 14:11:08