热搜:
法国赛林丹约战桃田贤斗 高昉洁陈雨菲围剿戴资颖天下財經週報:台積電法說會登場 將透露今年全球景氣是否更糟?|天下雜誌全榆木打造的璞榆系列实木家具你了解吗?

快捷

logo

综合

(电子发烧友网报道 文/章鹰)8月12日,破解在2025金融AI推理应用落地与发展论坛上,赖A理黑华为公司副总裁、科技开源数据存储产品线总裁周越峰宣布,线月华为此次和银联联合创新,正式推出AI推理创新技术UCM(推理记忆数据管理其器)和管理系统的破解算法,这项突破性成果降低对HBM技术的赖A理黑依赖,提升国内AI大模型的科技开源推理能力。


该技术是线月一款以KV Cache为中心的推理加速套件,UCM集成了多类型缓存加速算法工具,正式实现推理过程中KV Cache记忆数据的破解分级管理,从而扩大推理上下文窗口,赖A理黑提升推理效率。科技开源“银联的线月实际案例和大量测试显示,UCM显著降低首Token的正式时延,最高降低90%,系统吞吐率最大提升22倍,上下文的推理窗口可以扩展10倍以上,这是对于AI推理系统一个巨大的进步。” 周越峰指出。

华为UCM技术已率先应用在中国银联“客户之声”、“营销策划”和“办公助手”三大业务场景,开展智慧金融AI推理加速应用试点,并且已经取得成果。华为表示,计划于2025年9月正式开源UCM,将在魔擎社区首发,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

AI大模型推理给存储带来哪些挑战?UCM的创新之处如何解读?本文结合中国信通院人工智能研究平台与工程化部主任曹峰、华为数据存储产品线AI存储首席架构师李国杰的观点,进行详细分析。

AI大模型推理给存储带来三重挑战

“ChatGPT的访问量呈现线性增长,最新访问量达到4亿,受益于中国AI大模型DeepSeek爆发,日均调用量也在快速上升,2025年1月开始,中国AI推理的需求增长20倍,未来三年算力需求爆发。IDC表示,2024年算力需求60%是训练,40%是推理,到2027年中国用于推理的算力需求——工作负载将达到72.6%。” 中国信通院人工智能研究平台与工程化部主任曹峰分析说。

当下,AI大模型推理应用落地中,遇到推不动、推得慢和推得贵的三大挑战。首先,长文本越来越多,输入超过模型上下文窗口的内容,推理窗口小就推不动;其次,由于中美在AI基础设施的差距,中国互联网大模型首Token时延普遍慢于美国头部厂商的首Token时延,时延长度为后者的两倍;推得贵,美国大模型的推理吞吐率为中国大模型推理吞吐率的10倍。

华为公司副总裁、数据存储产品线总裁周越峰指出,AI时代,模型训练、推理效率与体验的量纲都以Token数为表征,Token经济已经到来。

在AI基础设施投资,中国和美国有差距,为了保障流畅的推理体验,企业要加大算力投入,但是如何改善AI推理的效率和体验,在推理效率与成本之间找到最佳平衡点?华为推出UCM,以KV Cache和记忆管理为中心提供全场景化系列化推理加速能力。

UCM两大关键能力和创新算法,破解HBM受困难题

HBM是解决"数据搬运"的关键技术。当HBM不足时,用户使用AI推理的体验会明显下降,导致出现任务卡顿、响应慢等问题。华为此次技术突破有望缓解这一瓶颈。

华为重磅推出UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

UCM的创新之处,在于可以根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,同时融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS(每秒处理token数)提升2至22倍,从而降低每个Token的推理成本。

“实时数据放在HBM当中,短期记忆数据放在DRAM中,其他数据就放在共享存储SSD中,极大提高系统的效率和AI推理能力。针对AI推理平衡成本和效能的挑战,华为推出UCM统一的记忆数据管理器,在两个层面以系统化的方案来解决问题。” 华为数据存储产品线AI存储首席架构师李国杰表示。

一、在底层的框架和机制上提供了多级缓存空间,构建智能管理以及智能流动的基础框架能力。在此基础之上,华为构筑了一系列创新的推理的加速算法和加速特性,包括自适应的全局Prefix Cache,降低首Token时延与单位Token成本。

二、采用动态的Training稀疏加速算法,倍数级提升长序列吞吐和体验。还有后缀检索、预测加速算法、PD检索加速和Agent原生记忆加速。

UCM将超长序列Cache分层卸载至外置专业存储,通过算法创新突破模型和资源限制,实现推理上下文窗口的10倍级扩展,满足长文本处理需求。

中国银联执行副总裁涂晓军分享说,华为与中国银联的联合创新技术试点中,在中国银联的“客户之声”业务场景下,借助UCM技术及工程化手段,大模型推理速度提升125倍,仅需10秒就可以精准识别客户高频问题,促进服务质量提升。

众所周知,目前,AI大模型训练对内存带宽需求呈指数级增长,传统DDR内存已无法满足需求。HBM(高带宽内存)是一种专用内存技术,用于 AI 处理器GPU和 HPC 系统,这些系统中带宽和能效比原始容量更为重要。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。

但是去年12月以来美国将HBM2E列入对中国的禁售清单,国产厂商HBM的突破还在推进中,华为推出UCM的重大意义,在于加速推进国产AI推理生态,其核心价值是推进更快的推理响应和更长的推理序列,以及更优化的成本。

中国信通院人工智能研究平台与工程化部主任曹峰认为,国产化AI推理生态建设应该加速,KV Cache已经成为架构优化的焦点,以KV Cache为核心的推理方案迭出,背后依赖的高性能存储、先进调度策略的重要性愈发显现。

李国杰还强调指出,AI是一个快速发展的行业,每6个月就会迎来新一轮的技术革新,UCM不仅定位于当下,解决AI推理问题,未来发展UCM将从KV Cache分层管理走向Agentic AI原生记忆管理和应用加速。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

相关阅读

乐从红星美凯龙“五一”浓情献礼暨周年庆大型优惠活动-

2025-08-26
1元起拍疯狂抢购 活动期间:5月1日-7日,每天下午13:00-16:00 活动内容:商场提供多款精美家居商品进行现场拍卖,所有拍卖品无论价值多少均1元起竞拍,眼疾口快,该出手时就出手,瞬间秒杀最惠商

纯四氟化碳气体标准物质:优质纯度,满足专业检测需求

2025-08-26
在气体检测与分析领域,纯四氟化碳气体标准物质扮演着至关重要的角色。它不仅是校准检测仪器、确保测量准确性的基石,更是推动相关行业技术进步与质量提升的关键要素。随着科技的不断发展和检测要求的日益严格,对纯

“就地消纳”再提速 分布式光伏装上“智能闸门”

2025-08-26
只要预警与措施精准对应,分布式光伏的‘无序扰动’就能变成‘有序供能’。”在近日召开的2025年二季度分布式光伏承载力评估会上,新乡电网为全年

2020年江西执法稽查和反垄断工作要点出炉

2025-08-26
中国消费者报南昌讯(严有生 记者 朱海)近日,江西省市场监管局印发《2020年全省执法稽查和反垄断工作要点》(以下简称《要点》),部署2020年全省执法稽查和反垄断工作任务,明确执法稽查和反垄断工作重

拉诺齐亚:现在开始创造伟大赛季

2025-08-26
9月21日米兰消息 - “我期待一个伟大的赛季。”在参加国米频道Prima Serata节目录制时,安德雷·拉诺齐亚说道。“我们是一支全新的队伍,在任何位置都是这样

逼近变盘时刻!疲软初请+制造业数据已就位,只待鲍威尔最终信号

2025-08-26
汇通财经APP讯——周四8月21日),北京时间20:30,美国劳工部公布最新一周初请失业金人数,费城联储同步发布8月制造业指数。初请失业金人数增加1.1万至23.5万,创6月以来最高,超出市场预期的2

整治“景观亮化工程”过度化对LED显示企业的机遇和挑战,行业资讯

2025-08-26
根据电视媒体新闻12月2日消息,中点“不忘初心、牢记使命”主题教育领导小组印发《关于整治“景观亮化工程”过度化等“政绩工程”、“面子工程”问题的通知》以下简称“《通知》”),要求把整治“景观亮化工程”

国网汉阴县供电公司:高效检修消缺 备战迎峰度冬

2025-08-26
“一定要知晓各自任务和危险点,做好每一项安全措施……”10月30日,国网汉阴县供电公司对122铜钱线双河支线开展隐患消缺,现场工作负责人反复叮嘱杆上作业人员注意每一个安全细节,确保消缺工作安全高效推进

厦门市唯一与地铁衔接的BRT文塔站 预计年内投用

2025-08-26
海峡网讯 (厦门晚报 记者 谢雨真 通讯员 黄芳芳)BRT文塔站正加紧建设,预计年内正式投用。昨日,记者从BRT场站公司获悉,该站点将成为目前唯一与地铁1号线衔接的BRT站点。BRT文塔站项目位于厦禾

城外城家具城公交坐车路线-

2025-08-26
城外城家具城公交坐车路线。城外城家具城是北京一家知名的家居卖场,植居于北京,一直为广大消费者提供一站式家具销售,全方位的服务。也靠着这一切,北京城外城家具城有着相当的口碑。下面我们就来看看城外城家具城

中国海油大型炼化一体化项目全面建成

2025-08-26
北京8月22日电 中国海油22日宣布,中海石油大榭石化炼化一体化项目在浙江宁波全面建成,对推动国家重质油高效转化、提升高端化工材料自主可控能力有重要意义。该项目总投资额为210亿元,此次投产的核心装置

不一样的生活不一样的家具,全屋定制实木家具!

2025-08-26
不一样的生活不一样的家具,全屋定制实木家具!定制家具是比较灵活高端的一种家具,定制实木家具比定制板式家具就更加高端了,如果您考虑全屋实木家具定制产品的话那就说明您的身份与品味绝非一般,那么定制实木家具

2017年亿万富豪报告发布:亚洲亿万富豪首超美国

2025-08-26
中国有钱人最多?每隔1天诞生1位新富豪!靠拆迁费和土地征收?瑞银与罗兵咸永道发表亿万富豪报告指,亚洲拥有世界上最多的亿万富豪,每隔一天就有一位新亿万富豪诞生,人数首次超过美国,分别有637人及563人

你也觉得床头柜没有用吗?看看再说吧

2025-08-26
你也觉得床头柜没有用吗?看看再说吧卧室的氛围是非常重要的,一张简雅、温馨的实木床,一隅线条干净,没有杂乱既视感的空间,搭配两个的床头柜,让人看着心情舒畅,也能提高睡眠质量。其实,经常被忽视的床头柜,对

易烊千玺出关是怎么回事?易烊千玺带上新节目出关陈坤杨紫琼加盟

2025-08-26
今天6月8号,高考的最后一天,也就意味着我们的易烊千玺大佬要出关了,不过这次,真的是惊喜,他还将带上新节目出关,还有陈坤杨紫琼加盟。已经有一个多月未见到易烊千玺了,马上就有节目播出,这无非是给粉丝们的

邓肯亲笔信:感恩拥有梦幻旅程 对一切感到敬畏

2025-08-26
邓肯亲笔信:感恩拥有梦幻旅程 对一切感到敬畏发布时间:2016-11-18 11:32 来源:豫都网 我来说说 我要投稿[摘要]北京时间7月14日消息,蒂姆-邓肯已做出决定,挥别19年职业生涯正式退役

商用车新能源化的第三条路:醇氢如何对标纯电与氢燃料

2025-08-26
推动新能源商用车可持续发展,既要站在国家的角度,考虑道路交通领域的“双碳”目标;也要站在市场的角度,考虑为用户提供更加适合的产品,提高用户的综合收益,这样才能实现新能源商用车行

为什么说网购实木家具送货周期越长越好

2025-08-26
为什么说网购实木家具送货周期越长越好首先我们网购的宝贝到您家,一般的小产品都是快递的形式到您的手里,但是家具您想过是怎么到您的家中呢。网购的热潮使得的少实木家具品牌开始了网上营销,可大家想过一个问题么

价格三年暴跌近八成 储能业联手“反内卷”

2025-08-26
近期,多家协会机构发布倡议,上百家产业链企业联手拒绝“价格战”,一场席卷储能行业的“反内卷”行动展开。“十四五”以来,我国新型储
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」鸟啼花怨网为你提供,,,,等 http://m.keepwgiscg.xyz/
点我复制链接

俺也是有底线滴

© 2023 鸟啼花怨网 版权所有
为你提供,,,,等 http://m.keepwgiscg.xyz/