热搜:
A股“较好壕”董秘!福莱特阮泽云身家26亿,企业新闻福禄克红外热像仪的测量指南收藏!春运12306新功能说明书

快捷

logo

综合

英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。

今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。

英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。

全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。

LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新:

vLLM:

·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍

·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10%

·逐层在线量化,减少所需的GPU内存

·支持vLLM中的PP(流水线并行)(实验性)

·支持torch.compile(实验性)

·推测解码(实验性)

·支持嵌入和重排序模型

·增强的多模态模型支持

·最大长度自动检测

·数据并行支持

OneCCL基准测试工具支持

XPU Manager:

·GPU功耗

·GPU固件更新

·GPU诊断

·GPU内存带宽

英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。

相关阅读

季丰精密通过IATF16949质量管理体系认证

2025-08-28
在竞争激烈的汽车行业供应链中,质量与可靠性始终是核心竞争力的关键要素。浙江季丰精密电子有限公司近日成功通过了 IATF16949 质量管理体系认证,这一里程碑式的成就标志着公司在汽车零部件制造领域的质

山东能源望田煤业:算好安全“三本账” 稳定发展“底气足”

2025-08-28
“现在正是降本增效、向生产要效益的关键时期,怎么咱矿的安全监管越来越严。”“咱们区长不是说过,安全是最大的效益,抓不好安全一切等于0…&hell

高铅银物料中氯量的测定

2025-08-28
高铅银物料经碳酸钠高温半熔融,用热水浸出,移至容量瓶,吸取上清液,经硝酸酸化后加入定量并过量的硝酸银。分离氯化银沉淀,以饱和硫酸高铁铵作指示剂,用硫氰酸钾标准溶液滴定过量的硝酸银,反滴定法测定氯离子的

无语了!谷歌正在油管上测试无法跳过的30秒长广告

2025-08-28
近日Search Engine Land 发现,谷歌正在YouTube常规广告中测试长达 30 秒的“不可跳过广告”。据称,该形式此前仅限通过YouTube预约购买(YouTube Reservati

残疾人两项补贴年内发放到位 每人每月不低于60元

2025-08-28
残疾人两项补贴年内发放到位 每人每月不低于60元发布时间:2017-03-15 14:02 来源:豫都网 我来说说 我要投稿[摘要]河南商报讯记者 李冰冰)昨日,河南商报记者从省民政厅了解到,省民政厅

微软AI Agent再升级

2025-08-28
AI智能体正重塑人机协作模式,不仅能响应指令,更能主动预判需求、执行复杂任务并持续进化:在办公领域,它已经能辅助完成高效的数据分析与洞察;在安全领域,它们可自动应对钓鱼攻击与数据风险;在开发领域,智能

微软AI Agent再升级

2025-08-28
AI智能体正重塑人机协作模式,不仅能响应指令,更能主动预判需求、执行复杂任务并持续进化:在办公领域,它已经能辅助完成高效的数据分析与洞察;在安全领域,它们可自动应对钓鱼攻击与数据风险;在开发领域,智能

单家企业票数最高超百万!四大维度助力“2022中国家居行业价值100公司”出圈

2025-08-28
向上生长,共生未来!面向中国家居行业,由搜狐焦点家居和焦点研究院联合主办的“2022中国家居行业价值100公司”评选近日启动,线上投票也于11月18日0:00正式上线,并引发企业踊跃参与和行业强烈关注

苹果iPhone 17系列9月10日发布 库克:前方超燃

2025-08-28
苹果在今天凌晨放出了2025年秋季新品发布会的邀请函,苹果CEO库克称这是一场超燃的发布会,暗示新机配备了VC散热。苹果在今天凌晨放出了2025年秋季新品发布会的邀请函,正如爆料所言,苹果将在9月9日

今年安徽省早稻总产量99.4万吨_

2025-08-28
8月22日,国家统计局发布2025年早稻产量数据。数据显示,今年安徽省早稻播种面积166.5千公顷,总产99.4万吨,单产5969.4公斤/公顷。国家统计局的公告显示,今年全国早稻播种面积稳中略减,单

安徽省用电负荷今年第三次刷新纪录_

2025-08-28
8月22日,记者从国网安徽省电力有限公司获悉,在新一轮连续高温天气拉动下,全省用电负荷持续增长。8月21日,全省最大用电负荷今年第三次刷新历史纪录,达到6857万千瓦,较去年最大负荷增长7.92%。当

首趟务工人员专列低京

2025-08-28
首趟务工人员专列低京。首趟务工人员专列低京。首趟务工人员专列低京。 2月24日12时50分,从江苏盐城开往北京的G1570次列车抵达北京南站。该趟列车也成为复工复产后,抵达北京的首趟务工人员专列。北京

泉州:城市“徒步族”自发组成 走出健康新生活

2025-08-28
通过徒步,许多人走出健康新生活。每天傍晚开始,城市健身锻炼的人逐渐增多,运动方式也是五花八门。夜幕降临后,在泉州江滨公园,“徒步一族”都会在固定时间出现,伴随欢快的音乐节拍,迈

旧椅子10年暴涨400倍 海南黄花梨:创造神话-

2025-08-28
买把椅子也能大把赚钱 眼下,越来越多的富人把目光投向了一个崭新的投资渠道——名贵木作投资。说简单点就是投资高端的木制仿古家具。据业内人士透露,保守估计,这类藏品中的小件价值每年都可增长15%,海南黄花

7月份中国炼焦煤进口量环比增长5.7%

2025-08-28
海关总署公布的最新数据显示,2025年7月份,中国进口炼焦煤962.3万吨,同比下降11.2%,环比增长5.7%。2025年1-7月,中国累计进口炼焦煤6244.5万吨,同比降8.5%。

F4重聚 现身五月天演唱会合唱《流星雨》

2025-08-28
7月12日,在五月天演唱会上,F4合体现身,与五月天一起演唱经典歌曲《流星雨》。网友纷纷感慨:“今夕是何年” “五月天真的有时光机”!阿信去年曾在直播时

吉林珲春:开展快检线上培训 巩固提升操作技能

2025-08-28
中国消费者报长春讯(魏薇 记者 李洪涛)4月13日,记者从吉林省珲春市市场监管局获悉,该局邀请快检仪器工程师开展了快检线上培训,普及食品快速检测设备的应用操作知识和技能。同时,对食品药品便民服务站快检

中粮集团2017年利润总额创历史新高

2025-08-28
刚刚过去的2017年,中粮集团交出一份靓丽的“成绩单”:年营业收入4825亿元,利润总额118亿元,资产总额达到5388亿元。按照十九大提出的现代化强国的战略部署,中粮集团提出

“复兴号”动车组预计到9月21日实施新的列车运行图

2025-08-28
“复兴号”在京津城际上线运行 《 人民日报 》 2017年08月22日 02 版) 图为8月21日,从北京南开往天津的C2001次“复兴号”中国标
小编推荐
猜你喜欢
如果觉得快捷不错,还请把快捷分享到你的微信好友、朋友圈、微博等,万分叩谢
「**」鸟啼花怨网为你提供,,,,等 http://m.keepwgiscg.xyz/
点我复制链接

俺也是有底线滴

© 2023 鸟啼花怨网 版权所有
为你提供,,,,等 http://m.keepwgiscg.xyz/