性价比超H100,英特尔宣告中国版Gaudi2 AI减速卡
机械之心宣告
编纂:泽南
英特尔会是性价宣告国内天生式 AI 算力的更优解吗?
在狂语言模子(LLM)规模,越强盛的比超版模子就越需要算力。最近有新闻称,中国之后业界标杆 GPT-4 在磨炼中运用了约 2.5 万块 A100 ,减速磨炼时长逾越 90 天。性价宣告
如斯高门槛的比超版天生式 AI 赛道上,各家科技公司的中国相助却颇为强烈,国内市场致使泛起了 AI 减速卡求过于供的减速形态 。对于 AI 磨炼的性价宣告算力,人们不断以来都在依赖 GPU,比超版最近 ,中国英特尔面向国内提出了一个新的减速处置妄想。
7 月 11 日在北京举行的性价宣告宣告会上,英特尔正式于中国市场推出第二代 Gaudi 深度学习减速器 ——Habana Gaudi2。比超版

明天的中国行动中,英特尔介绍了 Gaudi2 芯片的功能 ,并品评辩说了面向中国市场的英特尔 AI 策略、最新 AI 相关产物技术妨碍以及处置妄想的运用。
「Gaudi 深度学习减速器的狂语言模子磨炼能耐进一步丰硕了咱们的家养智能产物阵列,」英特尔公司实施副总裁、数据中间与家养智能事业部总司理 Sandra Rivera 展现。「对于在中鼎祚转深度学习磨炼以及推理使命负载的客户来说,与市场上其余面向大规模天生式 AI 以及狂语言模子的产物比照 ,Gaudi2 是更事实的抉择。除了在功能展现上逾越 A100 之外,Gaudi2 在种种开始进的模子上相对于 A100 提供了约两倍的性价比 。」

上周,英特尔 Habana Gaudi2 深度学习减速器以及第四代英特尔至强可扩展处置器在 MLPerf Training 3.0 基准测试的最新榜单上揭示了使人印象深入的服从。该基准由 MLCo妹妹ons 宣告,是业内普遍招供的 AI 功能行业尺度 。
Gaudi2 减速器在合计机视觉模子 ResNet-50(8 卡)、Unet3D(8 卡),以及做作语言处置模子 BERT(8/64 卡)上均取患了优异的磨炼服从,在每一个模子上功能都优于 A100,部份使命上挨近 H100。
此外,在狂语言模子 GPT-3 的评测上,Gaudi2 也揭示了实力 。它是仅有的两个提交了 GPT-3 LLM 磨炼功勤勉效的处置妄想之一(另一个是英伟达 H100)。在 GPT-3 的磨炼上,英特尔运用 384 块 Gaudi 2 减速器运用 311 分钟磨炼实现,在 GPT-3 模子上从 256 个减速器到 384 个减速器实现为了近线性 95% 的扩展。
「比照之下,英伟达在 512 块 H100 GPU 上的磨炼光阴则为 64 分钟 。这象征着,基于 GPT-3 模子,每一个 H100 的功能争先于 Gaudi2 3.6 倍,」Habana Labs 首席经营官 Eitan Medina 展现。「性价比是影响 H100 以及 Gaudi2 相对于价钱的紧张考量因素。Gaudi2 效率器的老本要比 H100 低良多 。纵然尚未装备 FP8,Gaudi2 在性价比上也压倒了 H100 。」

英特尔展现 ,Gaudi2 在 MLPerf 上提交的服从不经由模子或者框架的特殊调校,这象征着用户也可能在当地或者云端部署 Gaudi2 时取患上相似的功勤勉效。
Gaudi2 在效率器以及零星老本方面还具备清晰的老本优势,这使患上它可能成为英伟达 H100 的有力相助对于手 。
去年,英特尔旗下的 Habana Labs 推出了第二代 AI 磨炼加推理芯片 Gaudi2 。与头一代产物比照,Habana Gaudi 2 运用的制程工艺从 16 纳米跃升至 7 纳米,在矩阵乘法(MME)以及 Tensor 处置器中间合计引擎中引入了 FP8 在内的新数据规范,Tensor 处置器中间数目增至 24 个,同时集成为了多媒体处置引擎,内存降级至 96GB HBM2E。

在以先天生式 AI 看重的扩展功能方面 ,国内版本的 Gaudi2 每一张芯片集成为了 21 个专用于外部互联的 100Gbps(RoCEv2 RDMA)以太网接口(比照外洋版本略有削减),从而实现为了低延迟的效率器内扩展。
为反对于客户轻松构建模子 ,或者将之后基于 GPU 的运用迁移到 Gaudi2 效率器上,英特尔提供的 SynapseAI 软件套件针对于 Gaudi 平台深度学习营业妨碍了优化 。SynapseAI 集成为了对于 TensorFlow 以及 PyTorch 框架的反对于 ,并提供泛滥盛行的合计机视觉以及做作语言参考模子,可能知足深度学习开拓者的多样化需要。
而在 Hugging Face 平台上 ,已经有逾越 5 万个模子运用 Optimum Habana 软件库妨碍了优化。Sandra Rivera 展现,英特尔经由与 Hugging Face 的相助 ,平台上的现有的模子惟独要破费多少十秒光阴就能调通运行在 Gaudi 减速器上。
当初 ,已经有 OEM 厂商推出了基于英特尔 AI 减速卡的产物。在宣告行动中,英特尔宣告 Gaudi2 首先将经由浪潮信息向国内客户提供,其效率器集成为了 8 块 Gaudi2 减速卡 HL-225B,还搜罗两颗第四代英特尔至强可扩展处置器。
在明天的行动中,英特尔也泄露了其在 AI 减速规模的未来睁开倾向 。下一代 Gaudi 3 芯片估量在明年推出,将接管台积电 5 纳米制程,也会同期推出国内版 。而在 2025 年摆布,英特尔妄想将 Gaudi 与其现有 GPU 产物线妨碍整合。
相关文章:
- 拒绝爆冷,76人又赢了!恩比德狂轰38+14,东部黑马3连败一安徽农民因长相酷似普京,一夜走红,俄罗斯人:真的太像了
- 全天下最大的游戏引擎Unity要降天生式AI工具了,能不能做好3D是个下场
- 约基奇28分!掘金4-1热火,拿下队史首个NBA总冠军
- 法媒:利雅患上月芽妄想提供数年巨额年薪条约,但穆帅不感兴趣
- 原创 正负值-228!联盟倒数第一!离开勇士,普尔彻底废了
- 川大张薇闺蜜发声:人已经烦闷,心高气傲跌到谷底,求网夷易近给生路
- 热火社媒预热总决赛G5:用尽所有可能取
- 美媒列出家养智能ChatGPT,评出的21世纪10年月最重大的10名球员
- 原创 主动替补吧,克莱别因自尊毁勇士,向威少学,库里状态还可夺冠呢
- 澳超赛事前瞻:卫冕冠军西部联本赛季饱受伤病所扰戴笠是怎么辨别日本女特务的,只因一个隐私部位,和我国女子不同
相关推荐:
- 场均5分,0胜12负!天才榜眼沦为废柴,真不是勇士的问题25+2!19+3!压哨加盟太阳,从替补到第三巨头,你真的被低估了
- 中超第3遭遇重创!主力外援一大举动引发猜疑,难怪上轮如此悲痛
- 3000元冲功能旗舰机,iQOO Neo8 Pro配么?
- 队史首冠,约基奇FMVP,恭喜掘金,也致敬热火!
- 亚冠冲突后浙江队遭重罚 4人被禁赛 莱昂纳多姚均晟禁赛8场
- CBA | 雷蒙、范子铭续约首钢几成定局长期不穿内衣的女性,身体会发生哪些变化?女孩子不要羞于了解
- 北美五大同盟均薪TOP10:NBA包揽前4独占6席 布克唐斯榜首库里第4
- 湖人继续扩展引援名单 库里带刀侍卫进入佩总雷达如果没有他,林彪不是林彪,四野不是四野,去世后就连毛主席都要向他三鞠躬,他是谁?
- 长春亚泰VS山东泰山:泰山全力争三分,为争冠做最后努力非洲女孩巴特曼因有巨臀,一生被赤身裸体展览,死后还被做成标本
- 女子被指鞋面装摄像头偷拍,警方审核后廓清,当事人称将起诉
- 原创 季中赛步行者为什么打不过湖人?球迷实在是忍不住把话说透了
- 近11场8胜防守效率第二,快船四巨头终于有了冠军相?
- 原创 输给湖人!哈利伯顿开始招募巨星!乔治有望重返步行者
- 双塔威猛!森林狼撕碎灰熊领跑联盟,爱德华兹伤退,李凯尔准三双
- 乌杰里点名,猛龙太阳最新交易引爆球坛!
- 连续击败曼城阿森纳,埃梅里的维拉要在英超争冠了?
- 读书行路 篇九:我在欧洲浪啊浪 之 皇家马德里主场买球衣非洲女孩巴特曼因有巨臀,一生被赤身裸体展览,死后还被做成标本
- 亚冠罚单将至浙江残阵南征墨尔本 莱昂纳多停8场?泰国“流亡女总理”英拉,成了中国名企董事长?你看她的背后是谁
- 西部第一6连胜!爱德华兹伤退,戈贝尔狂揽20板,唐斯24+7+5中塔2.8万平方公里领土之争,中国只拿1158平方公里,为何妥协?
- CBA最新积分榜,广东升第二,浙江第三,深圳第七,山东两连胜