币灵灵财经
首页 > 理财知识 > 文章正文

成本降低12倍!英伟达升级版大模型芯片明年投产 黄仁勋:AIGC时代来了

币灵灵财经 2024-10-17 20:42 881

美国AI(人工智能)芯片巨头英伟达发布数据中心领域重磅芯片,剑指竞争对手AMD。

当地时间8月8日,英伟达(NVDA.US)CEO黄仁勋身穿经典皮衣,在计算机图形学顶会SIGGRAPH 2023现场发布新一代GH200 Grace Hopper超级芯片,并宣布将在2024年第二季度投入生产。GH200专为人工智能大模型设计,用于扩展全球的数据中心。

黄仁勋表示,生成式AI(AIGC)时代来临,英伟达将继续大力推动生成式AI发展的决心。

《华尔街日报》指出,这是英伟达对于AI数据中心芯片市场最大竞争对手AMD的“反击”,英伟达此前就已经预告将发布与AMD的Insight MI300X CPU + GPU对打的产品,后者是今年6月AMD刚刚发布的大模型专用芯片。

GH200超级芯片将于明年投入生产,较H100更强

GH200全球首发采用HBM3e高带宽内存,与英伟达目前最高端的AI芯片H100使用同样的GPU,但不同之处在于,GH200将同时配备高达141G的内存和72核ARM中央处理器,每秒5TB带宽。和现有Grace Hopper型号相比,最新版本的GH200超级芯片能够提供3.5倍以上的内存容量和3倍以上的带宽。和H100相比,GH200超级芯片的内存增加了1.7倍,带宽增加了1.5倍。全新一代的GH200预计明年二季度开始生产。

黄仁勋表示,一台服务器可以同时装载两个GH200超级芯片,大型语言模型的推理成本将会大幅降低。

据介绍,投资800万美元Grace Hopper,就相当于8800个价值1亿美元的x86 GPU,意味着成本降低12倍,能耗降低20倍。

GH200专为加速计算和生成式AI时代而打造,以巩固英伟达在AI界的主导地位,应对其老对手AMD于6月推出的数据中心APU(加速处理器)Instinct MI300系列的更新。

更厉害的地方在于,在内存和运算能力得到大幅度提升的基础上,GH200超级芯片还可以基于NVLink技术继续拓展互连,让GPU有能力访问全部的CPU内存,帮助客户减少机器数量并更快地完成工作。为了突出产品的这一特性,黄仁勋在演讲中屡次幽默地重复自己的口头禅:“你买得越多,就省得越多(The more you buy, the more you save)。”

“任何人都可以成为程序员”

在本次演讲中,生成式AI成为了被黄仁勋挂在嘴边的一大关键词。他在演讲中展示了图像和AI之间的不可分割性,表示AI既能够在虚拟世界中学习,也能够帮助搭建虚拟世界。

“大型语言模型是一个新的计算平台……人类就是新的编程语言,我们已经使计算机科学民主化,现在任何人都可以成为程序员,”黄仁勋在会议上说道,“时隔15年左右,终于有新的计算平台出现了,计算机本身必然会以截然不同的方式处理信息。”

美国科技媒体TechCrunch评价道,作为一款最新的、专门面向数据中心的AI开发硬件,在性价比高且耗能低的GH200即将推出的当下,再花费数百万美元为CPU机架等上一代计算资源进行投资研发将成为一种愚蠢的行为。虽然黄仁勋并未在演讲中提及AI目前面临的许多挑战、监管乃至概念上的变化,但他为观众展现了一个属于AI的积极前景。

英伟达的工作站GPU(图形处理芯片)系列也借本次发布会全面上新,一口气推出了4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。其中,性能最强的RTX 6000具有48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽。

针对企业客户,英伟达还为RTX 6000推出了最新的一站式解决方案RTX工作站。新的RTX工作站由英伟达和BOXX、戴尔科技、惠普和联想合作推出,支持最多4张RTX 6000 GPU,可以在15小时内完成8.6亿token(文本中的最小单位,一个单词或一个标点符号)的GPT3-40B的微调。

第三方开发者平台接入AI超算服务

对于开发者而言,英伟达将发布的全新统一工作空间是一个值得关注的话题。该空间被命名为NVIDIA AI Workbench,能够为开发者提供一个统一、易用的工作空间,使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将这些模型扩展到几乎所有数据中心、公有云或 DGX Cloud。

OpenUSD的开发也是本次演讲中的重点内容。就在本次演讲一周前的8月1日,美国3D内容行业的5家主要公司苹果、英伟达、皮克斯、Adobe和Autodesk联合成立了OpenUSD联盟(AOUSD)。OpenUSD技术是英伟达Omniverse平台的基础,可能会成为未来“元宇宙”的3D图形标准。

黄仁勋在演讲中宣布了英伟达 Omniverse 平台的重要更新,将为开发者、企业和行业带来新的基础应用和服务,使他们能够使用OpenUSD 框架和生成式AI优化改进3D流程。

另外,英伟达将发布四款全新Omniverse Cloud API,包括RunUSD、ChatUSD、 DeepSearch 和 USD-GDN Publisher,使开发者能够更加流畅地实施和部署 OpenUSD流程和应用。

合作伙伴方面,英伟达正在与人工智能初创公司Hugging Face展开合作,将支持Hugging Face名为“作为服务的聚类训练(Training Cluster as a Service)”的项目,简化企业创建新生成式AI模型的过程,这也意味着开发人员可以在Hugging Face平台上直接使用英伟达的超算服务。

5月25日,英伟达发布截至4月30日的2024财年第一季度财报,收入为71.9亿美元,高于市场预期的65.2亿美元,与上年同期的82.88亿美元相比下降13%,与上一财季的60.51亿美元相比增长19%。

Wind数据显示,英伟达2023年迄今的涨幅达到205.71%。或许是受到美股大盘集体走弱影响,英伟达美东时间8月8日股价低开低走,收跌1.66%,报446.64美元,总市值1.10万亿美元。英伟达将于太平洋时间8月23日(北京时间8月24日凌晨)发布截至2023年7月30日的2024财年第二财季财报。