黄仁勋:英伟达下一代Rubin架构AI芯片将于2026年推出 全球AI产业规模或高达100万亿美金

钛媒体
2024-06-03 09:47:59
18859
6月2日晚,“AI教父”、英伟达创始人、CEO黄仁勋(JensenHuang)宣布,英伟达打算每年都升级AI加速器/AI芯片,去年发布的Blackwell芯片现在开始投产,2025年将推出Blackwell Ultra,而下一代 AI 芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。

就在刚刚,身价961亿美元(约合6959.56亿元)的老黄,在台北超过5000人的体育场内,全面展示AI“核弹”带来的新产业革命。

6月2日晚,“AI教父”、英伟达创始人、CEO黄仁勋(JensenHuang)宣布,英伟达打算每年都升级AI加速器/AI芯片,去年发布的Blackwell芯片现在开始投产,2025年将推出BlackwellUltra,而下一代AI芯片架构平台名为Rubin,采用HBM4芯片,预计将于2026年推出。

同时,黄仁勋还宣布推出推理模型微服务NVIDIANIM,以部署在云、数据中心或工作站上,并且开发者能够轻松地为Copilot、ChatGPT等构建生成式AI应用,所需时间从数周缩短至几分钟。另外,英伟达面向GeForceRTXAI电脑平台推出AI助理,为数字人推出G-Assist和NVIDIAACE(数字人技术)NIMs,以及为微软WindowsCopilotRuntime推出用于RTX加速API的小语言模型(SLM)等等。

黄仁勋全程演讲接近2个小时,广达董事长林百里、和硕董事长童子贤等台系供应链厂商高管均悉数到场,现场5000多人座无虚席,而黄仁勋携带无数款英伟达新产品,希望让产业链和更多人看到新的AI时代下,英伟达处于GPU和AI技术的“交汇点”。

“今天,我们正处于计算领域重大转变的风口浪尖。AI和加速计算的交汇将重新定义未来。”黄仁勋强调,未来,全球AI产业规模将高达100万亿美金,比之前IT时代的3万亿美元高出33万倍以上,具有强大的市场前景。

黄仁勋引领的新一轮以AI为核心的产业革命已经开始。

从CUDA软件到GPU硬件,英伟达正“加速一切”

这次COMPUTEX上黄仁勋的演讲内容,钛媒体AGI梳理成四大主题层面:NIM软件,芯片架构和硬件,Omniverse和NVIDIAACE,以及机器人技术。

首先,黄仁勋表示,计算机行业迎来了非常激动人心的时刻,整个产业将被变革。而加速计算、和在全宇宙中运行的AI这两种技术力量将重塑计算机行业。其中,CPU处理性能扩展已大大放缓,“摩尔定律”已经跟不上AI数据和计算能力的发展,而基于GPU的加速计算和CUDA系统将“加速”计算机的应用研发速度。

“我们正在看到世界各地使用的数据中心电力数量正在大幅增长,计算成本正在增长,而且看到了计算通货膨胀。当然,这不能再继续下去了。同时,数据将继续呈指数级增长,CPU性能扩展将永远不会恢复到之前状态。”黄仁勋称,“我预测,在不久的将来,每个处理密集型的应用程序都将加速,每个数据中心肯定都会加速。现在,加速计算是非常明智的。这是很常见的感知。”

黄仁勋表示,“GPU处理器可以降低能耗和运算时间,并且运算速度之快令人难以置信。例如,如果GPU可加快100倍的运算速度,但你只增加了大约三倍的功率、只增加大约50%的成本。一旦GPU放到1000美元的PC设备上,性能显著提高,形成了小型的算力中心;如果5亿美元GPUs放到数据中心当中,它突然间会变成了一个AI算力工厂。节省的开支是相当惊人的,每1美元可以获得60倍的性能、100倍的速度提升,令人难以置信。而节省的费用是用美元来衡量的。”

黄仁勋强调,8年内英伟达AI计算架构加速了1000倍。

“加速计算是可持续计算,”他称,GPU和CPU的组合能够实现高达100倍的加速,同时仅将功耗增加三倍,与单独使用CPU相比,每瓦性能提高了25倍。

英伟达还展示了基于加速计算技术的模型如何更快、更省钱的预测天气。基于NVIDIAEarth-2研发的天气类生成式AI模型CorrDiff,可以将25公里模型解析为2公里,速度提高了1,000倍,单次推理所消耗的能量比传统方法减少了3,000倍,同时成本削减50倍,能源消耗削减25倍,以实现更快、更准的预测天气和气候变化。

英伟达称,这意味着,过去需要近300万美元才能完成一组CPU及其运行所需的能源的工作,现在只需使用NVIDIAH100TensorCoreGPU的单个系统,仅需大约60,000美元即可完成。这是一个巨大的节省,表明生成式AI和加速计算如何提高能源效率并降低总体拥有成本(TCO)。

黄仁勋指出:“买得(GPU)越多,省得(功耗和成本/TCO)越多”,强调了这种方法可以显著节省成本和能源。

随后,黄仁勋反复强调CUDA软件系统生态对于AI时代的重要性。目前,英伟达全球拥有500万开发者在CUDA生态上进行开发,服务包括医疗保健、金融服务、计算机、汽车等各行各业,几乎每一个科学领域因为有CUDA生态架构才可以获得用户。

因此,黄仁勋重磅推出首个基于GPU云的生成式AI推理部署服务:NVIDIANIM,通过优化容器形式提供模型,部署在云、数据中心或工作站上。借助NVIDIANIM,开发者能够轻松地为Copilots、聊天机器人等构建生成式AI应用,所需时间从数周缩短至几分钟,目前包括40余个NIM微服务为跨模式的生成式AI赋能。

具体来说,NVIDIANIM提供了一种简单、标准化的方式,将多个模型来生成文本、图像、视频、语音等生成式AI添加到应用中,显著提高了开发者的工作效率。包括Cadence、Cloudera、Cohesity、DataStax、NetApp、ScaleAI和新思科技等近200家技术合作伙伴正在将NIM集成到他们的平台中,以加快特定领域应用的生成式AI部署。

黄仁勋表示,“每个企业都希望在其运营中融入生成式AI,但并非每个企业都拥有专门的AI研究团队。NVIDIANIM可被集成到任意平台中,任何地方的开发者都可以访问,并且可以在任意环境中运行——它正在助力科技行业将生成式AI普及到每一个企业组织。”

另外,英伟达今日还宣布,集成NVIDIAHoloscan的NVIDIAAIEnterprise-IGX软件现已在NVIDIAIGX平台上正式可用,以满足工业边缘对实时AI计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业级软件和支持来加快开发和部署边缘AI解决方案。

其次,黄仁勋首次透露下一代技术架构:Rubin。

黄仁勋透露,英伟达新的GPU架构将从两年一次迭代,加速到以一年为周期推出。而Rubin平台首次亮相,将取代即将推出的Blackwell平台,该平台具有新的GPU、新的基于Arm的CPU—Vera—以及带有NVLink6、CX9SuperNIC和X1600融合InfiniBand/以太网交换机的高级网络。

“我们公司有一年的节奏。我们的基本理念很简单:建立整个数据中心规模,然后以一年的节奏拆解并出售给您,并将一切推向技术极限,”黄仁勋解释称。

同时,我们在图中还看到VeraCPU——下一代ARMCPU架构,他们共同出现在新的VeraRubin加速器上。而这一名称来源,实际上是来自美国一位女天文学家VeraRubin——研究暗物质先驱。

另外,在网络方面,黄仁勋公布每年发布Spectrum-X产品的计划,以满足AI对高性能以太网网络日益增长的需求。此次公布的全新NVIDIASpectrum-X,是首款专为AI打造的以太网架构,与传统以太网架构相比,其网络性能提高了1.6倍。它可加速AI工作负载的处理、分析和执行,进而加速AI解决方案的开发和部署。

据悉,CoreWeave、GMOInternetGroup、Lambda、Scaleway、STPXGlobal和Yotta是首批采用Spectrum-X的AI云服务提供商,旨在为其AI基础设施带来极致的网络性能。

基于GPU的强大加速计算能力,黄仁勋还宣布永擎电子、华硕、技嘉、鸿佰科技、英业达、和硕、QCT、Supermicro、纬创资通和纬颖将使用NVIDIAGPU和网络打造云、专用系统、嵌入式和边缘AI系统,从单GPU到多GPU、从x86到Grace、从风冷到液冷等全面进行整合英伟达“全家桶”,丰富的产品组合覆盖云、专用系统、嵌入式和边缘AI系统等。

“新一轮工业革命已经开始。众多企业和地区正在与NVIDIA合作推动价值万亿美元的传统数据中心向加速计算转型,并建造一种新型数据中心——AI工厂来生产新的商品‘人工智能’。从服务器、网络和基础设施制造商到软件开发商,整个行业正在准备使用Blackwell来加速各个领域实现AI驱动的创新。”黄仁勋称。

再次,黄仁勋重点谈及NVIDIAACE数字人AI技术,以及Omniverse数字孪生技术。

英伟达发布的数字人AI微服务NVIDIAACE(AvatarCloudEngine),可以让游戏NPC具有AI对话功能,同时能直接生成数字人的语音和面部动画,从而以加速下一波数字人类的诞生,提升游戏和虚拟角色互动体验的技术,以及即将在该平台上实现的全新生成式AI突破。

目前,客户服务、游戏和医疗保健领域的公司率先采用ACE技术,简化客户服务、远程医疗、游戏和娱乐领域逼真的数字人类的创建、动画和操作。而NVIDIAACE技术套件包括NVIDIARivaASR、TTS和NMT、NVIDIANemotronLLM、NVIDIAAudio2Face、NVIDIANemotron-34.5B—一种新型小型语言模型(SLM),专为低延迟、设备上RTXAIPC推理而构建等。

同时,英伟达已将ACE作为NIM微服务提供给开发人员在数据中心运行。现在,NVIDIA正在构建ACEPCNIM微服务,以部署在1亿台RTXAIPC和笔记本电脑上。

另外,关于英伟达Omniverse,黄仁勋称,NVIDIAMetropolis视觉AI、NVIDIAOmniverse基于物理的渲染和模拟以及NVIDIAIsaacAI机器人开发和部署,助力台达电子、富士康、和硕、纬创以数字化方式构建、模拟和运营工厂数字孪生。

富士康(鸿海)有透露,其在墨西哥的工厂采用了英伟达的一系列自动化和数字化技术,基于目前的努力,该公司预计可以使用模拟工厂提高复杂服务器的制造效率,从而大幅节省成本并每年减少30%以上的千瓦时使用量。

富士康首席执行官兼董事长刘扬伟表示:“AI和机器人技术有望彻底改变制造业,提高工厂车间的安全性并显著提高运营效率。通过将NVIDIAOmniverse、Metropolis和Isaac整合到我们的运营中,我们可以创建工厂的复杂数字孪生来训练机器人,以前所未有的精度优化工作流程并降低成本。”

英伟达强调,公司正引领价值50万亿美元的工业数字化转型,各行业都采用自主运营和数字孪生——提高效率和降低成本运营工厂。

针对消费级设备,黄仁勋透露,目前有超过200款RTXAI笔记本电脑上市,整个性能高达700AITOPs。

最后是机器人。

“下一波人工智能是物理人工智能。能够理解物理定律的人工智能,能够在我们之中工作的人工智能,”黄仁勋强调了机器人和AI在未来发展中的重要性。

英伟达发布的NVIDIAIsaac平台,为开发人员提供了强大的工具包,以构建AI机器人,包括AMR、工业机器手臂和人形机器人,由AI模型和JetsonOrin和Thor等超级计算机提供支持。

“机器人技术已经到来。物理人工智能已经到来。这不是科幻小说,它正在台湾各地使用。这真的非常令人兴奋,”黄仁勋称,全球电子巨头正在将NVIDIA的自主机器人集成到他们的工厂中,包括全球超过500万个预编程机器人正在进入工厂。

“未来,所有工厂都将是机器人工厂。工厂将协调机器人,而这些机器人将制造机器人产品,”黄仁勋称。

目前,比亚迪电子、西门子、泰瑞达和Alphabet旗下公司Intrinsic等全球十多家机器人行业领先企业,正在将NVIDIAIsaac加速库、基于物理学的仿真和AI模型集成到其软件框架和机器人模型中,以此提高工厂、仓库和配送中心的工作效率,使机器人的人类同事更安全地工作,并使机器人成为执行重复性或超精密任务的智能助手。

同时,100多家公司正在采用IsaacSim来仿真、测试和验证机器人应用,其中包括海克斯康、富世华和MathWorks。Agility、波士顿动力公司、FigureAI、傅利叶智能和SanctuaryAI正在使用IsaacLab。

黄仁勋强调,未来所有的产品都将是机器人,当然,其中之一是自动驾驶汽车,或具有大量自主能力的汽车。

“下一个大批量机器人产品将由机器人工厂制造,内部有机器人,可能是人形机器人。近年来,这在基础模型的认知的能力和正在发展的世界理解能力方面都有很大进步。我对这个领域感到非常兴奋,因为很明显,最容易适应世界的机器人是人类或机器人,‘我们’(人形机器人)为我们建造世界。我们还必须获取最多的数据来训练这些机器人,因为我们有相同的体质。或许,你将来会在云中构建可以四处走动的计算机。事实证明,机器人技术将有巨大的前景空间,所以这对我们来说将是一段非凡的未来旅程。”黄仁勋在演讲结尾表示。

总结来说,黄仁勋这次从CUDA软件到GPU硬件全面更新,证明英伟达正“加速一切”,以巩固其在AI算力领域的领先地位。

黄仁勋霸气尽显,英伟达要统领全球AI生态

当前,英伟达已经成为AI领域的重要推动者,规模超过2万亿美元,仅次于苹果公司。

就在5月22日美股盘后,英伟达发布的2025财年一季度财报(2024自然年一季度)显示,当季实现营收260亿美元,同比大增262%,环比增长18%,再创单季营收历史新高;净利润为148.81亿美元,环比增长21%,同比增长628%,营收利润双双暴增。

英伟达预计,今年第二财季营收为280亿美元,上下浮动2%;非通用会计师准则下毛利率约为75.5%,上下浮动50个基点。这一营收指引高于彭博统计的266亿美元市场预期。

这样一种营收预期,让黄仁勋乐到开花。因此,为了这次演讲,黄仁勋提早一个星期来到台北,逛夜市、请酒会、接受人们拍照采访,甚至和台系供应链成了“铁哥们”。

有趣的是,发布会前夕的一场酒会上,黄仁勋宴请台系供应链厂商高管——华硕董事长施崇棠、和硕董事长童子贤、鸿海董事长刘扬伟、纬创总经理林建勋、纬颖董事长洪丽宁、广达董事长林百里、云达(广达旗下服务器代工厂)总经理杨麒令、英业达董事长叶力诚、英业达总经理蔡枝安、台达电董事长郑平、宜鼎董事长简川胜、广运董事长谢清福及CEO谢明凯等10余人,参与者的身价共计1.5万亿元人民币,每桌消费约1040元。而且,黄仁勋还请台积电创始人张忠谋一起逛夜市,引发所有人的关注。

黄仁勋在餐叙的一开始,便霸气站在椅子上致词,他指出,“我们正在进入AI的新世代,你们生产的东西,是世界上最有价值的产品,这个AI世界若是没有你们的产品,就不可能产生。这是令人兴奋的时刻。我们还有很多工作与努力要做,我们一起工作已经30年,未来十年仍将持续”。

现场立刻有人附和,“我们enjoy”,而黄仁勋也回应“我也enjoy”。

“AI对中国台湾IT产业来说将会是很庞大的商机,中国台湾仍会维持全球科技产业中心的重要地位。中国台湾是AI科技的中心,我与中国台湾的朋友及CEO们相聚在一起,也为这个新时代做准备,科技的扩张将使得中国台湾受益,因为中国台湾占据了中心地位。”黄仁勋表示,中国台湾将是AI领域的重地,甚至以Country说法引发更多关注。

而且,黄仁勋还与张忠谋把酒言欢。

据DigitimesResearch此前公布的2022年数据显示,在全球服务器代工制造市场,鸿海的份额高达43%,稳居第一,其除了为惠普(HP)及戴尔(DELL)等品牌代工之外,还握有亚马逊和微软数据中心的订单。紧随其后的广达、纬创、英业达的市场份额分别为17%、14%、12.8%、7.6%。之后除了美商美超微(Supermicro,美国超微电脑股份有限公司)之外,还有神达、技嘉、环鸿、仁宝、和硕,基本都是台系厂商。

总体来看,在全球的服务器代工市场,台系厂商则占据了全球约90%的市场份额。

此次,黄仁勋演讲结束后,接下来几天内,Computex大会还会迎来AMDCEO苏姿丰、英特尔CEO基辛格等8大AI厂商代表演讲。

6月3日(9:30-11:00):AMD苏姿丰

6月3日(13:30-14:40)高通克里斯蒂亚诺・阿蒙

6月4日(11:00-12:00)英特尔帕特・基辛格

6月4日(13:30-14:30)联发科蔡力行

6月5日(09:30-10:30)超威电脑梁见后

6月5日(13:30-14:30)恩智浦LarsReger

6月6日(11:00-12:00)台达阙志克

免责声明:本文观点来自原作者,不代表天天在线的观点和立场。文章内容仅供参考、交流、学习,不构成投资建议
责任编辑:唐吉诃德XN046
猜你感兴趣