英伟达GTC：发布“地表最强”B200芯片，进军机器人领域，与苹果强强联合

访客 2024-03-19 16:29:39 23632 抢沙发

默认

北京时间3月19日，人工智能芯片巨头英伟达年度开发者大会(GTC)在美国加州圣何塞SAP中心举行。

时隔5年时间再度回归线下的GTC现场人头攒动。开场时，英伟达CEO黄仁勋笑谈道：你要知道，这不是一场演唱会，而是一个开发者大会。面对观众的热情欢呼，黄仁勋也不禁用调侃作为开场白。

在短短15个月内市值增长6倍，超过2万亿美元，成为继苹果和微软之后的全球第三大科技公司，英伟达有理由受到更多的关注，尤其在AI时代，作为全球最红的企业，英伟达的任何风吹草动也将成为科技圈的焦点。

在今年最重要的开发者盛会上，对于市值冲破2万亿美元的英伟达可谓是至关重要，在下一个计算时代，他们如何展现出更强大的统治力?是否还能领先对手?又在会上带来了哪些发布?本次，元宇宙新声也受邀参与全程报道，一同带大家探索今年GTC大会带来的新技术和新动态。

最强GPU诞生，英伟达继续统治AI时代

在本年度GTC大会上，身着大家熟悉黑皮衣的英伟达CEO黄仁勋发表主题演讲《见证AI的变革时刻》。

首先，黄仁勋用一张手绘图回顾了计算机产业的发展史，以及英伟达的发家史。从1964年IBM推出世界首个通用计算机开始，伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现，再到2016年，黄仁勋亲手将第一台DGX-1超级计算机送给了OpenAI。而在2022年，随着聊天机器人ChatGPT横空出世，生成式AI带来了全新一轮产业革命。

随后，到了黄仁勋演讲的重点，他带来了英伟达推出的最新一代AI芯片Blackwell GPU。

黄仁勋一边说着Hopper很棒，但我们需要更大的GPU，一边在现场展示了英伟达的新款Blackwell芯片，这款芯片被命名为B200。另外，英伟达还带来了全新的GB200芯片，计划于今年晚些时候上市。

目前，英伟达按照平均两年一次的更新频率升级GPU架构，对产品性能进行大幅提升。英伟达于2022年发布了基于Hopper架构的H100加速卡，而现在推出基于Blackwell的加速卡在性能上也得到了全面提升，更擅长处理AI相关任务。

全新B200拥有2080亿个晶体管，是上一代的两倍多。平台能够在万亿参数级的大型语言模型(LLM)上构建和运行实时生成式AI，与用于推理的相同数量的H100 Tensor Core图形处理单元(GPU)相比，全新GB200 NVL机架级系统具有36个Grace Blackwell超级芯片，性能提高了30倍，并且显著提高效率。

此外，黄仁勋还强调称：与H100相比，GB200的成本和能耗降低了25倍。

值得注意的是，B200 GPU的重要进步之一，是采用了第二代Transformer引擎。

它通过对每个神经元使用4位(20 petaflops FP4)而不是8位，直接将计算能力、带宽和模型参数规模翻了一倍。

而只有当这些大量的GPU连接在一起时，第二个重要区别才会显现，那就是新一代NVLink交换机可以让576个GPU相互通信，双向带宽高达1.8TB/秒。

而这就需要英伟达构建一个全新的网络交换芯片，其中包括500亿个晶体管和一些自己的板载计算，拥有3.6 teraflops FP8处理能力。在此之前，仅16个GPU组成的集群，就会耗费60%的时间用于相互通信，只有40%的时间能用于实际计算。

此次，英伟达还发布了GB200 NVL72，整合英伟达在数据中心硬件方案中GPU、DPU、NVLink等技术的最新成果，构成驱动大语言模型背后的引擎。

GB200 NVL72进入云端，成为云厂商计算实例，黄仁勋在演讲中还发布搭载B100 GPU的AI云服务DGX Cloud。通过与云厂商平台向用户提供能够训练生成式AI大模型，及其他AI应用的算力月租服务，该服务将首先上线亚马逊云、微软Azure和甲骨文云。

全新GPU将于今年晚些时候推出，英伟达称，包括亚马逊云科技、戴尔科技、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉和xAI将计划采用Blackwell产品。

微软首席执行官纳德拉(Satya Nadella)在一份声明中表示：我们致力于为客户提供最先进的基础设施，为他们的人工智能工作负载供电。通过将GB200 Grace Blackwell处理器带到我们全球的数据中心，我们正在为世界各地的组织实现人工智能的承诺。

亚马逊AWS宣布，计划为寻求高级生成人工智能功能的客户提供GB200 Grace Blackwell超级芯片和B100 Tensor Core GPU。

英伟达正式进军机器人领域

除了硬件系统，英伟达也利用生成式AI构建了一系列元宇宙、工业数字孪生、机器人训练软件体系。

在本年度GTC上，英伟达发布人形机器人通用基础模型Project GR00T，旨在进一步推动其在机器人和具身智能方面的突破。

在会上，黄仁勋展示了多个由GR00T驱动的人形机器人如何完成各种任务，包括来自Agility Robotics、Apptronik、傅利叶智能(Fourier Intelligence) 和宇树科技(Unitree Robotics) 的机器人产品。

GR00T驱动的机器人将能够理解自然语言，并通过观察人类行为来模仿动作。其能快速学习协调各种技能，具备更好的灵活性，以适应现实世界并与之互动。

英伟达还开发了一种新型机器人大脑计算芯片Jetson Thor，能够执行复杂的任务并使用Transformer引擎处理多个传感器。

据介绍，Jetson Thor是一个全新的计算平台，能够执行复杂的任务并安全、自然地与人和机器交互，具有针对性能、功耗和尺寸优化的模块化架构。

该SoC包括一个带有transformer engine的下一代GPU，其采用英伟达Blackwell架构，可提供每秒800万亿次8位浮点运算 AI 性能，以运行GR00T等多模态生成式AI模型。凭借集成的功能安全处理器、高性能CPU集群和100GB以太网带宽，大大简化了设计和集成工作。

黄仁勋感叹道：开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术，致力于在人工通用机器人领域实现突破。

基于Omniverse，与苹果达成合作

在GTC大会上，英伟达推出了一项全新的服务，帮助企业将3D应用中交互式通用场景描述(OpenUSD)串流到Apple Vision Pro混合现实头显中。该技术利用英伟达最新的Omniverse Clouds API，使用英伟达Graphics Delivery Network(GDN)传输数据。

黄仁勋表示：英伟达正在将Omniverse企业技术引入苹果。这个想法是让开发人员通过Vision Pro在AR/VR设置中使用Omniverse工具。在GTC上，英伟达展示了设计师是如何通过Vision Pro使用汽车配置工具来操纵车辆，然后虚拟地进入其中的。人们可以通过Omniverse Cloud API以及通过云端直接流式传输到Vision Pro的图形传输网络来做到这一点。

随着全新的Omniverse Clouds API的引入，开发人员只需连接互联网，就能将他们的应用程序和数据集直接传送到Vision Pro中，并进行完全基于RTX的实时物理渲染。

在GTC发布的演示中，英伟达展示了一个交互式、物理精确的汽车数字孪生模型，该模型以全保真方式串流到Apple Vision Pro中。

在演示中，一名设计师佩戴Vision Pro，使用CGI工作室Katana在Omniverse平台上开发的汽车配置器应用程序。设计师切换油漆和装饰选项，甚至调整内饰，将三维逼真环境与物理世界融为一体。

车载芯片提升AI能力

黄仁勋在GTC主题演讲中还谈到集中式车载计算平台DRIVE Thor，该平台将搭载专为Transformer、大语言模型(LLM)和生成式AI工作负载而打造的全新Blackwell架构。

2015年，英伟达进入车载计算平台领域，推出了初代自动驾驶计算平台DRIVE PX和Tegra系列车载芯片，后陆续发布Xavier芯片、Orin芯片问世，2022年又在汽车业务增速放缓的情况下，英伟达正式推出新一代自动驾驶计算芯片DRIVE Thor，当时公布的单颗算力高达2000 TOPS，是特斯拉FSD芯片算力的14倍。

据统计，多家头部电动汽车制造商展示了其基于英伟达最新技术的下一代AI车型，其中包括比亚迪、广汽埃安、小鹏、理想汽车和极氪等众多中国车企。另外，像宁畅等国内企业也根据英伟达的最新技术，提供了自动驾驶模型训练与仿真解决方案。

根据弗若沙利文统计数据显示，2022年英伟达出货量占到全球高算力自动驾驶芯片市场份额为82.5%。按照黄仁勋的规划，未来汽车业务将与数据中心、游戏并列成为英伟达的三大支柱业务。