本文作者:访客

英伟达GTC:发布“地表最强”B200芯片,进军机器人领域,与苹果强强联合

访客 2024-03-19 16:29:39 23632 抢沙发

北京时间3月19日,人工智能芯片巨头英伟达年度开发者大会(GTC)在美国加州圣何塞SAP中心举行。

时隔5年时间再度回归线下的GTC现场人头攒动。开场时,英伟达CEO黄仁勋笑谈道:你要知道,这不是一场演唱会,而是一个开发者大会。面对观众的热情欢呼,黄仁勋也不禁用调侃作为开场白。

在短短15个月内市值增长6倍,超过2万亿美元,成为继苹果和微软之后的全球第三大科技公司,英伟达有理由受到更多的关注,尤其在AI时代,作为全球最红的企业,英伟达的任何风吹草动也将成为科技圈的焦点。

在今年最重要的开发者盛会上,对于市值冲破2万亿美元的英伟达可谓是至关重要,在下一个计算时代,他们如何展现出更强大的统治力?是否还能领先对手?又在会上带来了哪些发布?本次,元宇宙新声也受邀参与全程报道,一同带大家探索今年GTC大会带来的新技术和新动态。

最强GPU诞生,英伟达继续统治AI时代

在本年度GTC大会上,身着大家熟悉黑皮衣的英伟达CEO黄仁勋发表主题演讲《见证AI的变革时刻》。

首先,黄仁勋用一张手绘图回顾了计算机产业的发展史,以及英伟达的发家史。从1964年IBM推出世界首个通用计算机开始,伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现,再到2016年,黄仁勋亲手将第一台DGX-1超级计算机送给了OpenAI。而在2022年,随着聊天机器人ChatGPT横空出世,生成式AI带来了全新一轮产业革命。

随后,到了黄仁勋演讲的重点,他带来了英伟达推出的最新一代AI芯片Blackwell GPU。

黄仁勋一边说着Hopper很棒,但我们需要更大的GPU,一边在现场展示了英伟达的新款Blackwell芯片,这款芯片被命名为B200。另外,英伟达还带来了全新的GB200芯片,计划于今年晚些时候上市。

目前,英伟达按照平均两年一次的更新频率升级GPU架构,对产品性能进行大幅提升。英伟达于2022年发布了基于Hopper架构的H100加速卡,而现在推出基于Blackwell的加速卡在性能上也得到了全面提升,更擅长处理AI相关任务。

全新B200拥有2080亿个晶体管,是上一代的两倍多。平台能够在万亿参数级的大型语言模型(LLM)上构建和运行实时生成式AI,与用于推理的相同数量的H100 Tensor Core图形处理单元(GPU)相比,全新GB200 NVL机架级系统具有36个Grace Blackwell超级芯片,性能提高了30倍,并且显著提高效率。

此外,黄仁勋还强调称:与H100相比,GB200的成本和能耗降低了25倍。

值得注意的是,B200 GPU的重要进步之一,是采用了第二代Transformer引擎。

它通过对每个神经元使用4位(20 petaflops FP4)而不是8位,直接将计算能力、带宽和模型参数规模翻了一倍。

而只有当这些大量的GPU连接在一起时,第二个重要区别才会显现,那就是新一代NVLink交换机可以让576个GPU相互通信,双向带宽高达1.8TB/秒。

而这就需要英伟达构建一个全新的网络交换芯片,其中包括500亿个晶体管和一些自己的板载计算,拥有3.6 teraflops FP8处理能力。在此之前,仅16个GPU组成的集群,就会耗费60%的时间用于相互通信,只有40%的时间能用于实际计算。

此次,英伟达还发布了GB200 NVL72,整合英伟达在数据中心硬件方案中GPU、DPU、NVLink等技术的最新成果,构成驱动大语言模型背后的引擎。

GB200 NVL72进入云端,成为云厂商计算实例,黄仁勋在演讲中还发布搭载B100 GPU的AI云服务DGX Cloud。通过与云厂商平台向用户提供能够训练生成式AI大模型,及其他AI应用的算力月租服务,该服务将首先上线亚马逊云、微软Azure和甲骨文云。

全新GPU将于今年晚些时候推出,英伟达称,包括亚马逊云科技、戴尔科技、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉和xAI将计划采用Blackwell产品。

微软首席执行官纳德拉(Satya Nadella)在一份声明中表示:我们致力于为客户提供最先进的基础设施,为他们的人工智能工作负载供电。通过将GB200 Grace Blackwell处理器带到我们全球的数据中心,我们正在为世界各地的组织实现人工智能的承诺。

亚马逊AWS宣布,计划为寻求高级生成人工智能功能的客户提供GB200 Grace Blackwell超级芯片和B100 Tensor Core GPU。

英伟达正式进军机器人领域

除了硬件系统,英伟达也利用生成式AI构建了一系列元宇宙、工业数字孪生、机器人训练软件体系。

在本年度GTC上,英伟达发布人形机器人通用基础模型Project GR00T,旨在进一步推动其在机器人和具身智能方面的突破。

在会上,黄仁勋展示了多个由GR00T驱动的人形机器人如何完成各种任务,包括来自Agility Robotics、Apptronik、傅利叶智能(Fourier Intelligence) 和宇树科技(Unitree Robotics) 的机器人产品。

GR00T驱动的机器人将能够理解自然语言,并通过观察人类行为来模仿动作。其能快速学习协调各种技能,具备更好的灵活性,以适应现实世界并与之互动。

英伟达还开发了一种新型机器人大脑计算芯片Jetson Thor,能够执行复杂的任务并使用Transformer引擎处理多个传感器。

据介绍,Jetson Thor是一个全新的计算平台,能够执行复杂的任务并安全、自然地与人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。

该SoC包括一个带有transformer engine的下一代GPU,其采用英伟达Blackwell架构,可提供每秒800万亿次8位浮点运算 AI 性能,以运行GR00T等多模态生成式AI模型。凭借集成的功能安全处理器、高性能CPU集群和100GB以太网带宽,大大简化了设计和集成工作。

黄仁勋感叹道:开发通用人形机器人基础模型是当今AI领域中最令人兴奋的课题之一。世界各地的机器人技术领导者正在汇集各种赋能技术,致力于在人工通用机器人领域实现突破。

基于Omniverse,与苹果达成合作

在GTC大会上,英伟达推出了一项全新的服务,帮助企业将3D应用中交互式通用场景描述(OpenUSD)串流到Apple Vision Pro混合现实头显中。该技术利用英伟达最新的Omniverse Clouds API,使用英伟达Graphics Delivery Network(GDN)传输数据。

黄仁勋表示:英伟达正在将Omniverse企业技术引入苹果。这个想法是让开发人员通过Vision Pro在AR/VR设置中使用Omniverse工具。在GTC上,英伟达展示了设计师是如何通过Vision Pro使用汽车配置工具来操纵车辆,然后虚拟地进入其中的。人们可以通过Omniverse Cloud API以及通过云端直接流式传输到Vision Pro的图形传输网络来做到这一点。

随着全新的Omniverse Clouds API的引入,开发人员只需连接互联网,就能将他们的应用程序和数据集直接传送到Vision Pro中,并进行完全基于RTX的实时物理渲染。

在GTC发布的演示中,英伟达展示了一个交互式、物理精确的汽车数字孪生模型,该模型以全保真方式串流到Apple Vision Pro中。

在演示中,一名设计师佩戴Vision Pro,使用CGI工作室Katana在Omniverse平台上开发的汽车配置器应用程序。设计师切换油漆和装饰选项,甚至调整内饰,将三维逼真环境与物理世界融为一体。

车载芯片提升AI能力

黄仁勋在GTC主题演讲中还谈到集中式车载计算平台DRIVE Thor,该平台将搭载专为Transformer、大语言模型(LLM)和生成式AI工作负载而打造的全新Blackwell架构。

2015年,英伟达进入车载计算平台领域,推出了初代自动驾驶计算平台DRIVE PX和Tegra系列车载芯片,后陆续发布Xavier芯片、Orin芯片问世,2022年又在汽车业务增速放缓的情况下,英伟达正式推出新一代自动驾驶计算芯片DRIVE Thor,当时公布的单颗算力高达2000 TOPS,是特斯拉FSD芯片算力的14倍。

据统计,多家头部电动汽车制造商展示了其基于英伟达最新技术的下一代AI车型,其中包括比亚迪、广汽埃安、小鹏、理想汽车和极氪等众多中国车企。另外,像宁畅等国内企业也根据英伟达的最新技术,提供了自动驾驶模型训练与仿真解决方案。

根据弗若沙利文统计数据显示,2022年英伟达出货量占到全球高算力自动驾驶芯片市场份额为82.5%。按照黄仁勋的规划,未来汽车业务将与数据中心、游戏并列成为英伟达的三大支柱业务。

带来更真实的游戏体验

在游戏领域也呼风唤雨的英伟达,也没有忘记人工智能技术运用在游戏领域,这次GTC上重点展示的是它的数字人技术。

据介绍,英伟达数字人平台包括三项主要技术:NVIDIA ACE、NVIDIA NeMo和RTX光线追踪技术,分别通过AI驱动游戏角色语言、语音、动画和图形。

其中,我们看到,NVIDIA ACE可帮助开发者通过Audio2Face驱动的面部动画以及由Riva自动语音识别(ASR)和文本转语音(TTS)驱动的语音交流,让数字人交互更加生动。英伟达称,NVIDIA ACE允许模型在云端和PC上运行,以确保用户获得最佳体验。

NVIDIA NeMo可帮助开发者提供企业级生成式AI模型,包括精确数据管理、模型个性化定制、检索增强生成和加速性能等。最后,包含RTX全局光照 (RTXGI) 和DLSS 3.5等渲染技术的集合,可在游戏和应用中实现实时光线路径追踪。

写在最后

除了带来最强AI芯片,我们发现,英伟达还是围绕着生态建设来继续巩固自己的位置,在本次GTC大会上,他们不仅宣布与苹果达成合作,还在云计算、自动驾驶、机器人等领域与头部企业展开新一轮的融合,而作为全球最强的芯片提供商,英伟达以自身技术为核心,让更多企业围绕自己建立生态圈,从而让自己的地位更上一层楼。

元宇宙新声认为,英伟达之所以异军突起,看上去不可战胜,主要体现在视野之上。尤其是他们不断依靠前沿技术引领全行业科技进步,持续享受到技术、产品变革的红利,而这些技术的基础,将会支撑英伟达继续坐稳全球AI行业,乃至整个科技行业的龙头位置。

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,23632人围观)参与讨论

还没有评论,来说两句吧...