![图片[1] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/a76af06f6fbe431d998a78dabbd18043noop.image_.webp)
刚刚,英伟达发布了全球最强的 AI 芯片。
生成式 AI 已经达到了引爆点。
两个小时的 GTC 2024 大会,更像一场大型演唱会,英伟达高级科学家 Jim Fan 调侃「黄仁勋是新的泰勒·斯威夫特」。
目前英伟达黄仁勋在 AI 行业的地位,大抵就是如此。
![图片[2] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/fdee2c4298234d08b484a71ea69538e6noop.image_.webp)
去年黄仁勋喊出 AI 的「iPhone 时刻」已经到来,让我们看到了日常生活如何被 AI 改写,而今天则展示了这个改变的速度正被疯狂加快。
在过去 10 年里,英伟达将 AI 推进了大约一百万倍,远超摩尔定律,或者说英伟达正在书写自己的迭代定律。从芯片算力到 AI 落地,从汽车制造到医疗物流,英伟达在自身进步的同时,也推动了各行各业发展。
摩尔定律已死,可英伟达让新的摩尔定律诞生了。
![图片[3] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/b4eb064d57684ec7a5ff819748616ecbnoop.image_.webp)
除了电脑显卡,英伟达在平时很少会被我们感知,但身边许多产品的技术进步又总离不开它们,看完这篇 GTC 2024 的首发总结,或许你能对 AIGC 的浪潮有更明显的感知
昨晚 OpenAI CEO Sam Altman 在 X 发的一条推文或许正是时代的注脚:
This is the most interesting year in human history, except for all future years
这是人类历史上最有趣的一年,但会是未来最无趣的一年。
全球最强 AI 芯片诞生,性能火箭跃升
这是当今世界上生产中最先进的 GPU。
![图片[4] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/bd118ee04b80427f93998661a86c0e6bnoop.image_.jpeg)
发布会的主角,是「Blackwell B200」AI 芯片,黄仁勋称这颗芯片的名字来自数学家、博弈论家、概率论家 David Blackwell。
基于台积电的 4NP 工艺,Blackwell 架构下的计算芯片拥有 1040 亿个晶体管,比起上一代 GH100 GPU 上的 800 亿个晶体管,实现了又一次突破。
![图片[5] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/f5aa322b22f847b884c427e2e615e31fnoop.image_.jpeg)
Blackwell B200 并不是传统意义上的单一 GPU,它由两个 Blackwell GPU + 一个 Grace CPU 芯片组合而成,并通过 10 TB/s NV-HBI(Nvidia 高带宽接口)连接,以确保每一颗芯片能够单独运行。
![图片[6] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/622b7df309c540f48bf71c59500f12a9noop.image_.webp)
因此,B200 实际上拥有 2080 亿个晶体管,能够提供高达 20 petaflops 的 FP4 算力,其中的两个 GPU 与单个 Grace CPU 相结合的 GB200,可以为 LLM(大语言模型)的推理提升 30 倍的工作效率。
GB200 的性能也将大幅提升,在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,而它的训练速度是 H100 的 4 倍。
![图片[7] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/43d9f5c1f99d45b1979f9d19b30fe7f0noop.image_.jpeg)
更重要的是,与 H100 相比,它可将成本和能耗降低 25 倍。
此前,英伟达的 AI 处理器 H100 尽管十分畅销,然而每块 H100 的峰值功耗高达 700 瓦,超过了普通美国家庭的平均功耗,专家预测,随着大量 H100 被部署,其总功耗将与一座美国大城市不相上下,甚至超过一些欧洲小国。
![图片[8] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/2cff1ca3f9f846508254ca35b6f16b62noop.image_.jpeg)
黄仁勋说,训练一个 1.8 万亿参数模型之前需要 8000 个 Hopper GPU 和 15 兆瓦的功率,如今 2000 个 Blackwell GPU 就可以做到这一点,而功耗仅为 4 兆瓦。
Blackwell B200 GPU 的彪悍性能,从能耗方面也能完美体现。采用了最新 NVLink 互联技术的 B200,支持相同的 8GPU 架构和 400GbE 网络交换机,在性能大幅提升的同时,可以做到与上一代 H100/H200 相同的峰值能耗(700W)。
![图片[9] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/dce40972a89e45198f7b992b31988d04noop.image_.webp)
另外一点值得注意的是 FP4 算力。黄仁勋表示在过去的 8 年里,AI 算力提升了一千倍,其中最为关键的改进是第二代 Transformer 引擎,通过 FP4 算力使计算、带宽和模型大小得到了显著提升。
相较于 AI 常用的 FP8 算力,B200 的 2 个计算芯片让其性能达到了 H100 的 2.5 倍,每个 Blackwell 架构下的芯片算力要比上代 Hopper 芯片高出了 25%。
英伟达高级科学家 Jim Fan 称全新的 Blackwell B200 GPU 是「新的性能野兽。」
![图片[10] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/d2377ec277eb42b1bdcd7a7964f26a0enoop.image_.webp)
B200 在单个架构内的计算能力超过 1 Exaflop,黄仁勋交付给 OpenAI 的第一台 DGX 性能是 0.17 Petaflops,GPT-4-1.8T 参数可以在 2000 台 Blackwell 上 90 天内完成训练。
毫不夸张地说,新的摩尔定律诞生了。
由于 Blackwell 有多种不同的变体可用,因此英伟达还提供了完整服务器节点的规格,主要有三个选项。
首先是最大、最强的 GB200 NVL72 系统,配置了 18 个 1U 服务器,每个服务器配置两个 GB200 超级芯片。该系统内提供了 72 片 B200 GPU,具有 1440Peta FLOPSde FP4 AI 推理性能,和 720 Peta FLOPS 的 FP8 AI 训练性能,并将采取液冷方案,一台 NVL72 可处理 27 万亿个参数模型(GPT-4 的最大参数不超过 1.7 万亿参数)。
![图片[11] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/aed086d76ba64f1b97a981c41542c070noop.image_.webp)
另外一个规格是 HGX B200,它基于在单个服务器节点中使用八个 B200 GPU 和一个 x86 CPU,每个 B200 GPU 可配置高达 1000W,并且 GPU 提供高达 18 petaflops 的 FP4 吞吐量,比 GB200 中的 GPU 慢 10%。
![图片[12] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/92c2e1b835034b5b8cf5d00837c99c71noop.image_.jpeg)
最后,英伟达还将推出 HGX B100,其大致规格与 HGX B200 相同,配备 x86 CPU 和 8 个 B100 GPU,只不过会与现有 HGX H100 基础设施直接兼容,并允许最快速地部署 Blackwell GPU,每个 GPU 的 TDP 限制为 700W。
![图片[13] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/7fb57050e8114c8f89d5fe8a14249116noop.image_.webp)
在此之前,英伟达通过 H100、H200 等 AI 芯片使其成为了一家价值数万亿美元的公司,并超越了亚马逊等头部公司,而今天发布的全新 Blackwell B200 GPU 和 GB200「超级芯片」很有可能会扩大其领先地位,甚至有望超越苹果。
软件定义一切的时代正在到来
2012 年,一小群研究人员发布了一个名为 AlexNet 的突破性图像识别系统,当时它在猫狗分类任务上的表现远超过了以往的方法,这使得它成为了深度学习和卷积神经网络(CNN)在图像识别领域潜力的一个标志性证明。
也正是借此看到 AI 的机遇后,黄仁勋决定全力押注 AI。有趣的是,以前是识别生成的图片到生成文字,而现在却是通过文字来生成图片。
![图片[14] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/0c14996c81e547d4b7d11ded394af3d9noop.image_.webp)
那么当生成式 AI 浪潮到来,我们能利用它做些什么呢?黄仁勋给出了一些标准答案。
传统的天气模型结合英伟达的气象模型 Cordiff,能够实现探索数百公里甚至数千公里面积范围的预报,提供诸如台风影响的侵袭范围,从而最大程度降低财产的损失。未来 Cordiff 也将向更多国家和地区开放。
生成式 AI 不仅可以通过数字化能力理解图像和音频,同理,也能凭借庞大的计算力扫描数十亿种化合物,从而筛选出新药。
![图片[15] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/4c46b0d2d1064ed489492d664a8f488dnoop.image_.webp)
作为一家 AI 军火商,黄仁勋还介绍了专门辅助开发 AI 芯片的 NiMS 系统。在未来,你甚至有机会组建一个 AI 超级团队,将任务拆解为一连串子任务后,就能让不同的 AI 完成检索、优化软件等任务。
未来的设施、仓库、工厂建筑将由软件定义。
无论是人形机器人、自动驾驶的汽车、操纵手臂,这些自主机器人都需要软件层面的操作系统。例如,通过 AI 与 Omniverse 的结合,英伟达打造了一个占地 10 万平米的机器人仓库。
在这个物理精确的模拟环境中,100 个安装在天花板上的摄像机使用英伟达 Metropolis 软件和自动移动机器人(AMR )的路线规划功能,实时映射了仓库的所有活动。
![图片[16] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/1f362140b0f248239b0a80d419aa1a30noop.image_.webp)
这些模拟还包括对 AI 代理的软件循环测试,以评估和优化系统对现实世界不可预测性的适应能力。
在模拟的一个场景中,AMR 在前往取货盘的途中遇到了一起事故,阻碍了其预定路线。Nvidia Metropolis 随即便能更新并发送了实时占用地图给控制系统,后者计算出了新的最优路径。
仓库操作员还可以通过自然语言向视觉模型提问,模型能够理解细节和活动,并提供即时反馈以改善运营效率。
![图片[17] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/834e3d7b3c644ebe9039debc051fbb2anoop.image_.webp)
值得一提的是,本次发布会还出现了苹果 Vision Pro 的身影。企业可以轻松地通过 Omniverse Cloud 将 3D 应用的交互式通用场景描述(OpenUSD)实时串流到 Vision Pro,帮助用户探索前所未有的虚拟世界。
![图片[18] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/379ae79a0e4649ffb7d8d6460adcadb9noop.image_.webp)
发布会的结尾则是熟悉的机器人环节,正如黄仁勋所说,当他张开双手,与其他人形机器人站在一起的那一刻,此时「计算机图形学,物理学,人工智能的交叉点,这一切都在这一刻开始」。
![图片[19] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/9a9c0806b6d948719789aa1acefad684noop.image_.webp)
▲ 小彩蛋
十年前 GTC,黄仁勋首次强调机器学习的重要性,在许多人还在把英伟达当作「游戏显卡」的制造商时,它们已经走在了 AI 变革的最前沿。
在被称为 AI 应用元年的 2024,英伟达早就用 AI 软硬件在众多领域为各行各业赋能:大语言模型、对话式 AI、边缘计算、大数据、自动驾驶、仿生机器人……
药物发现不是我们的专长,计算才是;制造汽车不是我们的专长,造汽车所需要的 AI 计算机才是。坦率地说,一家公司很难擅长所有这些事情,但我们非常擅长其中的人工智能计算部分。
相较于单一行业的佼佼者,英伟达更像是一个「幕后大佬」,只要谈到 AI,英伟达一定是绕不开的话题。
![图片[20] - 英伟达发布全球最强 AI 芯片,性能暴涨 30 倍! - 万事屋 | 生活·动漫·娱乐综合社区-银魂同好聚集地](https://www.rei3.com/wp-content/uploads/2024/03/e2bbb3d3b5da45e6a010840103b9a3e4noop.image_.webp)
就像老黄说的,英伟达已然是一家平台公司。
正是当年的超前部署、历史发展的大势所趋,让英伟达能在 AI 时代的开端,能够占据 AI 芯片市场 70% 以上的销售额,公司估值也在不久前超过 2 万亿美元。
或许这也是苹果纠结多年后放弃造车、并大力投入生成式 AI 的理由,无论是经济效益还是技术趋势,都太值得豪赌一把了。
在我们还在质疑「AI」有什么用的当下,英伟达用行动证明,AI 已经成为了新时代不可或缺的一部分。
文是楼上发的,图是楼上帖的,寻仇请认准对象。
有些是原创,有些图文皆转载,如有侵权,请联系告知,必删。
如果不爽,请怼作者,吐槽君和你们是一伙的!请勿伤及无辜...
本站所有原创帖均可复制、搬运,开网站就是为了大家一起乐乐,不在乎版权。
对了,本站小水管,垃圾服务器,请不要采集,吐槽君纯属用爱发电,经不起折腾。
暂无评论内容