华体会-Arm CEO对话黄仁勋:畅谈 AI 技术未来图景,探索“人类终极边疆”

[导读]提到AI,就会想到英伟达。而一样的,不成轻忽的端侧AI的计较供给者还Arm。这两家计较公司在计较能力上的互取彼长,才可以或许成绩今时本日和将来的周全AI场景。在当下AI加快成熟和范围化利用的阶段——或是像Rene Haas形容的在“人类摸索的最终边陲”,两位卖铲人又是若何对待AI的成长?在由Arm主办的《Tech Unheard》首期播客中,NVIDIA开创人、总裁兼首席履行官黄仁勋(Jensen Huang)与Arm首席履行官Rene Haas睁开对话。 提到AI,就会想到英伟达。而一样的,不成轻忽的端侧AI的计较供给者还Arm。这两家计较公司在计较能力上的互取彼长,才可以或许成绩今时本日和将来的周全AI场景。在当下AI加快成熟和范围化利用的阶段——或是像Rene Haas形容的在“人类摸索的最终边陲”,两位卖铲人又是若何对待AI的成长?在由Arm主办的《Tech Unheard》首期播客中,NVIDIA开创人、总裁兼首席履行官黄仁勋(Jensen Huang)与Arm首席履行官Rene Haas睁开对话。 在两位持久合作的同事和伴侣之间的对话中,他们深切切磋了Jensen作为科技巨子的开创人背后的过程、AI的将来,和NVIDIA若何以延续立异鞭策手艺冲破极限。 从GPU、到SoC、再到系统全栈的手艺进阶 在对谈中,黄仁勋分享了Arm与NVIDIA的合作若何帮忙NVIDIA从芯片制造扩大到完全的系统设计。Jensen提到:“事实上,Arm 帮忙我们转型为一家构建 SoC 的公司,这一点很是主要。” 甚么是 SoC?SoC 年夜体上相当在一整台计较机,而自力 GPU 是计较机中最后启动的一个部件。先是 CPU 启动,继而是指导 ROM 启动,接着是操作系统启动,终究才是 GPU 启动。对 SoC 来讲,必需亲身完成整体启动进程。这也使得英伟达从一家算法公司(现实上就是一家 GPU 公司)转型为一家周全的计较公司。 一最先构建SoC对英伟达而言其实不轻易,这标记着英伟达从一家算法公司(现实上就是一家 GPU 公司)转型为一家周全的计较公司。但一旦完成以后。Jensen的成长方针便快速推动到了下一步——构建完全的计较系统。 Jensen特殊提到,他依然很是喜好SHIELD,它现实上是其建立的第一个英伟达完全系统。SHIELD系列是NVIDIA 2013年最初发布为游戏主机,后来演化为一种高机能Android TV装备。它是NVIDIA 进入消费电子市场并测验考试从芯片制造扩大到系统级产物的主要一步。而彼时在Rene Haas回想起来,也恰好恰是Arm称得上是刚起步的时刻。 在今天看来,SHIELD代表了 NVIDIA 在消费市场上对游戏和多媒体文娱的测验考试,而另外一个主要的系统——DGX-1 则是其进入 AI 和数据中间计较范畴的计谋步调。 “SHIELD 是塑料材质,而 DGX1 重 600 磅,这类改变其实不是甚么年夜问题。主要的是,我们此刻可以或许构建系统。”Jesnsen强调到。 2016年,NVIDIA发布了DGX-1,这是一款专为深度进修和高机能计较设计的 AI 超等计较机。DGX-1 是 NVIDIA 第一个推出的完全计较系统之一,它不但包罗 GPU 硬件,还配有颠末优化的软件栈,专为深度进修而设计。它集成了 GPU 驱动法式、深度进修框架(如 TensorFlow、PyTorch等)和优化东西,用户可以开箱即用,快速最先 AI 项目标开辟和练习。DGX-1是 NVIDIA 在向系统设计扩大进程中获得的主要功效之一。与SHIELD 近似,DGX-1 也表现了 NVIDIA 从芯片设计扩大到整系统统的能力,只不外 DGX-1 面向的更多是企业级和数据中间级的 AI 利用场景。 而为了使这个“构建完全计较系统”的愿景进一步扩年夜,英伟达随后实现了对Mellanox的收购。而此次收购为英伟达带来了主要的收集和互连手艺,使得英伟达真正具有了构建完全计较系统的能力。 “我们的设法是计较机不再是阿谁节点,而是成为全部数据中间,而数据中间将成为计较单位。假如你没有设计过 GPU、CPU、NIC、互换机、各类收发器,然后将所有这些工具毗连在一路,从零最先启动系统,让一切正常运行并在此中分派工作负载,那末你就不会真正理解构建这些 AI 超等集群意味着甚么。”Jensen回首到。“这类改变、这类愿景是如斯清楚,可以或许鼓励我们的两个团队奋勇向前。为了鼓励团队,必需有一个很是清楚的愿景。” 而一切的堆集,成绩了本日NVIDIA不再只是GPU的供给者,而是整体解决方案的立异者。经由过程构建系统,他们致力在从单一组件到全部系统的冲破,这类前进使NVIDIA成了涵盖从芯片到系统解决方案的完全科技公司。 从“被开工具”到“AI工场”,鞭策AI计较降本增效提速 传统计较机一向被认为是一种东西,人们需要的时辰就利用它,就像一个装在口袋里的手机,只有利用时才有感化。而计较机之前是如许的“被开工具”。可是跟着 AI 的呈现,计较机最先改变,不再只是需要人类输入和激活才会阐扬感化的东西,而是最先自动工作,近似在一个“工场”,可以不竭地发生有价值的输出,好比词元(tokens)、智能洞察和数据阐发成果。 Jensen提到了一个“AI工场”的概念,即AI系统就像一台始终连结运转的制造装备,不管是不是有具体的使命,AI 城市不断地进行数据处置、进修和生成新的信息。这类延续的运转使得 AI 的出产体例与传统计较机判然不同,由于它不再是依靠人类手动操作才起感化,而是可以自动进交运算,延续不竭地缔造有价值的智能成果。 黄仁勋强调,AI 的这类改变激发了近似工业革命的转变。曩昔的工业革命使机械年夜范围出产物理产物,而此刻,AI 系统作为智能工场,可以年夜范围地出产“智能”——这是一种完全分歧的财产形态。这类转变带来了一个全新的时期,在这个时期中,计较机和 AI 不再是纯真的东西,而是出产智能的自动气力,从底子上改变了它们在社会中的脚色。 而NVIDIA 正在尽力加速 AI 和芯片手艺的成长,每一年进行一次手艺更新。经由过程这类快速的迭代,他们实现了每一年显著的机能晋升,使得手艺前进速度远超越传统的摩尔定律(摩尔定律指的是芯片机能每两年摆布翻倍)。 为了实现每代产物的显著机能晋升,NVIDIA 的策略是为每一个系统设计多种新型芯片,并操纵“协同设计”的方式,从系统架构到组件(例如NVLink互换机和新的系统机架)都进行整体优化。这类方式使得分歧的芯片和硬件组件可以高效协作,好比经由过程布设铜缆将所有 GPU 毗连起来构成年夜型封装,如许的 3D 封装可以提高系统的整体机能。 经由过程这些立异,NVIDIA 实现了每一年机能晋升 2-3 倍,而能耗和本钱却连结不变。这意味着 AI 手艺的本钱每一年都在下降,特别是在不异的能耗和硬件本钱下实现更高的计较能力。如许的效力晋升对 AI 的普遍利用是相当主要的。 黄仁勋提到 ChatGPT 作为当前 AI 利用的一个例子,指出今朝它在响应要求时只进行一次推理,但将来但愿可以或许让 AI 进行多轮推理。这意味着 AI 可以对每一个问题频频思虑,经由过程树形搜刮和迭代改良其回覆,使得终究输出的质量显著提高。而为了实现这类新型的“迭代推理”,NVIDIA 的方针是继续下降 AI 的运行本钱,使得 AI 能在划一本钱下实现更复杂的推理能力,晋升 AI 的智能程度和反映质量。 AI连结快速迭代的架构根本:从兼容性到范围扩大 AI将来的成长速度是不是可以继续连结今朝的程度?Jensen的谜底是必定的,但这需要一个系统化的方式,也就是各个手艺的开辟必需遵守同一的架构。 关在将来的手艺架构,黄仁勋强调了架构兼容性的主要性。他认为,“行业对软件的投资远高在硬件,是以,开辟或发布的软件必需进行持久保护。” CUDA作为NVIDIA的焦点理念,表现了这类对兼容性和持久投入的对峙。 例如,在开辟时为一个集群(如 Hoppers)建立的软件应当可以无缝运行在其他架构(如 Blackwell 或 Rubin)上。这类兼容性对 AI 手艺的快速成长相当主要。 他指出,行业对软件的投资比硬件高良多,是以,软件需要持久保护,包管分歧架构的兼容性很是主要,如许可让投入到一个 GPU 上的软件在其他 GPU 上也能利用,避免反复投入和华侈。 在谈和数据中间的扩大时,黄仁勋提到,从500兆瓦到5000兆瓦的进级对手艺架构提出了全新挑战。为了应对这些挑战,NVIDIA经由过程增添功率密度、采取液冷手艺和密集化设计,将多个GPU协作处置数据,从而实现数据中间的高效运行。 数据中间的功率密度在快速增添,这个趋向几近是指数级的增加。从12千瓦到40千瓦,再到 120 千瓦、200 千瓦的转变,将来还会继续晋升。这类增加代表了每一个数据中间机架的功率利用密度愈来愈年夜,以便在有限的物理空间内实现更高的计较能力。因为功率密度的增添,NVIDIA 正在尽量地对计较进行“紧缩和密集化”。这意味着他们在有限的空间内放置更多的计较能力,如许做可以提高整体效力。 黄仁勋提到,经由过程对数据中间进行密集化设计,NVIDIA 可让特定机架或相邻机架中的所有 GPU 结合起来,充任一个庞大的 GPU。这意味着,多个 GPU 可以协同工作,就像一个超年夜范围的计较单位一样。这类设计年夜年夜加强了数据中间的整体计较能力,也进一步提高了密集化的益处。 而黄仁勋提到的数据中间功率密度的晋升和计较紧缩,正好是 Arm 能帮忙改良的范畴。Arm 的处置器架构经由过程高能效,可以下降整体功耗,帮忙数据中间应对功率密度增添带来的冷却和能效挑战。 Arm 的 CPU 设计对使命的低能耗和效力有很年夜帮忙,连系 NVIDIA 的 GPU 可以在数据中间实现更高效的使命分派和更密集的计较能力。是以,Arm 和 NVIDIA 的协同可以在数据中间的能效优化和密集化设计上带来显著的优势。 黄仁勋特殊暗示:“我们很是存眷在每块 Arm 芯片上投入的尽力。头几天我们方才进行了展现。有人做了一些基准测试,成果显示,NVIDIA Grace 的每瓦机能是全球最好 CPU 的四倍。高能效比相当主要。它是重中之重。” 作为英伟达开创人,黄仁勋已带领公司30年且获得了庞大的成功。Rene Hass对其赞不绝口:“虽然完全不清晰终究的杀手级利用或终究状况是甚么,但你却有着使人难以置信的韧性去测验考试各类设法并进行测试,哪怕市场仿佛并未预备停当,或还没有对其进行界说。” Jensen笑谈到:“成功之路其实不是一个成绩接着一个成绩。事实并不是如斯。作为一位首席履行官,你会碰到庞大的挫折,有时会有使人为难的时刻,你可能还没有完全履历过这些。可是我但愿它会到来,由于这是对你有益的。在所有这些时刻中,我不肯定本身具体学到了甚么,但它让我变得更壮大,我知道我能挺曩昔。我那时其实不喜好这些。但当我回忆起这一切时,那些时刻让人成长。” 左一:Rene Hass,中心:黄仁勋

欲知详情,请下载word文档 下载文档

北京2024年8月27日 /美通社/ -- 在8月23日举行的2024年长三角生态绿色一体化成长示范区结合招商会上,软通动力信息手艺(团体)股分有限公司(以下简称 软通动力 )与长三角投资(上海)有限...

要害字: BSP 信息手艺

上海2024年8月26日 /美通社/ -- 本日,高端全合成润滑油品牌美孚1号联袂品牌体验官周冠宇,开启全新路程,助力泛博车主经由过程驾驶去摸索更广漠的世界。在全新发布的品牌视频中,周冠宇和分歧布景的消费者表达了对驾驶的酷爱...

要害字: BSP 汽车制造

上一篇:华体会-联想 下一篇:华体会-联发科天玑8400首曝:首发A725全大核架构