英伟达杀疯了!连投三家生成式AI独角兽,加单带飞台积电5nm产能
原文来源:芯东西
图片来源:由无界 AI 生成
芯东西6月30日消息,不管是今年上半年,还是本周,英伟达都是妥妥的大赢家。
在由生成式AI掀起的新一波人工智能热潮中,英伟达已经成为最热门的股票之一,今年迄今股价暴涨185%,市值突破1万亿美元,并在支持生成式AI及大模型研发的硬件竞赛中遥遥领先 。
围绕生成式AI创企投资,英伟达的存在感也越来越让人难以忽视。 本周四,美国AI聊天机器人创企Inflection AI宣布获得13亿美元新融资,估值升至约40亿美元;美国AI文生视频创企Runway宣布完成1.41亿美元新融资,估值升至约15亿美元。而英伟达均在这两笔融资的投资方之列。
另据市研机构TrendForce预测,因AI相关芯片部署刺激了营收增长,英伟达有望在2023年第二季度取代高通登顶全球最大芯片设计公司。
一边在AI芯片市场接单接到手软,另一边面向生成式AI赛道加码重金投资,英伟达的AI如意算盘正打得越来越响。
_01._连投生成式AI独角兽,英伟达闪电扩张AI投资版图
英伟达最新参投的两家生成式AI独角兽——打造出类ChatGPT产品的大型语言模型创企Inflection AI 和让用户输入文字就能轻松创作短视频的AI视频编辑软件创企Runway ,这两家都云集了非常强大的明星投资阵容。
除了英伟达之外,Inflection AI新一轮融资还获得了LinkedIn联合创始人Reid Hoffman 、微软联合创始人比尔·盖茨 、谷歌前CEO Eric Schmidt 等科技巨头及大佬的注资。Runway最新融资的投资方则包括谷歌 、Salesforce 等科技巨头,累计融资已经有约2.37亿美元。
更早之前,今年6月9日,同样在做类ChatGPT聊天机器人的加拿大AI创企Cohere 宣布完成2.7亿美元C轮融资,估值约22亿美元,英伟达 、甲骨文 、Salesforce 等均参与了该轮融资。
尤其值得一提的是Inflection AI,由DeepMind联合创始人Mustafa Suleyman于2022年联合创办并担任CEO,在推出Pi聊天机器人后收到了大量报价,继而获得了这一笔高额融资,而且英伟达是这轮唯一的新投资者 。至此,这家独角兽企业超过Cohere,成为估值仅次于OpenAI和Anthropic的全球第三大生成式AI独角兽 。
Inflection AI最近推出了其首个专有语言模型Inflection-1,并称该模型是在非常大的数据集上使用数千个英伟达H100 训练的,性能与GPT-3.5、Chinchilla和PaLM-540B相当。
▲Inflection-1、GPT-3.5、LLaMA-65B多任务准确率对比(图源:Inflection AI)
02. 11分钟训练GPT-3,英伟达GPU强势霸榜大模型基准测试
Inflection AI正与英伟达合作构建用于训练AI大模型的全球最大GPU集群之一 。通过与英伟达和云服务提供商CoreWeave的合作,其超级计算机将扩展至包含22000个H100 ,这一数量远超Meta RSC超算集群的16000个A100。
CoreWeave成立于2017年,号称可提供“比传统云提供商便宜80%”的计算能力。英伟达之前曾向CoreWeave投资1亿美元 。据外媒今年6月报道,微软同意在未来数年内向CoreWeave投资数十亿美元,用于云计算基础设施建设。
在最新发布的权威AI性能基准测试MLPerf中,英伟达和CoreWeave合作构建的拥有3584个H100的集群,仅用不到11分钟就训练完GPT-3大型语言模型 。
▲英伟达H100在最新GPT-3训练基准测试的表现
毫无意外的,英伟达凭借旗舰计算芯片H100 GPU继续霸榜各项基准测试。
▲英伟达H100在8项MLPerf基准测试的性能表现
最新MLPerf训练3.0新增了GPT-3大模型基准测试,而英伟达和英特尔成为唯二的参赛者。英伟达用3584个GPU创下了最快的GPT-3训练纪录,英特尔AI芯片Habana Gaudi2则通过在更小的系统上跑GPT-3展示在易用性和性价比方面的竞争力,包括在384个Gaudi2芯片上训练总时长为5个多小时,在256个Gaudi2芯片上训练总时长为7个多小时。
▲GPT-3训练基准测试结果对比,深红色图例为英伟达H100,浅红色图例为英特尔Gaudi2(图源:IEEE Spectrum)
在一些测试中,Gaudi2训练性能超过了英伟达A100 GPU。英特尔还计划通过软件优化进一步缩小Gaudi2与H100的差距,将于9月份发布对FP8的软件支持与新功能,并预告届时Gaudi2性能和性价比将超过H100。另一个被视作英伟达强劲竞争对手的AMD则并未提交测试成绩。
▲Gaudi2跑4款模型性能超过A100(图源:英特尔)
MLPerf基准测试的结果由MLCommons发布。据MLCommons执行董事David Kanter透露,GPT-3是MLPerf基准测试中对计算要求最高的,MLPerf中的大多数基准网络都能在单个处理器上运行,但GPT-3至少需要64个处理器。
_03._AI大模型军备竞赛白热化,大算力AI芯片需求暴涨
科技企业正积极将AI融入其产品和服务中,投资者对生成式AI创企的投资热情不减,显然没有谁愿意因为计算速度落后而错过这一波潜在的历史性增长机遇。
仅是在本周,国内外均诞生了迄今最大的生成式AI并购案:美国大数据超级独角兽Databricks同意以13亿美元(约合94亿人民币)收购美国大型语言模型创企MosaicML,美团昨日宣布以20.65亿元收购由美团联合创始人王慧文创办的大模型创企光年之外。
训练生成式AI模型离不开昂贵的数据中心计算芯片。大模型军备竞赛白热化背景下,大算力AI芯片市场需求持续高涨。而目前训练AI大模型的真正芯片赢家只有一家——英伟达。
去年11月,甲骨文宣布购买数万个A100和H100搭建新计算中心。谷歌在今年5月的I/O开发者大会上宣布推出了一台拥有26000个H100的AI超级计算机A3。本周甲骨文被外媒报道正在花费数十亿美元采购英伟达的芯片,以扩展针对新一波AI浪潮的云计算服务。
英伟达未来能否继续赢麻,还与中国市场息息相关 。根据财报,去年来自中国大陆和香港的收入占英伟达收入的22%。据《晚点LatePost》报道,今年春节后,拥有云计算业务的中国各互联网大公司都向英伟达下了大单,字节今年向英伟达订购了超过10亿美元的GPU,另一家互联网大厂今年至少已给英伟达下了万卡级别订单,按目录价估算价值超10亿元人民币。仅字节一家公司今年的订单可能已接近英伟达去年在中国销售的商用GPU总和。不算今年的新增订单,字节 A100和前代产品V100总数接近10万块;字节到货和没到货的A100与H800总计有10万块。
在本周出现美国商务部考虑进一步限制对华出口英伟达A800和H800的传闻后,英伟达首席财务官Colette Kress警告说:“从长远来看,禁止向中国销售我们的数据中心GPU的限制,如果实施,将导致美国工业永久失去在世界上最大的市场之一竞争和领先的机会,并影响我们未来的业务和财务业绩。”
_04._结语:距离登顶全球最大芯片设计公司,只差临门一脚
无论从产品性能、新增订单、业绩进展、股市表现、生态扩张还是投资布局来看,英伟达都已经肉眼可见的赢麻了。
5月25日,英伟达发布2024财年第一季度财报中,其单季度实现营收71.9亿美元,并预测其第二季度的收入将达到110.0亿美元。6月12日,据台媒报道,在英伟达AI芯片加单的带动下,台积电先进制程利用率大幅提升,5nm产能利用率从五成多提升至七八成。
据近日市研机构TrendForce发布的数据,受益于生成式AI和云端算力需求爆发以及新款GeForce RTX 40系列新品上市,英伟达在2023年第一季度营收环比增长13.5%至67.3亿美元,其全球芯片设计市场份额提升至19.9%。
▲2023年第一季度全球前十大芯片设计公司排名,单位:百万美元(图源:TrendForce)
TrendForce预测,因AI相关芯片部署刺激了营收的增长,增速明显,在2023年第二季度,英伟达有望取代高通成为全球最大的无晶圆厂芯片设计公司。
在英伟达俨然已是生成式AI时代最大受益者的背景下,英特尔、AMD等芯片巨头正虎视眈眈,试图通过软硬件协同优化分食AI计算市场。与此同时,国产AI芯片公司能否接住这一波大模型训练及部署红利,也成为业界关注的焦点。