大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

推荐平台	链接	平台介绍
币安网	注册链接	币安是全球领先的区块链生态系统，推出了一系列产品，其中包括最大的加密货币交易平台。我们的使命是在未来成为全球性加密货币基础架构供应商。
欧易OKX	注册链接	欧易是全球著名的数字资产交易平台之一，主要面向全球用户提供比特币、莱特币、以太币等数字资产的币币和衍生品交易服务。
HTX火币	注册链接	火币全球专业站，是火币集团旗下服务于全球专业交易用户的创新数字资产国际站，致力于发现优质的创新数字资产投资机会。

来源：量子位

一夜醒来，大模型圈都在热议一个词——“GPU贫民” （GPU-Poor）。

来自行业分析机构SemiAnalysis的一篇报告，爆料谷歌拥有的算力资源比OpenAI、Meta、亚马逊、甲骨文和CoreWeave加起来还要多 。

分析师Dylan Patel预测，谷歌DeepMind联手的下一代大模型Gemini，到年底训练量将碾压（Smash）GPT-4达到后者5倍。

报告提出在这种压倒性的优势面前，大部分创业公司和开源势力都成了“GPU贫民”，在用有限的资源苦苦挣扎。

这个既扎眼又扎心的说法迅速成为新梗，在行业里流传开来。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

上次这么火的梗还是“没有护城河”。巧了，也是同一位作者搞出来的，另外GPT-4内部架构细节大曝光也是他干的。

被点名的开源扛把子HuggingFace联合创始人Julien Chaumond表示：不要小看我们贫民啊。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

也有人代表学生在线吐槽：金钱上穷，算力上也穷，说的就是我们博士生了。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

正致力于让手机跑大模型的知名学者陈天奇表示，未来每个人都会拥有自己的AI助手，其中大多数人都会是“GPU贫民”，但不要低估合起来的总量。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

也有不少人认为，抛开争议性的内容和大部分内容收费不谈，这篇报告的免费前言部分就是对大模型行业现状的一个很好的批评和总结。

“GPU贫民”在做无用功

报告下笔很不留情，直言很多创业公司在GPU匮乏情况下花费大量时间精力做的事，都是无用功 。

比如很多人热衷使用大模型的输出微调小模型，然后去刷排行榜 ，但是评估方法不完善，更注重风格而不是准确性或实用性 。

报告还认为各种测量标准不完善的排行榜本身，也是对小公司的误导，由此产生一大批不实用的模型，对开源运动也是一种伤害 。

另一方面，GPU贫民们反而对资源的利用效率不高 ，大多使用密集模型 ，主要基于开源的羊驼生态。

但是OpenAI谷歌这些巨头已经在玩MoE架构这样的稀疏模型**，以及利用小模型** 投机采样（speculative decoding）提高推理效率了，完全是两个游戏 。

作者希望GPU贫民们不应该过度限制模型规模以及过度量化，而忽视模型质量下降 。应该专注于在共享的基础设施上高效地提供微调模型，减少延迟和内存带宽需求，满足边缘计算的需求 。

看到这里，也有人提出不同意见，认为创造性的突破往往正是来自有限制的环境，这反而是某种优势。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

但Perplexity.AI联合创始人Aravind Srinivas认为，GPU丰富的组织实际也会投资于带限制条件的研究。

并且要找到下一个像Transformer这样的突破，需要成千上万次的实验，要求的资源绝对不低。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

“GPU土豪”的游戏怎么玩

那么GPU平民的另一面，谷歌这个“GPU土豪”在做什么呢？。

严格来说，谷歌算力不是GPU而是自家TPU。报告认为虽然TPUv5单体性能不如英伟达H100，但是谷歌有最高效的基础设施架构。

谷歌大脑与DeepMind合并后，联手训练对标GPT-4的Gemini大模型。

由前DeepMind两位研究VP Koray Kavukcuoglu 与Oriol Vinyals 和前谷歌大脑掌门人Jeff Dean 共同领导百人团队。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

根据多方爆料，Gemini预计年内就会发布 ，更准确的来说是美国的秋季范围之内（9月23日-12月21日）。

Gemini将整合大模型与AI图像生成的能力，使用Youtube上93.6亿分钟的视频字幕训练，总数据集大小据估计是GPT-4的两倍。

前DeepMind创始人Hassabis曾透露，Gemini将结合AlphaGo类型系统的一些能力和“其他非常有趣的创新”。

另外谷歌创始人布林也一直在亲自参与Gemini研发，包括对模型做评估并协助训练。

关于Gemini更具体的消息还不多，但是有人推测也将与GPT-4一样使用MoE架构和投机采样技术 。

8月初Google DeepMind发表的新论文From Sparse to Soft Mixtures of Experts被认为可能与Gemini相关。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

投机采样能在不损失生成质量的前提下，让Transformer大模型获得2-3倍的推理加速。

具体来说是让小模型生成提前生成一些token并让大模型做评判，如果接受就让大模型生成下一个token再重复第一步，如果小模型生成的质量不高再换用大模型。

谷歌一方的投机采样论文在2022年11月才发表，但之前的爆料认为GPT-4也用了类似的技术。

大模型圈热议“GPU贫民”：谷歌算力被曝比其他公司加起来都多，扎创业公司心了

实际上投机采样技术的前身Blockwise Parallel Decoding也来自谷歌，作者中包括Transformer作者中的Noam Shazeer 。

Noam Shazeer这个人在谷歌时同时参与了Transformer、MoE和投机采样的研究，对今天的大模型来说都至关重要，另外他还参与了T5、LaMDA和PaLM等多个大模型研究。

SemiAnalysis的报告中还讲了他的一个八卦。

早在GPT-2时代Noam Shazeer就在谷歌写了一份内部备忘录，预测了未来大模型将以各种方式融入人们的生活，但当时这个观点并未被谷歌重视。

现在看来，他预测的很多事都在ChatGPT发布后真实发生了。

不过Noam Shazeer在2021年就离开谷歌创办了Character.ai，按照这篇报告的说法，他现在也是“GPU贫民”的一份子。

参考链接：
[1]https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini
[2]https://x.com/dylan522p/status/1695956854344749234
[3]https://x.com/AravSrinivas/status/1696182301934395486
[4]https://arxiv.org/abs/2211.17192

推荐平台	链接	平台介绍
Gate芝麻开门	平台介绍	Gate.io芝麻开门创立于2013年，是全球真实交易量TOP10的加密货币交易平台，向全球数千万用户提供安全可靠、真实透明的数字资产交易服务。
Bitget	注册链接	Bitget的背后是一群区块链技术的早期接受者，也是区块链未来发展的信仰者，一直致力于提供安全、一站式的交易解决方案，帮助用户更聪明地交易。
Bybit	注册链接	Bybit通过数字资产与传统金融的结合，引领数字资产的生态发展。提供一流的流动性，致力于打造业内最安全、公平、高效及人性化的交易服务平台。
派网	注册链接	派网提供多样化的量化交易机器人，用户可依照自身交易需求和策略选择最适合的机器人。同时派网也提供合约交易与合约网格机器人，给予更方便的合约交易体验。