推荐平台 链接 平台介绍
币安网 注册链接 币安是全球领先的区块链生态系统,推出了一系列产品,其中包括最大的加密货币交易平台。我们的使命是在未来成为全球性加密货币基础架构供应商。
欧易OKX 注册链接 欧易是全球著名的数字资产交易平台之一,主要面向全球用户提供比特币、莱特币、以太币等数字资产的币币和衍生品交易服务。
HTX火币 注册链接 火币全球专业站,是火币集团旗下服务于全球专业交易用户的创新数字资产国际站,致力于发现优质的创新数字资产投资机会。

原文来源:量子位

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

图片来源:由无界 AI‌ 生成

大模型训练推理要用多少内存?

打开这个网页一测便知,测量误差小至0.5MB。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

比如模型bert-base-case Int8估计占用413.18 MB 内存,实际占用为413.68MB相差0.5MB ,误差仅有0.1%

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

操作也很简单,输入模型名称,选择数据类型即可。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

这就是HuggingFace Space上的最新火起来工具——Model Memory Calculator ,模型内存测量器,在网页端人人可体验。

要知道,跑大模型最头疼的问题莫过于:GPU内存够吗?

现在能先预估一波、误差很小,让不少人大呼“Great”!

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

实际推理内存建议多加20%

使用第一步,需要输入模型的名称。

目前支持搜索在HuggingFace Transformers库和TIMM库中的模型。

比如想要看GLM-6B的情况,可以输入“THUDM/chatglm-6b ”。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

不过有一些模型会存在限制,需要获取API token后才能开始计算,比如Llama-2-7b。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

我们找了几个大模型实测,可以看到当模型规模达到百亿参数后,内存要求被直线拉高。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

基础版的BERT还是对GPU相当友好滴

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

而在实际推理过程,EleutherAI发现需要在预测数据基础上,预留20%的内存 。具体举例如下:

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

作者小哥热衷开源项目

最后来介绍一下带来这个项目的小哥Zach Mueller

他本科毕业于西佛罗里达大学,主修软件设计与开发,热衷开源,在GitHub有1k粉丝。之前做过很多和Fast.ai框架有关的开源项目。

大模型要占你多少内存?这个神器一键测量,误差低至0.5MB,免费可用

传送门:
https://huggingface.co/spaces/hf-accelerate/model-memory-usage

推荐平台 链接 平台介绍
Gate芝麻开门 平台介绍 Gate.io芝麻开门创立于2013年,是全球真实交易量TOP10的加密货币交易平台,向全球数千万用户提供安全可靠、真实透明的数字资产交易服务。
Bitget 注册链接 Bitget的背后是一群区块链技术的早期接受者,也是区块链未来发展的信仰者,一直致力于提供安全、一站式的交易解决方案,帮助用户更聪明地交易。
Bybit 注册链接 Bybit通过数字资产与传统金融的结合,引领数字资产的生态发展。提供一流的流动性,致力于打造业内最安全、公平、高效及人性化的交易服务平台。
派网 注册链接 派网提供多样化的量化交易机器人,用户可依照自身交易需求和策略选择最适合的机器人。 同时派网也提供合约交易与合约网格机器人,给予更方便的合约交易体验。