如何打造一个拖垮公司的大模型?
来源:特大号
作者:小黑羊
今年大模型实在太火
如何打造一个拖垮公司的大模型?
不多不少,一共分10步
▼
做大模型,要有大格局
舍不得孩子套不着狼
什么X100、Y100…
专挑算力强的买
正规渠道没货了?
不能怂!加价也要整起来
▼
必须是业界扛把子级别的大牛
就职于顶流AI公司比如“CloseAI”
经常在各种会议上高光出镜的那种
能把整个团队都带过来最好
成建制、好管理、出活儿快
▼
模型参数至少要万亿级别
当不成卷王,就只能被卷死
再来个「智算中心」
算力至少达要1000PFLOPS
自己训练完大模型
还能把算力开放出来给同行
数据不够怎么整?
公开一部分,自有一部分,交易一部分
拿到数据后,得清洗处理
全体动员做标注
老板亲自下场,主打一个陪伴
服务器挂了,存储速度跟不上了
跨卡性能不行、梯度消失、梯度爆炸….
什吗?!Checkpoints没保存?
反复回退,反复调参,反复排雷
问题一多,团队就乱了
人都变得很浮躁
公司原有的主营业务
停滞不前,业绩下滑
“我们来了 ”
广告要全渠道、全媒体覆盖
必须要业界感知到
我们来势汹汹的霸气
先结盟5000家合作伙伴
达成意向合作
第二天
大家联合发发新闻稿
必须让吃瓜群众充满期待
练是练出来了
看上去有点不对劲
莫不是个“大傻子”吧
落地实施,那叫一个难
不知道给谁用,不知道往哪儿用
然后开始复盘
多么痛的领悟
大牛来了又走了
算力卡买了又卖了
智算中心建了又拆了
大模型炼了又废了