开源还是封闭:没有“护城河”的谷歌和 OpenAI 像是被水果摊包围的沃尔玛
撰文:Devin Coldewey
来源:TechCrunch
图片来源:由无界 AI工具生成
现在的 OpenAI 可能是机器学习的代名词,而谷歌也正在尽力从地板上爬起来。不过,两者可能很快就会面临一个新的威胁:快速增加的开源项目推动了技术的发展,并将财力雄厚但笨重的公司甩在身后。这种类似于虫族的威胁可能还不存在,但它肯定会使主导者处于守势。
这一概念并不新鲜 – 在快速发展的人工智能界,几乎每周都会看到这种突破 – 据称来自谷歌内部的一份广泛共享的文件使人们看到了这种情况。“我们没有护城河,OpenAI 也没有,”该备忘录写道。
我不会用长篇大论的方式来概括这篇完全可读且有趣的文章,但其主要内容是,虽然 GPT-4 和其他专有模型已经获得了大部分的关注,甚至收入,但他们在资金和基础设施方面获得的领先优势看起来越来越小。
虽然以普通主要软件发布的标准来看,OpenAI 的发布速度可能显得很快,但如果把它们与 iOS 或 Photoshop 的版本相比,GPT-3、ChatGPT 和 GPT-4 是接踵而至的。但这仍是以月和年的规模发生的。
备忘录指出,3 月份,Meta 公司泄露的基础语言模型,称为 LLaMA,是以相当粗糙的形式被泄露的。几周之内,人们在笔记本电脑和一分钱一分钟的服务器上修修补补,增加了指令调整、多种模式和从人类反馈中强化学习等核心功能。OpenAI 和谷歌可能也在摸索代码,但他们没有——也不可能——复制 subreddits 和 discord 中出现的协作和实验水平。
难道说那个似乎对挑战者构成了不可逾越的障碍 – 护城河 – 的巨大计算问题,真的已经是人工智能发展的另一个时代遗迹了吗?
Sam Altman 已经指出,当向这个问题投掷参数时,我们应该期待回报递减。当然,越大并不总是越好——但很少有人会猜到反而是越小越好。
GPT-4 是沃尔玛,但实际上没人喜欢沃尔玛
OpenAI 和其他公司现在追求的商业范式是 SaaS 模式的直接后裔。你有一些高价值的软件或服务,你通过 API 或其他类似的方式提供精心设计的访问。这是一种直接的、经过验证的方法,当你投入数亿资金来开发像大型语言模型这样的单一单体但又多功能的产品时,这种方法就非常有意义。
如果 GPT-4 能很好地概括回答关于合同法中先例的问题,那就太好了 – 别忘了它的大量“智力”都致力于能够鹦鹉学舌,模仿每一个曾经用英语发表过作品的作者的风格。GPT-4 就像一个沃尔玛超市。但没有人真的想去那里,所以该公司只能确保周围没有其他选择。
顾客开始怀疑,为什么要穿过 50 条垃圾通道去买几个苹果?如果我只是想将这份合同的语言与其他几百份合同相匹配,我为什么要雇用有史以来最大且最通用的人工智能模型服务?如果 GPT-4 是你去买苹果的沃尔玛,那么当停车场的水果摊开门时会发生什么?
在 AI 世界中,不用过多久,大型语言模型就会以高度截断的形式在 Raspberry Pi 上运行。对于像 OpenAI 这样的企业,以及其操纵者微软、谷歌或人工智能即服务世界中的任何其他人来说,这实际上是对其业务的整个前提的乞求:这些系统是如此难以建立和运行,以至于必须由他们设计。但事实看起来更像是这些公司挑选并设计了一个适合他们现有商业模式的人工智能版本,而不是相反!
很久以前,你必须把文字处理中涉及的计算工作卸载到大型主机上,因为你的终端只是一个显示器而已。当然,那是一个不同的时代,现在的我们早已能够在个人电脑上安装整个应用程序。这个过程已经发生了很多次,因为我们的设备不断地以指数方式增加它们的计算能力。如今,当某些事情必须在超级计算机上完成时,每个人都明白这只是时间和优化的问题。
对于谷歌和 OpenAI 来说,时间的到来比预期要快得多。而且他们不是做优化的人,可能永远不会。
这并不意味着他们倒霉。要知道,谷歌并不是通过成为最牛的来获得它如今的地位的 – 无论如何,在很长一段时间内都不是。成为沃尔玛有它的好处。如果公司能够从现有供应商那里获得合理的价格并且不会造成太大的破坏,那么他们就不会想去寻找定制的解决方案来完成他们想要的任务,将速度提高 30%。永远不要低估惰性在商业中的价值!
当然,LLaMA 的迭代速度如此之快,以至于已无骆驼的名字可供命名。只是,很少有企业的 IT 部门会在 OpenAI 简单有效的 API 上拼凑实施 Stability 的开源衍生品 – 一个准合法的泄露的 Meta 模型。他们还有别的生意要做!
不过,与此同时,我在几年前就不再使用 Photoshop 进行图像编辑和创作了,因为像 Gimp 和 Paint.net 这样的开源选择已经变得非常好了。在这一点上,争论走向了另一个方向。Photoshop 要花多少钱?不,我们还得做别的呢!
谷歌的匿名作者显然担心的是,从第一种情况到第二种情况的距离将比任何人想象的要短得多,而且似乎没有人能对此做任何事情。
不过,备忘录也写道:接受它。开放、发布、合作、分享、妥协。他们总结道:
谷歌应该在开源社区建立自己的领导地位,通过与更广泛的对话合作,而不是忽视它。这可能意味着要采取一些不舒服的步骤,比如公布小型 ULM 变体的模型权重。这必然意味着放弃对我们模型的一些控制。但这种妥协是不可避免的。我们不能希望既推动创新又控制创新。