深度好文:AGI时代的产品版图和范式
来源:李建忠研思
非常感谢大家对全球产品经理大会的支持,是大家的支持让产品经理大会从2009年一直坚持到今天。我今天演讲的主题是《AGI时代的产品版图和范式》。我今天的演讲主要分为以下三个部分:
一、深度认识 AGI 时代特点 二、科技创新之“范式转换立方体” 三、AGI 产品未来发展的六点思考
第一部分:深度认识AGI时代的特点
首先,我们来通过下面这幅图,认识一下大模型技术的整个发展脉络。
大家可以看到最早的人工智能是从机器学习发展而来的。到2012年ImageNet上深度神经网络大放异彩之后,深度学习成为人工智能的显学。后来在自然语言处理领域发展出RNN、LSTM这些,到2017年Google的七个研究科学家发表Transformer论文后,预训练语言模型逐步成为主流,再到以GPT为代表的大语言模型(LLM)因为ChatGPT的成功,而被业界认为是通向通用人工智能(AGI )的大门。
我本人由于追踪研究人工智能相关技术的原因,正好和上述这条发展脉络上的几个关键人物有深入的交流和探讨。2018年我们在上海举办全球机器学习大会,邀请了机器学习之父、UC伯克利的著名教授迈克尓.乔丹作为keynote演讲嘉宾,和他有深入的交流。2021年4月,我们在北京举办机器学习大会时,因为疫情的原因,我们线上邀请了Google Transformer模型的共同创始人之一Lukasz Kaiser,他在那次演讲之后不久跟我说他离开Google去OpenAI了,后来就知道他是投入做GPT 3.5了。当时还邀请了另外一位深度学习元老级人物,LSTM之父Jurgen Schmidhuber。到今年4月份我去硅谷,和OpenAI的首席科学家Ilya Sutskever也做了很多深入的交流。总的来说,在AI的发展道路上,我们一直在保持和业界前沿的深度探讨和交流,这些让我本人收益良多。
首先来谈谈AGI技术栈,一般来说分为三层:应用层、模型层、基础架构层(当然业界也有人将LLMOps抽出来,单独做一层,称为四层)。无论三层、还是四层,看这幅图,都比较容易理解,我就不多解释了。它是我们认识大模型技术的一个基础。
但这个理解容易仅仅停留在技术表层,我们接下来看看大模型技术背后更深层次的东西,我觉得才能帮助我们更深入看清大模型引领的这一波技术革命。如果我们把历史稍微拉的长一点来看的话,在整个技术产业里面,有两个很重要的命题,一个是连接、另一个是计算 。它们就像一个钟摆一样,一段时间连接为主,一段时间又摆到计算为主。
我们来看看上面这幅图,从1840年到1940年这100年间,整个技术革命以“连接”为主,包括电报、电话、广播、电视,都是在这一段时期出现,它们大范围地连接了地球上各个角落的人和组织,深刻改变了当时的社会形态。
然后到1946年第一台计算机ENIAC诞生算起,人类技术革命又进入一个“计算”的钟摆。包括50年代的大型机、60年代的小型机、70年代的微型机、到80年代的PC。以冯诺伊曼架构为核心,都是围绕“计算”这一命题进行的。这一历程进行了大约50年。
接下来是1994年到95年互联网的出现,以Netscape和Yahoo为标志,WWW互联网将人类技术革命又推到了“连接”的钟摆上,接着是2004年的Web 2.0,2007以iPhone诞生为标志的移动互联网,2013年的云服务。都是在极大地发展和丰富“连接”这一命题。这一历程大约持续了30年。
时间来到2017年,Transformer模型的论文发表,2018年GPT 1.0诞生,然后2.0、3.0、直到去年底的GPT 3.5带来的ChatGPT横空出世,为整个人类带来通用人工智能AGI的曙光。这一轮大模型又进入“计算”的钟摆,时间大约从2020年算起。
很有意思的是,如果大家看第一次“连接”革命,我将其命名为“连接1.0“,它经历了大约100年;而第二次”计算“革命,我将其命名为”计算2.0“,它经历了大约50年;然后是第二次”连接“革命,所谓”连接2.0“,它经历了30年。大家有没有看出来时间跨度呈指数级下降的趋势?所以很多人认为,我们接下来可能要不了15年左右,到2035年,可能这一波大模型带来的”计算“钟摆就会到达顶峰。
有了产业的时间线认识之后,我们接下来看看**“连接“时代和”计算“时代的底层逻辑** 有什么不同?这个其实非常重要。因为很多人这段时间经常会使用移动互联网的各种各样的范式,来推演大模型时代的范式。我认为这种认知是错误的。因为移动互联网属于“连接”逻辑,而大模型时代属于“计算”逻辑。我们来看看下面的表格:
从生产变革的角度来看,连接逻辑主导的是“生产关系”,而计算逻辑主导的是“生产力“。从生产-消费关系来看,我们知道在互联网时代,连接逻辑下,有一个非常重要的效应叫”双边市场“,包括淘宝上的买家和卖家,滴滴上的乘客和司机,抖音上面的听众和主播。一个是生产者,一个是消费者。构成一个非常强的双边效应,也是互联网时代很多产品很重要的护城河。
而计算逻辑下,其实没有这样的一个双边效应,它的核心是一个单边市场。一端是算法算力,另一端是消费者。比如在Midjourney里面,没有设计师网络,算法直接出图给用户;比如到自动驾驶时代,如果去颠覆滴滴,滴滴的司机-乘客双边市场形成的护城河根本没有用,因为不需要司机了,是算法在开车。
再来看商业模式,在连接逻辑下,它的边际成本是非常低的,所以很容易做免费的商业模式。但在计算逻辑下,算法算力的成本是需要均摊的。那么绝大多数的商业模式还会像互联网、移动互联网时代的“免费为王”吗?大概率不会,这也是大家现在看到Midjourney,ChatGPT Plus这些纷纷收费的原因。很多硅谷投资人都提出,大模型时代“直接向用户收费”将是主要的商业模式。而不再是连接时代的“羊毛出在猪身上“的免费模式。
然后用户体验呢?互联网时代,连接逻辑是信息越多越好,不可避免出现的一个信息过载的问题。但是计算逻辑呢,其实是触点越少越好,效率为先。就是我下一个命令把我的结果给我就行了,中间过程不要让我参与。
从决策机制来讲。连接逻辑是“机器将信息给我,我来决策“。而计算逻辑是人给机器信息,也就是数据,机器来帮我做决策。
通过以上这些对比,大家可以看到这两个逻辑在我们的产品思维里面是非常不同的。接下来我们来谈谈,同样是计算逻辑,1940年到1990年的计算1.0和我们目前所处的计算2.0有什么本质区别?来看下面的图:
计算1.0时代,左边是人的大脑,我们叫生物神经网络,右边是数字逻辑电路,我们所有传统的计算机本质上就是数字逻辑电路的“与、或、非”。它是个结构化的运算逻辑,只能接受结构化的数据,本质上是一个0-1思维。它导向的结果是要让人来适应机器的逻辑。
所以你会发现在计算1.0下面,无论是PC还是手机软件上很多用户体验稍微不注意的地方,就容易让非行业的人士、包括老人、小孩陷入一种心智负担的困境。为什么有这种困境?
因为左边是人类大脑的生物神经网络,而右边是由“与、或、非”构成的数字逻辑电路,你要去适配它。任何Input输入先要转换成数字逻辑电路能理解的东西;任何电脑Output输出的东西,也要再经过一层转换变为生物神经网络能够理解的东西。这样来回的转换,就是没有经过训练的普通用户陷入困境的原因所在。
但是我们如果看看下图所描述的大模型所主导的计算2.0时代。
我把右边这幅图画成了大脑的样子,虽然它里面是一个硅基的芯片,所谓碳基智能和硅基智能。
我四月份在硅谷跟OpenAI的首席科学家Ilya Sutskever交流时,我记得他重复了三遍在强调,从数学原理来看,现在的数字神经网络和人脑的碳基神经网络,已经没什么不同。除了生物有机体的生存方式不一样外,运算逻辑是一样的。
这时候,人类和大模型的交互,其实就是生物神经网络,和数字神经网络之间的互动,特别自然,没有任何别扭,因为大家的输入输出是一致的,运算逻辑也是一致的。
它不再是计算1.0时代的那种数字电路的0-1思维,而是一个概率思维。大家知道你可以调整ChatGPT的temperature(温度值)那个参数。将temperature调高让它很有创意。用temperature这个词也很有意思,温度高的意思就是大脑发烫嘛,大脑发烫就比较有创意。也可以将temperature调低让它的回答很平庸俗套。概率思维本质就是神经网络的模式,它也是我们人脑的决策方式。大家仔细想一想,其实我们大脑的每一次思考都是在计算概率。计算2.0整个导向的结果是让机器来适应人的思维。
有了以上对整个AGI技术及其背后的逻辑的深入认识之后,我们下面来谈谈在AGI时代,如何做产品的一些方法论。
第二部分:科技创新之“范式转换立方体”
先谈谈范式转换,英文叫Paradigm Shift,由托马斯·库恩最早在《科学革命的结构》一书中提出,它指的是科技领域的基本概念和实践的根本性变化,它打破了原有的法则和界限,为人们的思想和行动开创全新的天地。技术领域我们常常谈的革命,其实都是发生了范式转换,比如从单机到互联网,从互联网到移动互联网,都是范式转换。
在中国互联网领域,很多朋友知道美团的王兴在2009年左右曾经有一个很著名的四纵三横论。当时互联网的很多人听到这个理论就特别兴奋。因为王兴的这个分析,当时看起来比较符合那时候的现状,2009年是移动互联网刚爆发的时候。跟现在AGI爆发这个点非常像。
王兴当时指出来,人类在技术行业基本由四大需求主宰:信息,沟通,娱乐,商业。所谓四纵。三横呢,王兴给出了自己的分析:搜索、社交、移动。然后四纵三横的交错点,就诞生了新的机会。对于“四纵”我非常认同,但是三横,我觉得这个分析方式是有问题的,因为社交、搜索其实都是人类需求,和移动互联网不在一个维度上。
我猜当时王兴把社交放在和移动一个维度上,是因为当时社交网络太火了,导致社交成为一个巨大的流量入口,在很多领域一旦碰上社交,就会有新的玩法。但是流量入口并不等于技术。搜索也是,因为也有流量入口效应,所以王兴觉得它在很多领域也引起过变化。但是王兴当时对搜索除了Google/百度这种模式之外,在沟通、娱乐、商业等领域并没有给出具有说服力的产品模式。所以我觉得王兴“四纵三横”这个方法论的“三横”是放错了位置。
接下来我来谈谈我提出的一个分析框架,这个分析框架我觉得对于我们分析AGI时代的产品范式很有帮助。我将我提出的分析框架命名为**“范式转换立方体”,英文命名为ParaShift Cube** ,其中Para就是Paradigm的缩写。
为什么叫立方体,因为我们定义了三个轴:x轴,y轴,z轴。
x轴代表技术轴,代表着技术范式的转换,这里面有连接1.0、计算1.0、连接2.0(这里面又包括PC互联网,移动互联网)、计算2.0,也就是我们说的AGI智能时代。
Y轴代表需求轴,涵盖人类需求的方方面面,包括王兴谈的部分:信息、娱乐、商业,同时我也把社交、搜索都放在Y轴里了。社交和沟通,我把它们合并了,虽然它们有细微的差别,但是它们的共性显然大于差异。
Z轴代表媒介轴,因为信息的表达需要特定的媒介,人类也是通过媒介和周围的世界交互的。媒介轴包括:文字、图片、音频、视频、以及三维空间计算(这是苹果在VisionPro最新提出的)。Z轴我觉得是很多人都忽视的一点。包括对计算机发展影响巨大的GUI图形用户界面,也是计算机图像这样一种媒介在事件驱动下的交互结果。
这三个轴线组成了一个立方体结构, 三个轴线,每一个轴线上的变化点,和其他轴线的交汇点,就是产品出现“范式转换创新”的地方。应用“范式转换立方体“来分析产品领域的创新机会,逻辑上就很顺了。
接下来,我们使用“范式转换立方体”来分析一下连接1.0时代的PC互联网,连接2.0时代的移动互联网、以及预测一下计算2.0 AGI智能时代可能的机会。至于计算1.0、和连接1.0时代,其实也可以使用“范式转换立方体”分析,只是年代比较久远,我在这里就不讲了,但大家有兴趣可以回溯历史来分析,你会发现也非常符合逻辑。
因为立方体里面填充内容的话在PPT里不是很好表达,所以我上面用了表格来表达技术轴和需求轴,下面还有一个蓝色的轴线,代表媒介变化。
我在表格中把需求轴分为两个部分:红色和绿色。红色的部分,在AGI智能时代,是范式转换发生比较剧烈的部分,创新、甚至掀翻巨头的机会很大;先看信息需求,PC到移动的转换中,新浪搜狐等门户模式被今日头条等打败,而到AGI智能时代信息的生产方式又会面临巨大变化。现在信息过载很严重,有时候阅读十篇文章,得到的其实就一个信息。那么大模型可不可以根据我的偏好帮我把前一天的几十篇的信息做整合,然后给我一些简短精炼的摘要出来,这是大模型非常擅长的。这就很容易形成对信息产品的范式转换。再来谈娱乐,娱乐是非常需要内容的,而内容生成是AIGC非常擅长的,娱乐的形式、载体、供应等多链条都会被AIGC重塑,所以也存在很多范式转换的机会。
最后聊聊搜索。搜索是互联网领域一个很大的产业,也是人类一个很大的需求。但是大家如果用了ChatGPT这些大模型产品之后,你会发现搜索行为的比例会显著下降,为什么?因为很多时候,我们搜索十几篇文章,翻好几页,就是为了寻找一个答案或者决策。这款产品好不好?那个景点值不值得去?这个药解决不解决问题?这些决策性的、答案性的需求是ChatGPT 这类大模型产品非常擅长的。所以说,搜索在AGI时代会面临巨大的被颠覆的可能。而很遗憾,四五月份从硅谷回来,我感觉到Google还躺在搜索的功劳簿上数钱,对ChatGPT带来的巨大范式转换的威胁反应麻木。
有人说,Google不是推出了很多大模型相关的技术和产品了吗?我的回答是,不要看表面推出的几个产品。这些防御性的动作在范式转换来临时,都是毛毛雨。想想看Yahoo当年是怎么轰然倒下的?当然Google有没有机会,我觉得有,但前提是Google上下必须拿出类似当年马化腾和张小龙举腾讯全公司之力All in 微信,来打米聊的那场战争的决心;或者比尔盖茨在1995年举微软全公司之力All in IE,来和Netscape打那场浏览器战争的决心,才有可能阻挡范式转换的颠覆性力量。而Google做了什么呢?创始人躺在加州的沙滩上晒太阳,让雇佣来的拿年薪为主的CEO和OpenAI的 Sam Altman与Ilya Sutskever等这样胸怀诗和远方的联合创始人来对打,接着后脚又把技术大神Jeff Dean从Goolge Brain老大的职位上拿掉,把深度学习之父Jeffrey Hinton委婉劝退。靠Google I/O大会上几个PPT大模型就想赢跑AGI时代吗?顺便批评一下Google这些年大兴PPT产品的浮躁之风(很多之后都没有正式发布),而大家看看OpenAI这些创业公司什么时候需要开发布会?产品release就是发布会,最多配一篇Blog解释一下。拿产品(而不是拿PPT)说话才是创新的王道!
最后说一句,颠覆Yahoo的不是另外一个门户;颠覆Google的也不会是另外一个搜索,而是范式转换带来的结构性颠覆,而这就是大模型时代搜索领域正在面临的棋局。
谈完红色的部分,来谈谈绿色的部分,相对红色部分来讲,绿色部分由于仍然具有连接时代的“双边市场”效应,所以护城河比较深,即使在技术发生范式转换时,我认为也不是有很大的机会。比如从PC互联网到移动的转型中,即使当时有米聊、陌陌等一众公司强攻社交,但是活下来还是腾讯(虽然从QQ换了个名字叫微信),因为腾讯在QQ时代建立的社交护城河太深了。整个中国的社交关系,不是简单的双边结构、而是网络结构,都掌握在腾讯手里。
很多人前段时间也在问在AGI时代,微信会被颠覆吗?我们用上面的范式转换立方体分析,结论是不会。首先AGI时代,人们的社交需求会变吗?不会。其次人和人的社交模式,会变成人和虚拟人的社交模式吗?我觉得也不会。在硅谷有一种说法,未来机器人都是人类的奴隶,人们使用机器人的目的很明确“让它干活“。社交的需求来自人类社会关系的结构:朋友、亲戚、同学、同事…… 除非人类社会结构里以后没有这些社会关系了。没有人愿意和机器人社交。所以,微信在全中国、准确说应该是全世界华人的社交关系网络的优势,即便在AGI大的范式转换的时代,也不会被颠覆。至于微信里面,具体交互的一些更新,比如文本、图片生成啦,更智能的信息优化啦,这些都属于小的交互改进,这些事情以微信的能力分分钟都会做好,轮不着任何创业公司来颠覆它。
我记得在2019年1月份的同一天,字节推出多闪、罗永浩推出聊天宝、快播创始人王欣推出马桶MT,想合伙颠覆微信的社交王者地位,但没过两个月就偃旗息鼓了。如果当时几位创始人看了我的“范式转换立方体”就明白了,此事不可为。何况2019年也不是一个技术范式转换的时代,即便是碰上PC互联网到移动的范式转换的时代,雷军的米聊、国际上的WhatsApp、Talkbox等一众应用也没有颠覆腾讯,因为社交的护城河是最深的。AGI时代大家不要想打微信的主意,门都没有。
再来说商业,其实指的是电商。大的颠覆机会不多,原因也是“连接时代”双边市场的护城河仍然在电商领域继续存在。任何商业形态都离不开买家和卖家,AGI大模型只能在商业闭环上优化一些小环节(比如淘宝的图片、虚拟试衣间等),但这些永远脱离不了买家、卖家、物流这些基本电商属性,而在这些领域传统巨头的优势还很大。就是从PC互联网到移动互联网的转换中,淘宝、京东的优势基本都是平移过来的。
不过有一点需要指出,在移动互联网领域,半路杀出了个拼多多和抖音电商,但这是微信和抖音的流量入口效应带来的,是很好的补充,但构不成颠覆,而且拼多多打的是下沉人群,是新的上网人口结构变化带来的(这个有机会再分析)。我的判断是,随着大模型可能带来新的流量入口,电商领域也许会冒出类似拼多多、抖音电商的新机会,但是淘宝、京东的既有优势仍然会存在。毕竟,电商的盘子太大了。太平洋容得下中美两国,电商领域更可以容得下很多小巨头。
最下面的蓝色轴线,主要是我们前面说的媒介:文字、图片、音频、视频、以及三维(空间计算)。很多人很容易忽视这一块,不同媒介背后蕴含的产品力量是非常不同的。我们在做任何产品的时候,都要想一想我们要在这里面主打什么样的媒介载体。
从媒介逻辑上,图片优于文字,视频优于图片,音频有它特殊场景。早期移动领域那些做笔记、文字类的产品,估计很多都消失匿迹了。一个手机摄像头养活了很多图片类产品。国外有Instagram、Pinterest等。大家说国内的图片产品呢?其实我有好几位朋友之前都是做图片产品的,但都做得不大,为什么?中国最大的图片产品其实是微信朋友圈。
很多人其实都不知道微信朋友圈怎么发纯文字,只知道用它发照片(不信,你找身边十个人问问,看看有几个知道?其实微信朋友圈有这个功能,只是隐藏起来了,需要长按相机按钮)。 朋友圈默认的按钮是一个相机按钮。微信为什么这么做?为什么张小龙在很多人呼吁下,还是没有将发文字的按钮和发照片按钮并列呢?很简单,你如果在上海的地铁站随便圈100个人,你问问这100人多少人会发图片,多少人会发文字? 我想这个差距会非常惊人。99%的微信用户都会用朋友圈发图片。但是能发文字的用户,我觉得不超过10%。写文字是需要技能的,而发图片妇孺皆知、毫无门槛。这就是不同媒介的产品力量。
再来说视频,我在硅谷的时候,有好几位Google的朋友都提到,TickTok对Google的威胁比ChatGPT大。为什么?因为TickTok的用户在线时长很高,在挤压Google的用户时长。国内版抖音更是现在的流量之王。如果微信这几年不做视频号,早期不做朋友圈。我想中国互联网的版图肯定不是今天这样子。作为对比,大家看看WhatsApp的今天,价值可能连微信的二十份之一都不到。微信在很正确的时间,抓住了图片的红利(朋友圈),视频的红利(视频号),每一步大旗踩的都很准,所以张小龙无愧中国第一产品经理的称号。
所以媒介也是一个很重要的变化轴线。那么视频之后呢?就是苹果前两周发布的VisionPro,所谓的三维(空间计算)。文字是一维的媒介,图片和视频是二维的媒介,而空间计算是三维的。二维一定超越一维,三维一定超越二维,这也是我之所以看好VisionPro的原因。
所以未来最大的两个范式转换的力量,第一是AGI大模型在技术轴带来的范式转换 ;第二是空间计算在媒介轴带来的范式转换 。第一个已经到来 ,第二个根据VisionPro产品的成熟速度,估计要晚2~3年。两轴交汇,我觉得未来5~10年一定非常精彩。
但大模型也不是在所有领域都有巨大的产品范式转换,我们来看下图
我把大模型产品的切入点分两类。一类属于会发生剧烈范式转换的,所谓AI-Native 原生应用。这一类的特点是不用大模型,产品根本没法做。这一类的代表产品品类有:智能助理(如ChatGPT),AIGC生成式产品(如Midjourney),具身智能(如特斯拉的擎天柱)。这些产品都有巨大的颠覆性机会,是AGI时代的新物种。
而另一类属于渐进增强型,所谓AI-Copilot副驾驶模式。比如生产力工具(Office Copilot),代码生成(Github Copilot),设计增强(Adobe Firefly),等等。这一类都是原有产品在某个环节使用大模型进行的增强。
AI-Native和AI-Copilot带来的范式转换和渐进增强,有很多不同的特点。我列在了上图中。大家要根据各自业务的特点来选择。我这里需要特别强调的是组织问题。如果你选择的是AI-Native 范式转换型的创新,必须重新搭组织,全新创业公司比较好办,如果是大公司内部创新,也必须搭建全新的团队,否则八成不靠谱。因为很多事情,都是组织的原因。历史无数次的证明,做新事情必须要新的团队架构。因为它的组织流程就不一样,商业模式也不一样,这就是我前面说的连接时代的逻辑和计算时代的逻辑是不一样的。如果你选择的是AI-Copilot,你肯定有比较成熟的现有产品,那么这时候老组织只需要做一些增强和微调就可以。它和AI-Native对团队的要求完全不同。这个在硅谷的很多公司里也是很明显的。
顺便提一下微软,AGI来了之后,微软一直在摇旗呐喊,很多人觉得微软走的是范式转换的路子。但我要说,从大的格局上来看,微软其实选择的是AI-Copilot的渐进增强模式。因为微软已经是个2.5万亿美金的公司了。它不需要革命,它只需要乘着AGI的东风缓慢增长。让它的Office、Windows、Azure核心产品增长30%左右,几年之后就可以变成一个4万亿,甚至5万亿美金的公司。它不需要赌上身家性命,去All-In 范式转换型的AI-Native产品,因为范式转换虽然有高收益的可能,但是也是高风险的。微软在AGI时代的产品战略选择,也是值得很多赛道里的成熟公司参考的。
第三部分:AGI 产品未来发展的六点思考
第一个思考是2C还是2B。 2C由于是端到端的产品,用户路径通常比较短,非常适合做AI-Native的范式转换。而2B由于客户路径比较长,AI的能力只是整个商业闭环的一个环节,所以适合做AI-Copilot的渐进增强。
重点说一下价值排序。2C产品是内容大于服务,服务大于工具。这个逻辑不仅在PC互联网、移动互联网时代适用,在AGI时代也适用。大家想想移动互联网时代刚开始的时候,很多大热的工具,比如修图的工具、杀毒的工具,笔记的工具等等热的不行,但是今天它们都在哪里呢?即使活着,整个价值远低于所有做内容的公司,比如小红书、知乎、抖音这些。服务主要指的是58、携程这些连接服务的产品,它们的价值大于工具,但低于内容。为什么?很简单,用户在内容上的时长、远大于服务、服务的时长远大于工具,完全不在一个数量级。用户时长基本决定了产品的价值区间。所以,在AGI时代,同样不要着迷于那些看起来很酷的工具,它的价值远不如做内容或服务。
而在2B领域,价值逻辑完全变了,客户的决策大于效率,效率大于内容。企业产品并不追求很多内容,反倒要求效率最大化,最好能辅助我快速做决策。
第二个思考是做平台,还是做应用 。大模型一热起来,又燃起了很多人的平台梦。我给一上来就哭着喊着要做大模型平台的朋友破盆凉水。我就引用Midjourney 创始人 David Holz最近讲的一个话。他说他在前一个创办的公司Leap Motion学到的最大教训是,大家一上来就奔着生态系统的平台梦,后来失败了。但他做Midjourney时就吸取了这个教训,一定要做一个用户真正喜欢的产品,将它先做成超级应用。
其实OpenAI也一样,它是先有了ChatGPT这样的超级应用,然后再去构筑Plugin、API这些生态建设。微信也一样,它是先有了聊天、朋友圈、公众号这样的超级应用入口后,才去建设小程序这样的生态。连乔布斯做iPhone的时候,也是先有了iTunes上很多好歌,放下身段去时代华纳、去迪士尼、去纽约时报各种求爷爷告奶奶地让他们在iPhone上做App,去说服很多网站搞好H5适配来让Safari浏览网站好用,iPhone才有了生态平台的地位。
这个路径对我们产品人非常重要。最近经常碰到一些人说,我们的目标是做XXX大模型平台,我都忍不住想吐,你的产品是啥还没有呢,从来没有人用过,哪来的勇气做平台啊,梁静茹给的吗?没有人会因为你号称自己是平台,就去支持你的。只有你有了超级应用,有了巨大的用户池,你才有平台的号召力,大家才会把你当作平台来支持你。
第三个思考是UGC VS. AIGC 。UGC曾经是Web 2.0里很重要的一个策略。但大模型带来了AIGC的能力。
UGC是一个典型的双边用户网络,而AIGC的内容提供者不是用户了,是模型+算力+数据,这个讲究的是数据飞轮。UGC的冷启动很难,因为你要聚拢很多创作者。但AIGC是算力为先,模型为先。UGC因为是薅了内容提供者的很多羊毛,所以成本低。而AIGC算力成本是较高的,尤其是启动的时候。反过来说UGC它的社交护城河比较高,因为用户有时候不仅仅是因为喜欢内容,而是这个创作者的粉丝。但AIGC,用户就是单纯消费内容,切换成本很低。如果一家大公司做的东西跟你差不多,但成本低一些,用户因为便宜可能马上就转过去了。
第四个思考是创新者的窘境:创新 vs. 守成
历史上每一次范式转换时,守成巨头都会面临创新者的窘境。比如拿Google现在的情况来说,OpenAI就是巧妙地利用了Google面临的“创新者的窘境”。
其实Google内部现在很多人仍然并不重视GPT等大模型,因为他们内部测算过,相对于基于索引的搜索查询,ChatGPT的神经网络训练太昂贵了。而搜索是Google 90%的收入来源。大模型能带来多少收入?还是未知数。所以Google现在很难All in 大模型,这就给了OpenAI非常好的战略机遇期。另外OpenAI还巧妙地通过战略合作,通过GPT赋能微软的Bing在搜索战场吸引Google火力,而自己则有机会在大模型的生态平台领域蒙眼狂奔。在范式转换的机会出现时,创业者一定要很好地利用“创新者的窘境”来阻挡巨头跟自己正面硬刚。
举一个反例,当年雷军做米聊,各种惊天动地的宣传惊动了腾讯,但没有提前做好应对巨头竞争的战略设计,从而让腾讯上下同仇敌忾、团结一致All in 微信,短短一年多时间,就基本上把米聊灭了。当然,反过来从腾讯的角度来说,在范式转换出现时,守成巨头如果能足够重视、足量All in ,也是能够摆脱“创新者窘境”的宿命。
第五个思考是AGI 如何跨越鸿沟
《跨越鸿沟》也是非常著名的一本书。它描述的多个阶段的鸿沟,是很多创新产品需要特别注意的。
目前ChatGPT显然已经跨过了第一个鸿沟(即Innovators和Early Adopters之间的小鸿沟),它的用户已经过亿。但是下一个鸿沟,就是从Early Adopters到Early Majority之间的这个鸿沟是最大的,ChatGPT还在尝试跨越。我个人比较看好,虽然它最近的数据表明Plugin还没有过PMF(产品市场匹配)。但据我在硅谷和OpenAI的人交流,他们内部还有很多大杀器,特别是它的多模态能力极其强悍,要远超无脑的Midjourney。只是它还需要做很多对齐合规的工作。当然每个产品都有自己的鸿沟需要去跨越。
第六个思考是大模型只是一扇通往AGI的门
如果我们回顾整个技术产业历史的话,很多技术刚出来的时候,我们就觉得这个技术很厉害。蜂拥而上这个技术,而忘了这个技术带来的各个领域的范式转换。比如当年浏览器和Web服务器刚出来的时候,很多人都会抢着做浏览器和Web服务器,因为很多技术人当时都认为浏览器和Web服务器就代表了互联网。最惨烈的战争是微软举全公司之力去开发IE和Netscape抢夺浏览器市场。我对这段历史比较清楚,因为我们全球产品经理大会的老朋友、《启示录》的作者Marty Cagan就是当年Netscape的产品高级副总裁,我之前请他来过很多次中国,经常聊起这段历史。
微软和Netscape在这件事上是两败俱伤,因为大家争斗的时候,全然忽略了人类进入互联网之后更大的战略机会,比如后来的eBay、Google、Facebook每一个产生的价值规模都远超浏览器和Web服务器市场。
现在很多公司蜂拥大模型,很有可能会重蹈当年的浏览器和Web服务器的覆辙。而全然忘记了大模型带来是巨大的产业级范式转移机会。从这个意义上来讲,大模型只是一扇门,这扇门推开之后有更精彩的AGI世界在等着我们。
好,我今天的演讲就到此结束,希望整个内容,特别是**“范式转换立方体“即ParaShift Cub 和 “连接与计算时代”** 的分析对大家在AGI时代进行创新创业有帮助,谢谢大家!