傅盛:大模型下半场,企业如何AI创新?
来源:创业邦
8月22-23日,2023 DEMO WORLD企业开放式创新大会在长三角G60科创走廊策源地松江隆重举行。本届大会由创业邦主办,松江区经济委员会、松江区投资促进服务中心、国家级上海松江经济技术开发区、松江区泗泾镇人民政府、松江区佘山镇人民政府协办。
大会以“拥抱开放”为主题,邀请200+跨国公司及本土企业创新领袖,聚焦开放式创新,通过演讲分享、报告发布、榜单评选、案例展示、需求对接等多种方式,推动全球创新资源在行业中的流动,加速世界各地的企业在中国成长。
会上,猎豹移动董事长兼CEO、猎户星空董事长傅盛在《大模型下半场,企业如何AI创新?》主题演讲中的精彩观点如下:
1.语义理解是人工智能皇冠上的明珠
2.ChatGPT带来了交互革命与生产力革命
3.大模型应用未来可期,未来每个公司都有自己的大模型
4.用新范式思考做大模型应用的机会
以下为演讲/对话内容,由创业邦整理:
1、语义理解是人工智能皇冠上的明珠
“大模型的下半场”,这个标题也不是我起的,是我们有一次在群里讨论,一个朋友发了一篇文章《大模型下半场》,我们所有人都说下半场了, 那上半场在哪里?我想说,这正好说明了大模型这个行业这次人工智能浪潮发展是如此之快,几乎就是日新月异。我记得在去年的时候,我在APP store上搜“AI”打头的APP就没有几个,到今年3月份就一大堆,当时我就感叹了一句,这真的是一次寒武纪生物大爆发,这次AI带来了非常大的机会,机会到底在哪里,我结合自己创业的思考和大家一起分享一下。
作为每个创业者其实最要学习的就是第一性原理,无论是一个技术也好,是一个产品也好,你得在最底层知道它为什么会这样。 其实我最早的时候给自己起了一个命题,为什么ChatGPT一款聊天软件,大家认为它会改变世界。我在2016年开始就投身于人工智能,做人工智能+服务机器人的创业活动。当时行业内是非常的乐观,就在AlphaGo战胜了李世石之后,大家认为人工智能的时代到了,所以就应该很快自动驾驶会出现,一个懂你的机器人会出现。但事实上经过了第一波人工智能1.0发展之后,人工智能行业遇到了天花板,最大的天花板就是语义理解。
语义理解是人工智能行业皇冠上的明珠 ,为什么是明珠呢?大家想100年前图灵在计算机都没有真正被发明之前,人们做了一个思维实验,如何证明以后一个机器具备了人的智能,这就是图灵测试。图灵测试的核心就是,跟它说话,它听得懂,你不知道它是一个机器。我想这个想法是如此的伟大,到今天也是这样的。因为语言事实上是人和其他动物真正智能的区别。“识别”这件事,你会识别,你家的狗也会识别,看到你就很开心,看到别人就汪汪叫,猴子也会识别。所以图像识别也好,这些都不是人类独有的智能,只有语言。《人类简史》里说,人类真正能够战胜其他物种,我们的祖先智人能够崛起于这个世界,成为世界的霸主,最核心就是语言能力,尤其是描述虚拟事物的能力。 虚拟事物的核心就是逻辑,因为有了语言我们才有了逻辑。
大家都知道语义理解是最核心的,我们认为是有两条技术路线,第一条路是学外语模式,我教你语法规则,主谓宾,然后背单词,知识图谱,capital是首都,首都的意思是什么。这个好处是什么呢,只要你用知识图谱和语法规则教计算机模型以后,它很快就会开始回答。事实上它的回答一直突破不了天花板,就像我们学了很久的英语,你第一天去美国,和海关说话都不太懂。这里有一个逻辑,虽然外语模式很快能见效,但我们学外语时已经有母语了,只有OpenAI当时觉得我们能不能用学母语的模式?这就是第二条路是学母语模式。就是不告诉你任何知识,你就在这里天天听,就跟小孩一样在旁边听,突然有一天他就开口说话了,和你交流了。
为什么OpenAI这么牛,并不是它找到了独门秘笈。在去年之前,OpenAI都是硅谷的笑话,大家觉得这事怎么可能呢,海量的数据神经网络学不会。事实上神经网络通过不断对文本的学习,你给它所有的文本。比如创业邦、上海,这样的词汇在文本里出现很多次,它就自动建立了词和词之间的关联。它开始并不知道创业邦和上海之间是什么关联,演讲和创业邦是什么关联,但在大量文本里重复出现,自动实现了词和词之间的概率。
我就做了一个比喻,ChatGPT出现之前就像鹦鹉学舌,那时候也有聊天机器人,就是匹配。你问它一个问题,它找一段文本做一个匹配。等找不到匹配或者对问题不理解时,就会答非所问,只有ChatGPT是建立在对词的理解上。ChatGPT的核心,或者这次AI的核心是通过自己对词的的不断学习,大量文本的学习,自动构建了一个词和词之间关联关系。这在数学里叫向量关系,这使得它知道了词之间各种稀疏关系建立了对语言的理解。 这次出来的各种聊天系统,无论答案是不是一本正经的胡说八道,但对问题的理解基本都能到位,这是一次巨大的变革。
一个新兴事物出现时人总有“认知障碍”,因为你搞过很久,觉得没有啥了不起,一直到我家那条狗“三万”,它是我在宠物医院里收养的,宠物医生给它起的名字是“三万”,一直到我走的时候,我都不知道它为什么叫三万。后来宠物医生说前主人把它遗弃,手术费要3万,前主人后来就不来了,医生很焦灼,就只好给它做了这个手术。为了纪念损失3万块钱手术款,于是起名三万。我就问了ChatGPT这个问题,这是一个在互联网上搜不到的数据,但是ChatGPT推理出来了。这个问答出了之后,我家狗就变成了人工智能的“网红狗”,因为很多人写书都要把这个例子写进去,都要过来和我打招呼,也上了微博热搜。
2、ChatGPT带来了交互革命与生产力革命
有了这样的推理能力,被机器学习以后,人工智能带来两个巨大的变革。首先是交互革命 ,我做了很多年的交互,因为我是从最早PC时代开始做,做360,后来做猎豹浏览器。到移动时代做猎豹清理大师,在海外有几亿用户,我们的工作都是围绕交互展开。乔布斯说每次交互的变化都是一次产业革命的机会。苹果有幸抓到过两次,iphone抓到第三次,第一次是出现了键盘,第二次是出现了图形界面,第三次是在手机上用拇指来操作。
这次的交互革命什么意思呢?这是人类历史上第一次机器可以围绕人来交互的,在之前我们很多工作都是围绕机器在交互。 比如最早我们要开始学office培训大纲、计算机等级考试。到手机时代每个APP都有自己的UI,UI做得很易用了。但你还得要知道微信面对面建群要打开那个“+”号,很多老年人疫情期间不会交互就寸步难行。这次语义被理解之后,每个人有1000种问法,机器都能理解,所以使得学习成本大幅度降低。
不知道大家看过一个电影《Her》没有,电影里就描述了交互的未来形态,很快就会到来。以前我看电影时都会觉得太理想化了,最近我又看了这部电影,所有创业者都应该看一下这部电影,这就是未来的交互。这样交互之后,你就会发现很多形态都会发生改变。
第二是生产力革命 ,因为它有推理能力,为什么OpenAI这次这么火,大家觉得可能它有一天能生产出一个爱因斯坦,如果它生产出一个爱因斯坦对世界的变化多大呀。其实不用生产出个爱因斯坦,你如果具备很多算力之后,算力以前是单纯的算力,有了ChatGPT后你得去匹配,现在算力就变成了智能。所以我有一个说法,以后HR应该改名IR,以前是Human resource(人力资源),以后叫Intelligent resource(智能资源)。这件事情已经发生了,硅谷创业公司以前大部分都是雇人,现在硅谷公司有一半的钱用来雇人,另外一半钱用来购买数据、购买向量数据库,然后组成一个由人工智能驱动的智能中心。现在在硅谷不谈区块链,就谈人工智能。一个人工智能的会议,门票可以高达几千美金,人山人海。
Sam Altman(OpenAI创始人)说:“人工智能将导致在电脑前工作的价格下降速度,远远快于现实世界中发生工作的价格。”这句话的意思我翻译了一下,就是在电脑前工作的人优先被人工智能替代 。首先今天这个社会是脑力工作者占了大部分,或者脑力工作者输出的价值占了大部分,这个大家应该没有异议。二是好多脑力工作者承担最重要的工作是“翻译”,不是中文翻译成英语,而是我们把人的一些意图翻译成机器能理解的指令。比如说程序员,他就是把产品经理的意图翻译成机器代码,无论是C语言也好,JAVA也好,这就是翻译。所以经常有产品经理和程序员之间互相battle,这就是翻译工作。再是翻译成PPT,今天的PPT要写出来,我和市场部说要怎么写,翻译成各种。助理订票、规划行程,也是翻译,翻译成日历能理解的,今天我要去哪儿,翻译成日历。还有设计师的工作,把老板要的或者产品要的翻译成一幅图画。实际上这个工作价格会急剧下降,因为AI能做很多事情。
我们公司每个节日都会给员工做礼品,给客户做礼品,后来我说别中秋节老买月饼,我也不吃,因为我老家是景德镇的,我就说能不能做一些瓷器,瓷器这个东西一直在用,然后也给我们家乡经济做贡献。我们行政部就选了好多款,我都不满意,我说为什么不用AI设计一下呢,因为景德镇瓷器好在都是手工生产的,不是工厂就能做出来的。后来行政部的同事用SD做的一些模型调优,一看我就满意了。做出这样设计之后,我们设计部同事就有一点炸锅了,感觉到岌岌可危,我说你们也要学会用。他们突然发现以前的“翻译”工作没了,以前找他们要个图至少两三天,现在5分钟就做出来,然后来回改,这就是正在发生的。
包括微软,它公布企业AI软件工具Microsoft 365 Copilot的售价后,一天内股价飙升了6%。Copilot并不是以前意义上的SaaS,而是数字员工。因为微软就是要把人工智能这一波AI 2.0变成一个个在企业当中标配的数字员工。微软以前在比尔盖茨时代梦想让每个家庭里有一台计算机,这个已经完成了。他们后面的梦想,是让每个人都有十个助理,Copilot就是副驾驶。如果把微软想象成不是一家科技公司,而是向全世界输出劳动力的公司,它会向全世界输出数十亿的劳动力,它的机会特别大。以前雇一个人在美国需要几千美金,现在花30美元能完成80%的工作了,哪个企业不会用呢。
讲到这儿我就想起当年GPT4.0出来时,它在两个领域指标特别高,一个在生物领域,一个在法律领域。ChatGPT参加律师资格考试能够超过90%的人,有一次香港一个投行的合伙人就跟我聊,他说律师资格考试是非常难的,看完ChatGPT之后都崩溃了,很多朋友都是名牌大学毕业,去考试都要考两三年,怎么GPT一下就过了,还能超过90%的人?后来我琢磨一下,应该是美国的律师费太贵,美国律师的费用占了全部GDP的7%,所以他们着重训练了一下,效果才这么好。
为什么GPT4的生物成绩也那么好?后来看一篇访谈,他们去找比尔·盖茨,说这个能力很强。比尔·盖茨正在搞生物科技,他说生物很难,这个东西能学会吗?没想到三个月以后一看,确实做的很好。这说明什么呢,今天大模型技术是靠数据驱动的,如果在某方面数据喂的足够多,在这方面能力就会真正提升。未来在不同的行业,不同的数据下,都有可能产生很强的能力。这是一个30美金,永不辞职,永远在线的员工,找它要一个文档不会几周之后才给你,几分钟就给你了,没有任何延迟,从理论上说还越学越聪明,对你的匹配度越来越高。
大模型应用未来可期,未来每个公司都有自己的大模型
未来只有两种人:
一种是AI的驾驭者,主动开放的心态去学习,拥有好奇心;
还有一种是被动型,我们叫躺平享受者,但是还没达到这个阶段,这中间会痛苦一段。
为什么会有这样的思考呢?我女儿寒假之后开学我在送她的路上给她讲了半天AI时代多好多好,突然一下我脑袋空白了,我忽然想到一个问题,这个时段她应该学什么呢?这个问题困扰了我一段时间,后来我发现只要你有主动性,学习技能不是为技能本身,而是因为学习的能力,因为思考的深度,为了自己的好奇心,其实什么技能都可以学。不要因为这个技能AI会了就不学,因为我们看中的是心态和过程。
我相信未来是两个圈。AI有一个很强的能力圈,看得见的未来和看不见的未来。看得见的未来是不可能完全替代人类的,所以一定是这样的互补,因为AI是一个大号的计算器,ChatGPT就是计算下一个词的概率,它就不断计算,所以它没有主动性,也没有所谓情感。这时候,你的主动性、创造力,作为创业者如何能真正更大范畴想问题,深入的去思考才是最关键的。
真正创业的话,机会在哪里呢?我画了一张图,今天大部分人的目光是在金字塔尖的,也就是过去几个月风风火火大模型,千亿大模型,感觉没有千亿参数大模型都不好意思出来见人。大家一聚会,你没有训大模型,都不好意思说是这个行业的。我不这么认为,所有的东西就像原点爆发一样,都是从一个技术点不断的爆发,然后就开始往下。比如行业的垂直大模型,三个月前大家都不敢这么提,因为大家还懵着,没有千亿参数就不能干活了。现在看到500亿,100亿的,最近阿里发了通义千问70亿的参数模型,在某些任务表现上都已经不错了。也就是说,这个技术OpenAI做出来了,捅破了那层窗户纸。随着各行各业,各种智力的人进来,参数的简化是未来很大的机会。
再往下是做应用,我实在买不起GPU,或者不想做算力怎么办?没有关系,做应用也是很大的机会。作为很多不是科技行业的人怎么办,最简单的方式就是把HR(人力资源)改名IR(智能资源),就是考核一下智能水平,检查一下我现在有哪些东西用了大模型,用了AI技术。这件事反正在我们公司已经发生了,我们公司到处挂的横幅都叫明天替代你的不是AI,而是会AI的同事,我们内部成立大概超过10个小组,每个小组都琢磨在自己这个工作范畴内如何用AI去优化。其实应用这个基座更大,而且机会更多。
我和朱啸虎有一个争论,我有一天发了一个朋友圈,他在底下回,突然第二天上了新闻头条。他发了文章说大模型要吞噬99%的应用,做应用没有价值。ChatGPT太强了,你问它都知道,还做啥应用呢,问它就好了。事实上会这样吗?我经过这几个月深度思考发现并不会。大模型是建立在公开数据之上的,需要协同才能完成专业工作。我现在越来越理解什么叫做暗知识,比如我们今天理解牛顿,只能通过三大定律那本书。真正要了解牛顿,或者学习他,如果你有时间和他喝杯咖啡,经常跟他聊、讨论,才能知道他更多知识。
今天我们公司开大量会议,这些在互联网上都找不到的,大模型完全没法知道。大家用久了ChatGPT也会发现一个问题,你问它什么都看上去正确,但好像没有什么用,这就是一个问题。事实上并不是它没有什么用,而是它完全不了解你的背景、你的知识,所以应用就能很好打通这一点。
还有开源模型也在极大降低成本,一个大模型统治世界肯定不可能的,而且我认为大模型未来会非常便宜。第一点是私有化大模型会白菜价。我甚至认为每一个中等规模公司都会拥有自己的大模型,会有一个native。 因为大模型数据最值钱,如果大家都用公开网上的,所有开会流程都被公网大模型吸收了之后,突然一天它做个应用就超过你了,这是今天所有做应用,做行业创业者最担心的,我认为未来每个公司都有自己私有化的大模型。
开源大模型Llama2,性能接近ChatGPT,我们国家出了那么多大模型,和开源有极大关系,不完全统计,10亿参数规模以上大模型79个。大家知道OpenAI烧了很多钱,每次训练几千万美金。今天训练一个10亿参数的大模型,大概百万人民币就够了,甚至可以更少。这时候门槛是极度被降低的,所以未来大模型就会变得越来越平民化。
讲了这个之外还有一点,今天我们通过和大模型不断写应用,会发现大模型能力并不像大家想象的那样,会出现一个prompt在不同时间问它的回答是不一样的。今天的大模型远远没有到达人的那种能力稳定性。 所以,今天就要在上面做应用,应用就有可能成就价值。拿微软这个例子来看,微软这么大公司投资了OpenAI,又和Llama合作,它自己没有推出AI的大模型,这是为什么?微软想的非常清楚,就是把应用做好,因为在这个链条里应用是最肥的那一块,它的Copilot一旦和office打通,全世界都有它的Copilot。今天应用生态才真正决定大模型价值,我们一定要纠正一些看法,比如“越有技术的越赚钱”,事实上不是这样的,很多行业都被验证过,比如操作系统,其实操作本身不赚钱的,没有商业化多好的回报,反而是这上面构建的一系列应用。包括移动互联网,做应用的公司市值和它的盈利能力都很高的。抖音也是一个应用,并不是一个技术模型使用的设备。
今天应用解决了大模型公司的商业价值,你训个1000亿参数模型到底有没有价值,不是参数说了算,也不是某个指标在设置级上比别人好说了算,而是下面的应用。 前两天OpenAI刚刚收购了一个做游戏的团队,因为OpenAI是一帮科学家组成的公司,不会做应用,事实上OpenAI也意识到应用才是核心。
4、用新范式思考做大模型应用的机会
我们公司做的是这几项,行业大模型做了,但没有做千亿大模型,因为技术变化太快,千亿大模型一次砸个几千万,成本很高,所以先围绕应用做。怎么做应用呢,我觉得每个时代的应用都必须重新思考,如果你用过去的思路去思考应用,就一定做不出一款好的应用。举个例子,汽油车时代想造出一款好车根本造不出来,因为发动机不可能造得过别人。只有重新思考,用新的范式思考应用,比如用电池做底盘,就能做出一个特斯拉。如果在手机时代做一个智能机,无论怎么加硬键盘,怎么做都做不过诺基亚。只有你想放弃掉硬键盘,搞成触屏,变成多点触摸模式,那就是iPhone。
其实每个应用来说上面大的都是不一样的,在PC时代最流行的是Web,网站。但到移动时代网站不流行了,变成APP了。今天在AGI时代,人工智能时代,我们认为最核心是AI-Agents,这是在今天硅谷也特别火的概念,通过几个不同的、有特征的、有记忆、有个性的AI代理去完成一系列智能决策。 如果你今天想做一个交友APP,用ChatGPT的技术或者大模型技术去做,肯定做不好,陌陌可能能做,但你做不好。不能在过去范式下思考应用,而是在新的范式下思考应用才有机会。
我们第一波做的是toB。很多人讨论toC应用,今天在中国做大模型toC应用太难了,第一是因为巨头太强;第二,如果要做toC应用必须想出新的范式。 我们做的是toB,我们和很多企业主交流,拿了大模型给团队用,用个两三天就不用了,没有啥用,比如一个采购单怎么用,回答出来效果对我们没有用。因此我们做了一个“聚言”的产品,这个产品结合了多家大模型和自己大模型技术,然后做了很多文档的归类、整理,使得我们以前做的实体机器人真的可以和场景结合。以前我们的机器人每进一个餐厅,针对这个餐厅做大量的问题列表,他才能回答,那时候回答效果很不好。现在进餐厅,把菜单一拍,哪怕只提供几个招牌菜的信息就可以实现很好的交互效果。我们进景点,把导游词往里一放,它就真和一个导游一样,它可以根据导游词内容回答,而不是根据大模型通用去回答。在行业里,它可以根据公司一些产品知识去问答,实际上就是一个根据企业私有知识挖掘的产品,形成各种智能促销员、讲解员、客服、分析员等。
聚言解决方案原理,其实就是输入一些企业信息文档,它就来进行归纳整理。可能很多人说有很多在做的这个,我想和创业者说,不管怎么做,最后还是要拼实际效果。我们最看重的是它对文档的理解和回答率,这个回答率能做到多少是最核心的指标。我也很骄傲的说,我们自己的回答效率,在所有竞品中,我们回答的效果都比他们好,这其实真正是对知识的理解。我们还推出了聚言魔盒,这是一个二维码,希望大家了解一下,我们能为企业提供自己私有化的模型,这个效果我们认为不可能比ChatGPT好,但能达到大概80%的ChatGPT水平。让你极低廉的价格去拥有,而且所有数据都在这个机器上,不会外泄,所有数据都是归于企业私有的,不再会被大模型拿走。
这是我们自己的一个例子,我们给网站上增加了一个虚拟机器人,每次人家来浏览网站时就会有一个智能客服主动回答问题。用户自主浏览网页还是很麻烦的,得通过用户自己找网站,找到他所需要的信息。这个智能客服上了之后,我们在这个网站上留资转化率提高了3倍,这就是交互改变,能够让真正用户很快知道你的特点是什么的例子。
这是我们的另一个例子,以前我们做的服务机器人真正能发挥作用的是递送,但现在由于加了聚言,我们打造了一个营销利器,机器人真可以做成促销员了。现在进入一个餐厅通过系统会自动生成很多问题,主动问消费者要点什么。我们和双汇合作的案例,现在已经在双汇500多家超市正在落地,做新品的推销。以前传统厂商在行业里推销是非常麻烦的,它要培训大量的促销员,还要做招聘,还要做考核。双汇鳕鱼肠这个产品做得非常好,从海外食材进口,但就是卖不动,因为很多人不知道。现在搞成机器人以后,就会发现它能实现移动促销,我们用这到去进行效果分发以后,这个销售能够平均提高3-4倍。
今天大模型来得非常快,到底怎么创业说实话我也不是特别清楚,但我想说创业者的核心就是先做起来,你一定要相信大趋势。人工智能这一波绝对不是忽悠,它和过去元宇宙、web3都不一样,它是实实在在,已经明显可以看到的突破性和革命性,所以对我们来说先做起来。
未来2-3年人工智能发展将决定未来20-30年世界格局,对于科技行业从业者而言,你要为这样的时刻而活一生,不要浪费它。有些时候十年都毫无进展,有些时候几周就发生了几十年的变化。技术是有爆发点的,ChatGPT引领了这波大模型的爆炸,为整个应用创业带来了无限的可能,我也希望每个创业者一起摸索。我们今天也在摸索,我刚才讲的一切都有可能是错的。即便是错的也没有关系,至少我实践过,知道我错在哪里。当机会来临的时候,我就一定会找到这样的机会。
有句话:现在是过去的未来,而现在不是未来的过去。 现在发生了,过去会这样发生。我是不相信宿命论,我相信事在人为,未来这个社会会怎么样,其实取决于在座每一位的努力。绝对不会出现一个大模型,只要它一个,这个世界就可以躺平了,不是这样的。还有大量的机会,才能真正改变这个世界。