AI大模型混战“真相”:投资人看得多投得少,20家公司仅获60亿元融资
来源:搜狐科技
作者:梁昌均
编辑:杨锦
图:2023世界人工智能大会上多家企业展示AI大模型产品和应用
“看得多、投得少”,“观望气氛比较浓厚”。谈及投资机构今年对AI大模型创业的态度,这是国内一些投资人和创业者的感受。
但在产业界,AI大模型依然火爆。刚刚结束的世界人工智能大会上,超30个大模型集体秀肌肉,国内互联网大厂和不少AI企业都已踏进大模型这条滚烫的赛道,百模大战已然开启。
在创投市场,王慧文、王小川、李开复等大佬先后入场,喊出要做中国的OpenAI、做中国最好的大模型等宣言,成为这波AI大模型浪潮中重要的一股势力。
据搜狐科技不完全统计,今年上半年,至少有20家大模型公司获得超过60亿元的融资。从全球来看,相关融资数量超过50笔,中美占据大头,均超20笔,涉及总额达1000亿元。
虽然国内交易次数较多,但金额在全球占比仅有6%,国内投资人出手并不阔绰,AI大模型投资市场稍显冷清。
同时,目前各方对大模型的创业价值并未达成共识,金沙江创投主管合伙人朱啸虎和猎豹移动董事长傅盛早前就因此互呛开怼。
远望资本创始人、迅雷创始人程浩判断,全球通用大模型不会超过10个,创业机会不大。这基本成为投资圈共识,百度CEO李彦宏此前也表示没必要重复造轮子。
但不少创业者难以认同。王小川就认为,创业公司一定有机会,而且没有包袱和更大的商业化压力,会比大公司跑得更快。
出门问问工程副总裁&首席科学家李维则对搜狐科技表示,大厂垄断通用大模型不大可能。“很多创业公司都推出了大模型,证明这件事已不是太大问题。”
尽管存在分歧,但也有共识,应用将是关键。从观望要不要做,到各路玩家纷纷入场,大模型已到要回答如何落地的阶段。无论对大厂,还是对创业公司来说,这都是一张必答卷。
大佬入局自带光环,谁在投资大模型?
ChatGPT横空出世,掀起第三波AI浪潮的大模型高峰,一批大佬下场创业。搜狐科技不完全统计,今年上半年,至少有20家大模型企业获得融资,且集中在早期的天使轮或A轮。
这些创业者基本自带光环,既有李开复、王慧文、王小川、李志飞、周伯文等有过创业或大厂背景的大佬,也有清华、人大、西湖大学等学院派新秀,其中清华尤为典型,生数科技、深言科技、月之暗面、清昴智能、面壁智能、聆心智能等背后都站着清华教授。
图:今年上半年公开获得融资的AI大模型企业 资料来源:公开信息、天眼查
从投资方来看,既有腾讯、百度风投、蚂蚁集团、好未来等产业资本,也有红杉、IDG、真格基金、创新工场、启明创投、经纬创投、奇绩创坛等风投。红杉最为活跃,至少出手5次,包括光年之外、深言科技、月之暗面和Project AI 2.0,腾讯则投资了光年之外、MiniMax、深言科技。
在融资规模上,此次统计的项目披露的融资总额超过60亿元。而公开数据显示,今年上半年,全球涉及AI大模型的企业融资有51笔,投融资金额超1000亿元,即国内交易数量占比近40%,但融资金额仅有约6%。
美国市场多笔大额交易占去了多数份额,包括微软向OpenAI投资100亿美元,比尔·盖茨、微软、英伟达等牵头向Inflection AI投资13亿美元,美国数据公司Databricks以13亿美元收购MosaicML。仅这三笔交易,金额占比就达到全球的九成左右。
这也在一定程度上显示出,虽然国内大模型内卷激烈,资本市场概念股翻倍暴涨,但一级市场投资人还是比较谨慎,尤其在大额交易方面逊色不少。
从事创投FA业务的42章经创始人曲凯透露,目前几乎所有的美元基金都在看AI,有些人民币基金也感兴趣。“很多机构看得很积极,但最后会出手的并不多,大概会有五六十家。”
出门问问工程副总裁&首席科学家李维也能感受到,投资界实际非常关注和看中大模型,但也很审慎。“毕竟这是一个投入大,但商业模式目前并不清晰的新技术方向。”
天使投资人、人工智能资深专家郭涛对搜狐科技分析称,越来越多的投资机构已意识到AI大模型面临投资金额大、回报周期长、成功率较低、行业竞争激烈、监管日益趋严等问题,因而出手趋于谨慎,目前观望气氛比较浓厚。
同时,郭涛认为,目前值得投资的AI大模型企业并不多,多数创业公司在技术、数据和生态层面几乎不具有显著优势,多数是以小成本试错的态度去尝试,很难获得投资机构的青睐。
此外,很多被看好的明星公司估值太贵,典型如光年之外,短短三个月估值从2亿美元冲到10亿美元,很多机构望而却步。这家公司的结局也颇为唏嘘,王兴的美团以超20亿元出手“救”下兄弟和投资者,王慧文因病提前退场。
延续互联网投资偏好,退热后开始拼落地
在AI大模型具体的投资方向上,投资机构几乎延续了互联网投资时代的偏好,应用层最受青睐。程浩称,远望资本就主要投中间件和应用层的公司。
曲凯透露的数据显示,今年拿到钱的AI项目中,做模型的有10%-20%,做infra/中间层的有20%-30%,做应用层的则有60%-70%。如果不算拿到钱的项目,做应用的项目可能达到95%。
从底层infra(如芯片、框架等基础设施),到模型层、中间件,再到各种应用,AI大模型产业也形成类似芯片产业的倒金字塔结构。在底层依赖国外开源技术且难以突破的情况下,国内创业公司大多押注应用层,成本高的模型层也仅是少数公司的游戏。
李维认为,创业公司主要做基础大模型和大模型下游应用,都去做基础大模型既不现实,也没必要。“因此很多初创公司倾向做垂直场景应用,以API调用或OEM私有化部署的方式,借力大模型供应方的大模型服务,聚焦数据和应用的创新研发,这会是比较清晰的方向。”
不过,这波大模型热潮似乎已开始趋冷,常引用的例证是ChatGPT流量见顶。据第三方网站SimilarWeb数据,今年6月ChatGPT的网站与移动客户端的全球流量环比下降9.7%,系去年底以来首次下滑,访客在网站上花费的时间也下降8.5%。此外,微软Bing、Character.AI等网站流量在6月也出现不同程度下滑。
“最近一两个月市场渐冷,原因是最近大模型的质变在减少,新出来的创业者和能讲的新故事都比年初少了一些。但每个赛道和热点都是有起有伏,这很正常。”曲凯表示。
他认为,AI大模型下一个阶段要拼实际的落地,下一波热点大概要在两三个月后,大量上半年拿到钱的项目,需要几个月才能完成产品上线,那时可以再看是否能出现更多更好的killer app,也可以看下谁到时会是应用层的带头大哥。
实际上,目前大厂也在拼大模型落地和商业应用。华为近日在发布盘古3.0时就表示,希望用其来帮助各行各业,而非专注在语音大模型层面。“我们忙着做事,没有时间作诗。”
郭涛认为,虽然AI大模型有所降温,但整体来看还将会持续一年左右的时间,而关注点将逐步从底层技术层面过渡到垂直应用层面。
小冰CE0李笛则判断,现在的大模型同质化严重,市面上根本用不了这么多大模型,2024年应该就会退热,发现谁在岸上谁在裸泳。
通用模型没机会?垂直赛道同质化严重
对创业者来说,如何在入场前想好方向极其关键。朱啸虎表示,ChatGPT对创业公司很不友好,未来两三年内要放弃融资幻想。傅盛就此互怼,称“我们的投资人无知者无畏”。
随后,朱啸虎又解释到,自己并非否定大模型领域创业机会,而是提醒创业者不要迷信通用大模型。“对于大部分创业者,场景优先,数据为王。”
这种观点基本已成为当下国内投资圈的共识。郭涛认为,通用大模型将会形成一定垄断局面,创业者和“小厂”布局通用大模型,在资金、技术、数据和生态上均处于劣势地位。
“通用大模型护城河非常高,它的网络效应也很强,用户反馈会让它越来越聪明,先做出来的企业会有先发优势。”程浩也认为,创业公司做通用大模型机会不大,只有大厂能玩得起。
同时,他认为,未来通用基座模型也不需要那么多公司。“可能全世界未来真正能够用到的闭源和开源加起来的通用大模型不超过10家,这还是往多了说。”
但不少创业者并不认同。“很多创业公司已推出大模型,证明这件事不是太大问题。如果要达到GPT-4的水平,头部大厂同样很困难,想要垄断现在看来也不大可能。”李维表示。
他认为,创业公司做大模型虽然在硬件资源和工程力量上无法与大厂相比,但优势是更接地气,有总体的落地路径或产品需求,不是为了大模型而大模型。
“基础大模型也并非铁板一块,有一定的伸缩余地,创业公司可以从十亿、百亿的模型练起,然后根据自身需求和后续资源来决定是否继续研发千亿级别的模型。”李维表示。
不少创业公司做大模型正是遵循这样的路线。比如百川智能先推出70亿参数模型,并还在训练500亿参数模型,基本没有创业公司选择去做千亿参数的大模型。
在李维看来,模型大小不是唯一的指征,应用场景也是重要的参考维度。“对于大多数应用,超大规模模型就像是大炮打蚊子,不仅推理时间长,费用大,而且很难应用部署,在实际效果上并没有什么意义。”
因此,李维认为,盲目竞争求大求全,不应该是大模型研发创新的主流,推动大模型轻量化、垂域化是更有意义的良性竞赛,这对推动大模型尽快落地和产生价值至关重要。
程浩认为,未来很多中小企业会有自己的垂直模型,而创业公司更多的机会是在垂直赛道上做应用或工具链。“大部分投资机构还都是看垂直行业的赛道,像王小川、王慧文这种,很大程度上是在赌人,并不是赌做通用大模型这件事。”
不过,选择垂直赛道的技术路线也面临不少挑战。李维就坦言,大模型在垂直领域的规模化落地会比想象的要艰难。
他认为,目前的挑战之一是变化太快,让人眼花缭乱,创业公司与大模型供应方的对接和互选产生困难,多数大模型还未出现可以应用的成熟服务,上下游存在无法无缝对接和匹配的问题。
同时,目前还存在技术同质化、商业互卷等问题。“鼓励技术竞争和模型差异化发展,协调商业合作、减少商业互卷是技术公司和社区应该共同努力的方向。”李维呼吁到。