大模型需要实干派
原创:吴先之 文烨豪
编辑:王潘
来源: 光子星球
图片来源:由无界 AI生成
国内大模型战事,一度被诸多疑云所笼罩。而随着京东、腾讯接连入座,这场复杂的牌局正变得明晰起来。
百度与阿里,作为国内最早一批大模型玩家,在“先声夺人”的同时亦争得了早期的流量。相比之下,腾讯、京东虽起步稍晚,但其更能深入审视大模型赛道,以加深对行业的理解。
正因如此,一些发布大模型相对较晚的大厂并未盲从大众,投入通用大模型的大潮。例如此前华为大模型提到实用性,而京东凭借着自身在产业、供应链等方面积累的深厚积累,选择了一条更有远见且更具针对性的路径,并在2023京东全球科技探索者大会暨京东云峰会(JDD大会),推出面向产业的京东言犀大模型。
在通用大模型混战的当下,京东推出的言犀大模型和其产业价值创造路径,既是建立大模型商业秩序的绝佳尝试,亦为整个行业带来全新的思考和方向。在大模型的商业化滞水里,距离落地更近的产业大模型,极可能在未来的大模型竞逐中一路领跑,成为一股不可忽视的新生力量。
大模型,既不是“故事”也不是“玩具”
每一轮科技演替的浪潮,往往也裹挟着大量的泥沙。
从早年的芯片、机器人,再到AI,每一波浪潮里,总有一些别有用心的玩家混迹于其中,将科技与营销混淆在一起,使原本清澈的赛道愈发浑浊。现阶段的国内大模型赛道,亦是如此。
赛道的一侧,玩家们苦苦摸索着大模型的技术脉络,并试图找寻落地方向;而在另一侧,纵使是和科技领域八竿子打不着一块的公司,也在纷纷下场,训练出所谓的“大模型”产品——不得不承认,当下“万物皆可大模型”的局面,颇有两年前“万物皆可元宇宙”的意味。
显然,当所谓的“大模型”变成一个代名词,服务于自身“讲故事”的诉求,而非创造实际价值,那大概率只能奔赴元宇宙的宿命。而这,对那些老实钻研技术的玩家们而言,同样成立。毕竟技术本身很难直接创造价值——大模型的终点,并非训练出通用大模型本身,而是让技术产生价值,进而实现成熟的商业化落地。
因此,追风蹭热者们看似滑稽的操作,其实给大模型赛道敲响了一记警钟。毕竟点燃AIGC的ChatGPT,潜移默化地影响着玩家们的大模型观,使一众玩家纷纷奔赴通用大模型,推出多款ChatGPT的“变种”。
客观地说,通用大模型有其价值所在,但在竞争维度愈发剧烈的当下,通用大模型并非坦途:
一方面,玩家们纷纷涌向单一领域,极有可能陷入“重复制造轮子”的境遇,想要从充斥着国内外科技巨头的战场中突围,难度可想而知。
另一方面,通用大模型是典型的消费与付费分离的产物,稍有不慎便会沦为“玩具”。
举一个简单的例子,广泛的C端用户或许会向其咨询问题乃至探讨宇宙和天空,但绝大部分普通用户其实并没有生产力诉求,在短期密集体验后,对新兴科技的新鲜感便会迅速丧失,未必有长期使用的动力。
基于此,纵使当下的通用大模型能在一定程度上提升内容创作效率,除了部分内容行业与组织内部降本增效以外,其尚未跑出成熟、可复制的商业模式。可以预见,随着通用大模型赛道日益拥挤,玩家们势必将在商业化延展层面面临诸多考验。
归根结底,“奇点”已至的当下,大模型不仅是科技演替的里程碑,更是塑造未来的关键驱动力。因循该逻辑,现阶段大模型战事绝非一场短程竞速,而是一项系统性工程。玩家们若想穿越周期、熬到终点,不能只靠技术层面的单点突破,而是需要同步思考技术方向、场景应用、商业模式等诸多维度。
产业大模型,“百模大战”的新战线
从1997年,“深蓝”战胜象棋大师加里·卡斯帕罗夫,到“阿尔法狗”杀入围棋圈,再到视觉系AI与自动驾驶,AI过往经历了多轮振奋人心的演化,每一轮仿佛都站在应用爆发的边缘,可满枝的花骨朵,却又迟迟未能开出繁花。
这背后的主因在于,技术尚未在产业端形成深厚的应用,毕竟科技进步的终点,不是在困在实验室里,而是落地下潜,走向“现实世界”。
因循该逻辑,审视现如今的通用大模型赛道,距离在真实商业场景落地生根并创造出实际价值,仍有着不少距离。
京东集团CEO许冉在JDD大会现场表示,大模型本身是实现产业价值的工具,而不是目的,大模型真正实现自己的价值,一定是在产业应用中。
换言之,大模型不是目的,应用才是目的。
当下的大模型厂商,往往会将模型参数视为大模型好坏的检验标准。殊不知,在商业落地层面,巨大的参数亦对应着高企的成本,亦存在着相应时间长、并发性差等问题。
一个简单的例子,部分“参数怪兽”,每回答一个问题就要耗费两三毛钱,还需等待5-10秒,就算回答得再精准,也很难实现大规模的商业化落地。此外,目前通用大模型85%左右的准确率,对于普通用户而言或许已经足够,但在严肃的商业场景下,此番误差很有可能对业务产生难以忽视的影响。
针对应用问题,京东多条业务线技术负责人都提到,人们会因为GPT一个编造的回答付之一笑,可一旦落实到实际应用过程中,任何偏差都导致巨大损失。
京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬博士曾亲身经历过一件事情,颇有代表性。“一个大模型回答143开平方,给出的答案是11.5(实际上约等于11.96),如果在实际应用场景中,这个答案将会带来巨大损失。”
在技术领域,模型参数、精度固然重要,但在商业世界中,大模型本身好用且稳定才是关键。而在此方面,同细分产业紧密关联的产业大模型,无疑存在着天然的优势。
只是,研发产业大模型绝非易事。众所周知,训练数据是大模型学习的基础,亦决定了大模型的泛化能力与应用场景。因此,除了技术层面的突破,源于产业的一手场景、数据,对研发产业大模型而言同样重要。
以京东为例,其之所以会推出面向产业的言犀大模型,很大程度上便源于其浓厚的产业基因。毕竟在一众国内大厂中,链接着消费市场与供应链两端的京东,同产业的绑定甚强,亦具备大量优质数据。
据悉,言犀大模型训练时,便融合70%的通用数据与30%数智供应链原生数据。可见,京东并不纯粹强调参数,也非刻意讲述“故事”,而是将重点放在“调教”层面,旨在打造出同产业高度相融的大模型。
产业大模型,或将成为大模型赛道迈向大规模商业化的重要一步,而逐渐参透该逻辑的玩家们,亦在渐渐上车。
近日,迟迟按兵不动的腾讯,发布了自己的行业大模型;高举通用大模型大旗的百度,亦端出覆盖交通、能源等领域的行业大模型。不难看出,随着巨头们纷纷加码,更贴近商业化的产业大模型,已然成为了“百模大战”的新战线。
狭路相逢,得“场景”者胜
无论是通用大模型,还是产业大模型,构筑出新的商业秩序始终绕不开“场景”。
换言之,对于落地而言,晦涩的技术名词、炫目的商业PPT均是空中楼阁,只有将大模型能力真正运用到场景中,并产生实际价值,才能打通良性循环。
而在各行各业AIGC需求井喷的当下,为大模型找到所谓的应用场景,本身并不算难。可若想找到适合大模型大规模落地,并跑通商业化路径的场景,则可能要经历大量的弯路。
因循该逻辑,已然端出大模型的玩家们,正在各种细分领域不断尝试,试图寻找属于自身的落脚点:
百度抓住一年一度的高考热点,推出AI志愿助手,活用大模型能力的同时,亦试图借此打入C端市场;阿里则以天猫精灵为锚点,探索大模型在消费电子领域的发展空间。
发力产业大模型的京东,则提出了“大模型的价值=算法×算力×数据×产业厚度的平方”的公式,而所谓的“产业厚度”,正是由一个个具体的场景堆砌而成。
无论路径如何,大模型玩家们抵达“应许之地”之前,势必将不断试错,乃至穿越“红海”。
面对大模型的落地难题,部分玩家选择扮演“卖水人”的角色,帮助企业构建属于自己的大模型。而打法一向务实的京东,则提出了“三步走”战略,即先搭建通用大模型,然后在内部探索场景与应用,而后逐步将能力对外开放——将自身作为试验田的同时,亦自我消化掉试错成本,以确保大模型产品能创造实际价值。
据悉,在京东内部,大模型不仅已经嵌入了数智营销、运营流程优化、客户服务等常见应用场景,更已延伸至零售、物流、金融、健康等诸多垂直场景。
以物流领域为例,面对这一门繁杂的系统工程,京东跑出了多条探索路径:历时5年打造的供应链产品京慧,除了丰富的AI预测、运筹优化等原生算法外,通过开放生态技术,不仅能很好的与异构系统的算法及数据互联互通,在大模型的加持下,在销量预测、库存、供应及补货计划方面更具表现力,同时由于AIGC的广泛应用,其交互式供应链控制塔能够帮助用户快速定位并解决供应链问题。
在基金理财场景,京东金融“智能选基”产品上线。传统的基金筛选,理解成本高,操作繁锁,直接影响交易成功率。借助大模型,京东在意图匹配、算法生成、意图识别、多轮对话等环节进行优化,使常见筛选问题准确率达90%,有效提升客户体验和交易效率。这一产品后续也将全面服务于金融机构。
由此可见,京东的“三步走”战略已初见成效,并已逐渐浸润到物流、金融等垂直行业的肌理之中。可以预见,随着战略逐渐铺开,京东亦将不断积累落地场景、高质量数据,从而转动起产业大模型商业落地的飞轮。
归根结底,看似复杂的大模型战事,终究要回归一个核心问题,即技术如何为实体产业带来实际价值。而现阶段,道路不同的玩家们,只能在这场漫长的马拉松,逐渐摸索、实践出问题的答案。