推荐平台 链接 平台介绍
币安网 注册链接 币安是全球领先的区块链生态系统,推出了一系列产品,其中包括最大的加密货币交易平台。我们的使命是在未来成为全球性加密货币基础架构供应商。
欧易OKX 注册链接 欧易是全球著名的数字资产交易平台之一,主要面向全球用户提供比特币、莱特币、以太币等数字资产的币币和衍生品交易服务。
HTX火币 注册链接 火币全球专业站,是火币集团旗下服务于全球专业交易用户的创新数字资产国际站,致力于发现优质的创新数字资产投资机会。

“我用几个模型计算得到的结果都不一样……”

7月14日,一位群友使用AI帮助计算一道数学题:高为11cm,上底直径为7.8cm,下底直径为6.2cm的圆台的容积为多少毫升?

这位网友使用了Claude-2、GPT-4、ChatGPT,得出的结果分别是:3634.57毫升、359.4毫升、469.3毫升。

另一位群友用文心一言得出的结果是64474.666666666635毫升。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

“初中题不会了”,“好家伙,各不相同”群友们七嘴八舌地评价。

我也好奇地使用ChatGPT测试了一下,得出的结果是1436.08毫升。

ChatGPT给出的计算步骤是完全正确的,圆台的容积公式=πh*(R^2+r^2+R*r)/3。

然而计算的结果是错误的。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

我让ChatGPT再次回答,得出的结果是513.47毫升。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

就离谱,计算步骤完全正确,最后的结果竟然每次都不一样。

我又使用了百度浏览器自带的“AI”,这是由文心一言支持的大模型。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

第一次得出的结果是:193522.10746113118毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

这错的太离谱了,我又问了一下得出的结果是:1168.75毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

还是不对,我又问了一下,结果是:1099620毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

再三追问下,百度AI不装了,彻底摆烂了。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

此前报道,GPT-4在MIT的数学本科学位考试中拿下满分,后来被曝出测试数据集的很大一部分被污染了。也就是说,模型就像一个学生在考试前被告知了答案,这是赤裸裸的「作弊」。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

此前还有报道,ChatGPT在参加中国高考数学考试中翻车‌。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

大模型无疑是最近被追捧的技术,然而频出的翻车案例,似乎如此前物理学者、科普作家张天蓉所说,语言模型本质是概率论的胜利‌,通俗的意思就是一个会“文字接龙”的机器 ,变换器对输入进行一个合理的延续,闹出一本正经地胡说八道的笑话也就不难理解了。

若大模型是概率论的胜利,那么人工智能觉醒还远未到来。

推荐平台 链接 平台介绍
Gate芝麻开门 平台介绍 Gate.io芝麻开门创立于2013年,是全球真实交易量TOP10的加密货币交易平台,向全球数千万用户提供安全可靠、真实透明的数字资产交易服务。
Bitget 注册链接 Bitget的背后是一群区块链技术的早期接受者,也是区块链未来发展的信仰者,一直致力于提供安全、一站式的交易解决方案,帮助用户更聪明地交易。
Bybit 注册链接 Bybit通过数字资产与传统金融的结合,引领数字资产的生态发展。提供一流的流动性,致力于打造业内最安全、公平、高效及人性化的交易服务平台。
派网 注册链接 派网提供多样化的量化交易机器人,用户可依照自身交易需求和策略选择最适合的机器人。 同时派网也提供合约交易与合约网格机器人,给予更方便的合约交易体验。