初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

by 佚名

2023-07-14

约 1302 字 - 预计阅读 3 分钟

其它文章

推荐平台	链接	平台介绍
币安网	注册链接	币安是全球领先的区块链生态系统，推出了一系列产品，其中包括最大的加密货币交易平台。我们的使命是在未来成为全球性加密货币基础架构供应商。
欧易OKX	注册链接	欧易是全球著名的数字资产交易平台之一，主要面向全球用户提供比特币、莱特币、以太币等数字资产的币币和衍生品交易服务。
HTX火币	注册链接	火币全球专业站，是火币集团旗下服务于全球专业交易用户的创新数字资产国际站，致力于发现优质的创新数字资产投资机会。

“我用几个模型计算得到的结果都不一样……”

7月14日，一位群友使用AI帮助计算一道数学题：高为11cm，上底直径为7.8cm，下底直径为6.2cm的圆台的容积为多少毫升？

这位网友使用了Claude-2、GPT-4、ChatGPT，得出的结果分别是：3634.57毫升、359.4毫升、469.3毫升。

另一位群友用文心一言得出的结果是64474.666666666635毫升。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

“初中题不会了”，“好家伙，各不相同”群友们七嘴八舌地评价。

我也好奇地使用ChatGPT测试了一下，得出的结果是1436.08毫升。

ChatGPT给出的计算步骤是完全正确的，圆台的容积公式=πh*(R^2+r^2+R*r)/3。

然而计算的结果是错误的。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

我让ChatGPT再次回答，得出的结果是513.47毫升。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

就离谱，计算步骤完全正确，最后的结果竟然每次都不一样。

我又使用了百度浏览器自带的“AI”，这是由文心一言支持的大模型。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

第一次得出的结果是：193522.10746113118毫升

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

这错的太离谱了，我又问了一下得出的结果是：1168.75毫升

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

还是不对，我又问了一下，结果是：1099620毫升

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

再三追问下，百度AI不装了，彻底摆烂了。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

此前报道，GPT-4在MIT的数学本科学位考试中拿下满分，后来被曝出测试数据集的很大一部分被污染了。也就是说，模型就像一个学生在考试前被告知了答案，这是赤裸裸的「作弊」。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

此前还有报道，ChatGPT在参加中国高考数学考试中翻车‌。

初中题都不会了，ChatGPT、文心一言、Claude露出鸡脚了？

大模型无疑是最近被追捧的技术，然而频出的翻车案例，似乎如此前物理学者、科普作家张天蓉所说，语言模型本质是概率论的胜利‌，通俗的意思就是一个会“文字接龙”的机器 ，变换器对输入进行一个合理的延续，闹出一本正经地胡说八道的笑话也就不难理解了。

若大模型是概率论的胜利，那么人工智能觉醒还远未到来。

推荐平台	链接	平台介绍
Gate芝麻开门	平台介绍	Gate.io芝麻开门创立于2013年，是全球真实交易量TOP10的加密货币交易平台，向全球数千万用户提供安全可靠、真实透明的数字资产交易服务。
Bitget	注册链接	Bitget的背后是一群区块链技术的早期接受者，也是区块链未来发展的信仰者，一直致力于提供安全、一站式的交易解决方案，帮助用户更聪明地交易。
Bybit	注册链接	Bybit通过数字资产与传统金融的结合，引领数字资产的生态发展。提供一流的流动性，致力于打造业内最安全、公平、高效及人性化的交易服务平台。
派网	注册链接	派网提供多样化的量化交易机器人，用户可依照自身交易需求和策略选择最适合的机器人。同时派网也提供合约交易与合约网格机器人，给予更方便的合约交易体验。