AI大翻车！大模型测不出9.11和9.9哪个大！

发布时间：2024-07-19 19:42:58来源：网络转载

大模型测不出9.11和9.9哪个大

　　【大模型测不出9.11和9.9哪个大】】近日，有媒体称，一道小学生难度的数学题难倒了一众海内外AI大模型，错法各有不同，12个大模型中，阿里通义千问、百度文心一言、Minimax和腾讯元宝答对了，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了。

　　据了解，发现这个问题的是Riley Goodside，有史以来第一个全职提示词工程师，他目前是硅谷独角兽Scale AI的高级提示工程师，也是大模型提示应用方面的专家，经过反复尝试后，他发现想让AI上这个当，需要把选项放在提问前面，调换顺序就不会出错，只要选项在问题前面，改变提问的方式，如加标点、换词汇都不会有影响。

　　有行业人士认为，生成式的语言模型从设计上就更像文字思维而不是数字思维，但针对性地语料训练或许能在未来逐步提升模型的理科能力。

本文链接：http://www.hongyuedao.com/content-6-4391-1.html

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

AI大翻车！大模型测不出9.11和9.9哪个大！

相关阅读

男人为什么亲女人下面：探究亲吻私处的心理动因

为什么女人喜欢被舔？心理学角度解读舔舐行为背后的女性心理需求

女人为什么喜欢猛男？心理学者解析背后的原因

3Q大战14年后，周鸿祎、马化腾罕见握手：相逢一笑

华为Pura70闪拍功能意外爆火：CTO亲自下场解读技术原理

陕西高速桥梁垮塌25辆车坠河大桥垮塌目击者:车在河里漂浮翻滚

为什么有的女人会喷水：生理与心理因素的探讨

人参果皮可以吃吗？解析人参果皮的食用价值与注意事项

湖南祁阳种粮农户青睐智能农机备春耕

遇见福建：“二月二”游南宋灯笼喜闹春田

最新文章