首页 > 新闻 >

AI大翻车!大模型测不出9.11和9.9哪个大!

发布时间:2024-07-19 19:42:58来源:网络转载

大模型测不出9.11和9.9哪个大

  【大模型测不出9.11和9.9哪个大】】近日,有媒体称,一道小学生难度的数学题难倒了一众海内外AI大模型,错法各有不同,12个大模型中,阿里通义千问、百度文心一言、Minimax和腾讯元宝答对了,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了。

  据了解,发现这个问题的是Riley Goodside,有史以来第一个全职提示词工程师,他目前是硅谷独角兽Scale AI的高级提示工程师,也是大模型提示应用方面的专家,经过反复尝试后,他发现想让AI上这个当,需要把选项放在提问前面,调换顺序就不会出错,只要选项在问题前面,改变提问的方式,如加标点、换词汇都不会有影响。

  有行业人士认为,生成式的语言模型从设计上就更像文字思维而不是数字思维,但针对性地语料训练或许能在未来逐步提升模型的理科能力。

本文链接:http://www.hongyuedao.com/content-6-4391-1.html

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。