2024年6月25日星期二

AI高考成绩揭晓!GPT-4o、文心一言考上一本,Kimi落榜

点击蓝字关注我吧!

自打GPT-4o问世以来,关于大模型之间孰强孰弱的新一轮争论热度陡增。
随着各省2024高考成绩陆续公布,有媒体举办了一场别样高考,快来看看各位备受期待的"大模型学霸"表现如何。
在2024年高考新课标I卷全科目测试中,GPT-4o文心4.0领衔总分前三甲。结合高考大省河南2024年的招生文科一本录取分数线来看,它们都能顺利考上一本。
 类比一下,能在高考大省顺利考上一本,GPT-4o、文心4.0等模型的综合能力还是非常出色的。
具体来看,百度的文心4.0在物理、生物等科目拿下全场最高分,显著领先于GPT-4o;在语文、英语、历史、化学等科目上毫不逊色于GPT-4o。
值得一提的是,在被认为最有挑战性的数学卷上,文心4.0在毫无准备、近乎"裸考"的第一次测试中,得到最高的66分,力压GPT-4o登顶第一。可以说,给咱们国产大模型长脸了。

其中,在卷面分值最多、难度最大的解答题方面,文心4.0拿下18分,而GPT-4o仅得14分。另外,在选择题方面,文心4.0拿下48分,GPT-4o只得到38分。可以说,在数学能力这道分水岭面前,文心4.0经受住了考验,证明了自身实力的强悍。
现在打开文心一言APP,用户可以随时体验文心4.0的数学能力,比如解答一元五次方程,完全是小菜一碟。强大的数学能力,已经让文心一言APP成为了辅助孩子学习的重要工具。
令人意外的是,在这一轮高考题目测试中,无论是全科目测试还是数学测试,通义千问、Kimi等多款近期热度很高的国内大模型,整体表现都有些不太理想,看来还有很大的进步空间。
在笔者看来,打造一款高人气、高性能的AI大模型,无疑是每一家科技厂商的梦想。作为一项将给人类带来深远影响的科技,大模型完全可以做到兼备"人气旺"与"性能强"。
大模型发展长路漫漫、挑战重重,唯有务实、理性能帮助我们到达理想的彼岸。
期待更多国产大模型能摆脱各类榜单排名与参数PK带来的喧嚣,潜心铸剑、历经考验与淬炼,真正修成正果,站上世界舞台,与顶级大模型一决高下。

没有评论:

发表评论

有问题找小红书,也不行了。。。

前几天,AI 仅退款的词条冲上了热搜。 点进去一看,是某些羊毛党利用平台支持仅退款的规则,用 AI 工具生成虚假瑕疵证据。 比如,给新鲜水果P出霉斑、给新衣物添加破损、伪造充电宝鼓包等,假装商品破损。 不仅是在消费者这一端,很多商家也在使用 AI 工具过分"美化...