AI I024: AI高考成绩揭晓！GPT-4o、文心一言考上一本，Kimi落榜

2024年6月25日星期二

点击蓝字关注我吧！

自打GPT-4o问世以来，关于大模型之间孰强孰弱的新一轮争论热度陡增。

随着各省2024高考成绩陆续公布，有媒体举办了一场别样高考，快来看看各位备受期待的"大模型学霸"表现如何。

在2024年高考新课标I卷全科目测试中，GPT-4o、文心4.0领衔总分前三甲。结合高考大省河南2024年的招生文科一本录取分数线来看，它们都能顺利考上一本。

类比一下，能在高考大省顺利考上一本，GPT-4o、文心4.0等模型的综合能力还是非常出色的。

、

具体来看，百度的文心4.0在物理、生物等科目拿下全场最高分，显著领先于GPT-4o；在语文、英语、历史、化学等科目上毫不逊色于GPT-4o。

值得一提的是，在被认为最有挑战性的数学卷上，文心4.0在毫无准备、近乎"裸考"的第一次测试中，得到最高的66分，力压GPT-4o登顶第一。可以说，给咱们国产大模型长脸了。

其中，在卷面分值最多、难度最大的解答题方面，文心4.0拿下18分，而GPT-4o仅得14分。另外，在选择题方面，文心4.0拿下48分，GPT-4o只得到38分。可以说，在数学能力这道分水岭面前，文心4.0经受住了考验，证明了自身实力的强悍。

现在打开文心一言APP，用户可以随时体验文心4.0的数学能力，比如解答一元五次方程，完全是小菜一碟。强大的数学能力，已经让文心一言APP成为了辅助孩子学习的重要工具。

令人意外的是，在这一轮高考题目测试中，无论是全科目测试还是数学测试，通义千问、Kimi等多款近期热度很高的国内大模型，整体表现都有些不太理想，看来还有很大的进步空间。

在笔者看来，打造一款高人气、高性能的AI大模型，无疑是每一家科技厂商的梦想。作为一项将给人类带来深远影响的科技，大模型完全可以做到兼备"人气旺"与"性能强"。

大模型发展长路漫漫、挑战重重，唯有务实、理性能帮助我们到达理想的彼岸。

期待更多国产大模型能摆脱各类榜单排名与参数PK带来的喧嚣，潜心铸剑、历经考验与淬炼，真正修成正果，站上世界舞台，与顶级大模型一决高下。