豆包AI高考成绩突破清华北大录取分数线,文科成绩高达683分领先国内外顶级人工智能模型

字节跳动Seed团队近日公布了2025高考全科测试的惊人结果:豆包Seed1.6-Thinking模型在高考中取得文科683分、理科648分的优异成绩,达到清华北大录取分数线,在国内外AI模型高考测试中表现抢眼。

字节跳动抖音豆包大模型

此次测试采用全国新一卷和山东省自主命题试卷,豆包与谷歌Gemini2.5Pro、DeepSeek R1、OpenAI o3等5款国内外顶级AI模型同台竞技。豆包文科成绩683分在参测模型中获得最高分,理科成绩648分仅次于谷歌Gemini2.5Pro的655分。在单科表现上,豆包在语文、英语、物理、历史、地理、政治六门学科均获最高分,数学成绩也超过140分,展现出色的逻辑推理能力。

在这场AI"高考大战"中,各模型展现了不同的学科优势。DeepSeek R1获得数学单科最高分145分,Gemini2.5Pro以82分获得化学最高分,OpenAI o3则与Gemini2.5Pro并列生物最高分77分。这种差异化表现反映了不同AI模型在知识结构和推理方式上的特色。

QQ20250626-095943.png

Seed团队发现了一个重要技术细节:首次测试中由于网络版考卷清晰度较低,各大模型在化学、生物等依赖图像的科目中普遍丢分严重。在获得高清版试题图片后,团队采用图文交织方式重新测试,结果显示豆包在化学、生物两科提升近30分,理科总成绩可达676分。这一发现验证了全模态推理对激发模型潜力的重要作用,为AI在视觉理解和跨模态推理方面的发展提供了重要启示。

山东省采用"3+3"高考模式,语数英为基础学科,另选三门科目采用等级赋分制。据当地资深高中教师分析,豆包赋分成绩组合最高可达690分左右,参照2025年山东地区一分一段表,排名约在前80位,成绩足以冲击清华、北大等顶尖学府。这一表现不仅展示了豆包的绝对实力,更体现了其在复杂评分体系下的适应能力。

豆包在高考中的出色表现不仅展示了其强大的知识储备和推理能力,更重要的是验证了多模态AI在复杂认知任务中的巨大潜力。特别是在图文结合的理科题目处理上,豆包展现出的近30分提升幅度,为AI教育应用提供了新的技术路径。这一成绩的取得,标志着国产AI大模型在综合认知能力上已达到国际先进水平,为AI在教育领域的深度应用奠定了坚实基础。

猜你喜欢

上古卷轴刀锋的种族分类详解 哪一种族在游戏中最具优势
上古卷轴刀锋的种族分类详解 哪一种族在游戏中最具优势

在上古卷轴刀锋中有多个种族,每个种族都有自己的特色,玩家可以自由的选择不同的种族,今天小编就来分享下全种族属性,感兴趣

光遇中蓝色光芒的具体位置详解以及如何找到它的方法
光遇中蓝色光芒的具体位置详解以及如何找到它的方法

在光遇中有很多的任务,每个任务的要求都是不同的,收集蓝色光芒就是其中一个任务要求,那么蓝色光芒在哪收集?想知道的就来看看

剑与远征耀光三宝阵容搭配全解析与最优组合思路分享
剑与远征耀光三宝阵容搭配全解析与最优组合思路分享

剑与远征耀光三宝最强阵容搭配思路

公主连结咲恋夏日阵容强度分析及最佳阵容搭配攻略
公主连结咲恋夏日阵容强度分析及最佳阵容搭配攻略

公主连结咲恋夏日即将上线,这是一个非常厉害的角色,玩家可以通过抽取获得,那么咲恋夏日如何组阵容比较厉害?下面就来看看吧!

以校之名2学费收取标准及具体金额是多少?
以校之名2学费收取标准及具体金额是多少?

在以校之名2中有很多有趣的玩法,其中一个就是收学费,这个需要玩家去收取,那么收学费有哪些技巧?感兴趣的就来看看吧!以校

蓝月传奇2战士英雄技能搭配全攻略及最佳阵容推荐
蓝月传奇2战士英雄技能搭配全攻略及最佳阵容推荐

蓝月传奇2战士必带英雄技能搭配攻略

原神中的渔获效果具体是什么样的?渔获在游戏中的实用性如何呢
原神中的渔获效果具体是什么样的?渔获在游戏中的实用性如何呢

原神2 1版本中将会上线不少的内容,其中就包括了新的武器,渔获就是其中一款武器,那么渔获怎么样?想知道的就来看看吧!原神

全民奇迹2中翅膀注灵的最佳搭配与实战技巧详解分享
全民奇迹2中翅膀注灵的最佳搭配与实战技巧详解分享

全民奇迹2翅膀注灵最优搭配与实战技巧分享

如何在泰拉瑞亚手机版中成功触发情人节活动以及相关技巧与建议
如何在泰拉瑞亚手机版中成功触发情人节活动以及相关技巧与建议

泰拉瑞亚手机版中的情人节事件也是需要玩家们有一定的机遇和技巧方式才能触发的。具体要怎么操作呢?接下来和小编一起来看看吧!