豆包大模型1.6高考测评:多模态训练显成效
上证报中国证券网讯(记者罗茂林)近日,随着2025年全国高考志愿填报的全面开启,字节跳动Seed团队使用山东高考全科试卷(语数英全国新一卷+其他学科山东自主命题),对豆包大模型1.6及业界主流推理模型进行了测评。
在包含378分图像题的全科试卷中(物理图像题占94分、地理76分),其文科总分683分位列榜首,地理、历史分别拿下94分和92分,将地图信息与文字史料的关联分析转化为优势。理科方面,尽管化学生物因网络试题图像模糊而丢掉一些分数,但物理90分的成绩已超越大部分人类考生。
总体来看,相较2024年,豆包1.6理科预估分提升181.5分,文科提升140.5分。当团队更换高清试题图片后,生化两科总分再提升近30分,理科总分可达676分。此次突破源于测评方式的“人类化”,即采用“题目文本+截图”的输入模式,模型通过多模态理解准确解析了化学分子结构式等复杂图像,多模态训练成为关键。
根据过往经验判断,3门副科的赋分相比原始分会有一定程度的提高,尤其是在化学、物理等难度较大的科目上。山东高考采用“3+3”形式,豆包大模型1.6如果选择物理、历史、地理三门副科,总分可达689,赋分成绩将超过690分。根据山东省高考一分一段表,这个成绩排名全省前80位,有望在山东考上清华北大。
值得关注的是,今年测评的一个关键变化,相较于去年普遍存在的“幻觉答题”现象(如虚构历史事件),豆包1.6整合事实性知识的水平显著提升。以“长征途经哪些省份”这类文科类经典题型为例,大模型不仅能准确罗列,还能关联地理气候特征分析行军难度,具有“举一反三”的能力,本质是知识结构化升级。
(文章来源:上海证券报·中国证券网)
声明:
- 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
- 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
推荐文章: