AI大模型高考成绩对比：哪家最强？-凡亿教育课堂

凡亿教育-丽丽

凡事用心，一起进步

打开APP

公司名片



凡亿专栏 | AI大模型高考成绩对比：哪家最强？

 

AI大模型高考成绩对比：哪家最强？

凡亿助教-小燕

2024-07-27 09:41:42  2155

关注

自从OpenAI2022年推ChatGPT，“AI大模型”新概念火爆全球，各大企业及组织纷纷研究专属AI模型，其中最为出名的是OpenAI的ChatGPT、阿里巴巴的通义千问等，如果这些AI大模型都去高考，那么谁的成绩最好？

近日，上海人工智能实验室旗下司南评测体系OpenCompass针对七家AI大模型，进行了高考九科目的全科目测试，从而全面评测大模型实例。

本次参与测试的AI模型，分别来自阿里巴巴、零一万物、智谱AI、上海人工智能实验室&商汤、法国Mistral的开源模型，以及OpenAI的闭源模型GPT-4o。

本次评测以参加高考人数最多的河南省分数线作为参考，从图中可看出，文科成绩最好的是阿里巴巴的通义千问，以546分成绩拿下第一，刚好达到文科一本线分数；理科成绩最好的是上海人工智能实验室&商汤联合研发的浦语文曲星，以468.5分拿下第一，不过没有达到一本线，而是只能上二本门槛。

而OpenAI的GPT-4o在文科上得分531分，排名第三，理科得分为467分，排名第二。

据评测机构分析，AI在文科科目如语文、历史、地理、思想政治等科目上展现了深厚的知识储备和理解能力，但在理科科目中，数理推理能力普遍存在短板。特别是在面对带图片的题目，得分率仅有37.64%。

这也可以看出：尽管大模型在基础知识掌握上表现出色，但在逻辑推理和知识灵活应用方面仍有较大差距。

登录查看更多内容

AI大模型高考人工智能

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表凡亿课堂立场。文章及其配图仅供工程师学习之用，如有内容图片侵权或者其他问题，请联系本站作侵删。

相关阅读

VK哈密瓜

已关注

段码屏静态驱动液晶驱动IC厂家芯片VKS232

产品型号：VKS232 产品品牌：VINKA/永嘉微电封装形式：LQFP128 产品年份：新年份简介：VKS232是一个点阵式存储映射双模式的LCD驱动器，可支持静态扫描点数最大116点（116SEGx1COM）的LCD屏，也可支持动态扫

2024-08-15 17:21:52 文章

电路之家

已关注

彻底告别，华为鸿蒙不再与安卓兼容

自从华为鸿蒙系统开始发布，虽然华为主打面向全场景的分布式操作系统，然而很多人质疑该系统的底层仍然是以安卓为主，当然情有可原，毕竟鸿蒙的生态系统仍未建立完全，所以离不开安卓，但现在，鸿蒙系统真的要和安卓告别了。9月25日，余承东在华为秋季全场

2023-11-13 11:33:22 文章

电子攻城狮之路

已关注

苹果包下台积电4nm产能供应iPhone 14全系A16芯片

虽然全球芯片短缺现象仍未得到缓解，疫情复苏导致中国上海工厂停工停产，不过从爆料的信息来看，苹果iPhone 14 系列的推进发布仍在预期之中。全面掌握电路设计，了解芯片封装技术来看看《IC&SiP芯片封装设计与信号》据外媒报道，苹果供应链的

2022-05-05 10:15:17 文章

电子攻城狮之路

已关注

苹果自研5G基带芯片失败？为什么这么难？

近日，来自天风证券的苹果分析师郭明錤在Twitter上表示，苹果自研的5G基带芯片可能已失败，因此高通依然是2023年下半年新iPhone 5G基带芯片的独家供应商。消息一出，苹果股价暴跌，高通股价暴涨。郭明錤认为，由于苹果未能如期完成自研

2022-07-01 11:29:04 文章

嵌入式大杂烩

已关注

2024年中国十大科技新闻正式公布

如果要评选2024年中国科技领域，毫无疑问是百家争鸣，百花齐放的场面。临近年底，我们回溯2024年，来看看有哪些科技新闻是你曾经关注过的。2024年国内十大科技新闻日前正式公布。此次评选由科技日报社主办，并汇聚了部分两院院士与媒体负责人的智

2024-12-27 11:06:25 文章

进入分区查看更多精彩内容>

精彩评论

暂无评论