五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半 天天消息

2023-06-09 00:06:26 来源:搜狐科技

一年一度高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。


(相关资料图)

在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示,这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题,正确率50%。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。

360智脑和通义千问则“全军覆没”,一道题也没答对,交了白卷。

值得一提的是,昨天搜狐科技也用五款大语言模型产品,对高考作文全国卷(甲)进行了测试,并邀请了5位语文名师打分。

打分结果显示,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题,对大模型能力考察的维度并不尽相同。但巧合的是,不擅长写作文的360智脑和通义千问,似乎也不擅长做数学题。

通过这两次高考题测试,也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”,那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目:

1.不等式|x-2|<1的解集为__

2.a=(2,3),b=(-1,2),则a·b=__

3.首项为3,公比为2的等比数列的前六项和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域为__

6.复数z=1-i,则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π,则m=__

8.三角形的三边长为a=4,b=5,c=6,则sinA=__

9.某地一年四个季度的GDP(亿元),第一季度GDP为232,第四季度GDP为241,且四个季度的GDP逐季度增长,中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正数k的最大值为__

责任编辑:

标签:

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半 天天消息

2023-06-09

世界球精选!王传福最新判断!新能源车行业供大于求

2023-06-08

当前视点!2元仅能冲洗30秒!游客吐槽在青岛一海水浴场冲脚要扫码支付,景区回应:没有免费的

2023-06-08

热文:《“十四五”市场监管科技发展规划》实施推进座谈会召开

2023-06-08

AIGC抢了电商打工人的饭碗? 环球速递

2023-06-08

每日快讯!华泰证券:航司盈利有望在暑运旺季取得突破

2023-06-08

易极:6.8原油日内继续低多为主!

2023-06-08

福州市营收超亿元服务业企业达145家

2023-06-08

环球观速讯丨中秋节的古诗大全(八月十五中秋节的古诗)

2023-06-08

甘肃省美食产业发展现场会暨临夏美食节各项筹备工作有序推进_焦点快看

2023-06-08

天津大学浙江研究院石英晶体微天平分析仪中标结果公告

2023-06-08

直击高考第一天!宝山3000余名学子向梦想进发_天天热消息

2023-06-08

金百泽:公司未直接向英伟达供货

2023-06-08

中国台球协会:将从严处罚旅英涉赌球员,开展全行业警示教育 全球今亮点

2023-06-08

华测检测:公司的经营情况良好 一季度营业收入和归母净利润均实现稳定增长|天天即时看

2023-06-08

发现两例!北京疾控提示

2023-06-08

家乡的端午节作文500字左右 世界微动态

2023-06-08

今日关注:金桥信息涨5.55% 未来平台2.0的升级,使案件量有一定增长

2023-06-08

预估2024年苹果Vision Pro出货量约20万台 后续消费款才是主打

2023-06-07

新民市气象局发布雷雨大风黄色预警【Ⅲ级/较重】【2023-06-07】

2023-06-07

观点:古代满100岁的人称为_古代满100岁被称为

2023-06-07

朱雀基金增持金力永磁(06680)11.08万股 每股作价17.12港元 最资讯

2023-06-07

青岛双星:公司目前主要销售渠道包括车厂配套渠道、经销商替换渠道及电商渠道,未来公司将会持续加大在新能源配套渠道及电商渠道的投入-全球通讯

2023-06-07

2连板国芳集团:未发现可能对公司股价产生较大影响的报道或市场传闻

2023-06-07

6月7日江苏地区醋酸市场平稳运行

2023-06-07

手机问题:vivoS9e怎么开启5G|环球速读

2023-06-07

多级放大电路中零点漂移产生与抑制措施|环球聚看点

2023-06-07

十恶是哪十恶_十善是哪十善 每日热文

2023-06-07

网传被撞车辆为送考车?上海闵行辟谣:涉事四车均无乘客

2023-06-07

世界资讯:克明食品:子公司5月生猪销售收入同比增38.4%

2023-06-07

Copyright ©  2015-2023 港澳频道网版权所有  备案号:京ICP备2023022245号-31   联系邮箱:435 226 40 @qq.com