上海发布“书生·浦语”大模型：评测表现优秀

2023-06-07 14:55:20

(相关资料图)

“书生·浦语”联合团队选取了20余项评测对其进行检验，其中包含全球最具影响力的四个综合性考试评测集，对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试。

6月7日，上海人工智能实验室（上海AI实验室）、商汤科技联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”（InternLM），具有1040亿参数，在多项中文考试中取得超越ChatGPT的成绩，在数学考试中成绩明显领先于谷歌、Meta的大模型。

“书生·浦语”联合团队选取了20余项评测对其进行检验，其中包含全球最具影响力的四个综合性考试评测集：由伯克利加州大学等高校构建的多任务考试评测集MMLU；微软研究院推出的学科考试评测集AGIEval（含中国高考、司法考试及美国SAT、LSAT、GRE 和 GMAT等），AGIEval的19个评测大项中有9个大项是中国高考，通常也列为一个重要的评测子集AGIEval（GK）；由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval；以及由复旦大学研究团队构建的高考题目评测集Gaokao。

实验室联合团队对“书生·浦语”、清华大学的GLM-130B、Meta的LLaMA-65B、OpenAI的ChatGPT和GPT-4进行了全面测试，针对上述四个评测集的成绩对比如下（满分100分）。

标签：

关闭

相关推荐

上海发布“书生·浦语”大模型：评测表现优秀

多团队合作揭示肝癌癌旁组织临床相关分子特征

ChatGPT之父：要保证对AI的决策权_环球看热讯

同学变同事南华大学一宿舍四人被同一单位录用世界热文

精彩组图

精彩放送

685人竞逐2023阿里巴巴全球数学竞赛决赛|世界快讯

网传小米竖向内折叠手机立项：追求极致轻薄天天精选

华为云CEO张平安：自研数据库GaussDB真正实现软硬件协同优化-天天聚看点

英特尔推锐炫Pro A60/A60M工作站显卡搭ACM-G12 GPU

今日要闻!2023年高考拉开帷幕

艺术 | 程韵秋声扬霏蕤雏凤清声话传承

跨过高考请继续努力焦点热议

同学变同事南华大学一宿舍四人被同一单位录用世界热文

全球微资讯！文物 | 中国文化遗产研究院组织召开2023年文化和自然遗产日活动“文化遗产保护与科技赋能专题论坛”

全球即时：彻底实现本土化红杉全球宣布三大区域将各自完全独立

世行：2023年全球增长料放缓至2.1% 高利率加剧金融风险

全球热文：【中国那些事儿】英媒：下一轮工业化浪潮，中国将是弄潮儿

全球头条：中消协提示警惕培训班退费骗局

理性看待REITs市场波动回归长期价值投资

【独家焦点】让好风景被更多人领略

当前消息！协同发展交通为先

【中国飞机图鉴】这是一张翼龙无人机的名片_每日快看

长联科技IPO：兄弟五人掌大权共享“资本盛宴”，第一大客户合作终止

中信证券：激光雷达行业一季度整体承压静待城区领航功能上线_世界热讯

教育部公布素质教育监测数据或可减少企业间恶意竞争

孟晚舟：万物正走向可感知、互联、智能数字孪生世界正在构建

晶升股份、唯捷创芯等16只科创板股融资余额增幅超10%

中国台球协会：将从严处罚旅英涉赌球员开展全行业警示教育

天天视点！港股异动 | 飞思达科技(01782)涨超14% 今年以来股价已大涨217%

港股异动 | 六福集团(00590)涨超4% 机构指珠宝龙头长期盈利能力有望上行

商丘将加强县域商业体系建设：支持县城商贸流通企业下沉业务_世界聚看点

超出预计：到2030年代北极夏季可能没有海冰世界热闻

光大同创：6月6日融资买入2235.83万元，融资融券余额7429.64万元

【当前热闻】未来电器：6月6日融资买入436.62万元，融资融券余额2127.98万元

整改！大连证监局出手，圆通速递涉财务核算、合同审查等多项违规

为高考营造良好环境泾川县开启“静音〞模式焦点热闻

奥普光电6月7日盘中涨幅达5%

数字鸿沟不是代沟，老年人也属于新时代天天快资讯

天天快看点丨恒盛能源6月1日盘中跌停

整改！大连证监局出手，圆通速递涉财务核算、合同审查等多项违规今日热讯

天天热议:中药板块震荡走高九芝堂反包板

天天实时：1小时6.5元！共享单车悄然涨价已贵过公交地铁

莫把暴力当正义别用键盘逞英雄_环球快播

《寂静岭 2 ：重制版》游戏所需存储空间量曝光，大小翻了 50 倍

在人生“大赛道”上跑出高考“好心态”-全球热议

这3所大学要停办了_当前关注

《全知读者视角》如何成为韩国特色爽文？全球聚看点

新加坡国立大学发布 GOAT 模型，算数能力居于 GPT-4 之上_天天聚看点

寿险产品定价利率下调在即年金险、分红险有望接力

如何越夜越精彩海口夜经济发展调查

精选！两岸街舞同台炫技台湾青年舞者“登陆”发展

今日看点：海南发现“鸡油菌大王”！

精准开展电动自行车治理工作

华润三九：融资净偿还698.7万元，融资余额3.04亿元（06-06）

粤最大海上养殖平台投产|环球新动态

看热讯：男子公交上偷亲女孩，坐出租车逃跑时被众人堵住，警方已介入处理

景区回应“过山车停运致众多游客倒挂半空中”：停电所致，游客已安全救下

【世界新要闻】证监会核发7个企业债注册批文募资约180亿

海兰信：融资净偿还1301.92万元，融资余额10.23亿元（06-06）焦点速读

天海防务：融资净偿还279.16万元，融资余额1.93亿元（06-06）|快消息

机构：一季度中国大陆AR/VR产品销量同比增长62% 全球实时

“大手牵小手”躬耕劳作，又一“大学生社会实践基地”揭牌-环球热资讯

关于孔垂楠被女友爆私生活混乱害其染病孔垂楠染了什么病的相关信息

凝聚广大职工奋进力量

德赛电池：公司储能电芯项目各项工作进展顺利

环球资讯：鸿博股份：与英伟达在智算中心等十大领域进行合作

+62是哪个国家的区号_858是哪个国家或地区的区号

6月7日生意社丙烯腈基准价为8212.50元/吨

@所有人一起为每一位考生送上祝福！_热头条

天天微头条丨老师收到毕业鲜花后落泪：男人至死是少年

每日看点！“乙类乙管”后首次高考开考，北京多措并举确保“平安高考”

经济恢复动能平稳人民币汇率不乏强支撑

当前播报:云南一导游暗讽游客不消费官方通报已立案调查

高考“调休”来了！高考期间上班人要注意这些

世界微资讯！亿利洁能资金悬疑：手握43亿现金却致7亿票据逾期

【世界报资讯】6月7日生意社PMMA基准价为14625.00元/吨

5G应用已融入超六成国民经济大类_新视野

6月7日生意社二甘醇基准价为5816.67元/吨

实体消费回暖，苏宁易购“618”门店客流提升

世界快看点丨模拟实战！我国七大流域机构完成防洪调度演练

观点：中华文明为何能延绵5000年未出现中断？快到“国家书房”一探究竟

拓斯达获21家机构调研：目前很多外资品牌在中国加大布局，未来市场空间可期待性较大（附调研问答）播资讯

高考首日降雨高温齐聚请考生合理规划做好应对

5G已融入超六成国民经济大类_天天实时

比亚迪加码新西兰市场 BYD ATTO 3再获纯电动汽车月度销冠|每日快看

【世界播资讯】5月城轨客运量同比增长87% 多地客流量创新高

今日快讯：诺纳生物任命Steve Arkinstall为首席科学顾问

美股异动丨Coinbase大跌20% 被SEC起诉违反美国证券法

宇宙注定要蒸发？霍金辐射理论或不仅限于黑洞|环球今热点

全球热头条丨广东高考平均分数_广东高考平均分

雅化集团：公司是其4680电池的主要供应商，如其需求增长，将拉动公司供货量

总裁的私有宝贝txt下载_权少的私有宝贝老公不可以txt

陕煤集团首家企业智慧法务云平台上线暨企业定额编制启动仪式成功举行

等行政压减落地，铁矿石震荡下行看待金十期货6月6日讯，基本面上，华南钢厂产量不变，华北华东，部分钢厂小规模复产，最新铁水数据240.81万吨/天，基本与上周持平，利润率随成材销售价格下降而回落，预计后续产量无上升动力快播

每日聚焦：日本交易市场日评6月6日：美国经济指标意外走弱，金融市场进入短期调整行情

618大促开门红，战绩来了！|天天报道

聚氨酯面漆使用方法_聚氨酯面漆是什么漆

环球最资讯丨美股异动 | 诺和诺德涨超2% 拟以1.54亿欧元收购Biocorp

美国多名参议员致信扎克伯格寻求有关大型语言模型LLaMA泄露的信息|焦点报道

@高考考生多地考点启用智能安检门这些设备物品不要带焦点快播

短讯！5月楼市延续降温：挂牌多成交少 “负首付”重出江湖

blackbird日语歌怎么学_blackbird日语歌

美股异动丨迅雷大涨33% 宣布2000万股票回购计划

高考“调休”来了！高考期间上班人要注意这些→

【世界时快讯】如何办理全电发票流程_如何办理qs认证

关于科讯网 | 联系我们 | 投诉联系：39 60 29 14 2@qq.com

Copyright © 2008 - 2023 www.tech-ex.com. All Rights Reserved

科讯网版权所有

皖ICP备2022009963号-7