中文通用大模型评测基准SuperCLUE发布:讯飞星火认知大模型国内第一

2023-05-09 16:12:01来源:快科技编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:中文通用大模型评测基准SuperCLUE发布:讯飞星火认知大模型国内第一

  5月9日消息,中文通用大模型综合性评测基准SuperCLUE正式发布。

  中文通用大模型基准(SuperCLUE),是针对中文可用的通用大模型的一个测评基准,它尝试在一系列国内外代表性的模型上使用多个维度能力进行测试。

  它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比如何?

  根据 榜单显示,国内大模型中,近期发布的星火认知大模型最好,总分53.58分,与GPT-4相比有23个百分点的差距,与gpt-3.5-turbo在总分上有13个百分点的差距。

中文通用大模型评测基准SuperCLUE发布:讯飞星火大模型国内第一 文心一言垫底

  值得一提的是,讯飞星火认知大模型在对话、百科知识、角色模拟、计算能力、语义理解、逻辑推理方面,已经达到GPT 3.5平齐的水准。

  在语义理解方面,讯飞星火认知大模型甚至得到100分的满分,超过GPT-4。

  而百度文心一言在总榜单中排名最后一名,得分32.61分。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
谷歌Chrome浏览器更新:实时字幕新增支持中文、 谷歌Chrome浏览器更新:实时字幕新增支持中文、

原标题:谷歌Chrome浏览器更新:实时字幕新增支持中文、日语等 3月5日消息,近

科技说2024-03-06

华为云推出大模型混合云助力春运:平均车速提 华为云推出大模型混合云助力春运:平均车速提

原标题:华为云推出 大模型混合云助力春运:平均车速提升8% 平均延误下降

科技说2024-02-01

360周鸿祎:2024年大模型将像PC电脑一样无处不在 360周鸿祎:2024年大模型将像PC电脑一样无处不在

原标题:360周鸿祎:2024年大模型将像PC电脑一样无处不在 1月7日消息,在2023年

科技说2024-01-07

信通院发布2024信息通信业十大趋势:5G增强技术 信通院发布2024信息通信业十大趋势:5G增强技术

原标题:信通院发布2024信息通信业十大趋势:5G增强技术、AI大模型成热点 12月

科技说2023-12-23

国内      官方大模型评测结果出炉!阿里云通义 国内 官方大模型评测结果出炉!阿里云通义

原标题:国内 官方大模型评测结果出炉!阿里云通义千问首批通过评测 1

科技说2023-12-22

华科大发布AI大模型猴子:部分超越GPT-4 华科大发布AI大模型猴子:部分超越GPT-4

原标题:华科大发布AI大模型猴子:部分超越GPT-4 12月12日消息,华中科技大学官

科技说2023-12-12

联发科天玑9300首发搞定70亿参数AI大模型:三个遥 联发科天玑9300首发搞定70亿参数AI大模型:三个遥

原标题:联发科天玑9300首发搞定70亿参数AI大模型:三个遥遥领先 这是一个AI风

科技说2023-10-18

vivo自研AI大模型来了:OriginOS 4全球首发 vivo自研AI大模型来了:OriginOS 4全球首发

原标题:vivo自研AI大模型来了:OriginOS 4全球首发 9月22日消息,博主数码闲聊站

科技说2023-09-22

华为:鸿蒙生态设备已达7亿台,小艺将具备AI大 华为:鸿蒙生态设备已达7亿台,小艺将具备AI大

原标题:华为:鸿蒙生态设备已达7亿台,小艺将具备AI大模型能力 8 月 4 日消息

科技说2023-08-04

百度:第三代昆仑芯明年初规模上市 大模型算力 百度:第三代昆仑芯明年初规模上市 大模型算力

原标题:百度:第三代昆仑芯明年初规模上市 大模型算力不成问题 6月9日消息

科技说2023-06-09