中文通用大模型评测基准SuperCLUE发布:讯飞星火认知大模型国内第一

2023-05-09 16:12:01来源:快科技编辑:时寒峰

扫一扫

分享文章到微信

扫一扫

关注鹿财经网微信公众号

  原标题:中文通用大模型评测基准SuperCLUE发布:讯飞星火认知大模型国内第一

  5月9日消息,中文通用大模型综合性评测基准SuperCLUE正式发布。

  中文通用大模型基准(SuperCLUE),是针对中文可用的通用大模型的一个测评基准,它尝试在一系列国内外代表性的模型上使用多个维度能力进行测试。

  它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比如何?

  根据首个榜单显示,国内大模型中,近期发布的星火认知大模型最好,总分53.58分,与GPT-4相比有23个百分点的差距,与gpt-3.5-turbo在总分上有13个百分点的差距。

中文通用大模型评测基准SuperCLUE发布:讯飞星火大模型国内第一 文心一言垫底

  值得一提的是,讯飞星火认知大模型在对话、百科知识、角色模拟、计算能力、语义理解、逻辑推理方面,已经达到GPT 3.5平齐的水准。

  在语义理解方面,讯飞星火认知大模型甚至得到100分的满分,超过GPT-4。

  而百度文心一言在总榜单中排名最后一名,得分32.61分。

     投稿邮箱:lukejiwang@163.com   详情访问鹿财经网:http://www.lucaijing.com.cn

相关推荐
端到端大模型到底是个啥 小米官方详解 端到端大模型到底是个啥 小米官方详解

原标题:端到端大模型到底是个啥 小米官方详解 11月16日消息,小米HAD(Xiaom

科技说2024-11-16

全球首次!卫星在轨运行AI大模型技术验证完成 全球首次!卫星在轨运行AI大模型技术验证完成

原标题:全球首次!卫星在轨运行AI大模型技术验证完成 10月6日消息,据媒体报

科技说2024-10-06

上汽通用联合宁德时代推出行业首个6C超快充磷酸 上汽通用联合宁德时代推出行业首个6C超快充磷酸

原标题:上汽通用联合宁德时代推出行业首个6C超快充磷酸铁锂电池:充电5分钟

科技说2024-09-25

阿里云全面升级GPU云服务:AI大模型推理性能可提 阿里云全面升级GPU云服务:AI大模型推理性能可提

原标题:阿里云全面升级GPU云服务:AI大模型推理性能可提升100% 7月19日消息,

科技说2024-07-19

对标GPT-4Turbo!科大讯飞:讯飞星火大模型V4.0即将 对标GPT-4Turbo!科大讯飞:讯飞星火大模型V4.0即将

原标题:对标GPT-4Turbo!科大讯飞:讯飞星火大模型V4.0即将于6月27日发布 6月2

科技说2024-06-24

曝iPhone 16国行版将使用中国AI公司大模型:苹果还 曝iPhone 16国行版将使用中国AI公司大模型:苹果还

原标题:曝iPhone 16国行版将使用中国AI公司大模型:苹果还未找到伙伴 6月22日消

科技说2024-06-22

第一品牌!科大讯飞刘庆峰:讯飞星火在多个行 第一品牌!科大讯飞刘庆峰:讯飞星火在多个行

原标题:第一品牌!科大讯飞刘庆峰:讯飞星火在多个行业大模型落地领先 6月

科技说2024-06-07

大模型免费时代来了!腾讯自研混元大模型全面 大模型免费时代来了!腾讯自研混元大模型全面

原标题:大模型免费时代来了!腾讯自研混元大模型全面降价:混元-lite模型免

科技说2024-05-22

字节与荣耀、小米、OPPO、vivo等共同宣布:成立智 字节与荣耀、小米、OPPO、vivo等共同宣布:成立智

原标题:字节与荣耀、小米、OPPO、vivo等共同宣布:成立智能终端大模型联盟

科技说2024-05-15

谷歌Chrome浏览器更新:实时字幕新增支持中文、 谷歌Chrome浏览器更新:实时字幕新增支持中文、

原标题:谷歌Chrome浏览器更新:实时字幕新增支持中文、日语等 3月5日消息,近

科技说2024-03-06