中文通用大模型基准测试SuperCLUE发布：GPT居首、星火第三 - 亚太时报网

频道
搜索

资讯国际国内体育关注汽车生活财经科技综合健康综合首页栏目法律

微信微博 QQ空间 MORE

【资料图】

新华财经上海5月10日电 5月9日，中文通用大模型综合性评测基准SuperCLUE正式发布。该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何；与国际代表性模型相比，中文大模型的表现达到了何种程度；中文大模型与人类表现相比如何等。

该机构利用SuperCLUE测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。由于大模型会不断迭代，所以该排行榜会定期更新，并于CLUEbenchmarks官方网站进行公示。最新排名显示，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。

该模型可通过多个层面，考验市面上主流的中文GPT大模型的能力。一是基础能力，包括常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力；二是专业能力，包括中学、大学与专业考试，涵盖从数学、物理、地理到社会科学等50多项能力；三是中文特性能力，针对有中文特点的任务，包括中文成语、诗歌、文学、字形等10项能力。

编辑：林郑宏

声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。

关键词：

责任编辑：zN_1051

中文通用大模型基准测试SuperCLUE发布：GPT居首、星火第三
5月9日，中文通用大模型综合性评测基准SuperCLUE正式发布。最新排名显示，GPT-4一骑绝尘，已经非常接近人类
中国生物制药与亿一生物合作创新药获批上市世界微动态
9日，国家药品监督管理局网站显示，亿一生物研发的一类创新药、新一代长效粒细胞集落刺激因子“艾贝格司亭
焦点关注：主人公叫洛天的小说名字主人公叫洛天的小说
今天来聊聊关于主人公叫洛天的小说名字，主人公叫洛天的小说的文章，现在就为大家来简单介绍下主人公叫洛天
环球滚动:更换全新设计别克新款昂科威PLUS申报图曝光
日前，我们在最新一批工信部申报目录中发现了别克新款昂科威PLUS的申报图，新车的外观设计变化较大，整体上
沪深股通4月成交宗数创历史新高北向资金逆势加仓新能源产业链
港交所最新公布的数据显示，北向沪深股通（含ETF及股票）4月成交总额达2 22万亿元人民币，较去年同期增加36

时尚

中文通用大模型基准测试SuperCLUE发布：GPT居首、星火第三

2023-05-10 10:22:07
中国生物制药与亿一生物合作创新药获批上市世界微动态

2023-05-10 10:27:27
焦点关注：主人公叫洛天的小说名字主人公叫洛天的小说

2023-05-10 10:10:20
环球滚动:更换全新设计别克新款昂科威PLUS申报图曝光

2023-05-10 09:48:27
沪深股通4月成交宗数创历史新高北向资金逆势加仓新能源产业链

2023-05-10 09:24:08

金融