郑州信息网 > 热点信息 > 正文
国内最有前途的认知大模型,讯飞星火在SuperCLUE测试中获得国产第一
网络整理 2023-05-11 15:03前有ChatGPT,后有百度文心、阿里千问、京东灵犀,一时间“AI大模型”一词迅速成为了网络流行语。并且在短短几个月时间内,国内有超过30家科技公司入局,彻底拉开了国内人工智能战场的序幕。5月6日,讯飞星火认知大模型成果发布会在安徽合肥举行,现场实测大模型七大核心能力,并发布了汽车、教育、办公、数字员工四大行业应用成果。
同时,讯飞星火认知大模型在应用场景落地方面也有很大突破,比如1+N模式,其中“1”是通用的人工智能底座,“N”是在教育、医疗、办公、人机交互、车载等领域的行业纵深应用,可见讯飞的星火认知大模型准备工作是非常充分的。
那备受瞩目的讯飞星火认知大模型在目前已知的AI大模型相比,实力究竟如何呢?人工智能大模型有没有官方统一的评测标准?就在5月9日,中文通用大模型综合性评测基准 SuperCLUE 正式发布。它主要解决的问题是在当前通用大模型大力发展的情况下,中文大模型的效果情况,包括但不限于这些模型不同任务的效果情况、和国际上代表性模型的比较情况以及和人类对比的效果。一系列国内外代表性模型在该基准下的多个维度接受能力测试,进而得出SuperCLUE评测榜单。
该基准测试主要关注以下问题:中文大模型在不同任务上的表现如何?与国际代表性模型相比,中文大模型的表现达到了何种程度?中文大模型与人类表现相比如何?该模型可通过多个层面,考验市面上主流的中文GPT大模型的能力。其中,基础能力包括了常见的有代表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力。专业能力包括了中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力。中文特性能力,针对有中文特点的任务,包括了中文成语、诗歌、文学、字形等10项多种能力。
除了多维度考察,SuperCLUE评测榜单还拥有自动化评测、广泛代表性和采取人类基准等特点,较为客观、全面展现当下的通用大模型的能力。
该机构利用 SuperCLUE 测试基准,对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出,GPT-4 一骑绝尘,已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三,国内排名第一。
多年来,科大讯飞已在认知智能领域有了丰富的储备和积累,此次成果发布,科大讯飞开放合作,与广大合作伙伴共建人工智能“星火”生态,为更多行业赋能,推动发展。
- 上一篇:潮趣“果岭派对”,演绎球场度假美学 ——全新HONMA SS23时尚高尔夫系列发布
- 下一篇:没有了
- 搜索
-
- 2023-05-11非法获利400余万元!霞浦
- 2023-05-11国潮崛起,无限极演绎民
- 2023-05-11康宝莱:产品创新是维持
- 2023-05-11协合百年电子商务旗下产
- 2023-05-11知直销,掌动态 | 直销热
- 2023-05-11一季度全国外贸“开门稳
- 2023-05-11“华夏之花”挂靠京安再
- 2023-05-1111家直销公司公布一季度业
- 2023-05-11发展商业模式兼顾有效管
- 2023-05-11豪门破局大健康手段既简
- 2019-08-08越狱未遂黑帮头目上吊身
- 2019-09-26吴刚:挺高兴能藏在角色后
- 2019-09-272019假期不够用?最强拼假
- 2019-10-03第一枚金屬國徽(新中國
- 2019-10-07女排世界杯-朱婷独揽22分
- 2019-10-07巴中一山体滑坡致3户农房
- 2019-10-13云南"啃老族"向县委留言要
- 2019-10-14徐峥《囧妈》首度官宣阵
- 2019-10-16大二女生兼职路上遇车祸
- 2019-10-19网曝那英准备离婚 孟桐黑
- 2023-05-11非法获利400余万元!霞浦
- 2023-05-11国潮崛起,无限极演绎民
- 2023-05-11康宝莱:产品创新是维持
- 2023-05-11协合百年电子商务旗下产
- 2023-05-11知直销,掌动态 | 直销热
- 2023-05-11一季度全国外贸“开门稳
- 2023-05-11“华夏之花”挂靠京安再
- 2023-05-1111家直销公司公布一季度业
- 2023-05-11发展商业模式兼顾有效管
- 2023-05-11豪门破局大健康手段既简
- 网站分类
-