郑州信息网 > 热点信息 > 正文

国内最有前途的认知大模型，讯飞星火在SuperCLUE测试中获得国产第一

网络整理 2023-05-11 15:03

前有ChatGPT，后有百度文心、阿里千问、京东灵犀，一时间“AI大模型”一词迅速成为了网络流行语。并且在短短几个月时间内，国内有超过30家科技公司入局，彻底拉开了国内人工智能战场的序幕。5月6日，讯飞星火认知大模型成果发布会在安徽合肥举行，现场实测大模型七大核心能力，并发布了汽车、教育、办公、数字员工四大行业应用成果。

同时，讯飞星火认知大模型在应用场景落地方面也有很大突破，比如1+N模式，其中“1”是通用的人工智能底座，“N”是在教育、医疗、办公、人机交互、车载等领域的行业纵深应用，可见讯飞的星火认知大模型准备工作是非常充分的。

那备受瞩目的讯飞星火认知大模型在目前已知的AI大模型相比，实力究竟如何呢？人工智能大模型有没有官方统一的评测标准？就在5月9日，中文通用大模型综合性评测基准 SuperCLUE 正式发布。它主要解决的问题是在当前通用大模型大力发展的情况下，中文大模型的效果情况，包括但不限于这些模型不同任务的效果情况、和国际上代表性模型的比较情况以及和人类对比的效果。一系列国内外代表性模型在该基准下的多个维度接受能力测试，进而得出SuperCLUE评测榜单。

国内最有前途的认知大模型，讯飞星火在SuperCLUE测试中获得国产第一

该基准测试主要关注以下问题：中文大模型在不同任务上的表现如何？与国际代表性模型相比，中文大模型的表现达到了何种程度？中文大模型与人类表现相比如何？该模型可通过多个层面，考验市面上主流的中文GPT大模型的能力。其中，基础能力包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力。专业能力包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力。中文特性能力，针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等10项多种能力。

除了多维度考察，SuperCLUE评测榜单还拥有自动化评测、广泛代表性和采取人类基准等特点，较为客观、全面展现当下的通用大模型的能力。

国内最有前途的认知大模型，讯飞星火在SuperCLUE测试中获得国产第一

该机构利用 SuperCLUE 测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4 一骑绝尘，已经非常接近人类的能力。国产大模型中讯飞科技研发的星火认知大模型总排名第三，国内排名第一。　

多年来，科大讯飞已在认知智能领域有了丰富的储备和积累，此次成果发布，科大讯飞开放合作，与广大合作伙伴共建人工智能“星火”生态，为更多行业赋能，推动发展。

Tags：发布(561)中文(11)模型(16)能力(124)

转载请标注：信息网——国内最有前途的认知大模型，讯飞星火在SuperCLUE测试中获得国产第一

上一篇：潮趣“果岭派对”，演绎球场度假美学 ——全新HONMA SS23时尚高尔夫系列发布
下一篇：没有了

郑州信息网 > 热点信息 > 正文

国内最有前途的认知大模型，讯飞星火在SuperCLUE测试中获得国产第一

猜你喜欢