6月27日,科大讯飞发布讯飞星火大模型V4.0。与此前的版本相比,讯飞星火VV4.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力上都有提升。
比如讯飞星火可以根据用户的语言描述,结合空间和常识推断描述对象所在的位置,这些能力的进步对于未来的机器人等具身智能产品都有意义。
在图文识别上,讯飞星火大模型V4.0能力也进一步升级,在科研、金融、医疗、司法、办公等场景的应用效果已*GPT-4o。
从国内外12项大模型主流测试集的结果来看,讯飞星火在8个测试集中排名第 一,在七大核心能力上全面超越了GPT-4 Turbo。
自去年9月全面开放以来,讯飞星火APP在安卓公开市场累计下载量达1.31亿次。科大讯飞方面公布的数据显示,今年618期间星火大模型加持的智能硬件销量同比增长超70%,月均使用次数超4000万。
面向未来的人工智能新生态,科大讯飞董事长刘庆峰强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地。
基于讯飞星火大模型V4.0的能力,科大讯飞同时发布或升级了多款应用。
在个人领域,科大讯飞推出了“个人空间”。用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。
在教育领域,科大讯飞发布了*星火智能批阅机。这款机器集智能批改、精准学情、个性学习于一体,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,还为老师作业讲评和面批辅导提供了素材。
科大讯飞研究院院长刘聪现场演示了星火智能批阅机批改作业的全流程,15份学生作业半分钟就能批改完成,批改模拟了真人笔迹,和老师平时批改作业几乎一样。
通过自动化识别,星火智能批阅机试题解析的准确率大于99%,学生可以随便涂抹,自由排版不限格式。原先要90分钟才能批改完的作业,现在只要5分钟就能完成,学生的错题解决率也从50%提升到73%。
面向万物互联时代,星火语音大模型发布国际*的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果*OpenAI whisper-V3,37个方言识别效果平均提升30%。现场,科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果,能让输入效率大大提高。
基于星火V4.0强大的多语种支持能力,科大讯飞发布软硬件一体化讯飞同传系统,可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等会议办公产品中。
同时赋能行业,发布星火企业智能体平台,围绕搭建智能体的三大关键能力,当前企业智能体平台已覆盖400+AI原子能力,集成90+外部信源,打通100+内部IT系统,可供企业结合业务场景快速构建可落地的智能体应用。平台围绕生产域、科创域、办公域、管理域上线32个企业智能体,供企业即插即用。
讯飞星火大模型带来行业赋能的同时,也在助力开发者生态蓬勃发展。自今年1月30日讯飞星火V3.5发布以来,短短5个月,星火开发者生态加速增长,开发者数从598万增长到702万,新增超104万;海外开发者数超40万;大模型开发者达57万。越来越多开发者正加入星火生态,释放更多刚需场景的应用价值。
刘庆峰说,只有自主可控的繁荣生态,才有中国通用人工智能的大未来。面向未来的人工智能新生态,他强调要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地;既要科学理性地认识中美在大模型上的综合差距,也要有信心快速追赶,给出从源头技术、到产业生态、再到应用落地的一整套的打法,以长期主义来打造真正自主可控的AI产业生态。