投资界(ID:pedaily2012)8月21日消息,近日,伪造检测领域头部企业中科睿鉴宣布完成近亿元融资,由达晨财智独家投资,用于业务线的拓展,保障AI鉴伪产品的规模化落地。该融资案例恰好也回应了公众关于AI安全的担忧。
AI算法在生成数据时更关注生成后的整体视觉效果达到“肉眼逼真”的表象,从而掩盖其在光学、物理等的内在不合理性,而人眼对这些深层的异常往往不太敏感。而睿鉴自研的伪造检测大模型“睿鉴图灵”如同X射线检测仪,可以透过伪装的“视觉”表象,从高阶语义、光学特征、成像原理、物理噪声等维度,检验其与真实数据分布的差异性,发现其生成痕迹。
自2020年起,中科睿鉴就致力于运用AI技术赋能数字内容安全。目前,围绕全类型伪造检测、多模态数据生成、内容合规审核等核心技术,中科睿鉴布局了“模型-数据-算力”的AI基础设施,面向国家、行业、个人安全场景,提供音视图文全栈全类型鉴伪技术和产品服务。
中科睿鉴能力全景图
大模型技术持续升级迭代,生成内容愈发逼真,进入2024年,几乎每2个月都会出现新的、效果更惊艳的生成技术。这暴露原本针对垂直领域的传统检测小模型的致命缺陷:泛化能力差,无法应对层出不穷的新型AI伪造内容。
解决针对新生成技术的广谱检测和快速响应难题,关键是摒弃“来一个打一枪”的事后思维,重视检测能力的基座化。为此,中科睿鉴自2023年初率先布局,打造了集模型、数据、算力一体的体系化能力底座,实现对新型伪造技术的快速响应、精准检测。
通过模型、数据、算力三者深度结合,一旦新的伪造技术面世,“睿鉴图灵”基础模型便可达到80%以上的检测精度。在基础模型上微调1-2周,便可取得90%以上的检测精度,大幅提高了对新型伪造技术的响应能力。
现实世界中,虚假信息的形式是多样的,最新的电诈骗术已经综合利用实时人脸替换、语音合成等多种伪造技术,让人防不胜防。为此,中科睿鉴研发了全栈全类型检测技术:图像视频检测方面,支持检测AI生成、深度合成、PS篡改等多种伪造;音频检测方面,能够检测合成、换声等多种伪造人声;文本检测方面,支持多领域、多语种、跨模型的AI生成文本检测。通过深度整合多模态伪造检测能力,检测系统已实现各类伪造风险场景有效防御。
此外,随着大模型的应用和生成数据的增加,利用AI手段侵害企业利益、骗取公众财产的案件进入高发期,伪造技术的潜在风险正飞速向企业和个人扩散,伪造检测的需求不再局限于国家安全。中科睿鉴面向国家、行业、个人安全场景展开全面布局,推出针对性解决方案:在ToG方向,推出专用系统和全国产化适配的专用设备,实现敏感任务安全处理;ToB方向,基于企业多元化业务需求,提供轻量灵活的SaaS服务;面对个人安全需求,推出终端设备和SDK等产品类型,并持续通过“睿鉴AI”微信小程序将最新检测能力面向公众免费开放。
不同于学术研究的理想场景,在现实场景实现有效伪造检测并非易事。
一方面,业界研究普遍依赖封闭且有限的数据集,而实际网络环境中的伪造数据为躲避审核,往往通过压缩、模糊等对抗处理。这就容易出现检测技术在实验环境表现优异,但在实际应用中效果大打折扣的结果,难以实现有效的工程化部署。
另一方面,面对美颜、影视创作等非恶意的生成内容,“一刀切”无疑会影响用户体验,提高监管成本,如何在数量庞大的生成数据中区分筛选有害伪造内容,是另一大难题。
对此,中科睿鉴的应对方法是,通过大规模实战深耕打磨检测技术。目前,中科睿鉴已经在实战场景中部署了近300台设备,稳定运行两年,模型累计运行超400亿次,有效检出有害伪造数据千万条。