随着6月6日快手旗下文生视频大模型“可灵”正式开始邀测,截至6月13日早9点,已有超过6.4万人排队申请测试,平均每天新增万人申请。
摩根士丹利近日也发表研报表示,可灵目前的表现与Sora不相上下,它的成功发布,将有望使快手的用户规模和活跃度进一步提升,从而长期影响快手在电商和商业化等领域的货币化潜力。大摩认为,目前,可灵的表现要比抖音和腾讯过往发布的视频生成模型都更加优秀,从时长来看,可灵可以生成长达2分钟的视频,而抖音的即梦Dreamina目前只支持生成最长3秒的视频、腾讯的混元大模型则能生成16秒视频。
公开信息显示,可灵大模型为快手AI团队自研,采用类Sora的技术路线并结合多项自研创新技术,具备诸多优势:
1、能够生成大幅度的合理运动;
2、能够模拟物理世界特性;
3、具备强大的概念组合能力和想象力;
4、生成的视频分辨率高达1080p,最长可达2分钟(帧率30fps),且支持自由的宽高比。
在此前举行的2023年Q4业绩电话会上,快手科技创始人兼首席执行官程一笑曾表示,自2023年初快手启动AI战略以来,公司一直扎实推进自研大模型的研发训练,加速大模型的场景化落地,这其中也包括视频生成技术的研究和投入,去年年底,快手还积极推进了视频生成技术的专项研发。
“未来我们会把生成模型和生产者工具结合起来,不断帮助创作者降低创作门槛,提升短视频制作质量和效率。”程一笑表示。
据快手方面介绍,可灵目前开放的是文生视频功能,近日还将开放图生视频功能。相比文生视频,图生视频的方式可以减少试错时间,同时对于风格的多样性和细节的控制能力更强。