1. 简单百科
  2. 可灵

可灵

可灵是快手AI团队自研的视频生成大模型,于2024年6月6日在官网正式上线。

可灵支持生成长达2分钟的30fps视频,分辨率高达1080p,并且支持多种宽高比。可灵大模型采用类Sora的DiT结构,用Transformer取代传统的卷积网络结构,为了提升计算效率,还使用flow模型作为扩散模型基座,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。

可灵大模型的推出标志着快手在AI视频生成技术上的又一重大突破。它不仅具备强大的生成能力,还能模拟真实的物理世界。

发展历程

2024年6月6日,快手“可灵”视频生成大模型官网正式上线,可灵大模型已在快影App开放邀测体验。7月24日,可灵AI宣布基础模型升级,全面开放内测,并且正式上线了会员体系。12月6日,由快手可灵AI联合李少红贾樟柯叶锦添薛晓路俞白眉董润年、张吃鱼、王子川、王卯卯等9位知名导演打造的9部AIGC电影短片正式亮相。

产品功能

可灵支持生成长达2分钟的30fps视频,分辨率高达1080p,并且支持多种宽高比。可灵大模型结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。可灵AI还拥有高表现模式、视频延长、视频生成尾帧参考、视频运镜支持大师运镜等多种会员专属功能。

应用领域

可灵大模型可应用于多个场景,如快影APP中的“AI舞王”和“AI唱跳”等功能。

技术特点

可灵采用了类Sora的DiT结构,用Transformer取代了传统的卷积网络结构,使得模型的处理和生成能力更强。数据质量对模型的表现至关重要。快手大模型团队构建了一个完备的标签体系,从视频基础质量、美学和自然度等多个维度对视频数据进行筛选和优化,并研发了视频描述模型,能够生成精确、结构化的视频描述,大幅提升了视频生成模型的文本指令响应能力。

为了提升计算效率,可灵大模型采用了flow模型作为扩散模型基座,并使用分布式训练集群,通过算子优化和重算策略优化,显著提升了硬件利用率。在训练过程中,团队采用分阶段训练策略,初期阶段通过大量数据增强模型对概念的理解,后期阶段通过高质量数据进一步提升模型性能和细节表现。

相关意义

可灵大模型的推出标志着快手在AI视频生成技术上的又一重大突破。它不仅具备强大的生成能力,还能模拟真实的物理世界。

相关事件

2024年12月6日,中国首个AIGC导演共创计划在快手平台上线,并在中国电影博物馆举行了首映礼。由快手可灵AI联合李少红贾樟柯叶锦添薛晓路俞白眉董润年、张吃鱼、王子川王卯卯等9位知名导演打造的9部AIGC电影短片正式亮相,涵盖奇幻、志怪、亲情、动画等多元类型。作为中国首个AIGC导演共创计划的成果,9部AIGC电影短片被中国电影博物馆永久收藏、放映展示。

参考资料

快手视频生成大模型“可灵”开放邀测.界面新闻.2024-06-13

能媲美sora的AI视频大模型来了,快手团队的「可灵」开放测试!.百家号.2024-06-13

快手“可灵”视频生成大模型开放邀测 称效果对标Sora.每日经济新闻.2024-06-13

快手可灵AI全面开放内测 模型效果再次升级.百家号.2024-07-24

可灵AI导演共创计划上线,9部AIGC电影短片在京首映.百家号.2024-12-10