更多精彩 >

昆仑万维开源面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

2025-02-18 12:58:10   来源:中国网  作者: 

摘要:2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。

开源地址:

1、SkyReels-V1:https://github.com/SkyworkAI/SkyReels-V1

2、SkyReels-A1:https://github.com/SkyworkAI/SkyReels-A1

3、技术报告:https://skyworkai.github.io/skyreels-a1.github.io/report.pdf

4、SkyReels官方地址:skyreels.ai

1. SkyReels-V1:Human-Centric Video Foundation Model,中国首个面向AI短剧创作的开源视频生成模型

SkyReels-V1可实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。正如以下视频所示,SkyReels-V1支持生成大笑、怒吼、惊讶、哭泣等微表情,展现出人物情感丰沛的表演细节。即使有大幅度肢体动作,SkyReels-V1生成的微表情也完美贴合人物肢体表演。

 

48.png

同时,SkyReels-V1为AI视频生成带来了电影级光影美学,基于好莱坞级的高质量影视数据训练,当前SkyReels生成的每一帧画面,在构图、演员站位、相机角度等都具备电影级的质感。无论是单人镜头表演细节,还是多人构图,当前已具备精准的表情控制和高质感画面。

更重要的是,SkyReels-V1不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。

 

49.png

图1丨SkyReels-V1文生视频指标对比(来源:昆仑万维SkyReels)

能够实现这样的SOTA级别,不仅依赖于昆仑万维SkyReels团队基于自研的高质量数据清洗和人工标注管线,构建了千万级的高质量电影&电视剧&纪录片数据。更依托团队自研「Human-Centric」的视频理解多模态大模型,大幅提升视频中人物相关的理解能力,尤其是自研人物智能解析系统。

综上所述,得益于扎实的数据工作和先进的人物智能解析系统,SkyReels-V1可以实现:

影视化表情识别体系:11种针对影视戏剧中的人物表情理解,如不屑、不耐烦、无助、厌恶等表情的理解;

人物空间位置感知:基于人体三维重建技术,实现对视频中多人的空间相对关系理解,助力模型生成影视级人物站位;

行为意图理解:构建超过400种行为语义单元,实现对人物行为的精准理解;

表演场景理解:实现人物-服装-场景-剧情的关联分析。

SkyReels-V1不仅是全球极少数开源的视频生成模型,还是围绕人物表演、开源视频生成模型中性能最强的。

在自研推理优化框架「SkyReels-Infer」的加持下,大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行,支持Context Parallel,CFG Parallel,和 VAE Parallel。此外,采取fp8 quantization以及parameter-level offload,满足低显存用户级显卡运行需求;支持flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源diffuser库,提升易用性。

正如下图2所示,在同等RTX4090资源情况下对比(4卡),SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s);SkyReels-Infer版本具备更鲁棒的部署策略,支持用户级别显卡1卡-8卡的推理部署。

 

50.jpg

图2丨推理生成544p视频,使用相同卡数的RTX 4090,SkyReels-Infer版本端到端延迟优于HunyuanVideo官方(xdit) 58.3%

在同等A800资源情况下对比,SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少14.7%~28.2%(如图3所示),SkyReels-Infer版本具备更鲁棒的多卡部署策略。

 

51.png

图3丨推理生成544p视频,SkyReels-Infer版本具备更鲁棒的多卡部署策略,支持8卡部署

2.SkyReels-A1:首个SOTA级别的基于视频基座模型的表情动作可控算法

为了实现更加精准可控的人物视频生成,昆仑万维还开源了SOTA级别的基于视频基座模型的表情动作可控算法SkyReels-A1,对标Runway的Act-One,SkyReels-A1支持视频驱动的电影级表情捕捉,实现高保真微表情还原。能够基于任意人体比例(包括肖像、半身及全身构图)生成高度逼真的人物动态视频,其真实感源自对人物表情变化和情绪的精准模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。

SkyReels-A1不仅支持侧脸的表情控制生成、还能实现更加逼真的眉眼微表情生成和更大幅度的头部与自然身体动作。SkyReels-A1能够实现更大幅度的人物表情驱动。相比Runway的Act-One,SkyReels-A1可以迁移更复杂的表情动作,生成的人物面部神情可以配合肢体及画面内容实现更栩栩如生的表演。

3.以开源之姿,以破局之势,昆仑万维致力于推动全球AI短剧创作生态繁荣发展

昆仑万维一直坚持开源,推动技术平权。昆仑万维同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。

我们相信在进行推理优化的升级和可控算法的开源后,它们将为用户带来低成本、可控性更强的AIGC能力。昆仑万维希望通过更多优秀视频生成模型的开源和极致的AI短剧产品能力,为用户带来低成本实现AI短剧创作的可能性、突破行业目前视频生成一致性差的问题,让大众通过自己的电脑生成精细且可控的人物表演。

此次开源的视频大模型,不仅是一次技术突破,有助于缩小全球内容产业的数字鸿沟,更是文化产业生产力的一次革命。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合。AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。

实现通用人工智能,让每个人更好地塑造和表达自我”是公司的使命,未来,昆仑万维及SkyReels还将开源更多视频生成模型和算法、通用模型,通过开源实现AGI平权,推动AI短剧生态的持续建设和繁荣,促进开源社区、开发生态以及AI行业的发展。


猜你喜欢

昆仑万维开源R1V视觉思维链推理模型,开启多模态思考新时代

昆仑万维创新创业

3月18日,昆仑万维正式开源首款工业界多模态思维链推理模型Skywork R1V,即日起开源模型权重...

2025-03-18

昆仑万维发布Matrix-Zero世界模型,开启空间智能新时代

昆仑万维创新创业

2月14日,昆仑万维正式推出 Matrix-Zero世界模型,成为中国第一家同时推出3D场景生成和可...

2025-02-14

昆仑万维「天工大模型4.0」o1版(Skywork o1)正式启动邀请测试

昆仑万维智能+

今天,昆仑万维正式推出具有复杂思考推理能力的系列模型——“天工大模型4.0” o1版(Skywork...

2024-11-27

昆仑万维推出“天工大模型4”4o版(Skywork 4o)

昆仑万维智能+

从「天工大模型1.0」的研发到「天工大模型3.0」的发布,再到今天的「天工大模型4.0」阶段,我们坚...

2024-11-20

听力熊Teeni.AI全面接入DeepSeek大模型 顶尖科学家张驰加盟强化技术壁垒

创新创业听力熊(Teeni.AI)

近日,国内青少年智能硬件头部品牌听力熊(Teeni.AI)宣布两大重要进展:全面接入深度求索(Dee...

2025-02-13

元宵、情人节特惠狂欢 中免集团海南离岛免税店活动精彩纷呈

大消费中免集团

未来,中免集团将持续秉承“诚信经营 优质服务”理念,深耕海南市场,创新营销、优化环境、提升服务,助力...

2025-02-13

传奇结合,九游娱乐正式携手云达不莱梅俱乐部

创新创业九游娱乐

近日,亚洲领先的数字娱乐平台九游娱乐与德国足球传统劲旅云达不莱梅足球俱乐部正式宣布达成战略合作协议,...

2025-02-13

斯帝尔收购六维力传感器黑马,全球首款「打磨」场景人形机器人亮相

创新创业斯帝尔

这一举措不仅加速了斯帝尔在智能打磨技术领域的深耕,也标志着柔性力控机器人在工业形态与人形形态的双向融...

2025-02-13

安科生物作为基石投资者参与维昇药业香港IPO,深化内分泌治疗领域布局

上市公司安科生物

2月10日,安徽安科生物工程(集团)股份有限公司(以下简称“安科生物”)股票代码300009,召开第...

2025-02-13

浩万(HORWIN)权威认可,携欧洲环境署(EEA)绿色出行

新能源浩万

在全球环保意识不断增强的背景下,绿色出行已成为全球交通领域的重要发展趋势。

2025-02-13

第二届北京商业航天产业高质量发展大会在北京亦庄举办

峰会北京商业航天产业高质量发展大会

新场景、新举措、新标准发布,8家北京市重点实验室、卫星互联网产业园揭牌,国内首个低轨宽带通信试验星座...

2025-02-13

微众银行政银合作模式创新实践获2024大湾区科技金融应用优秀案例

金融科技微众银行

日前,由中国人民银行深圳市分行、中共深圳市委金融委员会办公室、深圳市科技创新局指导,金融时报社主办的...

2025-02-13

Exness故事:赋能全球交易者

金融科技Exness

在交易世界中,交易者常常会对经纪商的承诺感到失望。

2025-02-13

开工采购就来京东企业购,全年18000元“开工大礼包”先到多得

京东大消费

新春伊始,企业纷纷开足马力抢抓生产,京东政企业务以「开工即冲刺」之势,联合众多品牌启动「政企开工季」...

2025-02-13

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

沙特天空塔投资设立专项基金带领中国氢能独角兽扎根沙特

2016年注册于北京的中氢新能技术有限公司,下设位于大兴的装备制造公司、位于海淀区的技术研究院、材料...

挑战奔驰的明星车企,突然“翻车”了

一度无比高光的理想汽车,猝不及防遭遇重挫。

深圳天使母基金姚小雄:将来股权投资行业竞争是服务能力的竞争

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

2024年的一级市场,“耐心”是最高命题,也引发了持续全年的讨论。

不响不辍|第18届中国投资年会·年度峰会在沪召开

不响不辍|第18届中国投资年会·年度峰会在沪召开

5月8-10日,由投中信息、投中网主办的“第18届中国投资年会·年度峰会”在上海外滩W酒店盛大召开。