挑战Sora?潞晨科技发布的Open-Sora 2.0开源视频大模型,实现降本提速新突破

听说过壕无人性的 OpenAI Sora 吧?动辄几百万美元的训练成本,简直就是视频生成界的“劳斯莱斯”。现在,潞晨科技宣布开源视频生成模型 Open-Sora2.0!

仅仅花费了区区20万美元(相当于224张 GPU 的投入),就成功训练出了一个拥有 110亿参数的商业级视频生成大模型。

QQ_1741846201943.png

性能直追“OpenAI Sora ”

别看 Open-Sora2.0成本不高,实力可一点都不含糊。它可是敢于叫板行业标杆 HunyuanVideo 和拥有300亿参数的 Step-Video 的狠角色。在权威评测 VBench 和用户偏好测试中,Open-Sora2.0的表现都令人刮目相看,多项关键指标上都能够媲美那些动辄花费数百万美元训练的闭源模型。

更令人激动的是,Open-Sora2.0在 VBench 的评测中,与 OpenAI Sora 之间的性能差距竟然从之前的4.52% 大幅缩小至仅仅0.69%!这几乎可以说是性能上的全面追平了!

而且,Open-Sora2.0在 VBench 中的得分甚至超过了腾讯的 HunyuanVideo,真可谓是“长江后浪推前浪”,以更低的成本实现了更高的性能,为开源视频生成技术树立了新的标杆!

在用户偏好评测中,Open Sora 在视觉表现、文本一致性和动作表现这三个关键维度上,至少有两个指标都超越了开源 SOTA 模型 HunyuanVideo 以及商业模型 Runway Gen-3Alpha 等。

QQ_1741846235912.png

低成本高效能的秘密武器

大家肯定好奇,Open-Sora2.0是如何做到以如此低的成本实现如此高性能的?这背后可有不少秘密武器。首先,Open Sora 团队在模型架构上延续了 Open-Sora1.2的设计思路,继续采用 3D 自编码器和 Flow Matching 训练框架。同时,他们还引入了 3D 全注意力机制,进一步提升了视频生成质量。

为了追求极致的成本优化,Open-Sora2.0从多个方面入手:

  • 严格的数据筛选,确保高质量的训练数据输入,从源头提升效率。
  • 优先进行低分辨率训练,高效学习运动信息,降低计算成本。要知道,高分辨率训练的成本可是低分辨率的几十倍呢!
  • 优先训练图生视频任务,加速模型收敛,进一步降低训练成本。而且,在推理阶段,还可以通过文本生图再生视频(T2I2V),以获得更精细的视觉效果。
  • 采用了 高效的并行训练方案,结合 ColossalAI 和系统级优化,大幅提升计算资源利用率。各种诸如高效的序列并行和 ZeroDP、细粒度控制的 Gradient Checkpointing、训练自动恢复机制等等“黑科技”加持,让训练效率大大提升。

据估计,市面上10B 以上的开源视频模型,单次训练成本动辄上百万美元,而 Open Sora2.0将这个成本降低了5-10倍。这简直是视频生成领域的福音,让更多人有机会参与到高质量视频生成的研发中来。

开源共享,共建繁荣生态

更令人称赞的是,Open-Sora 不仅开源了模型代码和权重,还开源了全流程训练代码,这无疑将极大地促进整个开源生态的发展。正如第三方技术平台统计,Open-Sora 的学术论文引用量在半年内就获得了近百引用,在全球开源影响力排名中稳居首位,成为全球影响力最大的开源视频生成项目之一。

Open-Sora 团队还积极探索高压缩比视频自编码器的应用,以大幅降低推理成本。他们训练了一款高压缩比(4×32×32)的视频自编码器,将单卡生成768px、5秒视频的推理时间从近30分钟缩短至3分钟以内,速度提升了10倍! 这意味着未来我们能够更快地生成高质量的视频内容。

潞晨科技推出的开源视频生成模型 Open-Sora2.0,以其低成本、高性能、全面开源的特性,无疑给视频生成领域带来了一股强劲的“平价”风。它的出现,不仅缩小了与顶级闭源模型之间的差距,更降低了高质量视频生成的门槛,让更多开发者能够参与其中,共同推动视频生成技术的发展。

🔗 GitHub 开源仓库:https://github.com/hpcaitech/Open-Sora

📄技术报告:https://github.com/hpcaitech/Open-Sora-Demo/blob/main/paper/Open_Sora_2_tech_report.pdf

猜你喜欢

山乡的风景之美,是在于深厚的女儿情怀与绵延的亲情故事
山乡的风景之美,是在于深厚的女儿情怀与绵延的亲情故事

在遥远的古城中,历史与现代交织出一幅独特的画卷。古寺、古柏、古塔与古钟,这些遥远年代的遗产,在雨雪风霜的洗礼下,诉说着一

如何选出美职篮全明星西部球队中最优秀的明星球员及其评选标准
如何选出美职篮全明星西部球队中最优秀的明星球员及其评选标准

美职篮全明星赛是篮球界的一大盛事,西部明星球员的选择备受瞩目。这不仅关乎球员个人的荣誉,更代表着西部赛区的实力与风采。那

中央芭蕾舞团在羊城倾情演出,2025女性艺术节共飨《红色娘子军》与《舞姬》的艺术盛宴
中央芭蕾舞团在羊城倾情演出,2025女性艺术节共飨《红色娘子军》与《舞姬》的艺术盛宴

广州大剧院即将迎来一场舞蹈艺术的双重盛宴,作为2025女性艺术节的核心亮点,中央芭蕾舞团将于3月4日至9日期间,精彩演绎

欢乐对决樱花刺杀的游戏玩法和技巧解析,让你轻松掌握如何在游戏中取胜
欢乐对决樱花刺杀的游戏玩法和技巧解析,让你轻松掌握如何在游戏中取胜

欢乐对决中的樱花刺杀玩法充满趣味与挑战,掌握一些攻略能让你在该玩法中表现得更加出色。熟悉樱花刺客特性樱花刺客是具有独特技

张燕明:汉隶艺术的杰出代表,笔墨之中彰显文人气质与风雅魅力
张燕明:汉隶艺术的杰出代表,笔墨之中彰显文人气质与风雅魅力

著名书法家张燕明先生的作品,在汉隶领域中以其鲜明的艺术风格脱颖而出,备受书法界瞩目。其作品不仅展现了深厚的传统功底,更融

如何成功通关江湖天星阁第60层攻略分享,助你轻松突破难关
如何成功通关江湖天星阁第60层攻略分享,助你轻松突破难关

这就是江湖天星阁60层,那是一个充满神秘与挑战的所在。踏入其中,仿佛进入了另一个世界,四周弥漫着一股古老而又深邃的气息。

曾翔书法艺术的追寻:寻找创作中的真实自我与突破之道
曾翔书法艺术的追寻:寻找创作中的真实自我与突破之道

书法界近期掀起了一场关于艺术境界的热烈讨论,焦点人物为知名且颇具争议的书法家曾翔。他的最新作品,不仅在网络上引发了广泛关

如何在“想不想修真”中有效获取天灵精粹的最佳途径与技巧分享
如何在“想不想修真”中有效获取天灵精粹的最佳途径与技巧分享

在想不想修真这款游戏中,天灵精粹是一种极为重要的资源,它对于玩家的修炼和发展起着关键作用。那么,如何才能获得天灵精粹呢?

姜国亮:书法艺术的先锋,以多重角色在艺术领域追求创新与突破
姜国亮:书法艺术的先锋,以多重角色在艺术领域追求创新与突破

在中国书法艺术界,姜国亮无疑是一位备受瞩目的大家。他不仅是国家一级美术师,还身兼多职,包括中国人民大学教授、博士研究生导

日本黄冈站与日本黄冈站的不同之处:揭示功能配置与服务标准之间的差异
日本黄冈站与日本黄冈站的不同之处:揭示功能配置与服务标准之间的差异

日本黄冈站和日本黄冈站的区别在于它们提供的功能和服务标准的显著不同。两者都位于日本,却在设施管理和乘客体验方面展现了各自