阿里“欢乐马”横空出世碾压对手 字节紧急变阵 AI视频格局生变

   时间:2026-04-11 00:58 来源:天脉网作者:江紫萱

AI视频生成领域近日迎来重大转折,一款名为HappyHorse的开源模型突然崛起,以碾压性优势登顶全球权威评测榜单Artificial Analysis Video Arena,引发行业震动。这款由阿里巴巴ATH创新事业部研发的模型,不仅在文本生成视频和图片生成视频的四大细分赛道中全面超越字节跳动的Seedance 2.0,更以开源策略打破行业格局,迫使竞争对手紧急调整战略。

根据评测数据,HappyHorse在文本生成视频(不含音频)赛道以1389分领先第二名Seedance 2.0达115分,图片生成视频(不含音频)赛道更以1415分刷新历史纪录。即便在含音频的综合评测中,该模型仍保持显著优势,仅在图片生成视频(含音频)赛道以2分之差微弱落后。这种全方位的领先得益于其创新的技术架构——作为全球首个原生支持音视频联合生成的开源模型,HappyHorse通过统一自注意力Transformer架构,将文本、图像、音频等多模态Token整合为单一序列,实现"一次推理生成成片"的突破,单张H100显卡生成5秒1080p视频仅需38秒。

模型背后的操盘手张迪成为行业焦点。这位技术传奇人物拥有上海交通大学本硕学历,2010年加入阿里巴巴后主导阿里妈妈大数据架构,2020年跳槽快手担任技术总监,2024年以"技术一号位"身份带领团队研发出可灵AI两代架构,被业界誉为"可灵之父"。2025年11月回归阿里后,他仅用5个月就完成HappyHorse-1.0的开发,相较传统大模型12-18个月的开发周期堪称奇迹。更引人注目的是其职业轨迹:从阿里到快手,再从哔哩哔哩短暂任职后重返阿里,每次转身都留下具有行业影响力的技术成果。

开源策略成为HappyHorse的制胜关键。与字节Seedance 2.0设置企业认证、百万保证金、并发数限制等严苛准入条件不同,阿里选择完全开源模型代码和权重。这种差异在行业引发连锁反应:据知情人士透露,字节AI视频团队在HappyHorse登顶后紧急召开会议,原定对Seedance 2.0实施的限制性条款被连夜调整,计划全面放开企业认证和保证金要求。此前Seedance 2.0因版权争议陷入困境——美国电影协会和影视演员协会指控其大规模使用受版权保护作品,导致字节被迫暂缓全球发售计划,而HappyHorse通过开源社区协作模式有效规避了这类风险。

技术评测显示,HappyHorse在场景真实感和唇形同步精度上表现卓越,支持英、中、日、韩等七种语言的音画同步,词错误率处于行业最低水平。但该模型在复杂动作控制和分镜调度方面仍存在不足,更适合静态场景生成而非动态叙事。这种特性与其技术路线密切相关:通过消除传统模型"视频生成-配音-口型对齐"的多阶段流程,虽然提升了效率,却牺牲了部分动作控制精度。相比之下,Seedance 2.0在生成长视频时仍保持更好的角色连贯性,但在生成速度和开源生态上明显落后。

行业观察者指出,HappyHorse的崛起标志着AI视频生成进入"开源制衡闭源"的新阶段。阿里通过组织架构调整成立ATH创新事业部,将原通义实验室升级为通义大模型事业部,显示出全力押注AI视频赛道的决心。而字节面对开源模型的冲击,不得不重新评估其商业策略——既要解决Seedance 2.0的版权争议,又要应对HappyHorse带来的技术压力。这场变局使得原本由字节主导、快手紧随的竞争格局被彻底打破,中国AI视频领域正式形成字节、阿里、快手三足鼎立的新态势。

 
 
更多>同类内容
全站最新
热门内容