在AI视频生成领域,一款名为HappyHorse-1.0的开源模型近日成为焦点。这款由阿里巴巴内部孵化的模型以黑马姿态登顶Artificial Analysis视频竞技场排行榜,在文本生成视频、图片生成视频等四大核心赛道中全面领先,其中图片生成视频(不含音频)赛道更以1413分刷新纪录,较第二名高出110分。
技术突破是该模型的核心竞争力。作为全球首个原生支持音视频联合生成的开源模型,HappyHorse采用40层统一自注意力Transformer架构,参数规模达150亿。在硬件效率方面,单张H100显卡生成5秒1080p视频仅需38秒,较同类模型提升40%以上。多语言支持能力尤为突出,可实现英语、普通话、粤语等七种语言的精准唇形同步,词错误率控制在行业最低水平。
该模型的技术基因可追溯至阿里内部组织架构调整。2024年3月,阿里CEO吴泳铭宣布成立ATH事业群,整合通义实验室、MaaS业务线等五大核心板块,重点布局AI基础设施。4月8日,集团技术委员会正式成立,通义实验室升级为独立事业部,标志着阿里AI战略进入全面加速期。HappyHorse正是在此背景下,由原淘天集团未来生活实验室团队研发,后随实验室划归ATH事业群AI创新事业部。
商业化进程已同步启动。阿里云销售团队正积极拓展AI短剧、漫剧等垂直领域客户,计划通过MaaS平台向开发者提供模型服务。据内部人士透露,HappyHorse已完成内部上架,预计一周后正式对外发布。海外社交平台显示,阿里巴巴集团官方账号已成为该模型首位关注者,释放出强烈的市场信号。
行业格局面临重塑。当前全球视频生成市场呈现梯队化竞争态势,字节跳动Seedance 2.0、快手可灵3.0等模型占据头部位置。高盛研究报告指出,该领域市场规模将从2025年的30亿美元激增至2030年的290亿美元。HappyHorse的横空出世,不仅验证了阿里在多模态大模型领域的技术积累,更可能打破现有竞争格局,推动国产模型进入新一轮技术竞赛。











