阿里HappyHorse强势登顶视频竞技场全球首个音视频联合生成开源模型将发布-耳机音频-智能日报

在AI视频生成领域，一款名为HappyHorse-1.0的开源模型近日成为焦点。这款由阿里巴巴内部孵化的模型以黑马姿态登顶Artificial Analysis视频竞技场排行榜，在文本生成视频、图片生成视频等四大核心赛道中全面领先，其中图片生成视频（不含音频）赛道更以1413分刷新纪录，较第二名高出110分。

技术突破是该模型的核心竞争力。作为全球首个原生支持音视频联合生成的开源模型，HappyHorse采用40层统一自注意力Transformer架构，参数规模达150亿。在硬件效率方面，单张H100显卡生成5秒1080p视频仅需38秒，较同类模型提升40%以上。多语言支持能力尤为突出，可实现英语、普通话、粤语等七种语言的精准唇形同步，词错误率控制在行业最低水平。

该模型的技术基因可追溯至阿里内部组织架构调整。2024年3月，阿里CEO吴泳铭宣布成立ATH事业群，整合通义实验室、MaaS业务线等五大核心板块，重点布局AI基础设施。4月8日，集团技术委员会正式成立，通义实验室升级为独立事业部，标志着阿里AI战略进入全面加速期。HappyHorse正是在此背景下，由原淘天集团未来生活实验室团队研发，后随实验室划归ATH事业群AI创新事业部。

商业化进程已同步启动。阿里云销售团队正积极拓展AI短剧、漫剧等垂直领域客户，计划通过MaaS平台向开发者提供模型服务。据内部人士透露，HappyHorse已完成内部上架，预计一周后正式对外发布。海外社交平台显示，阿里巴巴集团官方账号已成为该模型首位关注者，释放出强烈的市场信号。

行业格局面临重塑。当前全球视频生成市场呈现梯队化竞争态势，字节跳动Seedance 2.0、快手可灵3.0等模型占据头部位置。高盛研究报告指出，该领域市场规模将从2025年的30亿美元激增至2030年的290亿美元。HappyHorse的横空出世，不仅验证了阿里在多模态大模型领域的技术积累，更可能打破现有竞争格局，推动国产模型进入新一轮技术竞赛。

活动同步开启捷途旅行者PLUS与旅行者PLUSC‑DM双车预售，并联合中汽信科、清华大学发布越野行业白皮书，拿下自主知识产权创新认证，完成技术、产品、标准三位一体发布。此次捷途旅行者PLUS燃油版预售区间18…

IT之家 4 月 9 日消息，HONOR 荣耀现已在全渠道启动 WIN 游戏本系列的预约，该型号将于 4 月 23 日发布。IT之家注意到，荣耀昨日展示了 WIN 游戏本系列的 BC 面外观，其中键盘区上方…

月 9 日消息，韩媒 ETNEWS 本日早些时候报道称，三星显示 (SDC) 将于今年下半年向苹果和谷歌供应基于最新 M16基材（IT之家注：即发光材料体系）的 OLED 显示面板。 ▲ 三星显示 OLED…

英特尔的至强 Xeon 处理器将继续为谷歌云基础设施提供强大支持，以头节点的身份成为 AI 系统的核心组成单元。同时，英特尔与谷歌将扩大IPU 这类网络 ASIC 上的开发合作，提高 CPU 利用率、提…

为了适应日益服务于AI智能体需求但却忽视网站所有者需求的互联网环境，Cloudflare和GoDaddy正在合作努力控制AI如何爬取网络并与网页内容交互。"我们希望确保每个创作者都有工具来验证谁在与他们的网…

在AI基础设施-算力领域，以“5+X”多芯片协同设计，打破算力孤岛；通过业界首创的“OEX创新正交架构”，打造开放、高密度、高可扩展的超节点架构；可支持单机柜128个GPU，算力规模还可进一步扩展至1.6万…

今天，我们就来盘点一下 vivo X300 Ultra 的几大系统功能亮点，看看它是如何提升我们的用机体验的。这就不得不提在 X300Ultra 上体验极佳的第三方效率神器——一键改图App。得益于 X…

PCDaliy智能日报 - 每日更新世界智能科技的最新进展、产品评测和行业动态，为您提供全面而深入的视角，让您在这个日新月异的智能时代始终领先一步。
PC Daily（www.pcd.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:智能日报）
Copyright © PCD 2012-2023 www.pcd.com.cn All rights reserved. 鲁ICP备2022032383号-10 鲁公网安备37010202700527号

阿里HappyHorse强势登顶视频竞技场 全球首个音视频联合生成开源模型将发布

阿里HappyHorse强势登顶视频竞技场全球首个音视频联合生成开源模型将发布