4月27日,阿里巴巴旗下AI视频生成模型
HappyHorse-1.0正式通过阿里云百炼平台开放企业级API测试,首批面向企业客户邀测,并计划于5月正式发布商用版本。

产品定位
HappyHorse定位为创作者友好型的全能视频生成工具,核心特点是“单模型、全能力、音画同步”。用户只需输入文本描述或上传图片,即可在单次推理中直接输出包含音效、配音和唇形同步的完整视频,无需后期拼接。
三大生成模式
文生视频:自然语言描述直接输出1080P电影级视频,支持4至12秒时长,精准还原光影、运动和空间关系。
图生视频:单张或多张图片输入即可生成连贯动态短片,语义理解能力强,动作自然、无闪烁感。
原生音视频联合生成:这是该产品的核心突破,在单个40层Transformer中同步生成画面与音效,支持普通话、粤语、英语、日语、韩语、德语、法语七种语言的唇形同步。
技术规格
HappyHorse-1.0采用150亿参数统一Transformer架构,通过DMD-2蒸馏技术将去噪步骤压缩至8步。在单张H100显卡上,生成5秒1080P视频仅需约38秒。输出支持稳定1080P分辨率,覆盖16:9、9:16等主流画幅,动态一致性强,AI闪烁感低。
配套功能
产品还提供了中英双语Prompt支持、智能回退、种子值锁定、4K画质升级等专业功能,降低创作者的使用门槛。

商业化路径
阿里选择从企业级市场切入。首批API测试名额采用白名单邀请制,主要面向AI短剧制作方、漫剧平台、跨境MCN等专业内容生产者开放。后续将逐步扩展至订阅制和私有化部署等模式。
团队与背景
HappyHorse由阿里巴巴ATH事业群创新事业部主导,联合阿里平台技术、通义实验室和淘天技术等团队协同打造。项目负责人同时兼任阿里妈妈CTO,被视为阿里推动AI视频商业化变现的重要布局。
🔗 HappyHorse 产品官网
本文观点不代表发现AI立场,转载请联系原作者。