阿里 ATH 重磅发布!全球首个主动式实时交互世界模型 HappyOyster 上线

AI 世界模型赛道再迎重磅玩家!成立刚满一个月的阿里巴巴 ATH(Alibaba Token Hub)事业群,正式推出全球首个主动式实时交互世界模型 ——HappyOyster(快乐生蚝),凭借可漫游、可导演、可创造、可分享的沉浸式体验,彻底打破传统 AI 生成的 “第四面墙”。


一、产品定位:不止生成视频,而是生成可进入的世界

HappyOyster 是一款面向开放场景的实时世界创建与交互产品,基于原生多模态流式生成架构打造,核心支持四大能力:

  • Wander(漫游):自由穿梭 AI 生成的数字世界

  • Direct(导演):实时操控剧情、镜头与角色走向

  • Create(创造):从零搭建专属可交互世界

  • Share(分享):支持他人探索与二次创作

官方标语取自莎士比亚经典:The world is your oyster. Now open it.,寓意每个人都能轻松打开属于自己的数字世界。


二、两大核心玩法:漫游 + 导演,沉浸式拉满

1. Wandering 自由漫游

  • 支持文本 / 图片多模态输入

  • 可自定义角色 + 场景,支持第一 / 第三人称切换

  • WASD + 方向键实时控制移动与视角

  • 世界自带 BGM 与动态 NPC,自动录制可下载视频

  • 当前支持 480p,单次探索时长 1 分钟

无论是滑雪赛场、海边小镇,还是像素风、油画风场景,都能快速生成并实时互动。

2. Directing 实时导演

5eac3030c3687c9016d54d611729bade

  • 支持 480p/72p 分辨率切换

  • 可设定风格(常规 / 平静 / 戏剧)与运镜(平稳 / 快速)

  • 生成过程中随时输入指令修改剧情

  • 画面即时响应,实现 “边拍边改”

传统 AI 视频是 “生成→等待→成片”,而 HappyOyster 支持全程实时干预,用户从旁观者变成创作者。


三、核心技术:三大突破,重构世界模型体验

HappyOyster 依托阿里 ATH 团队的底层技术,攻克了世界模型长期存在的痛点:

1. 长时世界建模,解决内容错乱

  • 长时序世界演化机制,保持场景一致性

  • 状态复用 + 历史注意力传递,避免结构退化

  • 长时间生成不漂移、不崩坏

2. 实时交互响应,低延迟操控

  • 控制信号在线注入,无需重置生成流程

  • 隐状态压缩建模,大幅降低计算开销

  • 文本 / 图像 / 操作指令实时驱动世界变化

3. 音视频联合生成,沉浸感拉满

  • 统一框架同步生成画面与音频

  • 音画天然对齐,语义高度一致

  • 告别后期配音,提升真实感


四、应用场景:从娱乐到产业,空间全面打开

HappyOyster 不局限于内容创作,更可作为实时世界引擎落地多领域:

  • 文旅展陈、线下互动娱乐

  • 机器人仿真训练

  • 数字人陪伴与交互

  • 教育演练、模拟实训

  • 智能空间、可穿戴设备联动

结合硬件后,可成为 “现实感知 + 实时生成 + 即时反馈” 的闭环系统。


五、关于阿里 ATH 与产品体验

阿里巴巴 ATH 事业群于 2026 年 3 月 16 日成立,整合通义实验室、MaaS、千问、悟空等团队,专注 Token 生态构建。

体验方式

  • 目前处于Early Access阶段,需申请邀请码

  • 官网:happyoyster.cn

  • 支持在线创建、探索画廊公开世界、下载视频


结语

从文本、图像到视频,生成式 AI 一直在升级呈现形式;而 HappyOyster 直接跳到 **“可交互世界”** 新阶段,让用户真正 “走进” AI 生成的内容里。

作为阿里布局世界模型的首款重磅产品,HappyOyster 不仅重新定义了实时交互体验,也为下一代生成式 AI 指明了新方向 ——不止生成像素,而是创造世界。

有点意思啊可以去试试

看起来还挺有意思的

实时生成还带交互,这个技术路线选得挺准。不过480p分辨率现在看有点不够用,未来得优化渲染管线才行。