AI 世界模型赛道再迎重磅玩家!成立刚满一个月的阿里巴巴 ATH(Alibaba Token Hub)事业群,正式推出全球首个主动式实时交互世界模型 ——HappyOyster(快乐生蚝),凭借可漫游、可导演、可创造、可分享的沉浸式体验,彻底打破传统 AI 生成的 “第四面墙”。
一、产品定位:不止生成视频,而是生成可进入的世界
HappyOyster 是一款面向开放场景的实时世界创建与交互产品,基于原生多模态流式生成架构打造,核心支持四大能力:
-
Wander(漫游):自由穿梭 AI 生成的数字世界
-
Direct(导演):实时操控剧情、镜头与角色走向
-
Create(创造):从零搭建专属可交互世界
-
Share(分享):支持他人探索与二次创作
官方标语取自莎士比亚经典:The world is your oyster. Now open it.,寓意每个人都能轻松打开属于自己的数字世界。
二、两大核心玩法:漫游 + 导演,沉浸式拉满
1. Wandering 自由漫游
-
支持文本 / 图片多模态输入
-
可自定义角色 + 场景,支持第一 / 第三人称切换
-
WASD + 方向键实时控制移动与视角
-
世界自带 BGM 与动态 NPC,自动录制可下载视频
-
当前支持 480p,单次探索时长 1 分钟
无论是滑雪赛场、海边小镇,还是像素风、油画风场景,都能快速生成并实时互动。
2. Directing 实时导演

-
支持 480p/72p 分辨率切换
-
可设定风格(常规 / 平静 / 戏剧)与运镜(平稳 / 快速)
-
生成过程中随时输入指令修改剧情
-
画面即时响应,实现 “边拍边改”
传统 AI 视频是 “生成→等待→成片”,而 HappyOyster 支持全程实时干预,用户从旁观者变成创作者。
三、核心技术:三大突破,重构世界模型体验
HappyOyster 依托阿里 ATH 团队的底层技术,攻克了世界模型长期存在的痛点:
1. 长时世界建模,解决内容错乱
-
长时序世界演化机制,保持场景一致性
-
状态复用 + 历史注意力传递,避免结构退化
-
长时间生成不漂移、不崩坏
2. 实时交互响应,低延迟操控
-
控制信号在线注入,无需重置生成流程
-
隐状态压缩建模,大幅降低计算开销
-
文本 / 图像 / 操作指令实时驱动世界变化
3. 音视频联合生成,沉浸感拉满
-
统一框架同步生成画面与音频
-
音画天然对齐,语义高度一致
-
告别后期配音,提升真实感
四、应用场景:从娱乐到产业,空间全面打开
HappyOyster 不局限于内容创作,更可作为实时世界引擎落地多领域:
-
文旅展陈、线下互动娱乐
-
机器人仿真训练
-
数字人陪伴与交互
-
教育演练、模拟实训
-
智能空间、可穿戴设备联动
结合硬件后,可成为 “现实感知 + 实时生成 + 即时反馈” 的闭环系统。
五、关于阿里 ATH 与产品体验
阿里巴巴 ATH 事业群于 2026 年 3 月 16 日成立,整合通义实验室、MaaS、千问、悟空等团队,专注 Token 生态构建。
体验方式
-
目前处于Early Access阶段,需申请邀请码
-
支持在线创建、探索画廊公开世界、下载视频
结语
从文本、图像到视频,生成式 AI 一直在升级呈现形式;而 HappyOyster 直接跳到 **“可交互世界”** 新阶段,让用户真正 “走进” AI 生成的内容里。
作为阿里布局世界模型的首款重磅产品,HappyOyster 不仅重新定义了实时交互体验,也为下一代生成式 AI 指明了新方向 ——不止生成像素,而是创造世界。

