机器人独角兽酷哇科技,开源了业内首个交互式世界模型

发布时间:2026-05-30 10:32

图片1

《星岛》记者 曹安浔 广州报道

具身智能正加速从实验室融入物理世界真实场景。5月29日,酷哇科技(Coowa)技术团队正式发布全新一代交互式世界模型 CooWAIM 2.0。

图片2png

作为Coowa WAM的跨代际演进版本,CooWAIM 2.0从底层架构上彻底突破了前代模型“预测与规划分离”的局限。CooWAIM 2.0模型首次将隐空间物理推理深度融入决策闭环,让世界预测与动作生成在推理过程中实现协同演化,为具身智能世界模型的发展提供了极具前瞻性的解法。

简单来说, CooWAIM 模型的核心是让预测未来和生成动作在机器人脑子里像辩论一样互相修正、共同演化,不是想完再做,而是边想边做。它不需要渲染完整的未来画面,那太慢且太贵,而是在一个压缩的隐空间里短程推演几秒,就能支撑很长的安全轨迹。

架构重构与隐空间的压缩

DAWN架构的本质突破,在于它重新定义了世界-动作交互模型(WAIM)的底层逻辑:未来世界和未来动作不应是单向生成的产物,而必须作为一对耦合变量,在推理阶段通过迭代交互来寻求自洽 。

通过一系列基础逻辑的重构,CooWAIM 2.0不仅实现了从“被动预测”向“交互式博弈”的跨越,还完成了对隐空间的极致压缩。

过去,在端侧设备上实现高频的递归推演,对算力分配提出了极高要求,也将带来难以接受的延迟。

而DAWN 架构的前端采用了强悍的视觉主干网络提取特征,而真正的优化核心在于其独创的Auto-Encoder Resampler(自编码器重采样模块)。通过这个模块,CooWAIM 2.0能够将繁杂的视觉数据提炼为16个潜变量Token。它有效地过滤了光影变化等冗余噪声,精准保留了路网几何、障碍物拓扑等决定规划质量的“核心物理语义”,为高频递归推演留足了算力冗余。  

不仅如此,数据表明,CooWAIM 2.0最核心的性能跃升集中在2—3秒的“短时潜变量推演”上。CooWAIM 2.0无需消耗过量资源去模拟过度长远的未来,它只需要在隐空间里往后“看”一眼,确认接下来的动作不会引发连锁物理崩溃,就足以支撑生成极高质量的长程轨迹。

图片3

赋能全形态终端,重塑 Robocity 城市全景智能

需要注意的是,DAWN架构解决的并不是特定硬件的控制问题,而是“动作”与“环境演变”之间的通用博弈逻辑。

因此,这赋予了CooWAIM 2.0跨硬件平台泛化的能力。

目前,酷哇科技正逐步将这套模型部署至旗下多元化的具身智能产品矩阵中,以适应轮式底盘与智能小巴、四足机器狗、泛人形机器人等不同复杂度的工作环境。

以轮式底盘与智能小巴为例,在城市主干道与复杂街区中,车辆面临着高度动态的交通参与者。搭载 CooWAIM 2.0的X系列智能清扫机器人与L4级无人小巴Coobus,能够在隐空间内实时推演行人、非机动车的行为意图,并在汇入车流或贴边作业时,进行更具交互感的自适应博弈,提升城市服务过程中的行驶平顺性与安全性。

相比于轮式设备,足式机器人的动作空间包含了更高频的关节力矩与地面反作用力计算。在面对台阶、松软草坪或散落物时,CooWAIM 2.0展现了对非结构化地形的强大适应力,机器狗能够通过短时隐空间推演预判足端接触面的物理反馈,从而提前规避失稳风险,深入传统轮式设备难以触及的末端场景。

当面向未来智能制造与家庭物业服务场景,人形机器人需要进行精细的接触式操作(如抓取、擦拭、协同搬运)。CooWAIM 2.0的自我进化闭环,将持续助力人形机器人在复杂的双臂协同与环境交互中,实现更稳定、更泛化的作业能力。

据悉,酷哇科技(COOWA)成立于2015年,作为世界模型驱动的城市场景具身智能全栈商,聚焦智慧出行、市政环卫、智能制造、物业服务四大核心场景,构建了涵盖轮式机器人、四足机器狗及泛人形机器人的多元化产品矩阵。

此番CooWAIM 交互式世界模型的发布,标志着酷哇在通用具身智能底座上的技术壁垒进一步加强,有望推动多形态机器人在更广泛的城市场景中实现规模化、经营性落地。

更多优质产业新闻请扫码关注“星岛产研”微信公众号获取

更多优质产业新闻请扫码关注“星岛产研”微信公众号获取



编辑︱林木