AI 模型近年不断发展,对於多媒体处理和生成都已经逐渐纯熟,不过要处理现实世界的物理变化等细节则尚有改进空间。最近 Google 就宣布开发能够模拟真实世界的模型,做为 DeepMind 的一部分。
新的开发计画将由 OpenAI Sora 影片生成工具前共同负责人 Tim Brooks 领导,Brooks 在 X 表示,新团队将与 Google 现有 Gemini、Veo 和 Genie 等团队合作,招募文宣说影片与多模态资料 AI 训练规模化,将是通往通用人工智慧(AGI)的发展方向。新团队集中开发「即时互动生成」工具,与现有多模态模型 Gemini 等整合,提供更全面的功能。
真实世界模拟应用范围相当广泛,从视觉推理、模拟、规划具身智慧助理 (Embodied Agent),到即时互动娱乐等都会用到。除了 Google 开发中 Genie 模型,其他「世界模型」还有 World Labs、Decart 和 Odyssey 等,可生成互动多媒体内容如游戏和电影等,以及逼真模拟、训练机器人等。
(本文由 Unwire Pro 授权转载;首图来源:shutterstock)