上传一张图片即时生成一个3D世界!AI进化成这样了?
来源: 紫牛新闻
2026-04-27 11:44:00
一张照片,一部手机,你就能在AI造的世界里漫步。
4月27日,蚂蚁灵光App正式上线“体验世界模型 ”功能,成为业界首个可在移动端体验世界模型的AGI产品。记者体验发现,只需上传一张图片,即可在手机上最长60秒探索3D世界,并且用手游操控视角,像玩游戏一样在里面走动探索,从触发指令到开始探索,仅需秒级。这是业内首次实现在端侧跑起世界模型,分钟级的长时一致性、实时可交互的体验再一次引领了AGI产品。灵光一直致力于探索智能的边界,在此之前灵光上线“闪应用”功能,率先实现在手机端30秒生应用引领全民Wish Coding。
手机上打开灵光APP,点击左下角「➕」号上传图片,点击「生成图中世界」,即可体验世界模型
世界模型被视为通向AGI(通用人工智能)的重要路径之一,是连接数字世界与物理世界的重要桥梁。此次灵光App“体验世界模型 ”功能背后接入了蚂蚁灵波LingBot-World-Fast世界模型,该模型也已经开源。
灵光App为用户提供了便捷的世界模型体验入口。打开灵光App,在对话框上传一张图片后,系统会智能推荐操作指令,用户选择“生成图中世界”。或者,直接输入“帮我用第一人称视角探索这个世界”这类自然语言,系统会自动进入世界模型生成流程。从触发指令到开始探索,仅需秒级。
进入世界模型体验页面后,灵光App针对移动端用户的操作习惯进行了精心设计,创新性地引入了手游摇杆操控方式,让用户以最熟悉的方式探索AI即时生成的3D世界。具体而言,屏幕左侧摇杆负责控制角色在3D场景中的位移,用户可前后左右自由行走;右侧摇杆则负责控制视角旋转,实现全方位环顾探索。这一操控逻辑与主流3D手游高度一致,玩家无需额外学习,即可上手操控,真正做到“零门槛沉浸”。
世界模型的移动端部署,是行业里公认的难题。算力需求大、延迟控制难、终端性能参差不齐,每一条都是实际的工程挑战。灵光团队采用高效、低延迟的流式传输技术,实现了百毫秒级的响应延迟,用户从触发指令到开始探索3D世界仅需秒级,打破了此前世界模型“高门槛、高算力、难落地”的刻板印象。
灵光App负责人蔡伟表示,“体验世界模型功能是灵光在探索智能边界的又一实践。此前灵光推出的"闪应用"功能可实现自然语言30秒生应用,也是把原本专业开发者的Coding能力给到普通用户。灵光希望不断探索智能的边界,挖掘用户未被满足的需求,把好的AI体验给到所有人。”
扬子晚报/紫牛新闻记者 徐晓风