当大模型长出“手臂”:VLA架构如何让AI从“会想”到“会做”

数字AI解决的是理解和生成,而Physical AI要面对真实空间、真实物体、真实动作和真实约束。它不只是会想,还必须会做。

7月3日,2026全球数字经济大会上,云迹科技发布的具身智能单臂协作机器人,是VLA(视觉-语言-动作)架构在商用服务领域的典型实践。产品集成感知内嵌推演、常识认知推理、长任务在线自适应、双路线动作生成、agent调度总线五大技术。

云迹科技新品具身智能单臂协作机器人亮相2026全球数字经济大会

 

感知内嵌推演:从“反应式”到“预判式”

其中,“感知内嵌推演”尤为值得关注——机器人在行动前即可在“大脑”中预演动作后果,理解物理规律。这种推演式感知能力,让VLA架构从学术概念走向真实商业场景。传统机器人靠的是“示教再现”,每换一个场景就要重新编程。而基于世界模型的推演能力,机器人能够在“大脑”中预演动作后果,预测衣物重量、洗衣机门的开合角度、不同材质布料的抓取力度,从而具备跨场景泛化作业能力。

长任务规划:从“执行指令”到“独立履约”

更值得关注的是长任务规划闭环能力——机器人不再是执行单一指令的“工具”,而是能够独立完成跨时段、多步骤复杂任务的“智能体”。以酒店洗衣为例,从收衣到送回,持续数小时、涉及十几个操作节点,机器人可自主拆解任务、跟踪进度、处理异常。它跨越的不只是技术鸿沟,更是从“演示”走向“真实履约”的鸿沟。

服务Token化:物理动作的“标准化”

“服务Token化”的提出,进一步将物理动作纳入Transformer自回归范式。云迹在流匹配与动作离散化双路线上的布局,正是为了让物理动作能够接入Transformer自回归范式,从而实现服务的标准化与可交易化。这意味着Physical AI正在从“功能实现”走向“标准定义”——物理世界的工作,第一次可以被标准化计价、规模化调度。

云迹科技智造中心总经理赵博学现场发布新品

标签:

上一篇:动励启能专题家长讲座圆满落幕|聚焦青少年抑郁休学,破解家庭陪伴困局
下一篇: