蚂蚁集团发布 LingBot-VLA:双臂机器人操控步入“大模型时代” ...
LingBot-VLA 采用了创新的“混合 Transformer”架构。 它以 Qwen2.5-VL 作为多模态主干,能够同时处理多视角图像和自然语言指令。 与此同时,模型内置的“动作专家”分支会实时结合机器人的自身状态,通过条件流匹配技术,输出平滑且连续的控制轨迹,确保了双臂协作的精准度。
此外,针对传统模型在空间深度感知上的弱点,蚂蚁集团引入了 LingBot-Depth 空间感知模型。 通过特征蒸馏技术,LingBot-VLA 即使在传感器数据缺失的情况下,也能展现出卓越的3D 空间推理能力,在叠放、插入、折叠等精细化任务中表现尤为出色。
在包含100项挑战任务的 GM-100现实世界基准测试中,带深度感知版本的 LingBot-VLA 成功率达到17.30%,显著优于 π0.5和 GR00T N1.6等同类模型。 研究还发现,该模型具有极高的数据效率,仅需约80条特定任务的演示数据,即可快速适配新机器人。
目前,蚂蚁集团已将 LingBot-VLA 的全套训练工具包和模型权重正式开源。 该工具包针对大规模 GPU 集群进行了优化,训练吞吐量比现有主流框架提升了1.5至2.8倍。 这一举措将极大降低机器人大模型的开发门槛,推动具身智能技术向更多实际应用场景渗透。
论文:https://arxiv.org/pdf/2601.18692
如何用 DeepSeek 生成备课教案
在教育工作里,编写教案既重要又耗时。借助 AI 工具 DeepSeek,教师可快速生成系统有
如何用 DeepSeek 进行论文降重
在学术写作中,论文重复率超标是常见难题。DeepSeek 作为强大的 AI 工具,能助力对重
利用AI制作古风Q版戏曲娃娃,小红书博主们狂吸粉
赚钱思路在小红书上,可以看到很多博主们利用AI技术制作古风Q版戏曲娃娃视频,通过小
抖音博主用 “AI 说唱 + 动物科普” 爆款视频涨粉125W+
赚钱思路通过 Suno V5等 AI 工具将动物科普知识转化为洗脑中文说唱,搭配真实纪录素材
3个月狂揽100万粉丝!这个年轻人给动物写Rap,一条视频播放破3亿
赚钱思路将硬核动物科普知识通过AI生成说唱形式呈现,让知识更易传播接受,通过流量变










