开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口-云开体育以确保深奥的扩张性与通用性-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

云开体育以确保深奥的扩张性与通用性-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

发布日期:2025-11-10 11:12  点击次数:142

云开体育以确保深奥的扩张性与通用性-开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口

机器东说念主亦然卷疯了!

不仅能叠穿着,况兼一干便是俩小时,且全程无任何扶直。

清华大学智能产业推敲院(AIR)与上海东说念主工智能实验室合股发布通用跨践诺具身基座模子 X-VLA,通过翻新的 Soft-Prompt 机制、高效的框架盘算推算与定制化考试范式,权臣提高预考试效果与模子性能。

更关键的是,X-VLA 是首个完结 120min 无扶直自主叠衣任务的全开源模子(公开数据、代码与参数),以仅 0.9B 的参数目在五大泰斗仿真基准上全面刷新性能记载。

中枢递次

为克服不同机器东说念主平台在解放度、相机不雅测视角等践诺参数上的分歧,推敲引入了可学习的 Soft-Prompt。

该机制动态地将具身践诺的硬件确立信息编码为一种连气儿表征,使模子在预考试中粗略解耦任务政策与具体践诺器,从而权臣增强模子对异构机器东说念主平台的允洽才智,并提高羼杂数据考试的安靖性与效果。

针对机器东说念主任务中多源视觉输入的异质性,推敲团队建议了分治编码决议。

任务关联的主视角图像由高性能视觉 - 话语模子编码,以索求高层语义特征;而主要提供低眉目空间反映的扶直视角,则通过轻量化的汇集进行局部特征索求。

该政策在保证信息竣工性的前提下,优化了运筹帷幄资源的分拨,提高了模子的信息管理通量。

模子骨干弃取范例 Transformer 架构,以确保深奥的扩张性与通用性。当作生成模块摈弃了传统的细目性输出政策,转而弃取先进的flow-matching,以概率生成的神气建模机器东说念主当作序列。

该递次权臣增强了当作轨迹的平滑性与对不细目环境的鲁棒性,为万古序任务的得胜践诺奠定了坚实基础。

在预考试阶段,推敲弃取大限制高质地异构数据,主要特质如下所示:

平衡化数据采样:定制数据采样政策,确保异构数据集的平衡考试,幸免模子偏袒。

多模态数据清洗与时空对都活水线:团队对原始机器东说念主操作数据实施了严格预管理,包括:将不同空间下的当作数据长入映射至范例任务空间;对高频率齐集的数据进行时序层面的对都与重采样。

此过程极大提高了状况 - 当作序列在技巧上的一致性逻辑与举座质地。

以语义 - 当作对都为导向的数据彩选范例:团队开拓了严格的数据质地门槛,中枢是筛选视觉帧明晰、话语领导形色精确且与后续当作序列高度关联的数据样本。

此举从源流上确保了模子学习到的是有明确因果相干的"举止常识",而非浅层的舛误关联。

在后考试阶段,推敲主要在两个方面进行了诊治。

分层分组的自允洽学习率诊治

鉴于模子中不同组件(如预考试冻结的 VLM、新引入的 Soft-Prompt、骨干 Transformer 等)的参数限制与治理本性分歧,团队为其施加了分组别、分歧化的学习率诊治政策。

该盘算推算既保护了预考试取得的基础常识,又允许关键适配层快速诊治,从而在保证考试安靖性的同期,大幅优化了治理效果。

面向异构模块的渐进式 warm-up 政策

关于模子中新引入的可学习参数(如 Soft-Prompt),团队在考试开动阶段弃取线性递加的学习率热身机制,使其参数空间得以牢固开动化,再徐徐融入全局优化过程。

该政策有用幸免了考试初期因梯度巨变导致的不安靖性,尤其适用于异构模块的协同考试。

实验截至高效预考试:可扩张的架构上风

可扩张的架构上风 X-VLA 的预考试缩放定律(Scaling Laws)弧线呈现出优异的线性增长趋势。这标明,跟着模子参数以及考试数据限制的同步扩大,其在测试集的开环测试性能呈现安靖、可展望的提高。

这一惬心考证了所建议的 Soft-Prompt 机制与粗略 Transformer 架构的纷乱可扩张性,为构建更大限制的具身智能基座模子奠定了坚实基础。

数据与算法的协同优化

获利于高质地的预考试基座,X-VLA 在后考试(微调)阶段展现出极高的数据效果与安靖性。针对不同的卑鄙任务(如自主叠衣),只需使用中小限制的场景专属数据进行微调,模子便能快速允洽并达到 SOTA 性能。

这源于预考试阶段学习到的通用视觉 - 话语 - 当作表征,以及后考试中弃取的定制化学习率政策与慢启动机制,它们共同确保了常识从通用域到特定任务的高效、安靖迁徙。

X-VLA 除了在包括 LIBERO、SIMPLER 等在内的泰斗仿真环境中取得 SOTA 认知外,在实在的机器东说念主平台上,该模子也在大都肤浅执取和桌面操作任务中展现了纷乱性能,并得胜完成了无穷时长的自主叠衣任务,展示了其疏漏复杂长程任务的超卓才智。

技俩主页:https://thu-air-dream.github.io/X-VLA/

代码:https://github.com/2toinf/X-VLA.git

论文聚拢: https://arxiv.org/pdf/2510.10274

一键三连「点赞」「转发」「注意心」

接待在挑剔区留住你的思法!

—  完  —

� � 点亮星标 � �

科技前沿进展逐日见云开体育



相关资讯
热点资讯
  • 友情链接:

Powered by 开云官网kaiyun皇马赞助商 (中国)官方网站 登录入口 @2013-2022 RSS地图 HTML地图