UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架

PHP中文网 • 2025年4月1日 20:50:58 • 编程技术 • 阅读 1

uniact：一种新型具身基础模型框架

UniAct 是一种创新的具身基础模型框架，旨在解决机器人行为的异构性问题。它通过学习通用行为，提取不同机器人共享的原子行为特征，从而克服由物理形态和控制接口差异造成的行为不一致性。UniAct 的架构主要由通用行为提取器、通用行为空间和异构解码器三部分构成。通用行为提取器基于视觉语言模型，通过观察和任务目标来提取通用行为；通用行为空间采用向量量化码本的形式，每个向量代表一种原子行为；异构解码器则负责将通用行为转化为特定机器人的控制信号。

核心功能：

通用动作编码: UniAct 将不同机器人的原子行为（例如“移动到目标位置”或“避开障碍物”）转化为通用的向量化码本，每个代码代表一种可跨平台共享的通用技能。轻量高效: UniAct-0.5B 模型仅需 0.5 亿参数，其真实和模拟环境下的任务表现已超越参数规模达 14 亿的 OpenVLA 模型。快速适应性: UniAct 仅需 50 条专用示教数据即可在新环境中微调，并能快速适应新的机器人和控制接口。只需添加轻量级解码器，即可轻松扩展到新的机器人平台。跨领域数据利用: UniAct 通过通用行为空间，更有效地利用跨领域数据进行训练，从而在不同机器人和环境中实现更强大的泛化能力。行为一致性: 在不同的部署场景和机器人类型上，相同的通用动作能展现出一致的行为模式，为具身智能体的控制提供了更便捷的方式。用户只需从码本中选择相应的通用动作，即可指挥不同类型的机器人完成任务。

技术原理详解：

通用动作空间: UniAct 利用向量量化构建了一个离散的通用动作空间，该空间是一个向量化码本，每个向量嵌入代表一种通用的原子行为。这些原子行为是不同机器人在不同环境下共享的基本行为模式。通用动作提取器: 基于视觉语言模型 (VLM)，UniAct 的通用动作提取器能够识别和提取通用动作。它根据观察结果和任务目标，输出选择通用动作的概率。异构解码器: UniAct 使用异构解码器将通用动作转换为特定机器人的可执行命令。这些解码器针对不同的机器人平台进行设计，能根据机器人的具体特征将通用动作转换为具体的控制信号。轻量化架构与高效训练: UniAct 采用轻量化模型架构，即使参数较少也能保持优异的性能。它通过行为克隆损失进行训练，并根据动作标签的性质选择合适的损失函数。

项目信息：

项目官网: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6cGithub 仓库: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6carXiv 技术论文: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6c

应用场景：

UniAct 的应用前景广泛，包括自动驾驶、医疗机器人、工业自动化和智能家居等领域。其通用性使其能够高效地控制各种类型的机器人，并适应不同的环境和任务需求。

以上就是UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/3234065.html

AI Git

0 0

关于作者

PHP中文网签约作者

557.0K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

路由器登录IP地址大全：192.168.0.1/10.0.0.1等

上一篇 2025年4月1日 20:50:51

GaussianAnything— 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架

下一篇 2025年4月1日 20:51:03

编程技术

Java面试题及答案的高效复习资料

准备java面试时，高效复习的关键方法包括：1.分类复习，将题目按类型分类；2.动手实践，对于编程题自己动手写代码；3.模拟面试，提升表达和应变能力，这些方法能帮助你巩固知识并在面试中脱颖而出。引言在准备Java面试时，找到高效的复习资…

PHP中文网
2025年4月2日
1000
编程技术

通过缓存技术优化Java框架的性能

针对 java 框架的性能优化，可以通过缓存技术提高访问速度。具体步骤包括：使用缓存库（如 caffeine、ehcache、guava cache）将频繁访问的数据（如数据库查询结果）存储在内存中使用 caffeine 构建缓存示例：导入…

PHP中文网
2025年4月2日
1000
编程技术

使用Java框架在DevOps中构建高效的工作流

使用 java 框架在 devops 中构建高效的工作流：使用 jenkins 设置持续集成和持续交付管道，自动化构建、测试和部署过程。利用 gitlab ci/cd 提供的内置管道功能，管理 java 项目的 ci/cd 流程。创建自定义…

PHP中文网
2025年4月2日
1000
编程技术

从Java框架社区获得帮助的途径

从 java 框架社区获得帮助有多种途径：在线论坛和社区：stack overflow、java 论坛、github issues社交媒体：twitter、linkedin 群组文档和教程：框架文档、代码示例、书籍社区活动和会议：meetu…

PHP中文网
2025年4月2日
1000
编程技术

java怎么判断回文数

使用Java判断回文数的方法包括：字符串反转：将数字转换为字符串，反转字符串，然后与原始字符串比较。反转数字：将数字反转，然后与原始数字比较。对于小整数，反转数字效率更高，而对于大整数，字符串反转效率较低。 Java判断回文数的方法回文数…

PHP中文网
2025年4月2日
1000
编程技术

java文件操作怎么回滚

Java 文件操作的回滚方法有：使用文件锁；创建文件备份；使用版本控制系统；使用 Java NIO2 的 FileChannel.truncate 方法。 Java 文件操作的回滚回滚 Java 文件操作涉及将文件恢复到其以前的状态，通常…

PHP中文网
2025年4月2日
1000
编程技术

如何使用开源替代品替代现有java框架？

如何使用开源替代品替代现有 java 框架？识别要替换的框架，明确其功能和局限性。探索开源平台，寻找具有类似功能的开源框架，考虑社区支持和许可条款。评估替代品，进行性能测试、特性比较和兼容性检查。制定迁移计划，包括测试、实施和回滚策略。分阶…

PHP中文网
2025年4月2日
1000
编程技术

最佳的开源替代品在哪些行业和用例中使用？

开源替代品广泛应用于各个行业，提供与专有软件相当的功能，成本和限制更低。这些应用包括云计算、数据库、办公套件、操作系统和开发工具。例如，金融行业使用开源替代品创建了风险管理系统，降低了成本并提高了灵活性。随着开源软件的成熟，其采用范围预计将…

PHP中文网
2025年4月2日
1000
编程技术

java框架如何加速人工智能模型训练？

java 框架可通过以下方式加速人工智能模型训练：利用 tensorflow serving 部署预训练模型进行快速推理；使用 h2o ai driverless ai 自动化训练过程并利用分布式计算缩短训练时间；通过 spark mlli…

PHP中文网
2025年4月2日
1000
编程技术

java框架中的DevOps实践：代码审查与结对编程

通过代码审查和结对编程，java 框架中的 devops 实践可以提高代码质量、生产力和协作：代码审查：审查代码以发现错误、漏洞和违规行为，从而提高代码质量。结对编程：两名开发人员同时编写代码，促进实时讨论、反馈和知识共享，从而提高生产力。…

PHP中文网
2025年4月2日
1000