UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架

uniact:一种新型具身基础模型框架

UniAct 是一种创新的具身基础模型框架,旨在解决机器人行为的异构性问题。它通过学习通用行为,提取不同机器人共享的原子行为特征,从而克服由物理形态和控制接口差异造成的行为不一致性。UniAct 的架构主要由通用行为提取器、通用行为空间和异构解码器三部分构成。通用行为提取器基于视觉语言模型,通过观察和任务目标来提取通用行为;通用行为空间采用向量量化码本的形式,每个向量代表一种原子行为;异构解码器则负责将通用行为转化为特定机器人的控制信号。

UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架

核心功能:

通用动作编码: UniAct 将不同机器人的原子行为(例如“移动到目标位置”或“避开障碍物”)转化为通用的向量化码本,每个代码代表一种可跨平台共享的通用技能。轻量高效: UniAct-0.5B 模型仅需 0.5 亿参数,其真实和模拟环境下的任务表现已超越参数规模达 14 亿的 OpenVLA 模型。快速适应性: UniAct 仅需 50 条专用示教数据即可在新环境中微调,并能快速适应新的机器人和控制接口。只需添加轻量级解码器,即可轻松扩展到新的机器人平台。跨领域数据利用: UniAct 通过通用行为空间,更有效地利用跨领域数据进行训练,从而在不同机器人和环境中实现更强大的泛化能力。行为一致性: 在不同的部署场景和机器人类型上,相同的通用动作能展现出一致的行为模式,为具身智能体的控制提供了更便捷的方式。用户只需从码本中选择相应的通用动作,即可指挥不同类型的机器人完成任务。

技术原理详解:

通用动作空间: UniAct 利用向量量化构建了一个离散的通用动作空间,该空间是一个向量化码本,每个向量嵌入代表一种通用的原子行为。这些原子行为是不同机器人在不同环境下共享的基本行为模式。通用动作提取器: 基于视觉语言模型 (VLM),UniAct 的通用动作提取器能够识别和提取通用动作。它根据观察结果和任务目标,输出选择通用动作的概率。异构解码器: UniAct 使用异构解码器将通用动作转换为特定机器人的可执行命令。这些解码器针对不同的机器人平台进行设计,能根据机器人的具体特征将通用动作转换为具体的控制信号。轻量化架构与高效训练: UniAct 采用轻量化模型架构,即使参数较少也能保持优异的性能。它通过行为克隆损失进行训练,并根据动作标签的性质选择合适的损失函数。

项目信息:

项目官网: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6cGithub 仓库: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6carXiv 技术论文: https://www.php.cn/link/a87823bb4525992c4faeea10b5965d6c

应用场景:

UniAct 的应用前景广泛,包括自动驾驶、医疗机器人、工业自动化和智能家居等领域。其通用性使其能够高效地控制各种类型的机器人,并适应不同的环境和任务需求。

以上就是UniAct— 清华、商汤、北大、上海AI Lab共同推出的具身基础模型框架的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/3234065.html

(0)
上一篇 2025年4月1日 20:50:51
下一篇 2025年4月1日 20:51:03

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • Java面试题及答案的高效复习资料

    准备java面试时,高效复习的关键方法包括:1.分类复习,将题目按类型分类;2.动手实践,对于编程题自己动手写代码;3.模拟面试,提升表达和应变能力,这些方法能帮助你巩固知识并在面试中脱颖而出。 引言 在准备Java面试时,找到高效的复习资…

    2025年4月2日
    100
  • 通过缓存技术优化Java框架的性能

    针对 java 框架的性能优化,可以通过缓存技术提高访问速度。具体步骤包括:使用缓存库(如 caffeine、ehcache、guava cache)将频繁访问的数据(如数据库查询结果)存储在内存中使用 caffeine 构建缓存示例:导入…

    2025年4月2日
    100
  • 使用Java框架在DevOps中构建高效的工作流

    使用 java 框架在 devops 中构建高效的工作流:使用 jenkins 设置持续集成和持续交付管道,自动化构建、测试和部署过程。利用 gitlab ci/cd 提供的内置管道功能,管理 java 项目的 ci/cd 流程。创建自定义…

    2025年4月2日
    100
  • 从Java框架社区获得帮助的途径

    从 java 框架社区获得帮助有多种途径:在线论坛和社区:stack overflow、java 论坛、github issues社交媒体:twitter、linkedin 群组文档和教程:框架文档、代码示例、书籍社区活动和会议:meetu…

    2025年4月2日
    100
  • java怎么判断回文数

    使用Java判断回文数的方法包括:字符串反转:将数字转换为字符串,反转字符串,然后与原始字符串比较。反转数字:将数字反转,然后与原始数字比较。对于小整数,反转数字效率更高,而对于大整数,字符串反转效率较低。 Java判断回文数的方法 回文数…

    2025年4月2日
    100
  • java文件操作怎么回滚

    Java 文件操作的回滚方法有:使用文件锁;创建文件备份;使用版本控制系统;使用 Java NIO2 的 FileChannel.truncate 方法。 Java 文件操作的回滚 回滚 Java 文件操作涉及将文件恢复到其以前的状态,通常…

    2025年4月2日
    100
  • 如何使用开源替代品替代现有java框架?

    如何使用开源替代品替代现有 java 框架?识别要替换的框架,明确其功能和局限性。探索开源平台,寻找具有类似功能的开源框架,考虑社区支持和许可条款。评估替代品,进行性能测试、特性比较和兼容性检查。制定迁移计划,包括测试、实施和回滚策略。分阶…

    2025年4月2日
    100
  • 最佳的开源替代品在哪些行业和用例中使用?

    开源替代品广泛应用于各个行业,提供与专有软件相当的功能,成本和限制更低。这些应用包括云计算、数据库、办公套件、操作系统和开发工具。例如,金融行业使用开源替代品创建了风险管理系统,降低了成本并提高了灵活性。随着开源软件的成熟,其采用范围预计将…

    2025年4月2日
    100
  • java框架如何加速人工智能模型训练?

    java 框架可通过以下方式加速人工智能模型训练:利用 tensorflow serving 部署预训练模型进行快速推理;使用 h2o ai driverless ai 自动化训练过程并利用分布式计算缩短训练时间;通过 spark mlli…

    2025年4月2日
    100
  • java框架中的DevOps实践:代码审查与结对编程

    通过代码审查和结对编程,java 框架中的 devops 实践可以提高代码质量、生产力和协作:代码审查:审查代码以发现错误、漏洞和违规行为,从而提高代码质量。结对编程:两名开发人员同时编写代码,促进实时讨论、反馈和知识共享,从而提高生产力。…

    2025年4月2日
    100

发表回复

登录后才能评论