nvidia发布全球首个开源通用人形机器人基础模型:gr00t n1
NVIDIA重磅推出GR00T N1,这是全球首个面向通用人形机器人的开源基础模型。它能够基于多模态输入(例如语言和图像)在各种环境中执行多种操作任务。
GR00T N1核心功能:
多功能操作: 执行抓取、搬运、双臂协调等多种操作任务,适应复杂环境。多模态理解: 理解自然语言指令并结合视觉图像信息执行任务。跨平台兼容: 兼容多种机器人平台,例如Fourier GR-1和1X Neo。复杂任务规划: 能够处理需要多步骤和多种技能整合的复杂任务。高效数据利用: 结合互联网数据、合成数据和真实机器人数据进行训练,提高性能和泛化能力,降低对标注数据的依赖。
GR00T N1技术架构与原理:
GR00T N1采用双系统架构:
视觉-语言模型 (System 2): 基于NVIDIA-Eagle和SmolLM-1.7B构建,负责环境理解、推理和规划,生成动作计划。扩散变换器 (System 1): 将视觉-语言模型的计划转化为精确的连续动作,控制机器人运动。
其数据策略涵盖互联网视频数据、合成数据(NVIDIA Omniverse生成)和真实机器人数据,并利用无监督学习提升效率。模型通过大规模数据预训练和针对特定平台、任务和环境的微调来优化性能。
获取GR00T N1:
项目官网: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2bGitHub仓库: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2bHuggingFace模型库: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b技术论文: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b
GR00T N1应用前景:
GR00T N1在物流、制造、零售、医疗和工业检查维护等领域具有广泛的应用前景,有望显著提升效率和自动化水平。
以上就是GR00T N1— 英伟达开源的人形机器人基础模型的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/3272138.html