滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

地瓜机器人&CASIA新突破：单目方案让机器人轻松抓取透明物体

时间：2025-03-05 19:06:33 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

在机器人技术的前沿探索中，一项关于透明物体抓取的重大突破近日由地瓜机器人携手中国科学院自动化研究所多模态人工智能系统全国重点实验室共同宣布。他们的研究成果——MODEST单目透明物体抓取算法，成功入选即将于2025年举行的IEEE机器人与自动化国际会议（ICRA 2025）论文名录，标志着该技术在国际舞台上的认可。

透明物体，如水杯、试管乃至窗户，虽广泛存在于我们的日常生活中，但其独特的折射与反射特性却给机器人的视觉感知带来了巨大挑战。在常规的RGB图像中，透明物体往往因缺乏鲜明的纹理而难以与背景区分，同时，现有的商用深度相机也难以精确捕捉这些物体的深度信息，导致机器人在处理这类物体时捉襟见肘。

为了攻克这一难题，地瓜机器人与中科院自动化所的研究团队联合推出了MODEST框架。这一创新性的多任务框架专注于透明物体的单目深度估计与语义分割，通过巧妙的语义和几何融合模块，结合特征迭代更新策略，显著提升了深度估计与语义分割的准确性，特别是在抓取成功率和系统泛化性上实现了质的飞跃。

MODEST算法框架作为通用抓取模型的前置增强模块，其即插即用的特性无需依赖额外的传感器，仅凭单张RGB图像即可实现对透明物体的精准抓取。这一特性使得MODEST在智能工厂、实验室自动化以及智慧家居等多个领域具有广泛的应用前景，不仅降低了设备成本，还显著提升了机器人对透明物体的操作能力。

MODEST的核心在于其针对透明物体的深度估计能力。通过设计的语义和几何结合的多任务框架，MODEST能够准确获取透明物体的深度信息，并结合基于点云的抓取网络实现抓取操作。这一过程相当于在通用抓取网络前增加了一个专门针对透明物体的增强模块，从而大幅提升了抓取的精准度和成功率。

MODEST模型的整体架构由编码、重组、语义几何融合和迭代解码四个模块组成。输入的单目RGB图像首先经过基于ViT的编码模块处理，随后被重组为多尺度特征，分别对应分割和深度两个分支。在融合模块中，这两组特征被混合并增强，通过多次迭代逐步更新特征，最终获得准确的分割结果和深度预测。

为了验证MODEST算法的有效性，地瓜机器人将其迁移至真实机器人平台进行了透明物体抓取实验。实验平台由UR机械臂和深度相机组成，在MODEST算法的精准感知基础上，采用GraspNet进行抓取位姿的生成。实验结果显示，MODEST算法在真实平台上表现出了良好的鲁棒性和泛化性，能够在各种透明物体上实现稳定且精准的抓取。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

新款iPad Air(M3)到底值不值得买？AI们这样说……

03-05

AI智能体“入职”，开启行业智能化革新新纪元

近日，安恒信息召开发布会，正式发布恒脑·DeepSeek安全垂域一体机及恒脑智盾两款重磅产品，作为国内率先提出安全智能体理念的领军企业，安恒信息始终引领行业创新。2023年8月，恒脑·安全垂域大模型首次公开亮相，基于安全垂域大模型的安全运营平台全新升级发布。如今

03-05

MWC25观察：边缘云成新宠，5G-A与AI沦为配角？

03-05

罗永浩为AIOS大动作，小米前元老汪文俊强势加盟！

03-05

上海交大新规：AI辅助学习，学生需守规范促智慧发展

03-05

冯远征试水DeepSeek写剧本：严谨有余，人情味不足？

03-05

腾讯元宝针对“霸王条款”争议，回应：已升级数据管理功能

03-05

京东2025年JDY实习生计划盛大启动，万余岗位等你来战！

03-05

马斯克阻止OpenAI营利转型遭拒，奥尔特曼能否加速商业化进程？

03-05

京东2025实习生计划启动：万余岗位开放，产研岗月薪破万！

03-05

罗永浩进军AIOS，小米前50号员工汪文俊强势加盟！

03-05

DeepSeek时代，谁的内容将引领搜索新风尚？

微博智搜的深度思考过程是比较让我感到意外的，它提到“雷军喜提1小时首富”的内容是来自“认证账号”，还有一个内容是普通账号转发了“上观新闻”这一权威媒体的文章，“因此有一定的可信度”，我感觉它就像我们科技媒体…

03-05

明略科技CDP+MA：赋能品牌全域增长，精准营销解锁新路径

03-05

量化巨头跨界AI大模型，九坤投资能否复制DeepSeek成新星？

王琛，正是九坤投资的创始人，也是最近风投圈关注的又一位AI大模型新星。在《财经故事荟》看来，有人、有钱、有技术是坐上大模型牌桌不可或缺的条件，而量化基金公司刚好都具备。但更深远的意义则是，DeepSee…

03-05

抖音豆包联手，字节跳动加速AI生态布局能否突围？

无论是抖音接入豆包App，还是腾讯系接入腾讯元宝App，其背后都反映出互联网大厂对于AI技术在内容生态中应用的重视，以及对用户流量和使用时长的激烈争夺。一位字节的技术总监告诉Tech星球，“大模型比拼到最…

03-05

点击查看更多 +

全站最新

比亚迪元PLUS智驾版焕新上市，售价11.58万起，智驾体验全面升级！

比亚迪大疆联手发布“灵鸢”系统，智能车载无人机时代来临

DeepSeek引领汽车智能革命，车企竞逐智舱升级与投资成本优化

极星汽车中国业务大调整，销量低迷能否借新车翻盘？

全新奥迪A6 Avant官图发布，第九代家族成员展现年轻凶狠新风貌

东风日产新能源技术大爆发，“沙发厂”能否借势重回巅峰？

热门内容

本栏最新

MWC25观察：边缘云成新宠，5G-A与AI沦为配角？

罗永浩进军AIOS，小米前50号员工汪文俊强势加盟！

DeepSeek时代，谁的内容将引领搜索新风尚？

努比亚Flip 2小折叠屏手机京东首发，立减500元还有多重福利！

腾讯AI新动向：DeepSeek赋能社会创新，Light公益点燃技术向善星火

吴明辉谈DeepSeek：如何携手打造中国AI营销大模型新标杆？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.