新闻中心

新闻中心

【WRC • 前沿】达芬奇机器人变身‘模仿达人’,通过看视频模仿手术缝合、穿针、打结等动作

时间: 2020-07-03

模仿是最原始的学习方法,也是实现人工智能的基石。


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyep1yDLZSwtL3Dp1pibwUvT3nynFxVAJuuvnRkiaXckcb4iaYGicLTOu8SO1g/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


通过深度学习和算法,机器人也可以通过看视频学会各种各样的技能。

先看个图:


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepPymaOf57W3ibW01W6yf76xUYNicbUAsvexYhpw8um9pAN0WEiavDjLlTA/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


是不是觉得有点眼熟。

没错,它就是技艺高超,被大家所熟知的达芬奇机器人。


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepJLzolfxEHvxzoLATKaGyvuHfSOPu57IZSpUYxE58a6TsmDuI6HgVLw/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


这次它又被赋予了新功能:通过观看教学视频,学会外科手术中的相关任务。比如缝合,穿针,以及打结等动作。

让达芬奇机器人变成‘模仿艺人’的关键,是一个叫做Motion2Vec的半监督式学习算法,近日由谷歌大脑,英特尔公司和加利福尼亚大学伯克利分校合作开发。


起初,加州大学伯克利分校的教授曾使用YouTube视频作为机器人学习各种动作(例如跳跃或跳舞)的指南。机器人模仿视频中的动作,成功学习了20多种杂技,比如侧空翻、单手翻、后空翻等高难度动作。


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepcoMJEExIeJsx2GVSI0FOkxNPEVcsLC1hRsGvJRQRvcpc0PHjFIhSwQ/640?wx_fmt=gif&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepAWTK1nI6NPt0iaoibhZ5SicN5m7yIQvExZ7dStIAZyUKhkxnib22jQTrYQ/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


谷歌此前也有过相关研究,例如使用视频来教授四足机器人学习狗狗的灵活动作。


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepUMQFkX3Y3ZD7KOvP2Gu8MT3ljdYDHrdYTebflnkNicNicuQjaWcBZz8Q/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


这些经历促成了他们彼此的合作,他们将这些知识应用于最新项目Motion2Vec中,在这个过程中,使用了实际手术过程的视频进行指导和训练。

在最近发布的论文中,研究人员概述了他们如何使用YouTube视频训练两臂的达芬奇机器人在织布机上插入针头并进行缝合。


人类在看视频的时候可以迅速理解内容,但机器人目前无法做到这一点,它们只是将其视为像素流。因此,要以机器人的方式让他们理解并学习——弄清并分析这些像素,然后将视频分割成有意义的序列。


事实上,Motion2Vec算法的开发主要基于暹罗网络和递归神经网络。


暹罗网络(Siamesenetwork)就是“连体的神经网络”,神经网络的“连体”是通过共享权值来实现的。它的主要功能是衡量两个物体的相似度。比如,看看某两个人长得像不像。


https://mmbiz.qpic.cn/mmbiz_jpg/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepbPVvlgtuWRXzfxClstf9FO2KW2usIbrtkUZrKqhibYSNcuQngegwazQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1

这样,研究人员就可以将视频中相同动作段的图像放到一起,并给它们做一个标记,比如‘针头插入’,或‘瞄准位置’等,从而对视频中的图像进行分割和分类。



https://mmbiz.qpic.cn/mmbiz_jpg/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepZ3NAbS6SJdQ6anjPrrug3TicNoTJ3CxicP5wsicubxYKEakokQFwAAlJQ/640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1&wx_co=1


然后,研究人员使用递归神经网络来找到那些没有被标记的图像,这些图像会反馈到暹罗网络中以改善动作片段的比对。

对于缝合任务,研究团队仅需要78个教学医学视频即可训练其AI引擎执行该过程,成功率为85%。


https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyep8NMmE8D7B7Q8JeMKFmtYuMBvqaEAnQDtWYsrpc004bCVmnnQkHwv3g/640?wx_fmt=gif&wxfrom=5&wx_lazy=1

https://mmbiz.qpic.cn/mmbiz_gif/LJiau2qPWAcUxpQbwYotc2mvZ6Es0uyepZcjk7qRRUxFH8kIyGtaCcQccdDibsIo31XrCc0fCktBpicTRf7tKfpRw/640?wx_fmt=gif&wxfrom=5&wx_lazy=1


这似乎意味着机器人可以在外科手术中承担一些更基本,重复性的任务,但它们目前还无法完全代替医生来做手术。


加州大学伯克利分校实验室的负责人KenGoldberg解释说“我们想要看到的是,机器人在做基本缝合任务,而外科医生能够监视手术过程,比如像机器人表明他们想要在哪一排进行缝合,或传达出希望进行六次覆膜缝合的想法。” “这样,机器人能代替外科医生做最基本的任务,让医生们得到更多的休息,并能够专注于手术中更复杂或更细微的部分。”


(来源:机器人大讲堂公众号)

请扫描二维码关注大会官方微信

获取有关世界机器人大会的最新动态

中国电子学会 © 2015-2024 All rights reserved备案号:京ICP备12041980号-10