我们已经更新了隐私政策为了更清楚我们如何使用您的个人数据。

我们使用cookie为您提供更好的体验。你可以阅读我们的饼干政策这里。

广告
解决AI披萨制造挑战
消息

解决AI披萨制造挑战

解决AI披萨制造挑战
消息

解决AI披萨制造挑战

学分:Max Saeling/ Unplash
阅读时间:

想要这个新闻故事的免费PDF版本吗?

填写下面的表格,我们将向您发送PDF版本的电子邮件“解决AI披萨制造挑战”

名*
姓*
电子邮件地址*
国家*
公司类型*
工作职能*
您想从技术网络接收进一步的电子邮件通信吗?捷克葡萄牙直播

捷克葡萄牙直播技术网络有限公司需要您提供给我们的联系信息,以与您联系我们的产品和服务。您可以随时退订这些通信。有关如何取消订阅以及我们的隐私惯例和保护隐私的承诺的信息,请查看我们隐私政策

想象一下一个用面团球工作的披萨制造商。她可能会用刮刀将面团提起到切菜板上,然后用滚动销将其扁平化成一个圆圈。容易,对吧?如果这个比萨制造商是机器人,那不是。


对于机器人而言,使用像面团这样的可变形物体的对象工作很棘手,因为面团的形状可以在许多方面发生变化,这很难用方程式来表示。另外,从该面团中创建一个新形状需要多个步骤和使用不同工具。对于机器人来说,要学习一系列步骤(有很多可能的选择)的操纵任务特别困难,因为学习通常是通过反复试验而发生的。


麻省理工学院,卡内基·梅隆大学和加利福尼亚大学圣地亚哥分校的研究人员提出了更好的方法。他们为使用两个阶段学习过程的机器人操纵系统创建了一个框架,该过程可以使机器人在长时间内执行复杂的面团操作任务。“老师”算法解决了机器人必须采取的每个步骤才能完成任务。然后,它训练一个“学生”的机器学习模型,该模型了解了关于何时以及如何在任务过程中执行所需的每种技能的抽象想法,例如使用滚动别针。有了这些知识,系统的原因是如何执行技能完成整个任务。


研究人员表明,他们称之为这种方法diffskill,可以在模拟中执行复杂的操作任务,例如切割和撒店面团,或从切菜板周围收集面团,同时超过其他机器学习方法。


除了披萨制作之外,该方法还可以应用于机器人需要操纵可变形物体的其他环境中,例如喂养,沐浴或服装老年人或有运动障碍的护理机器人。


“这种方法更接近我们作为人类计划行动的方式。当人类执行长途任务时,我们并没有写下所有细节。我们有一个高级规划师,粗略地告诉我们什么是阶段,以及在此过程中需要实现的一些中间目标,然后我们执行它们。实验室(CSAIL),以及呈现Diffskill。


李的合着者包括卡内基·梅隆大学(CMU)研究生的主要作家Xingyu Lin;夏黄(Zhiao Huang),加州大学圣地亚哥分校的研究生;Joshua B. Tenenbaum,Paul E. Newton的职业发展教授,在麻省理工学院大脑与认知科学系的认知科学与计算部和CSAIL成员;David Held,CMU的助理教授;MIT-IBM Watson AI实验室的研究科学家Chuang Gan和高级作家Chuang Gan。该研究将在国际学习表现会议上介绍。

学生和老师

DIFFSKILL框架中的“老师”是一种轨迹优化算法,可以解决短距离任务,其中对象的初始状态和目标位置靠近。该轨迹优化器在模拟器中起作用,该模拟器建模现实世界的物理学(称为可区分的物理模拟器,它将“ diff”放在“ diffskill”中)。“老师”算法使用模拟器中的信息来了解面团在每个阶段,一次必须如何移动,然后输出这些轨迹。


然后是“学生”神经网络学会模仿老师的行为。作为输入,它使用了两个相机图像,一个显示了当前状态的面团,另一个显示了任务末尾的面团。神经网络生成了一个高级计划,以确定如何将不同的技能联系起来以达到目标。然后,它为每种技能生成特定的短距离轨迹,并将命令直接发送到工具。


研究人员使用这项技术来实验三个不同的模拟面团操作任务。在一项任务中,机器人使用刮铲将面团抬到切菜板上,然后使用滚动销将其弄平。在另一个机器人中,机器人使用抓手从柜台上收集面团,将其放在刮刀上,然后将其转移到切菜板上。在第三个任务中,机器人用刀将一堆面团切成两半,然后使用抓手将每块碎片运送到不同的位置。

在其余的

Diffskill能够超越依赖强化学习的流行技术,在这种技术中,机器人通过反复试验学习任务。实际上,Diffskill是唯一能够成功完成所有三个面团操纵任务的方法。有趣的是,研究人员发现,“学生”神经网络甚至能够胜过“老师”算法。


“我们的框架为机器人提供了新技能提供了一种新颖的方式。然后可以链接这些技能,以解决更复杂的任务,这些任务超出了以前的机器人系统的能力。”林说。


由于他们的方法着重于控制工具(刮刀,刀,滚动销等),因此可以应用于不同的机器人,但前提是他们使用研究人员定义的特定工具。将来,他们计划将工具的形状集成到“学生”网络的推理中,以便将其应用于其他设备。


研究人员打算通过使用3D数据作为输入来提高DIFFSKILL的性能,而不是很难从模拟转移到现实世界的图像。他们还希望使神经网络计划过程更加高效,并收集更多样化的培训数据,以增强DiFfskill概括为新情况的能力。从长远来看,他们希望将Diffskill应用于更多样化的任务,包括布料操纵。


国家科学基金会,LG Electronics,MIT-IBM Watson AI实验室,海军研究办公室和国防高级研究项目机构机器常识计划的一部分支持这项工作。


本文已从以下内容重新发布材料。注意:材料可能已被编辑有关长度和内容。有关更多信息,请联系引用的来源。



广告