赋予机器人社交技能

机器人可以在大学校园里送食物，可以在高尔夫球场上一杆进洞，但即使是最先进的机器人也不能进行对人类日常生活至关重要的基本社会交往。

麻省理工学院的研究人员现在已经将某些社会互动纳入机器人的框架，使机器能够理解相互帮助或阻碍意味着什么，并学会自己执行这些社会行为。在模拟环境中，一个机器人观察它的同伴，猜测它想完成什么任务，然后根据自己的目标帮助或阻碍另一个机器人。

研究人员还表明，他们的模型创造了现实和可预测的社会互动。当他们将这些模拟机器人与人类互动的视频展示给人类看时，人类观众对模型中所发生的社会行为基本上是一致的。

让机器人表现出社交技能，可能会带来更顺畅、更积极的人机互动。例如，辅助生活设施中的机器人可以利用这些能力为老年人创造一个更有关怀的环境。新的模型也可以让科学家定量地测量社会互动，这可以帮助心理学家研究自闭症或分析抗抑郁药的效果。

“机器人很快就会生活在我们的世界里，它们真的需要学习如何以人类的方式与我们交流。他们需要知道什么时候该提供帮助，什么时候该看看自己能做些什么来防止事情发生。这是非常早期的工作，我们只是触及了表面，但我觉得这是第一次非常认真的尝试，以理解人类和机器进行社交互动的意义。”计算机科学与人工智能实验室(CSAIL) InfoLab小组首席研究科学家、大脑、思维和机器中心(CBMM)成员鲍里斯·卡茨说。

和Katz一起撰写论文的是联合首席作者Ravi Tejwani，他是CSAIL的研究助理;联合首席作者郭彦玲，CSAIL博士生;舒天民，脑与认知科学系博士后;资深作者Andrei Barbu是CSAIL和CBMM的研究科学家。这项研究将在11月的机器人学习会议上公布。

一个社会仿真

为了研究社会互动，研究人员创造了一个模拟环境，在这个环境中，机器人在二维网格中移动，追求物理和社会目标。

物理目标与环境有关。例如，机器人的物理目标可能是导航到网格上某一点的树。社交目标包括猜测另一个机器人正在尝试做什么，然后根据这个估计采取行动，比如帮助另一个机器人给树浇水。

研究人员使用他们的模型来指定机器人的物理目标是什么，它的社会目标是什么，以及它应该在这方面重视多少。机器人会因为接近目标的行动而获得奖励。如果一个机器人试图帮助它的同伴，它会调整自己的奖励以匹配另一个机器人的奖励;如果它试图阻碍，它就会将奖励调整为相反的方向。规划师是一种决定机器人应该采取何种行动的算法，它使用这种不断更新的奖励来引导机器人实现物理和社会目标的混合。

“我们开辟了一个新的数学框架，用于模拟两个主体之间的社会互动。如果你是一个机器人，你想去位置X，而我是另一个机器人，我看到你想去位置X，我可以合作，帮助你更快地到达位置X。这可能意味着让X更接近你，找到另一个更好的X，或采取任何你必须在X采取的行动。我们把‘什么’定义为社会互动在数学上的意义，”Tejwani说。

将机器人的身体目标和社交目标结合起来，对于创造真实的互动非常重要，因为互相帮助的人类能够做到的程度是有限的。例如，一个理性的人可能不会把钱包递给陌生人，Barbu说。

研究人员使用这个数学框架定义了三种类型的机器人。0级机器人只有物理目标，不能进行社交推理。1级机器人有物理和社会目标，但假设所有其他机器人只有物理目标。一级机器人可以根据其他机器人的物理目标采取行动，比如帮助或阻碍。2级机器人假设其他机器人有社会和物理目标;这些机器人可以采取更复杂的行动，如加入到一起帮助。

评估模型

为了了解他们的模型与人类的社会互动视角相比如何，他们创建了98个不同的场景，机器人处于0级、1级和2级。12个人观看了196个机器人互动的视频片段，然后被要求估计这些机器人的物理和社交目标。

在大多数情况下，他们的模型与人类对每一帧中发生的社会互动的看法一致。

“我们有这个长期的兴趣，既要为机器人建立计算模型，也要更深地挖掘这方面的人类方面。我们想从这些视频中找出人类用来理解社会互动的特征。我们能不能做一个客观测试来测试你识别社交互动的能力?也许有一种方法可以教人们认识这些社会互动，并提高他们的能力。我们离实现这一目标还有很长的路要走，但即使只是能够有效地衡量社交互动，也是向前迈进了一大步，”Barbu说。

更加成熟

研究人员正致力于开发一个带有3D代理的系统，该系统可以在一个环境中进行更多类型的交互，比如对家居用品的操作。他们还计划修改他们的模型，以包含操作可能失败的环境。

研究人员还想在模型中加入一个基于神经网络的机器人规划器，它可以从经验中学习并更快地执行。最后，他们希望进行一项实验，收集人类用来确定两个机器人是否在进行社交互动的特征的数据。

巴布说:“希望我们能有一个基准，让所有研究人员都能研究这些社交互动，并激发我们在物体和动作识别等其他领域看到的科学和工程进步。”

这项研究得到了大脑，思想和机器中心，国家科学基金会，麻省理工学院CSAIL系统学习计划，麻省理工- ibm沃森人工智能实验室，美国国防部高级研究计划局人工社会智能成功团队计划，美国空军研究实验室，美国空军人工智能加速器，以及海军研究办公室。

＃＃＃

作者:Adam Zewe，麻省理工学院新闻办公室

论文:“作为递归MDps的社会互动”

https://openreview.net/pdf?id=3HZLte8gMYS

文章标题

“作为递归MDps的社会互动”