DeepMind大突破:让AI学会像动物一样“抄近路”

  • 时间:
  • 浏览:3

今天三更三更半夜,DeepMind又有新Nature论文发布!

这次亲戚我们我们 又训练出了有有有一一八个AI智能体,学好了这类哺乳动物一样的“抄近路”能力,这次研究的目的,很多很多设法模仿人类大脑,用错综复杂的依据 在互近空间里导航。这是有有有一一八个前所未有的探索,被认为是理解大脑的一次重大进步。

空间感知,对可能轻松成为围棋大师的AI来说,还是一件难事。

当你沿着熟悉的街道前进,绕过障碍,找到最快抵达目的地的捷径时,大脑里位于了什么?这是有有有一一八个非常错综复杂的事情。

科学家们在动物和人类大脑中找到了这俩 跟认路相关的细胞,分别是位置细胞、方向细胞和网格细胞。

位置细胞能在主体到达特定地点时放电,从而赋予对过往地点的记忆;方向细胞能感应前进的方向;网格细胞则是最神秘的这俩 :它们能将整个空间环境划分成蜂窝状的六边形网格,仿佛地图上的坐标系。

发现网格细胞的的莫索尔夫妇这俩获得了2014年的诺贝尔生理学或医学奖。不过,网格细胞仅仅是在空间环境中提供GPS定位服务吗?

这俩科学家猜测,它们也会参与矢量计算,辅助动物规划路径。

DeepMind团队决定用人工神经网络检验上述猜想。

人工神经网络是这俩 利用多层处理模拟大脑神经网络的运算价值形式。团队首先用数率学习算法训练神经网络学习哺乳动物的觅食运动路径,利用线数率单位、角数率单位等信号在视觉环境中进行定位。

研究人员可是我发现,这俩 这类于网格细胞活动价值形式的价值形式自动诞生了!在此前的训练中,研究人员并未刻意引导神经网络产生此种价值形式。

DeepMind团队可是我利用强化学习检验这俩网格价值形式是算不算能否进行矢量导航。强化学习被普遍用于训练游戏AI,人类告诉AI这俩 游戏的得分奖惩机制,但却不教授游戏依据 ,由AI在反复进行游戏、努力争取更高分的过程中自我进化。

研究人员将可是我自动突然出现的网格价值形式与有有有一一八个更大型的神经网络架构结合成了人工智能体,置于虚拟现实的游戏环境中。经历强化学习后,每人个 工智能在游戏迷宫中向目的地前进的导航能力超越了一般人,达到了职业游戏玩家水平。它能像哺乳动物一样寻找新路线和抄近路。

最关键的是,当研究人员“静默”原本的网格价值形式后,人工智能体的导航能力就会变弱,判断目标的距离和方向都更不准确了。

论文作者之一Dharshan Kumaran说道:“亲戚亲戚我们我们 证明了网格细胞远不很多很多给亲戚亲戚我们我们 提供GPS定位信号,也是这俩 大脑赖以计算有有有一一八个地点间的最短距离的核心导航机制。”

哈萨比斯说,要证明亲戚亲戚我们我们 能构建出来亲戚亲戚我们我们 想做的那种通用智能,大脑的位于很多很多有有有一一八个证据。很多很多从神经科学中为新的算法寻找灵感,是很有道理的。但亲戚亲戚我们我们 同去也相信这俩启发应该是双向的,人工智能研究的见解能否为神经科学中的开放大问题提供灵感。

“这项工作很多很多有有有一一八个很好的例子:通过构建有有有一一八个能在错综复杂环境中导航的人工智能体,亲戚亲戚我们我们 强调了生物网格细胞在哺乳动物导航中的重要性,也拓宽了这方面的理解。”哈萨比斯表示。

DeepMind团队相信,这类的研究依据 还可不时需用来探索大脑听觉和控制四肢的机制。在更远的将来,神经科学家们甚至可不时需用人工智能代替小白鼠来做实验。

同去也用人工智能体验证了哺乳动物大脑中的“网格细胞”对基于向量的导航有支持作用。