目前对于计算机科学家来讲,人工神经网络构建,往往基于这样一个概念:神经元是一个简单的、非智能的开关,神经网络的信息处理来源于数万(数万亿)个神经元之间的连接。
然后神经科学家对于人脑的研究发现却并不是如此。在神经科学的诸多研究中已经发现,人脑在信息计算上并不只有神经元连接在起作用,单个的神经元也同样承担着比以前人们想象中要重要得多的计算任务。
最近《Science》上发表了一篇论文 “Dendritic action potentials and computation in human layer 2/3 cortical neurons”。在这篇论文中,研究人员发现,皮质神经元树突上的微小区室(tiny compartments in the dendritic arms of cortical neurons)可以执行特定的计算-“异或”。这个发现之所以重要,在于,一直以来数学理论家们都认为单个神经元是无法进行“异或”计算的;现在则不仅是单个神经元,甚至神经元的树突上的部分都可以进行“异或”运算。
神经元并不单纯只是为了连接,它们同样能够执行复杂运算,神经元本身可能也是一个多层网络。这个发现对于构建人工神经网络的计算机科学家们来讲,或许会是一个非常重要的启发。
哑神经元的局限性
在上世纪40年代和50年代,这样一幅图片开始在神经科学领域占主导地位:
-
哑神经元(“dumb” neuron),一个简单的积分器,整个网络中对输入进行求和的点;
-
从神经元延伸出来的分支(称为树突)能够从邻近神经元接收成千上万的信号,有些是兴奋性信号,有些是抑制性信号;
-
在神经元细胞体上,所有的信号在这里进行加权和计数,如果总和超过某个阈值,则神经元会发出一系列的电脉冲(动作电位),这些电脉冲会直接刺激邻近的神经元。
大约在同一时间,研究人员意识到,单个神经元可以起到逻辑门的作用,类似于数字电路中的逻辑门(尽管截止目前我们还不清楚大脑在处理信息,在多大程度上是这样的)。例如,如果神经元仅在收到足够数量的输入后才触发,实际上就是一个“与”门。因此理论上,神经元网络可以执行任何计算。但显然这种模型是存在局限性的。在这种模型中,神经元将坍缩为空间中的一个点,它没有任何内部结构。另一方面这个模型也忽略了一个事实:流入给定神经元的数千个输入是沿着不同的树突进入神经元细胞体的,而这些树突本身所起到的功能可能差异巨大,或者更为具体来说,这些树突内部本身可能存在一些计算功能。这种模型在80年代开始改变。
神经科学家Christof Koch等人通过建模(后来也得到了实验的支持)表明,单个神经元内部不能表达为单个或统一的电压信号;取而代之的是,电压信号沿着树突进入神经元胞体内时会降低,并且通常对细胞的最终输出没有任何贡献。
信号的不一致性,意味着单个的树突可能在彼此独立地处理信息。这与先前的神经元假说是有矛盾的;在先前的神经元假说中,神经元只是简单将所有东西加在一起。
这项工作促使了Koch以及耶鲁大学医学院的Gordon Shepherd等人开始对树突结构进行建模。基本的思路就是,神经元不再只是充当一个简单的逻辑门,而是一个复杂的多单元处理系统。
后来 Mel 等人进行了更加细致的研究,他们发现:1)树突能够产生局部尖峰;2)树突具有自己的非线性输入-输出曲线;3)树突有自己的激活阈值(这个阈值与神经元整体阈值不同);4)树突本身可以充当 AND 门或其他单元。
Mel等人认为,这意味着可以将单个的神经元构想为 two-layer 的神经网络:树突充当非线性计算子单元,收集输入并吐出中间输出;这些输出信号将在细胞体中进行结合,然后决定整个神经元的反应。
当然,截止目前为止,我们还并不清楚树突水平的活动,是否会影响神经元的放电以及邻近神经元的活动。不过,不管如何,局部处理在整个神经元系统中的作用已经毋庸置疑。在计算能力上,神经元要比我们想象的强大很多。
神经学家Shepherd也曾表示:“皮层中进行处理的大部分功率实际上是低于阈值的。单个神经元系统可能并不仅仅只是一个加权求和的系统。”
从理论上来讲,几乎任何可以想象的计算都可以由一个具有足够树突的神经元来执行,每个树突都能够执行自己的非线性计算。
而前面提到的最近发表在《Science》上的论文中,研究人员将这一想法又向前推进了一步:他们认为,不仅仅是树突本身,树突中的微小区室也能够独立执行复杂计算。
意外尖峰与明斯基的不可能
本文作者Matthew Larkum 是一位洪堡德的神经科学家,他的研究团队希望能够从不同的问题角度来研究树突。之前研究者主要在研究啮齿类动物的树突活动,因此他们希望能够研究有大量且更长树突的人类神经元中的电信号有什么不同。
他们从人类大脑皮层的第二层和第三层获取了脑组织切片,人类大脑皮层包含了有许多树突的特大神经元。当他们用电流来刺激这些树突时,他们看到了意料之外且反复出现的尖峰,这些尖峰似乎与其他已知的神经信号完全不一样。它们非常迅速而短暂,就如同动作电位一般,是由钙离子的流动所引起的。这是值得注意的,因为传统的动作电位通常是由钠离子和钾离子所引起的。并且,虽然此前已经在啮齿动物的树突状中也观察到了这种由钙离子所诱发的信号,但是那些尖状物的持续时间要长得多。
更奇怪的是,给树突注入给多的电流刺激,反而会降低神经元放电的密集度,而非增加。
为了搞清楚这种新的尖峰可能带来什么影响,研究人员构建了一个能够反映神经元行为的模型。
该模型发现,输入 X和输入Y,如果只有输入 X 或只有输入Y,树突会出现尖峰;而如果两个输入同时出现,就不会有尖峰。这相当于异或(或XOR)的非线性计算。
这一发现在计算机领域产生了轰动。多年来,他们都认为 XOR 函数不可能出现在单个神经元中,著名的计算机科学家Marvin Minsky 和Seymour Papert在他们于1969年合著的《Perceptrons》一书中,还对单层人工网络无法执行 XOR 进行了论证。这一结论具有毁灭性的影响,以至于很多计算机科学家都将20世纪80年代之前神经网络研究陷入低迷状态,归咎于这一结论。
神经网络研究者最终找到了避开Minsky 和 Papert所提出的困难的方法,同时神经科学家们也在自然界中找到了这些解决方案的案例。例如,Poirazi 之前就已经发现了XOR是可能存在于单个神经元中的:并且简单将两个树突结合起来,就能够实现这一点。而在最近的这个实验中,他们甚至能够提供了一个合理的、在单个树突中执行XOR的生物物理机制。
处理器中的处理器
当然,并非所有的神经元都是如此。据论文作者 Gidon 所说,大脑的其他部分也存在很多更小的点状神经元。或许发现的这种神经复杂性的存在是有原因的。
神经元中的一个小区室,为什么需要具有整个神经元或一个小型的神经网络才具备的能力呢?
一个可能是:多层神经网络的神经元能够有更好的处理能力,并且能够有更好的学习和存储能力。
对此,Poirazi指出:“或许在单个的神经元内就有一个深度网络,这在学习有难度的问题或认知方面,会强大许多。”
Kording 也提到:“单个神经元或许能够计算真正复杂的函数,例如,它可能能够拥有自主识别对象的能力。”
正如Poirazi 所说,如此强大的单个神经元,也将有助于大脑降低能量消耗。据了解,研究者们计划下一步将尝试在啮齿类动物或其他动物身上的树突中寻找相似的信号,以此来确定这种计算能力是否是人类所独有。他们也希望能够超越模型的范畴,将他们观察到的神经行为与动物的实际行为结合起来研究。
与此同时,Poirazi 则期望能够比较这些树突中的计算与神经元网络中实际发生的情况,以此证明前者是否具备一些优势。这包括测试其他类型的逻辑操作、探索这些操作将对学习和记忆有哪些贡献意义。她表示:“在我们开展这些实验之前,我们无法真正确定这一发现将带来多大的影响。”
结语
虽然现在研究者们还有很多工作需要做,但他们认为这些发现也暗示着他们需要重新思考他们该如何对大脑以及其更广泛的函数建模。仅仅关注不同神经元和大脑区域的关联性,远远不够。
这一新结果,似乎也会对人工智能和机器学习领域的问题带来影响。人工神经网络依赖于点状模型,这种模型将神经元视作对输入计数并在活动函数中传递总数的节点。
纽约大学认知科学家、深度学习的怀疑者 Gary Marcus曾说过:“只有少数人在认真对待这个观点:单个神经元可能是一个复杂计算的设备。”