当前位置: 玩币族首页 > 区块链资产 > 理解深度学习系统中的记忆

理解深度学习系统中的记忆

2020-08-08 区块链研究员来源：区块链网络

记忆是深度神经网络的新兴组成部分之一，在神经科学和心理学理论中有着坚实的根基，本文将从神经科学和认知心理学的角度来帮助你理解深度学习系统中的记忆。

资料来源：https://medicalxpress.com/news/2017-02-human-brain-critical-short-term-memory.html。

我最近开始了一个新的专注于AI教育的系列。TheSequence是一个没有BS（意思是没有炒作，没有新闻等）的专注于人工智能的系列。目标是让你了解机器学习项目、研究论文和概念的最新情况。

记忆建模是深度学习领域一个活跃的研究领域。近年来，神经图灵机(NTM)等技术取得了重大进展，为在深度学习系统中建立类似人类的记忆结构奠定了基础。在过去，我已经广泛地写过关于记忆在人工智能(AI)中的作用的文章，所以我不打算无聊地重复同样的观点。相反，我想从不同的角度来探讨这个问题，并试图回答我们在思考深度学习模型中的记忆时应该记住的三个基本问题。

a) 是什么让记忆在深度学习系统中成为一个如此复杂的主题？

b)我们可以从哪里获得关于内存架构的灵感？

c)深度学习模型中代表记忆的主要技术是什么？

为了有效地回答前两个问题，我们应该从记忆的生物学理论和心理学理论两方面进行研究。这把我们带到对我们的记忆知识影响最大的两个学派：神经科学和认知心理学。按照这种相同的思路，我们将把这篇文章结构成三个主要部分。第一部分将解释记忆的神经科学理论。第二部分将从认知心理学的角度来探讨记忆，而最后一部分将关注深度学习是如何从这些学科中汲取灵感，将记忆融入到神经网络中。所以，让我们从记忆产生的地方开始：人脑。

记忆的神经科学理论

了解记忆是如何被创造的，是如何被破坏的，以及长期记忆和短期记忆之间的差异，是过去十年神经科学研究的一个重要领域。激发这种研究水平的标志性课题之一被称为患者HM。

亨利-古斯塔夫-莫莱森(HM)在9岁时遭遇了一场意外，导致他在随后的几年里经常发生抽搐。1952年，在二十五岁的时候，HM接受了一次手术来缓解他的症状。这个过程最初被认为是成功的，直到后来医生发现，他们已经意外地削减了HM的海马体的一部分，因此，HM无法保留新的记忆。

没有新记忆的生活，就是永远活在当下的物理状态。相信我，我说的不是心境的方式，而是你无法联想到过去最近发生的事件或设想未来的事件。患者HM每天只保留几分钟的信息，跟同样的人打招呼，问同样的问题，然后周而复始。HM的案例对于帮助神经科学家理解记忆是如何被创造、存储和回忆的具有关键意义。

现代神经科学的记忆理论涉及大脑的三个基本区域：丘脑、前额叶皮层和海马体。丘脑可以被认为是一个处理感觉信息（视觉、触觉、语言）的路由器，将感觉信息传递给大脑的感觉叶sensory lobes进行评估。经过评估的信息最终到达前额叶皮层，在那里它进入我们的意识，形成短期记忆。这些信息也会被送到海马体，海马体将不同的片段分配到不同的皮质，形成长期记忆。当今神经科学最大的挑战之一就是要了解如何将那些分散的记忆碎片重新组合成有凝聚力的记忆体验。这在神经科学中被称为 "捆绑问题binding problem"。

捆绑问题

捆绑问题被认为是记忆神经科学理论中最令人费解的方面之一，它挑战了从其他感官信息中重新创造记忆的概念。以和你的爱人一起去看音乐会的经历为例。关于该事件的记忆会被分解并存储在大脑的不同区域。然而，只需要一次经历，如听同一乐队的旋律或看到你的妻子跳舞，就能回忆起整个记忆的概念。这怎么发生的？

一种解决捆绑问题的理论指出，记忆碎片是由不断流经大脑的电磁振动连接起来的。那里的振动在记忆片段之间建立了一种时间（而不是空间）的联系，使它们能够一起激活，成为一个有凝聚力的记忆。

记忆的神经科学理论给我们提供了理解智能记忆架构的一些主要成分的基础。然而，人类的记忆不仅是大脑各组成部分的副产品，还深受背景环境的影响。这将是下一篇文章的主题。

记忆的认知心理学理论

记忆神经科学理论中的 "捆绑问题 "解释了分散的记忆片段如何被组合成有凝聚力的记忆。事实证明，为了解释捆绑问题，我们需要扩展到大脑的架构之外，评估各种深刻影响记忆如何被回忆的心理背景因素。认知心理学中试图解释记忆的联想性的主要理论之一，就是所谓的启动效应Priming Effect。

联想记忆与启动效应

就像认知心理学中所有好的理论一样，让我们试着用实验来解释启动效应。想一想，当你听到晚餐这个词的时候，你首先想到的是什么？是酒吗(对我来说是)，甜点吗，也许是周六晚上的约会？正如你所看到的，像一个词这样简单的东西可以唤起一系列混合的情绪，甚至其他相关的词。我们正在有效地回忆相关的记忆。

之前的实验最显著的结果之一就是注意到你能够多快地检索出那些相关的单词或记忆。之所以会发生这种情况，是因为联想记忆是诺贝尔经济学奖得主丹尼尔-凯恩曼Daniel Kanehman所说的系统1的一部分，它们发生得很快，而且会产生一系列相关的情绪和生理反应。在心理学中，这种类型的现象被称为联想一致性。

回到我们的文字游戏；事实上，晚餐这个词唤起了酒或甜点的想法，这被称为 "启动效应"，即 "晚餐启动甜点"。启动效应对解释记忆的运作方式有重要作用。启动效应不仅适用于单词，也适用于情绪、生理反应、本能和其他认知现象。在记忆的语境中，启动效应告诉我们，记忆不仅仅是由联想的方法来回忆，而是由 "启动想法 "来回忆。

可得性启发

认知心理学记忆理论的另一个重要内容涵盖了我们回忆事件的频率。例如，如果我问你 "过去十年你参加过多少场音乐会？"如果你的回答感觉很流利，或者你最近刚好参加了一次音乐会，你很可能会高估这个数字。否则，如果你不喜欢上一次的音乐会经历，这个数字可能就会低估。这个认知过程被称为可得性启发，解释了我们的记忆是如何被一个答案的快速可得性深深影响。

现在我们已经知道了如何从大脑（神经科学）和我们的社会环境（认知心理学）来思考记忆。那么这些理论在深度学习算法中是如何模仿的？

记忆和深度学习

从神经科学和认知心理学的记忆理论中我们知道，任何人工记忆系统都应该具有下面一系列特定的特征，以类似于人类的记忆：

a)将记忆分割成描述不同知识领域的片段

b)将不同的部分重新组合成有凝聚力的信息结构。

c)根据上下文和非直接相关的信息以及外部数据引用来检索数据。

在计算机科学中，没有任何一门学科能比深度学习更能从类似人类的记忆系统中获益。从早期开始，深度学习领域就一直在努力模拟人类记忆的一些关键特征的系统模型。

深度学习和显式记忆

为了理解记忆在深度学习模型中的相关性，我们应该区分隐性知识和显性知识的概念。隐性知识通常是潜意识的，因此，很难解释。我们可以在语音和视觉分析等领域找到隐性知识的例子，如识别图片中的猴子或口语句子中的语气和情绪。与这种模式形成对比的是，显性知识很容易被陈述性建模。例如，理解猴子是一种动物，或者理解某些形容词是攻击性的，都是显性知识的典型例子。我们知道，深度学习算法在表示隐性知识方面已经取得了令人难以置信的进步，但它们仍然难以对显性知识进行建模和 "记忆"。

是什么让显式知识在深度学习算法的背景下如此困难？如果你想一想传统的神经网络的架构，有数百万个相互连接的节点，我们就会意识到，它们缺乏一个可以存储推断的知识片段及其关系的相当于工作记忆系统的东西，从而可以很容易地从网络中的不同层加入。最近，新的深度学习技术已经被创造出来，用于解决这一限制。

神经图灵机

深度学习算法的快速发展引发了人们对记忆系统的需求，这些记忆系统在处理显性知识时能够显现出类似于人类记忆的特征。记忆建模领域最流行的技术之一被称为神经图灵机（NTM），由DeepMind在2014年推出。

NTM的工作原理是通过扩展一个深度神经网络，其记忆单元可以存储完整的向量。NTM最大的创新之一是它使用启发式方法来读写信息。例如，NTM实现了一种被称为基于内容的寻址的机制，可以根据输入模式检索向量。这类似于人类基于皮层经验回忆记忆的方式。此外，NTM还包括根据记忆单元的回忆频率来增加记忆的重要性。

NTM并不是在深度学习系统中实现记忆能力的唯一技术，但无疑是最受欢迎的技术之一。模仿人类记忆的生物和心理功能并不是一件容易的事情，已经成为深度学习领域最重要的研究之一。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

作者:Jesus Rodriguez

—-

编译者/作者：区块链研究员

玩币族申明：玩币族作为开放的资讯翻译/分享平台，所提供的所有资讯仅代表作者个人观点，与玩币族平台立场无关，且不构成任何投资理财建议。文章版权归原作者所有。

知识区块链深度认知记忆

理解深度学习系统中的记忆

相关阅读：

新文章

知识推荐