跳转到内容

认知模型

维基百科,自由的百科全书

认知模型(英语:Cognitive model)是对动物(主要是人类)认知过程的近似,人们可以透过这种方式理解认知过程并基于此进行一些预言。无论是否在认知架构的条件下,我们均能够建立认知模型,尽管这两种情况并不容易区分。

与认知架构不同,认知模型倾向于关注单一认知现象或过程(例如,列表学习),多个认知过程是如何互动(例如,视觉搜索和决策),或是对特定任务或工具(例如,安装新的套装软件会如何影响生产率)做出行为预测。认知架构则倾向专注于建模系统的结构特性,并有助于约束认知架构内认知模型的开发。同样地,认知模型的开发有助于了解认知架构的局限性及不足之处。在认知模型中,最流行的一些架构包括ACT-RCLARIONSoar

历史

认知模型是从认知心理学认知科学发展而来(包括人因工程学),而机器学习人工智能领域也提供了一些贡献。认知模型的类型很多,范围涵盖了方框和箭头图、方程组,以及与“人类所用的同类工具”互动的软件程序(如电脑鼠标和键盘)[1]

方框箭头模型

言语病理学家在治疗儿童患者时,通常会使用许多关键术语来描述言语的知觉、储存和产生。输入信号指的是儿童所听到的语音信号,通常假设输入信号来自成年的发声者。输出信号指的是儿童所发出的言语。在输入信号到达和输出信号产生之间,这中间所发生的不可见的心理事件为心理语言学模型关注的焦点。处理输入信号的事件称为输入过程,而处理言语产生的事件称为输出过程。言语处理的某些部分被认为是线上发生的——也就是说,它们发生在言语的实际感知或产生过程中,因此需要分配一定的注意力资源来完成言语任务;其他过程则被认为是离线进行,是儿童背景心理处理的一部分,而非在专注于言语任务的期间进行。在这个意义上,线上处理有时被定义为即时发生,而离线处理被称为无时间限制的(Hewlett, 1990)。在方框箭头心理语言学模型中,每一个假设,其表征的或处理的级别都可以在图表中用“方框”来表示,它们之间的关系用“箭头”来表示,故得此名。有时如本文后面描述的Smith(1973)和Menn(1978)的模型中那样,箭头表示方框中所示过程以外的过程。这种模型以类似计算机流程图用以描述计算机程序执行过程和决策的方式,明确规定了在特定认知功能(如语言)中进行的资讯处理活动的假设。方框箭头模型在描述的“不可见的心理过程数量”上相差甚远,因此在它们包含的方框数量上也有很大的不同。有些在输入和输出信号之间只有一两个方框(例如,Menn, 1978; Smith, 1973),而另一些情况则有多个方框,代表许多不同资讯处理事件之间有着复杂关系(例如Hewlett, 1990; Hewlett, Gibbon, & Cohen- McKenzie,1998; Stackhouse & Wells, 199)。然而,最重要的方框,也是许多正在进行的争论的来源,代表潜在的表征(underlying representation,UR)。本质上,一个潜在的表征充分体现了储存在儿童心里所知道及所使用的单字资讯。如下面几个模型的描述所示,这种资讯的性质以及在儿童知识库中所呈现的表征类型,已经引起了研究者的注意。(Elise Baker et al. Psycholinguistic Models of Speech Development and Their Application to Clinical Practice. Journal of Speech, Language, and Hearing Research. June 2001. 44. p 685–702.)

计算模型

计算模型计算科学中的数学模型,需要大量的计算资源,透过计算机模拟来研究复杂系统的行为。研究的系统通常是复杂的非线性系统,不易获得简单直观的解析解。该模型并非推导出问题的数学解析解,而是透过改变计算机中的系统参数的实验过程,并研究结果的差异来得到解答。模型的操作理论可以从这些计算实验中推导出来。常见计算模型的例子有天气预报模型、地球模拟器模型、飞行模拟器模型、分子蛋白质折叠模型和神经网络模型。

符号

以字符(通常是非数字)表示,使用前需要先对其翻译。

次符号

若非由依次表征的实体所构成(例如像素,耳朵所感知的声音,信号取样),则可以把神经网络中的次符号单位看作此类特殊情况。

混合

混合计算机是同时具有类比计算机和数位计算机特征的计算机。通常,数位元件会作为控制器并提供逻辑操作,而类比元件则作为微分方程的解答器。详见混合智能系统。

动态系统

在传统的计算方法中,表征被看作是离散符号的静态结构。认知是透过将静态符号结构转换成离散、序列的步骤来实现的。感觉资讯被转换成符号输入,而符号输入产生符号输出,符号输出又可被转换成运动输出。整个系统在一个持续的循环中运行。

这种传统观点的不足之处在于,人类的认知会连续、即时地发生。将流程分解为离散时间的步骤可能无法完全体现这种行为。另一种方法将系统定义如下

  1. 在任何给定时间系统的状态
  2. 行为,定义为整体状态随时间的变化
  3. 状态集或状态空间,表示系统可能处于的全部状态[2]

系统的特征在于,任何方面的系统状态变化,都取决于同个系统或其他系统在其他方面的状态。[3]

典型的动态模型是由几个描述系统状态随时间变化的微分方程来形式化的,从而形成了可能轨迹的空间形式,以及形成随着时间而展开的特定轨迹的内外力,具有解释性,而不是体现这一动态的潜在机制的物理性质。在这种动力学观点上,参数输入改变了系统的内在动力学,而不是指定一个内部状态来描述一些事件的外部状态。

早期动态系统

联想记忆

Hopfield神经网络模型中[4][5],可以发现早期将动态系统应用于认知的成果。这些网络被提议作为联想记忆的模型。它们代表记忆的神经层次,模拟了大约30个神经元的系统,这些神经元可以处于打开状态或关闭状态。透过让网络自行学习,就能够自然产生结构和计算属性。与过去的模型不同,只需输入整体记忆的一小部分,即可形成和调用这些记忆。记忆的时间顺序也可以被编码。系统的行为是以数值可变的向量来建模,这些数值代表了系统所处的不同状态。这个早期的模型是朝着人类认知的动态系统观迈出的重要一步,尽管许多细节有待补充,更多现象有待解释。

语言习得

考虑到人类神经系统演化发展以及大脑与其他器官的相似性,埃尔曼(Jeffrey Elman)建议将语言和认知视为动态系统,而非数位的符号处理器。[6]埃尔曼所实现的这种神经网络称为埃尔曼网络静态词汇项语法规则会根据固定规则学习,然后才被运用,不过在动态系统的观点中,并非将语言视为这些静态词汇项与语法规则之集合,而是将词汇定义为动态系统中的状态空间区域。语法由吸引子和排斥子组成,它们会约束着状态空间中的运动。这意味着上下文脉络对于表征有着敏感性,而心理表征被看作是穿梭在心理空间的轨迹,并非构造出来又保持静止的物体。用简单句子训练埃尔曼网络,便能够将语法表示为一个动态系统。一旦掌握了基础语法,这些网络就可以根据动态模型预测下一个出现的单词来解析复杂的句子。[7]

认知发展

已在动态系统的背景下,对经典的发展错误展开研究:[8][9]AB位置错判(A-not-B error)被认为在特定年龄(8到10个月大)内发生的错误并非确真的错误,而是动态学习过程的一个特征,而这些特征也同样存在于较大的孩子身上。在寻找藏在沙箱中的玩具时,也发现了2岁儿童犯了类似于AB位置错判的错误。让2岁的孩子观察到藏在位置A的玩具并重复搜索多次之后,向其展示藏在新位置B的玩具。当他们寻找玩具时,他们倾向于搜索A附近的位置,这表明,随着时间的推移,玩具的位置会不断变化。而过去的行为影响了孩子如何对沙箱位置建模。因此,对行为和学习的描述必须考虑“沙箱与孩子过去行为”的系统是如何随时间改变。[9]

移动

分析了连续时间的循环神经网络(CTRNN)之后,提出了一种动态系统机制。透过强调神经网络的“输出”而不是状态,并检查完全互联的网络,三神经元中央模式生成器(CPG)可表征像是走路时的腿部运动这样的系统。这个CPG包含三个运动神经元来控制足部、后摆和前摆。该网络的输出表示脚是向上还是向下,以及施加多大的力来产生腿关节的扭矩。大部分时间下的神经元输出非开即闭是该模式的特点。“准稳定状态”是另一个特点,这意味着它们最终会过渡到其他状态。像这样的简单模式产生电路被提议作为动态系统的基础。同时从某准稳定状态过渡到另一种准稳定状态的神经元组,则被定义为动态模块。这些模块理论上可以组合成更大的电路,组成一个完整的动态系统。然而,这种结合如何发生的细节还没有完全弄清楚。

现代动态系统

行为动力学

这些应用于认知研究的动态系统,其现代形式化皆有所不同。其中一种称为“行为动力学”[10],该形式化将代理和环境视为一对基于经典动力学系统理论的耦合动力学系统。在该形式化中,能够由环境资讯得知代理改造环境的行为、动作。在知觉-动作周期的特定情况下,环境和代理的耦合由两个函数形式化。第一个函数将代理的动作表征转换为特定的肌肉激活模式,进而在环境中产生力量。第二个函数将环境中的资讯(即反映环境当前状态的代理感受器的刺激模式)转换为可用于控制代理动作的表征。其他类似的动力学系统已经提出(虽然没有发展成一个正式的框架),其中代理的神经系统和身体与环境耦合在一起。[11][12]

适应性行为

行为动力学已应用于移动行为。[10][13][14]其行为动力学建模表明,适应性行为可能来自于代理和环境的相互作用。根据此框架,适应性行为可以被两个层次的分析所捕获。在第一层次的知觉和动作上,代理和环境可以概念化为一对动态系统,由代理作用于环境的力量和环境提供的结构化资讯将其耦合在一起。因此,行为动力学会从代理-环境相互作用中浮现出来。在时间演化的第二个层次上,行为能够以一个由向量场表征的动态系统来表达。在这个向量场中,吸引子反映了稳定的行为解,而其中分歧现象反映了行为的变化。与之前对中央模式产生器的工作不同,该框架表明稳定的行为模式是代理-环境系统的一种浮现的、自组织的属性,而不是由代理或环境的结构所决定。

开放动态系统

在经典动态系统理论的拓展中[15],并非将环境和代理的动态系统彼此耦合,而是有个“开放动态系统”定义了“综合系统”、“代理系统”以及将这两个系统联系起来的机制。综合系统是用于建模环境中的代理的动态系统,而代理系统则是用于建模代理的内在动态(即在缺少环境条件下的代理动态)的动态系统。重要的是,联系机制并没有将两个系统耦合在一起,而是不断地将综合系统修改为去耦合的代理系统。透过区分综合系统和代理系统,可以研究代理与环境隔离时以及嵌入到环境中时的行为。这种形式化可以视为是来自经典形式化中的一种概括,其中,代理系统可以被视为开放动态系统中的代理系统,而环境以及与环境耦合的代理可以被视为开放动态系统中的综合系统。

体化认知

在动态系统和体化认知(Embodied cognition)之中,表征可以被概念化为“指标物”(indicator)或“中介物”(mediator)。在指标物的观点中,内部状态携带着在环境中物体存在的资讯,其中系统在接触物体期间的状态是该物体之表征。在中介物的观点中,内部状态则是携带着系统用于实现目标的环境资讯。在更复杂的描述中,系统状态承载的资讯是介于“代理从环境中所获取的资讯”以及“代理行为对环境所施加的作用力”之间。这边讨论了开放动态系统在四种经典的体化认知实例中的应用。[16]

  1. 环境和代理必须协同工作以实现目标的实例称为“亲密关系”。 其中一个典型例子是简易代理为实现目标而工作的行为(例如,昆虫在环境中移动)。 目标是否成功完全则取决于代理与环境的耦合。[17]
  2. 相对于不使用外部构件,使用外部构件的实例改善了任务的表现。而这个过程被称为“卸载”(offload)。其中一个典型例子是Scrabble玩家的行为:当人们在玩拼字游戏的时候,如果字母牌摆于面前,并且允许在物理上操纵其排列方式,人们就能够创造出更多的单词。在本例中,Scrabble字母牌允许代理将工作记忆需求卸载到字母牌本身。[18]
  3. 功能等效的外部构件取代了通常由代理在内部执行的功能,此为一种特殊卸载情形的实例。一个著名例子是人类(特别是代理Otto和Inga)无论是否在构件的帮助,都能在复杂环境中导航。[19]
  4. 非单一代理的实例。单独的代理是大型系统的一部分,包含了多个代理和构件。埃德温·哈钦斯在他的书《野外认知》中阐述了一个著名的例子,也就是军舰航行。[20]

这些范例的解释依赖于以下逻辑:

  1. 综合系统包含了体化。
  2. 单个或多个代理系统包含了单个代理的内在动力。
  3. 代理的完整行为可被理解为代理内在动力之变化,而这与代理在环境中的情形相关。
  4. 开放动态系统的路径可被解释为表征的处理过程。

这些体化认知的实例表明了研究代理-环境系统的的浮现动力学以及代理系统的内在动力学之重要性。 动态系统并非与传统认知科学的方法相冲突,而是这些方法的自然延伸,应该并行研究,而不是相互竞争。

参见

参考

  1. ^ Sun, R. (ed.), (2008). The Cambridge Handbook of Computational Psychology. New York: Cambridge University Press.
  2. ^ van Gelder, T. (1998). The dynamical hypothesis in cognitive science页面存档备份,存于互联网档案馆). Behavioral and Brain Sciences, 21, 615-665.
  3. ^ van Gelder, T. & Port, R. F. (1995). It's about time: An overview of the dynamical Approach to cognition页面存档备份,存于互联网档案馆). In R.F. Port and T. van Gelder (Eds.), Mind as motion: Explorations in the Dynamics of Cognition. (pp. 1-43). Cambridge, Massachusetts: MIT Press.
  4. ^ Hopfield, J. J. (1982). Neural networks and physical systems with emergent collective computational abilities页面存档备份,存于互联网档案馆). PNAS, 79, 2554-2558.
  5. ^ Hopfield, J. J. (1984). Neurons with graded response have collective computational properties like those of two-state neurons页面存档备份,存于互联网档案馆). PNAS, 81, 3088-3092.
  6. ^ Elman, J. L. (1995). Language as a dynamical system页面存档备份,存于互联网档案馆). In R.F. Port and T. van Gelder (Eds.), Mind as motion: Explorations in the Dynamics of Cognition. (pp. 195-223). Cambridge, Massachusetts: MIT Press.
  7. ^ Elman, J. L. (1991). Distributed representations, simple recurrent networks, and grammatical structure页面存档备份,存于互联网档案馆). Machine Learning, 7, 195-225.
  8. ^ Spencer, J. P., Smith, L. B., & Thelen, E. (2001). Tests of dynamical systems account of the A-not-B error: The influence of prior experience on the spatial memory abilities of two-year-olds. Child Development, 72(5), 1327-1346.
  9. ^ 9.0 9.1 Thelen E., Schoner, G., Scheier, C., Smith, L. B. (2001). The dynamics of embodiment: A field theory of infant preservative reaching页面存档备份,存于互联网档案馆). Behavioral and Brain Sciences, 24, 1-86.
  10. ^ 10.0 10.1 Warren, W. H. (2006). The dynamics of perception and action页面存档备份,存于互联网档案馆). Psychological Review, 113(2), 359-389. doi: 10.1037/0033-295X.113.2.358
  11. ^ Beer, R. D. (2000). Dynamical approaches to cognitive science. Trends in Cognitive Sciences, 4(3), 91-99.
  12. ^ Beer, R. D. (2003). The dynamics of active categorical perception in an evolved model agent页面存档备份,存于互联网档案馆). Adaptive Behavior, 11(4), 209-243. doi: 10.1177/1059712303114001
  13. ^ Fajen, B., R., & Warren, W. H. (2003). Behavioral dynamics of steering, obstacle avoidance, and route selection页面存档备份,存于互联网档案馆). Journal of Experimental Psychology: Human Perception and Performance, 29, 343-362.
  14. ^ Fajen, B. R., Warren, W. H., Temizer, S., & Kaelbling, L. P. (2003). A dynamical model of visually-guided steering, obstacle avoidance, and route selection页面存档备份,存于互联网档案馆). International Journal of Computer Vision, 54, 15-34.
  15. ^ Hotton, S., & Yoshimi, J. (2010). The dynamics of embodied cognition. International Journal of Bifurcation and Chaos, 20(4), 943-972. doi:10.1142/S0218127410026241
  16. ^ Hotton, S., & Yoshimi, J. (2011). Extending dynamical systems theory to model embodied cognition. Cognitive Science, 35, 444-479. doi: 10.1111/j.1551-6709.2010.01151.x
  17. ^ Haugeland, J. (1996). Mind embodied and embedded页面存档备份,存于互联网档案馆). In J. Haugeland (Ed.), Having thought: Essays in the metaphysics of mind (pp. 207-237). Cambridge, Massachusetts: Harvard University Press.
  18. ^ Maglio, P., Matlock, T., Raphaely, D., Chernickym B., & Kirsh, D. (1999). Interactive skill in scrabble页面存档备份,存于互联网档案馆). In M. Hahn & S. C. Stoness (Eds.), Proceedings of twenty-first annual conference of the Cognitive Science Society, (pp. 326-330). Mahwah, NJ: Lawrence Erlbaum Associates.
  19. ^ Clark, A., & Chalmers, D. (1998). The extended mind页面存档备份,存于互联网档案馆). Analysis, 58(1), 7-19.
  20. ^ Hutchins, E., (1995). Cognition in the wild页面存档备份,存于互联网档案馆). Cambridge, Massachusetts: MIT Press.