網易首頁 > 網易號 > 正文申請入駐

具身智能：學習型智能決策代理認知架構中的流暢應對

2026-03-16 13:08:18　來源: CreateAMind

上海舉報

分享至

Embodied Intelligence: Smooth Coping in the Learning Intelligent Decision Agent Cognitive Architecture

具身智能:學習智能決策主體認知結構中的平穩應對

https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2

我們大部分的日常具身行動都以流暢應對（smooth coping）的形式出現。流暢應對是指已經變得習慣化且根深蒂固的熟練行動，與深思熟慮的思想和行動相比，它通常對認知負荷施加的壓力較小。當憑借技能和專業知識執行時，行走、駕駛、滑雪、音樂表演和快餐烹飪都是這種現象的例子。流暢應對的特征在于其迅速性和相對缺乏反思，這兩者都是自動化的標志。深思熟慮和反思性的行動提供了對照案例。在德雷福斯（Dreyfus）的經典觀點中，流暢應對是對行動的“無心”沉浸，處于流暢狀態（in the flow），任何反思性思維只會打斷這種流暢。基于杜威（Dewey）的實用主義論述，其他人，如薩頓（Sutton）、蒙特羅（Montero）和加拉格爾（Gallagher），堅持認為流暢應對中內置了智能靈活性，表明它不等同于自動化。我們在本文中尋求回答兩個互補的挑戰。首先，我們如何在細粒度上對自主體（自然的或人工的）中的流暢應對進行建模？其次，我們使用這個流暢應對模型來展示我們如何在人工智能體中實現流暢應對。我們在 LIDA（學習智能決策代理，Learning Intelligent Decision Agent）中開發了一個流暢應對的概念模型。LIDA 是一個具身認知架構，實現了意識的全局工作空間理論（global workspace theory of consciousness）以及其他心理學理論。LIDA 對意識的實現使我們能夠解釋流暢應對的現象學，這是少數認知架構能夠做到的。通過對 LIDA 的細粒度分析，我們認為流暢應對是一系列自動化行動，間歇性地穿插著意識介導的行動選擇，并由背側流（dorsal stream）過程補充。換句話說，非意識的、自動化的行動（無論是習得的還是先天的）通常需要偶爾爆發的意識認知，以實現流暢應對的熟練和靈活調整。此外，從未進入意識的背側流信息和相關的感覺運動過程在流暢應對期間提供進一步的在線調整。為了在 LIDA 中實現流暢應對，我們向 LIDA 認知架構引入了一個新模塊，即自動化行動選擇子模塊（Automatized Action Selection sub-module）。我們復雜的流暢應對模型從生成主義（enactivism）借用了“具身智能”的概念，并通過允許表征和更詳細的意識控制機制來增強這些概念。我們探討了流暢應對的幾個擴展例子，從像行走這樣的基本活動開始，擴展到像駕駛和快餐烹飪這樣更復雜的任務。

關鍵詞：流暢應對，自動化，行動選擇，認知架構，具身認知，全局工作空間理論，LIDA

引言

在本文中，我們使用 LIDA（學習智能決策代理）開發了一個流暢應對的概念模型，LIDA 是一個混合的、具身的認知架構，實現了意識的全球工作空間理論（GWT）（Baars, 1988）、感知 - 行動循環（Neisser, 1976; Freeman, 2002; Fuster, 2004; Cutsuridis et al., 2011）、grounded 認知（Harnad, 1990; Barsalou, 1999）、評估理論（Lazarus, 1991; Roseman and Smith, 2001）、長期工作記憶（Ericsson and Kintsch, 1995）以及其他認知理論。它旨在成為一個“認知的統一理論”（Newell, 1994），采納這些以及其他不同的理論，并將它們統一在一個單一的、綜合的架構之下。LIDA 是一個概念性和計算性的架構，已被用作軟件和機器人代理的基礎。當前的論文是關于如何在 LIDA 中實現流暢應對的理論概述。后續研究將實現形式體系、編寫代理代碼，并在各種環境中測試代理。我們將這項工作視為邁向流暢應對機器人實現的第一步，這將符合機器人學的當前趨勢，例如通過模仿學習（Bullard et al., 2019）。

流暢應對是熟練且適應性地行動的過程，通常朝向任務的完成。流暢應對涵蓋了廣泛的熟練行為，從相對基本的行為如呼吸或吸吮，到那些通過艱苦訓練習得的行為，如成為飛行員（Dreyfus and Dreyfus, 1980）。熟練地駕車穿過交通、滑雪坡或跑障礙課程都是流暢應對的經典例子。然而，這個概念也可以包括烹飪、放羊、跳舞、整理以及許多其他可能達到優化性能狀態的活動。這個概念起源于現象學哲學，特別是海德格爾（Heidegger, 1928/2010）和梅洛 - 龐蒂（Merleau-Ponty, 1945/2012）的具身現象學。這兩位思想家都在反對哲學和心理學中將人類存在智力化的愿景，這種愿景將我們視為本質上旨在認識世界的認識論主體。作為替代，他們提出了一種人類存在的愿景，這種愿景在其根本上是實用性地面向行動和運動的，并且（對于梅洛 - 龐蒂而言）是基于代理的具身性的。

在流暢應對中，代理不僅僅是在做脫節的多任務處理，也不僅僅是在做自動化行動。相反，代理的大部分認知過程連貫地朝向實現一個遠端意圖。我們概述了 LIDA 代理如何實現流暢應對，并提供三個案例研究：行走、駕駛和快餐烹飪（見“結論”部分）。重要的是，LIDA 中的流暢應對通常需要一個“混合的”組合，包含意識的、意識介導的和從未意識的過程，這些過程交織在使用意識的全球工作空間理論實現的一系列持續的認知周期中（Franklin and Baars, 2010）。歷史上，在 LIDA 概念模型中，行動選擇一次只能選擇一個，且僅能選擇一個行動。在本文中，我們通過向行動選擇引入一個新子模塊：自動化行動選擇（AAS），對 LIDA 模型做出了重大貢獻。這個子模塊允許行動的并發選擇——AAS 能夠并行選擇自動化行動。此外，AAS 與原始行動選擇算法并行運行，后者繼續一次選擇一個行動。

我們首先詳細闡述最近關于流暢應對的辯論，并強調支持它的認知的混合性質（Christensen et al., 2016; Gallagher and Varga, 2020）。然后我們介紹 LIDA 模型以及與該項目相關的 LIDA 方面。為了更全面地概述 LIDA，我們建議閱讀教程和我們最近的兩篇論文（Franklin et al., 2016; Kronsted et al., 2021; Neemeh et al., 2021）。我們通過三個復雜度遞增的案例研究來說明流暢應對如何在 LIDA 代理中發生：獨自行走、交通中駕駛和快餐烹飪（見“結論”部分）。

流暢應對

盡管最近關于流暢應對的辯論有所增加，但這一主題至少可以追溯到亞里士多德以及實踐智慧（phronesis，通常譯為"實踐智慧"）的概念。自其最早提出以來，流暢應對的辯論通常與文化和社會性緊密相連——流暢地應對世界往往是在豐富的社會文化語境中進行的（Rietveld and Kiverstein, 2014）。因此，關于流暢應對的辯論跨越了社會認知、人類學、表演研究以及"專家表現"討論中的諸多議題（Cappuccio, 2019）。

在處理流暢應對時，運動性討論與文化討論的交叉在現象學傳統中尤為明顯。在二十世紀，馬丁·海德格爾在其巨著《存在與時間》（1927）中引入了"上手狀態"（Zuhandenheit）一詞。該詞常被譯為"就緒在手"，指的是一種前反思、前理論的行為模式。當我將某物（比如說錘子這樣的工具）視為就緒在手時，我是在使用它，而非反思它。這種使用是一種具身的"知道如何"（know-how），而非理論性的沉思。海德格爾認為，西方哲學傳統完全聚焦于"現成在手"（Vorhandenheit），即理論性的行為模式。例如，康德的體驗理論明確旨在支持科學的事業。這種對理論理性而非具身行動的關注，是我們可以在人工智能和機器人學歷史中看到被重復的現象。相比之下，梅洛 - 龐蒂（Merleau-Ponty, 1945/2012）考察了具身性與行動如何與空間、時間、性、其他主體以及其他領域動態地相互作用。根據梅洛 - 龐蒂的觀點，流暢應對是我們日常生活最基本的模式。多年后，漢斯·約納斯（Hans Jonas, 2001）發展了一種主體性的發生現象學，根據該理論，流暢應對的這些基礎層次使得更高階的認知過程得以涌現，類似于當代關于支架作用（scaffolding）的主張。縱觀現象學傳統的思想家們，我們看到一種對具身性的強調，其中流暢應對是認知主體在世界中移動時的基本能力。總之，許多現象學家持這樣的觀點：流暢應對構成了具身人類能動性的基本背景，而更具認識論導向的、邏輯的或更高階的過程則較為少見，并且是在這一背景之上建立的。

在現象學傳統的基礎上，德雷福斯和德雷福斯（Dreyfus and Dreyfus, 1980）基于技能習得的五個階段發展了一種流暢應對的認知理論。根據他們的理論，某項技能的專長特征是自動化以及缺乏高階思維。在這個流暢應對模型中，專家們已將其領域內的技能習慣化到其動作完全自動化的程度。這反過來旨在解釋為何關注自身或部署高階認知過程（如"策略制定"）有時會對表現產生不利影響（Fitts and Posner, 1967; Cappuccio et al., 2019）。

在關于流暢應對和專家表現的文獻中，其他人追隨德雷福斯和德雷福斯，同樣認為熟練行動中的流暢應對是完全自動化的問題（Papineau, 2013, 2015）。

然而，德雷福斯模型近年來受到了來自各種理論家、運動員和藝術家的批評，且來自多種視角。例如，芭芭拉·蓋爾·蒙特羅（Barbara Gail Montero, 2010, 2016）表明，要在許多運動中取得成效，運動員必須同時部署自動化和高階認知過程。此外，蒙特羅等人（Montero et al., 2019）表明，聲稱自我關注對表現有害的實證研究計劃是基于有缺陷的實驗設計。自我關注、監控、策略制定等往往被整合到表現的流動中，而非打斷它。

這里的要點是，高階過程，如規劃、策略制定、監控等，并非總是對專家表現有害，相反，它們通常是專家表現和成功流暢應對所必需的。鑒于這一洞見，流暢應對往往是將一些人所謂的"在線"（需要即時感官刺激）和"離線"（脫離即時感官刺激）認知流暢整合的問題（Wilson, 2002）。現在有幾個理論提出了低階和高階過程在專家表現及更廣泛的流暢應對中之間相互作用的因果整合網絡。此類模型包括"拱形"模型（H?ffding and Satne, 2019）、混合架構（Christensen et al., 2016, 2019）、雙過程模型（Neemeh, 2021）、激進混合架構（Gallagher and Varga, 2020）以及各種類似方法（Bermúdez, 2017; Pacherie and Mylopoulos, 2021）。

雖然這些模型在其理論承諾方面各不相同，但總體主旨是一致的：在專家表現過程中，低階和高階認知過程都被利用并相互影響。例如，自動化的非意識過程，如姿勢的持續調整或籃球運球，可能受到高階意識過程的影響，如思考并意識到對手的策略。一位面對臂展更長對手的混合武術格斗手可能會戰略性地試圖通過擒抱而非踢打和拳擊來智勝對手。這種高階戰略決策反過來影響格斗手如何調整姿勢并重新配置其感覺運動準備狀態以適應某些行動類型。

在舞蹈表演的文獻中，一些現象學家同樣指出，即使在高度編排的表演中（一個動作引發下一個動作），專業舞者也必須根據舞臺的特殊性、當晚的觀眾、燈光、空氣密度和濕度、服裝故障以及其他因素調整其表演（Bresnahan, 2014）。同樣重要的是，或許甚至更重要的是，專業舞者（以及一般的專業表演者）必須始終在對身體本身的意識監控中進出，以根據身體當天的感覺進行調整（Ravn, 2020）。

從這些簡要的例子中，我們可以看到，具身的專業知識，無論是在行走或駕駛等平凡案例中，還是在體育和表演等高度專業化的領域中，都涉及各種認知過程和不同意識層次（意識的、從未意識的、前意識的、前反思的）的流暢混合。雖然混合架構方法在諸如"心理表征"等概念的承諾上，或如何概念化不同認知機制之間的因果關系上存在分歧，但普遍共識是，流暢應對不僅僅是自動化的問題。相反，我們經常利用并在各種認知過程之間切換。例如，音樂家有時會報告自己處于完全自動化的狀態，同時監控自己的行動和同伴音樂家的行動。在這種狀態下，演奏的音樂家通過自動化行動，但他們隨時準備以自上而下的控制進行干預（H?ffding, 2019）。

在流暢應對和專家表現的討論中同樣重要的是傾向性技能或習慣的概念。在此，思想家們傾向于發展強烈受約翰·杜威（John Dewey, 1922）習慣概念啟發的習慣理論，即將習慣視為一種對情境敏感、靈活的行動傾向。無論是在明確反表征主義的生成式認知科學中（Gallagher, 2020; Segundo-Ortin and Heras-Escribano, 2021），還是在表征主義的認知科學中（Schack, 2004; Sutton et al., 2011; Bermúdez, 2017; Pacherie and Mylopoulos, 2021），普遍認為習慣是專家表現和流暢應對中的一個重要概念。在這種觀點下，習慣通過練習而根深蒂固，但能靈活地適應各種情境。與情境上僵化的運動程序不同（Ghez, 1985; Neilson and Neilson, 2005），習慣總是由當前情境調節并精細調整的——習慣是適應性地在環境中存在的方式（Dewey, 1922）。

學習智能決策代理認知架構

學習智能決策代理（Learning Intelligent Decision Agent，LIDA）是一個系統層面的認知架構，旨在提供對認知的完整且整合的解釋（Franklin et al., 2016）。因此，LIDA 模型并非僅建模心智的某一方面，而是旨在成為一個"認知的統一理論"（Newell, 1994），能夠建模人類、動物和人工心智。此處所使用的"認知"廣泛涵蓋了心智的每一種機制，包括但不限于感知、注意、動機、規劃、深思、元認知、行動選擇和運動控制，以及所有這些活動的具身性。因此，"認知"意在涵蓋代理心智生活的全部，包括其具身性和具身行動。在 LIDA 框架內，"心智"被廣泛理解為自主代理的控制結構（Franklin, 1995; Franklin and Graesser, 1997）。此處"控制結構"（參見 Newell, 1973）被廣泛理解為那些使代理能夠追求其議程的機制。成為自主代理的部分含義在于擁有一個議程，而擁有心智則意味著擁有使個體能夠追求該議程的結構（無論其議程多么簡單或復雜）。因此，自主代理始終在處理"我接下來應該做什么？"這一問題。

學習智能決策代理由許多短期和長期記憶模塊，以及被稱為代碼元（codelets）的專用處理器組成。雖然模塊化有時在當代心智哲學中被視為"貶義詞"，但 LIDA 模型在以下意義上是模塊化的：它由一組獨立模塊組成，這些模塊持續執行其指定任務。然而，重要的是要注意，LIDA 模型并不承諾大腦的模塊化（Franklin et al., 2013）。事實上，LIDA 模型對大腦不做任何主張。因此，即使由動態且充滿神經復用（neural reuse）的大腦（Kelso, 1995; Anderson, 2014）也可以實現 LIDA 模型。

重要的是，LIDA 模型實現了意識的全球工作空間理論（Baars, 1988, 2019）。代理通常無法意識到其環境（外部或內部）中的一切，因此需要"過濾掉"最相關的信息。因此，LIDA 代理擁有關于世界的信息，這些信息在稱為全局工作空間（Global Workspace）的模塊中"競爭"其注意力。任何勝出的結構（最典型的是一組結構的聯盟）會被全局廣播到整個模型中的每個模塊——因此稱為"全局廣播"。通過這種方式，全局工作空間充當一個過濾器，決定哪些信息可供代理的其余模塊使用。

在 LIDA 中，感官刺激被用于在稱為當前情境模型（Current Situational Model, CSM）的模塊內構建外部環境和內部環境的豐富模型。概括而言，CSM 創建世界的模型，然后模型的不同部分被發送到全局工作空間中競爭。

LIDA 模型利用兩種類型的專用處理器：結構構建代碼元和注意代碼元。結構構建代碼元在 LIDA 的 CSM 中構建（可能復雜的）表征結構。這些結構可以包括（除其他外）來自代理環境的感官內容和被提示的長期記憶（例如，來自感知聯想記憶、空間記憶、瞬態情景記憶和陳述性記憶）。另一方面，注意代碼元持續監控 CSM，尋找與其關注點匹配的結構。如果找到，前意識內容及其對應的注意代碼元會形成聯盟，在 LIDA 的全局工作空間中競爭意識。

聯盟由注意代碼元及其倡導的內容組成。這些聯盟隨后被發送到全局工作空間內競爭意識的"注意"。在全局工作空間模塊內發生的競爭決定系統將意識性地注意什么。無論哪個聯盟具有最高的激活值，其內容就會被廣播到整個模型中的每個 LIDA 模塊（即，其內容被全局廣播）。意識包括（除其他外）離散的認知時刻在重疊周期中展開的頻繁序列化廣播，然后通常由每個模塊處理。換句話說，意識是離散的，一件事接一件事以快速節奏發生（Baars, 1988）。雖然 LIDA 的所有模塊都異步接收輸入，但全局廣播的序列化性質促進了意識以及（如我們將看到的）具身行動的平滑序列化展開。關于 LIDA 模型、其模塊和過程的一般概述，見圖 1。

為了能夠處理代理在不同文化、個人歷史和當前情境下具有不同需求的事實，多個變量被附加到 CSM 中的結構上。例如，每個結構都有一個激活值，該值部分用于衡量其顯著性。這些結構的顯著性用于確定包含這些結構的聯盟的激活，從而調節它們在全局工作空間中贏得全局廣播競爭的機會。關于 LIDA 中顯著性和動機的深入說明（參見 McCall et al., 2020）。

LIDA 研究計劃的核心承諾之一是 LIDA 模型是一個具身架構（Franklin et al., 2013）。這意味著 LIDA 代理在設計上是受生物啟發的，并且始終與其環境處于活躍的交互之中。符合認知的 4E 方法，LIDA 代理始終處于回答“我接下來做什么？”這一問題的過程中。此外，不斷回答這個問題意味著所有 LIDA 代理都有一個“議程”，并且在許多具身 LIDA 代理中，該議程源于代理身體的需求。

具身認知領域的辯論經常區分弱具身和強具身（Gallagher, 2011）。粗略地說，如果身體傾向于僅僅在系統的中央處理中被“表征”，那么一種認知方法就是弱具身的。如果系統物理身體的構造有助于其認知的構成，那么該系統就是強具身的。然而，LIDA 模型并不完全符合這一分類。LIDA 模型使用包容架構（Brooks, 1991），并通過其背側流與環境處于持續敏感的交互之中。LIDA 背側流除其他外，直接影響代理與其世界的物理介入。LIDA 代理還擁有一個身體圖式，持續影響感覺運動行動的展開。同時，確實 LIDA 模型也在當前情境模型中表征其自身的身體。此外，LIDA 認知架構的設計使其既可以在物理代理中實現，也可以在非物理代理中實現，例如分別是機器人或軟件代理。因此，LIDA 模型包含強具身和弱具身兩者的元素，并且在物理代理中，這兩種方法往往都起作用。

有了這個概述，我們準備好深入探討關于 LIDA 認知周期和行動選擇的更多細節。行動選擇在流暢應對期間尤為重要，因為成功的流暢應對需要在正確的時間熟練地選擇和執行正確的行動。

認知周期

學習智能決策代理（LIDA）的認知周期分為理解階段、注意階段以及行動與學習階段（見圖 2）。LIDA 的認知周期始于外部和內部的感官輸入，以及在當前情境模型（Current Situational Model, CSM）中結構（即表征）的構建與更新。吸引注意代碼元關注的結構隨后被帶到全局工作空間，在此它們競爭意識。勝出的結構在整個模型中被廣播，系統可能通過行動選擇機制做出行動（內部或外部）的決策。學習也可能作為每次意識廣播的結果而發生。雖然關于 LIDA 中學習的詳細討論超出了本文的范圍，但足以說明的是，LIDA 代理通常在每個認知周期中學習（作為其意識廣播的直接結果）。

對于不熟悉 LIDA 的讀者而言，記住以下幾點是有幫助的：每個認知周期都非常迅速，在人類中僅持續 200–500 毫秒（Madl et al., 2011），并且 LIDA 的模塊在很大程度上是異步且獨立于彼此工作的。因此，認知周期可以"重疊"。例如，一個認知周期的"行動與學習階段"可以與下一個認知周期的"感知與理解階段"同時發生。因此，雖然每個認知周期在概念上被劃分為離散的、串行的階段，但代理的模塊和過程完全處于非活動狀態的情況很少見。

行動選擇

在每個認知周期的行動與學習階段，LIDA 的行動選擇模塊通常會選擇指定可執行（內部或外部）行動的行為。出于多種原因，這個行動選擇過程是必要的。例如，可能存在許多行為可以完成一項任務，盡管并非所有行為都能同樣出色地完成。例如，移動一個盒子可以通過攜帶它、用手推它、用腳蹬它，甚至四肢著地爬行時用頭推它來實現。在這些情況下，行動選擇有助于選擇這些行為中最具情境相關性和最可靠的行為。此外，在任何給定時刻，代理可能擁有多個相互競爭的欲望和目標。行動選擇有助于選擇更有可能導致最期望結果的行為。最后，行動選擇協調非沖突行為的并行選擇。

歷史上，行動選擇一次只選擇一個行為。在本文中，我們增強了行動選擇模塊，包含了一個自動化行動選擇子模塊（見"LIDA 中的流暢應對”部分），允許在每個行動選擇事件中選擇多個非沖突的行為。行動選擇依賴于 LIDA 的程序性記憶，這是一個長期記憶模塊，用于確定情境相關的行動及其預期的環境后果。換句話說，程序性記憶指定了可采取的行動以及如果采取這些行動會發生什么，而行動選擇則根據該知識決定代理將做什么（見圖 3）。

當意識內容被全局廣播到所有 LIDA 模塊時，它被程序性記憶接收，程序性記憶利用意識廣播的內容來實例化與該意識內容相關的圖式。實例化的圖式被稱為行為，它們是 LIDA 行動選擇模塊選擇的候選者。每個圖式由一個上下文（即環境情境）、一個行動和一個結果（即該行動的預期環境后果）組成。這些可以在許多不同的抽象和普遍性級別上指定。每個圖式還包含一個基線激活值，用于估計在給定上下文中采取該行動時，圖式結果隨之發生的可能性。例如，一個通用的“轉鑰匙圖式”可能指定一個行動，對應于轉動鑰匙所需的身體運動，上下文是靠近鎖，預期結果是鎖被打開。每次成功選擇并執行該圖式的行動（在給定上下文中）通常會導致其基線激活值增加。同樣，每次失敗會導致其基線激活值減少。如果，正如我們可能預期的，這個“轉鑰匙圖式”通常成功，那么它最終將擁有較高的基線激活值。然而，如果其上下文指定不足，例如如果它沒有限制“轉鑰匙”僅在代理“靠近鎖”時進行，那么其行動可能會在不適當的情境中被采取，導致一個不可靠的圖式，經常莫名其妙地失敗。這種不可靠性將表現為該圖式具有較低的基線激活值。

此時，自然會有人問：“等等，每件事都有一個圖式嗎？有煮咖啡圖式嗎？有看電視圖示嗎？有 CrossFit 圖式嗎？”首先，我們必須理解許多圖式是特定于文化的。一個部署在汽車工廠流水線機器人上的 LIDA 代理不需要一個“酷握手”圖式。然而，一個存在于不同握手是文化流暢性不可或缺組成部分的文化中的代理，可能擁有針對不同文化相關問候的圖式。其次，我們必須理解復雜行動是通過執行多個更簡單的行動來實現的。例如，騎自行車包括雙腿蹬踏、轉向、剎車、掃描環境等等。在 LIDA 的歷史上，將多個行動協調為復雜行動是通過圖式流來實現的（見“行為流和技能”部分）。由于這些流的存在，LIDA 代理不需要為每個復雜行動學習獨特的圖式。相反，看似新穎的復雜行動可以通過多個預先存在的圖式表現出來。通過這種方式，LIDA 實現了一種形式的“遷移學習”（Pan and Yang, 2009）。為了進一步促進復雜行動的學習，在本文中，我們引入了圖式的層級組織（見"LIDA 中的流暢應對”部分），它與行動的自動化行動選擇相結合，允許流暢的代理行為。

當行動選擇選擇一個指定外部行動的行為時（即，旨在修改代理外部環境的行動），它將其傳遞給 LIDA 的感覺運動記憶以執行。另一方面，如果選擇的行為指定了一個內部行動（例如，用于支持心理模擬的行動），它會被發送到（或用于生成）一個結構構建代碼元，從而相應地更新當前情境模型。行為的選擇也可能導致期望代碼元的創建。期望代碼元是一種注意代碼元， tasked with 監控當前情境模型，尋找與代理最近選擇行為的預期結果相匹配的內容。這會暫時使代理的注意力偏向于其最近行動的環境后果，有助于在代理的行動及其結果之間產生反饋循環。因此，符合生成式和預測性的認知方法，行動、感知和預測在一個反饋循環中緊密聯系在一起。

關于流暢應對的研究普遍認同，流暢應對由一系列自動的和有意識控制的行動組成，同時也包括低層感覺運動活動和高層思維，如策略制定或監控（Christensen et al., 2016; Montero, 2016; H?ffding, 2019; Gallagher and Varga, 2020）。換句話說，流暢應對是根深蒂固的自動過程與有意識的深思熟慮過程的結合，從而產生流暢且熟練的行動。在 LIDA 中，這是通過結合四種不同的行動選擇模式來建模的：意識介導的行動選擇、意志決策、警報和自動化行動選擇（Franklin et al., 2016, pp. 29–32）。意識介導的行動選擇指的是代理執行的許多行動，其中涉及意識廣播，但同時代理并未意識到那些用于選擇這些行動的選擇過程。例如，在帆船運動中，運動帆船手可能有意識地意識到桅桿上的不同繩索，但并未意識到行動選擇中的競爭過程，正是該過程使她選擇了最終部署的特定繩索握法。同樣，網球運動員可能有意識地意識到接近的球，但并未意識到使他選擇扣殺而非截擊的行動選擇過程。

意志行動選擇指的是這樣一種行動選擇類型，其中代理有意識地且主動地意識到某些選擇過程。例如，當一個代理在深思熟慮棋盤游戲中最好的一步棋是什么，并反復斟酌不同的選擇、結果和陷阱時，他們就是在進行意志行動選擇。通過反復斟酌不同的可能行動及其結果，“選項”在當前情境模型中被創建出來（Franklin et al., 2016）。這些選項可以變得有意識并進入程序性記憶，程序性記憶隨后可能基于這些選項實例化行為。行動選擇隨后可以從這些行為中進行選擇。因此，意志行動選擇的第一部分是有意識的，而第二部分是無意識的（意識廣播正在被利用，但代理并未意識到行動選擇模塊中發生的過程）。事實上，在任何行動選擇模式中，代理都無法意識到行動選擇模塊內部正在發生什么——該模塊只是持續地執行其工作。簡而言之，在意志行動選擇期間，代理意識到他們正在權衡的選項，但并未意識到行動選擇“內部”正在發生什么。

警報是從未意識的過程，它們繞過全局工作空間中的競爭。如果某個對象或事件被感知聯想記憶識別為警報，該對象或事件將被直接發送至程序性記憶以實例化圖式。與警報內容相關的行為在行動選擇中被賦予高激活值，通常被選中并立即傳遞給感覺運動記憶——感覺運動記憶反過來將運動計劃傳遞給運動計劃執行。簡單來說，許多代理都有過在警報情況下行動的經歷，并且只在事后才意識到他們的行動。例如，對于許多人來說，一只大蜘蛛爬在手臂上會導致一系列刷拂、跳躍和痙攣反應，他們只在事后才意識到威脅。同樣，在駕駛中，許多司機體驗到對危險情況的反應速度快于或等于他們有意識地意識到情況的速度。注意此處，警報既可以是像蜘蛛例子中那樣的先天性的，也可以是像駕駛例子中那樣由文化決定的。

行動選擇的最后一種模式是自動化行動選擇。自動化行動是過度學習的行動，其中一個行動可以被視為調用下一個行動。自動化行動的選擇是無意識地進行的，也就是說，選擇不一定需要來自意識廣播的內容。這些通常是那些已經反復練習過的行動，它們可以在沒有意識思考的情況下執行。例如，在空曠的人行道上行走是典型的自動化行動。它只需要很少的注意力，代理可以同時專注于其他事項。在本文中，我們將在"LIDA 中的流暢應對”部分詳細討論自動化行動選擇。

雖然我們在"LIDA 中的流暢應對”部分會詳細討論自動化，但值得在此注意自動化行動選擇與警報之間的一個核心區別。警報行動一旦執行完畢就會恢復到正常功能，并且不要求進一步的行動。通過這種方式，警報是對代理正在進行的任何事情的暫時中斷。另一方面，自動化行動不會中斷系統內的正常過程，也不會優先于正常過程。此外，自動化行動指定哪些行動將從自動化行動選擇模塊內隨后進行（關于此更多內容見"LIDA 中的流暢應對”部分）。

雖然在人類看來，這個整個過程，從程序性記憶開始，經過行動選擇、感覺運動記憶，最后到運動計劃執行，可能顯得漫長且費力，但重要的是要記住這個過程極其迅速。每個認知周期通常發生在幾百毫秒之內（Madl et al., 2011）。因此，當處理快速動態行動時（正如流暢應對中經常發生的那樣），重疊的認知周期足夠迅速，足以進行調整并即時行動。此外，我們必須記住，運動計劃執行與所有其他系統并行運行，允許對進行中的運動計劃進行無意識調整。此外，LIDA 感覺運動系統基于 Brooks 的包容架構（Brooks, 1991），允許代理與世界進行快速交互。

同樣，類似于生成式和預測性處理的心智方法，LIDA 代理始終處于適應性行動的過程中；我們可以說，LIDA 代理始終在回答“我接下來應該做什么？”這個問題。在 LIDA 中，行動選擇不斷從候選行為中選擇一個行為并將其發送至感覺運動記憶（除非該行動是進行深思）。這確保了代理始終處于行動過程中，以保持與其環境的最佳適應關系。

行為流與技能

流暢應對涉及“技能”和“最佳把握”（optimal grip）。對一項活動擁有最佳把握，意味著熟練地、流暢且輕松地駕馭該活動（Merleau-Ponty, 1945/2012; Rietveld and Kiverstein, 2014; Bruineberg et al., 2021）。諸如“技能”和“流暢性”之類的概念，通常包括能夠以不間斷的方式執行多個行動，并將這些動作鏈調整以適應情境的動態實時變化和需求（Nakamura and Csikszentmihalyi, 2014）。

在 LIDA 中，技能和流暢性部分是通過行為流來實現的。除了單個圖式外，程序性記憶還包含可以被實例化的圖式流。圖式流是一系列串在一起的動作圖式，可以使用來自一個或多個全局廣播的內容集體實例化。整個實例化的圖式流被稱為行為流。一旦行為流被發送到行動選擇模塊，該模塊可以快速一次選擇一個行為，并將每個行為傳遞給感覺運動記憶（后者反過來將運動計劃傳遞給運動計劃執行）。

對于生物代理而言，流暢應對通常涉及一系列流暢的行動。例如，運籃球、邁三大步，然后跳起扣籃，可以作為一系列整合的、流暢的動作發生。此外，人們很少一次只做一件事。因此，LIDA 中的行動選擇過程通常涉及行動選擇模塊從幾個行為流中快速挑選行為。歷史上，在 LIDA 概念模型中，行動選擇一直是一次只選擇一個行動，且僅選擇一個。然而，在生物代理中，物理行動經常重疊。因此，在本文中，我們正在增強 LIDA 的行動選擇以支持多個行動的同時選擇。具體來說，除了通過我們原始的行動選擇算法一個接一個地選擇行動外，我們還支持自動化行動的同時選擇。這是通過行動選擇的新自動化行動選擇子模塊實現的。開發這個子模塊是本文的貢獻之一。

例如，人們可以想象一個（令人難忘的）場景：馬戲團小丑騎著獨輪車，雜耍，同時故意地、瘋狂地大笑，同時表演性地齜牙咧嘴。這樣的表演需要多個熟練行動同時重疊。即使行動選擇被限制為一次只選擇一個行為，這并不意味著先前選擇的行為的執行必須是順序的。此外，行動選擇可以從多個并發行為流中快速選擇行為，并將它們向前傳遞給感覺運動記憶以執行。

成為某項活動的熟練代理涉及（除其他外）擁有經過微調、排練良好的行為流和運動計劃模板，這些可以靈活地調整以適應當前情境的需求。在 LIDA 中，流暢應對的許多“熟練”方面由行動選擇、感覺運動記憶，尤其是運動計劃執行處理。當行為被發送到感覺運動記憶時，系統必須創建一個運動計劃——一個高度具體的身體運動計劃。運動計劃指定特定運動命令序列（即運動命令），這些命令指導代理的每個特定執行器。這里，執行器僅僅意味著代理通過其作用于世界的物理部件之一。例如，工廠機器人可能只擁有一個“手臂”執行器。另一方面，人類擁有多得多的執行器。

運動計劃及其運動命令通過背側流對來自感覺記憶的快速傳入數據做出反應和適應（Neemeh et al., 2021），以保證代理的行動與環境的最當前狀態同步。

通常在流暢應對中，當代理作用于環境時，環境可能會發生變化。例如，作為一名運動帆船手，涉及在船只被不規則的風和水流碰撞和搖晃時，熟練地操縱船帆。為了在這種動態情境中熟練地完成運動計劃，運動計劃在代理行動時通過 LIDA 的背側流不斷對感官信息做出反應。一個正在航行的代理可能會發出一個運動計劃去抓取特定的繩索。然而，當他們抓取時，船被一個大浪搖晃。而不是以相同的方式繼續抓取，通過背側流實時更新運動計劃確保代理調整其抓取動作，并仍然成功抓住繩索。

可供性、面向行動的表征和行為流

最近關于流暢應對的研究用可供性，有時是面向行動的表征，闡釋了代理與環境之間大部分熟練的交互循環（Milikan, 1995; Clark, 2016; Williams, 2018; Gallagher, 2020; Bruineberg et al., 2021; Kronsted, 2021a）。可供性和面向行動的表征是兩個非常相似的概念。可供性通常被定義為行動的可能性，這種可能性作為一種關系存在于受文化熏陶的代理與環境之間（Gibson, 1979/2013; Chemero, 2009）。重要的是，可供性通常被認為是一個非表征概念。面向行動的表征非常相似——但正如名字所暗示的，它們是一類心理表征。面向行動的表征是那些也召喚或推動代理進入行動的表征（Milikan, 1995; Ramsey, 2007; Clark, 2016; Kirchhoff and Kiverstein, 2019）。

在 LIDA 中，我們通過使用表征性可供性采取了一種中間立場的方法。LIDA 可供性被概念化為系統內的表征。關于 LIDA 代理如何學習和使用可供性的最近論述（見 Neemeh et al., 2021）。在此只需說明，隨著 LIDA 代理在各種活動中變得受文化熏陶并接受訓練，它們學習感知新的可供性，并可以對此做出反應。隨著 LIDA 代理獲得更高的技能，其感知系統可以檢測到越來越細粒度的可供性，這些可供性可以納入越來越細粒度的行為流的選擇中。

行動、學習、行為流和可供性之間存在著細致的關系。LIDA 使該模型區別于其他認知架構的方面之一是"L"——學習。嚴格來說，LIDA 代理可以在每個認知周期中“學習”新事物。隨著每次全局廣播，幾乎所有模塊都可以用來自廣播的內容進行更新，并且每個模塊（包括各種記憶模塊）都可以根據該廣播執行某些功能。例如，感知聯想記憶可能會建立新的連接，瞬態情景記憶可能會組合成一個新事件，意識內容隊列添加到似是而非的當下（specious present），也許程序性記憶開始構建一個新圖式，等等。關于 LIDA 中學習的詳細論述（見 Kugele and Franklin, 2021）。

就流暢應對而言，隨著 LIDA 代理作用于其環境，每次廣播后，代理會慢慢變得更加熟悉該環境和手頭的相關任務。這種適應包括為這些可供性構建更專門化和細粒度的可供性及行為圖式。例如，代理可能對巴西柔術一無所知，但經過訓練，對手的不同動作會與行動或反行動的可供性相關聯（Kimmel and Rogler, 2018）。對手試圖進行后頸絞殺——提供了將背部平貼在墊子上的可供性。對手在封閉防守期間將體重放在錯誤的位置提供了執行腿部三角絞的可供性。可供性與其相關的行為圖式之間存在一個良性循環。流暢應對通常是一個擁有細粒度可供性的問題，這些可供性使得使用適當細粒度的行為圖式成為可能（見圖 4）。

當代理感知到一個事件時，它們也感知到相關的可供性。如果包含可供性的聯盟在全局工作空間的廣播競爭中勝出，那么廣播內容中可供性的存在將有助于實例化行為圖式，從而也促進在行動選擇中贏得競爭。

如前所述，選擇一個行為（可能來自行為流）也會創建一個期望代碼元，以促進對行為相關結果的監控。期望代碼元的創建不僅有助于將行動結果帶入意識，還有助于確保與這些行動結果相關的可供性也被有意識地廣播。在一個促進行動的反饋循環中，對一個可供性采取行動會帶來下一個可供性。這種反饋循環符合關于可供性的經驗和理論文獻，這些文獻將流暢應對概念化為行動與可供性之間的反饋循環（Di Paolo et al., 2018; Kimmel and Rogler, 2018; de Oliveira et al., 2021; Kimmel and Hristova, 2021; Kronsted, 2021b）。

總體而言，我們看到流暢應對不是一個已經熟練某項活動的問題。相反，流暢應對涉及不斷提高自身技能和適應性的能力。在 LIDA 中，這種適應性內置于跨模塊的信息流中，由意識廣播促進。

當然，流暢應對不僅關乎知道“做什么”，還關乎擁有足夠發展的感覺運動協調性來做到這一點——用外行話說就是擁有正確的運動技能。因此，LIDA 中的技能循環還包括代理構建和完善日益復雜的運動計劃模板。經過許多認知周期，感覺運動記憶被緩慢更新，以便代理（希望）始終處于知道“如何做”的位置，并且具有高度的復雜性。詳細說明感覺運動記憶如何構建和更新運動計劃超出了本文的范圍。重要的要點是，LIDA 代理通過更新其“做什么”的圖式（行為）和“如何做”的計劃（運動計劃模板）來一致地更新其行動能力。

讓我們以變得擅長運動為例——在這種情況下，是足球。通過練習，足球運動員學習感知場地，并根據不同的機會來看待它。也就是說，球員隨著時間的推移，學會根據不同的可供性來體驗比賽，“在這種情況下，我可以長傳，從右邊這個人身邊運球過去，或者短傳回傳。”隨著時間的推移，球員學會根據提供“做什么”可能性（潛在行為）的可供性來看待場地。然而，學習利用可供性也是學習如何具體利用可供性“如何做”（運動計劃）的問題。因此，通過練習，代理還通過開發日益復雜的運動計劃模板來微調其身體能力——起初，運球和踢球是笨拙的，但隨著時間的推移，它變得成為第二天性。

自然地，做像專家級足球這樣高級的事情需要多個過程——一些是意識介導的，另一些是自動的。因此，接下來，我們將看看在流暢應對期間不同的行動選擇模式是如何交織在一起的，以及自動化行動的作用。

自動化與自動化行動選擇子模塊

流暢應對的一個關鍵方面在于它同時涉及高層和低層認知過程（Christensen et al., 2016; Montero, 2016; H?ffding and Satne, 2019; Gallagher and Varga, 2020）。讓我們回到小丑的例子。那位同時騎著獨輪車、雜耍、咧嘴笑并與選定的觀眾成員交談的小丑表演者，可能會利用意識介導的、完全意識的以及自動化的行動。因此，為了說明流暢應對期間行動中這種重疊現象，我們需要看一看 LIDA 代理是如何實現自動化的。自動化行動被實現為行為流中的一系列行為，這些行為已被掌握到這樣的程度，即這些行為可以在沒有意識廣播介導的情況下被選擇——也就是說，自動化行為可以在不需要感官輸入更新的情況下被選擇。然而，這些行為的執行可能通常仍需感官輸入（例如通過背側流甚至意識廣播）。

自動化與自動化行動選擇子模塊

就流暢應對而言，代理能夠同時執行多個行動往往是重要的（例如，踩踏板和傳球，運球和鏟球，拳擊和格擋，等等）。因此，在本文中，我們向 LIDA 模型引入了一個新的子模塊，即行動選擇的自動化行動選擇子模塊（AAS）。該子模塊與行動選擇并行運行，并反復將行為發送至感覺運動記憶（SMM）。例如，在我們的獨輪車小丑例子中，自動化行動選擇可以反復選擇自動化行為“踩踏板”并將其發送至 SMM。

擁有一個完全處理自動化行為的子模塊，并能夠反復選擇此類行為，允許行動選擇并行專注于其他形式的行動選擇，如意識介導的行動選擇或深思。讓我們回到柔術和三角絞的例子。“三角絞”是一個高層行為，由幾個動作組成（見圖 5）：腿勾、三角勾、手臂勾和擠壓。當行動選擇選擇該高層行為時，它將該行為發送至 AAS 子模塊。從那里，AAS 可以從“三角絞”行為流中的組成行為中進行選擇。簡而言之，行動選擇將高層自動化行為傳遞給 AAS，然后 AAS 從高層行為的行為流中的低層組成行為中進行選擇。能夠并行選擇行動，使得柔術練習者能夠仔細閱讀對手的模式，并深思接下來做什么，同時產生復雜的行為，如“三角絞”（圖 6, 7）。流暢應對通常是通過讓自動化行動選擇與其他形式的行動選擇和諧地并行工作來實現的。

自動化行動選擇與行動選擇并行運行，從自動化行為流中選擇行為（例如，行走、踩踏板、運球、演奏一首根深蒂固的歌曲等）。來自所選行為流的每個行為可以被視為在該流中“調用下一個”行為。因此，一旦選擇了高層自動化行為，其每個低層行為，比喻地說，得以選擇下一個行為是什么。例如，如果一個代理通過自動化行動選擇演奏一首過度學習的鋼琴曲（比如 Bent Fabric 的《Alley Cat》），每個音符，對應一個低層行為，“調用下一個”。一旦從"Alley Cat 自動化行為流”中選擇了第一個音符，第一個音符在其完成后選擇下一個音符。這產生了許多音樂家認可的感覺，即樂曲本質上在演奏自己。這種一個行動調用下一個行動的自動化也確保音樂家可以同時唱歌，與觀眾眼神交流，俏皮地抖動肩膀等，所有這些都同時進行。

用 LIDA 術語來說，自動化行為是“退化”行為流——它們是不包含分支選項的過度學習的行動。缺乏分支選項是允許行為直接“調用下一個”的原因。一個用于踩踏板的高層自動化行為可能包含一個用右腿踩踏板的行為，然后調用一個用左腿踩踏板的行為——沒有分支選項。

重要的是，自動化行為流也可以是層級結構化的，其中這些流中的每個行為可以對應其他行為流。這種能力至關重要，因為許多行動的規格受益于層級結構，并且這些高層行為的復用在記憶中可能更高效。高層行為通常包含必須“對齊”的多個行為流。例如，制作一個魯本三明治需要獲取面包、蛋黃醬、酸菜、咸牛肉和瑞士奶酪，組裝組件，并將它們放在盤子上。這些子行動中的每一個都可以是自動化的，并屬于其自己的行為流。共同地，這些自動化行為有助于實現高層“魯本三明治”行為。

熟食店工人可能會像往常一樣制作和包裝三明治，而不考慮顧客的困難特殊訂單“只加一點蛋黃醬，多加泡菜，加沙丁魚！”以不同方式制作三明治需要意識介導的行動選擇，而非一個行動調用下一個行動的自動化。這解釋了為何有時即使明確打算做一件事，代理最終卻做了另一件事，因為行動的開端具有自動化性質。

值得注意的是，盡管自動化行為沒有分支選項并調用下一個行動，它們仍然生成期望代碼元。就像 LIDA 中的所有其他行動一樣，期望代碼元的生成允許系統跟蹤其行動的完成情況，以便系統可以知道是繼續其行為還是切換到其他行為。

當自動化行動選擇將自動化行為向前饋送到感覺運動記憶時，該模塊可以實例化運動計劃，這些計劃也指示自動化行動需要執行多長時間的“時機”——從而降低“無心”做某事太久的風險。在音樂例子中，每個音符的運動計劃被指定非常短且精確的時機。另一方面，自動化“行走”的運動計劃可以在運動計劃內具有“直到進一步通知”的時間指定。我們必須記住，雖然自動化通常對專家表現有益，但流暢應對涉及交織的行動類型。過度依賴自動化通常會導致任務失敗。

LIDA 中的流暢應對

描述流暢應對的一種方式是：使用自動化，并間歇性地使用意識介導的行動（見圖 8），以及其他重疊的行動選擇類型，以實現某個意圖（Kronsted et al., 2021）。代理并非僅僅在進行多任務處理或僅僅進行自動化。相反，代理的全部或大部分認知過程都連貫地朝向實現一個意圖（完成這個困難的食譜、足球動作、穿過交通到達工作地點）。

如果某個事件迫使代理放棄其行動朝向該意圖的連貫性，流暢應對過程就會被中斷。例如，騎獨輪車的小丑正在進行流暢應對——騎車、雜耍、咧嘴笑和唱歌，所有這些都朝向以迷住的觀眾完成其表演的意圖。然而，如果一個舞臺工作人員突然跑到舞臺上大喊："你必須馬上過來，你妻子要生了，"那么代理的行動就不再指向完成表演這一遠端意圖。流暢應對已被中斷。不那么戲劇性的是，如果代理在烹飪時電話響了，如果代理接起電話并關注電話交談而非爐灶，流暢應對就暫時被中斷了。當然，一旦代理放下電話，這些過程就可以重新參與。相比之下，如果代理在打電話時繼續烹飪，則仍可以說該代理處于流暢應對狀態。

雖然我們在此主要關注感知和行動選擇，而非記憶過程，但 LIDA 中的流暢應對是一個跨所有模塊運作的現象。如前文所述，我們在本文中在此向 LIDA 認知架構引入了一個新補充——自動化行動選擇子模塊。在本節中，我們將簡要更詳細地討論不同的行動選擇模式，然后描述它們在流暢應對期間交織的性質，特別是與自動化行動選擇子模塊相關的方面。最后，我們提供三個具體案例研究，以展示整個理論框架可能如何展開（見"結論"部分）。

交織的行動選擇與反饋循環

我們現在可以看到，LIDA 代理如何在流暢應對期間通過行動選擇類型的交織來實現行動選擇——意識介導的行動選擇、意志行動選擇、警報和自動化行動選擇。當代理在各種動態變化的情境中行動時，它們必須部署不同形式的行動選擇以適應性地實現其目標。例如，代理可能會部署一系列行為和行為流，以仔細操作臺鋸，將木塊雕刻成正確的尺寸。此類行為和行為流可能包括走向臺鋸、抓住木材、仔細將其在臺面上對齊，并將木材向前滑動到鋸上，同時瞄準以確保直線切割。當代理部署這些行為流時，它們也可能會有間歇性的深思時刻，在此期間它們積極思考先切割哪些塊以及如何按正確順序將它們堆疊起來。代理可能會進一步深思切割的正確尺寸，這反過來將向下傳遞并影響實例化運動計劃的具體細節以及運動計劃執行中的行動執行。

由于我們例子中的代理非常擅長木工，他們經過多年練習開發了用于操作臺鋸的自動化行為流和高度復雜的運動計劃模板。因此，代理主要通過自動化行動選擇來操作鋸。也許當代理操作臺鋸時，他們的手指危險地靠近刀片，系統中觸發警報將手向后拉。重要的是，當警報使代理能夠繼續預期活動時，它們是流暢應對流程的一部分。因此，在臺鋸例子中，阻止代理切斷手指的警報自然允許代理繼續該活動。然而，將大蜘蛛從手上甩掉的警報并不會延續預期活動，并且通常會打破流暢應對。在此提出警報的原因是為了強調警報通常必須被學習，并且通常是特定于技能和情境的。例如，在巴西柔術的情境之外，得到一個漂亮的下勾抱是甜蜜且令人安慰的。然而，在柔術情境內，這意味著練習者即將被掃倒并可能輸掉比賽。因此，可能會觸發一個特定于情境的警報，使練習者收回手臂并試圖夾緊腋窩（以拒絕對手的下勾）。警報通常是掌握技能的組成部分，因為它們迅速且繞過意識廣播的競爭。

讓我們回到我們的臺鋸例子。在多年練習的某個時刻，操作臺鋸已變得自動化；選擇木塊、在臺面上準備它們以及執行切割現在由自動化行為流完成，其中一個行動調用下一個行動。通過這種方式，代理可以反復一次又一次地選擇相同可靠的行為流，直到工作完成。自動化允許在自動化行動展開的同時并行選擇其他行動（通常是意識介導的或深思的行動）。工人可以操作臺鋸（得益于自動化行動選擇子模塊），同時大聲呵斥其學徒糾正姿勢、給他們端咖啡，或者深思對于需要不同技術的困難木塊使用哪種技術。

總的要點是，LIDA 中的流暢應對涉及部署各種形式的行動選擇，每種形式都針對手頭的任務。無論是警報、意識介導的行動、深思行動還是純自動化行動，每個被選擇的行為都連貫地朝向以適應性的方式完成代理的目標。

在此關頭，我們不能忘記流暢應對涉及代理的行動與環境變化之間的多個反饋循環。例如，跟在一輛車后面駕駛同時試圖閱讀車上有趣的保險杠貼紙，涉及必須與該車輛保持正確的距離范圍。太遠則無法閱讀貼紙，太近則車輛可能相撞——代理必須保持“最佳把握”（Merleau-Ponty, 1945/2012; Dreyfus and Wrathall, 2014; Bruineberg et al., 2021）。如前所述，運動中感官信息的快速背側流更新會更新行動中的運動計劃執行，以便代理在行動期間能與環境保持最佳關系。LIDA 代理的行動與背側流信息之間存在持續的反饋循環。

此外，隨著每個行動，也會生成一個期望代碼元。如前所述，此類代碼元掃描當前情境模型，尋找與代理行動預期結果相關的對象和事件。由期望代碼元帶入全局工作空間的結構通常具有高度顯著性，并且非常可能贏得意識廣播的競爭。以這種方式，代理的行動與其期望之間存在一個反饋循環。通過行動與高激活結果之間的反饋循環，LIDA 代理可以在動態情境中與其活動的展開保持仔細協調。我們看到，與代理行動同時發生的是對這些行動結果的注意，這反過來有助于確定預期活動的完成。這是對行動結果的注意偏向，這反過來有助于延續預期活動的完成。

最后，認知周期通常通過學習協助增加適應性。LIDA 代理可以在每個認知周期更新其記憶模塊（Kugele and Franklin, 2021）。通過這種方式，代理總是緩慢但肯定地使其自身朝向更大程度的適應性移動。

通常，我們可以想到至少三個幫助 LIDA 代理進行流暢應對的反饋循環——一般認知周期（遠端時間尺度上的適應性）、行動注意循環（近端時間尺度上的適應性）和行動背側流循環（快速時間尺度上的運動適應性）。簡而言之，認知周期有助于較長時間內的任務適應性。意識介導的行動選擇有助于代理當前情境中的適應性。自動化、運動計劃和背側流負責快速的瞬間適應性（見圖 9）。

我們已經探討了不同形式的行動選擇，以及它們在流暢應對期間如何交織朝向任務的完成。我們也探討了伴隨這些各種形式行動選擇的不同反饋循環，以及這些反饋循環如何幫助代理在不同時間尺度上適應任務。

在我們的討論中，我們將把迄今為止所探討的所有內容應用于三個小型案例研究，以觀察流暢應對如何在每種情境下的 LIDA 代理中展開。我們從相對簡單的行走例子開始，逐步提升到駕駛，然后是快餐烹飪。

獨自行走

薩姆（Sam）早上 5:00 起床，在謝爾比農場公園（Shelby Farms Park）進行日常散步。這條小路是環繞湖泊的一英里環路，清晨時分意味著同時散步的人非常少。

薩姆的系統利用了行走的自動化行為流。當小路圍繞湖泊略微彎曲時，感覺記憶更新薩姆的運動計劃和運動命令，以便薩姆調整其身體方向、每一步的高度和長度，以及在非常易行的平坦地形中移動所需的其他微小調整。路面高度的微小差異意味著有時薩姆的感覺記憶必須更新其踏步運動命令，使其稍微更長、更高一些。

由于這主要是自動化的問題，薩姆可以讓他的思緒漫游，并積極思考生活中其他需要深思的事情（我應該加入比特幣熱潮嗎？《魷魚游戲》真的那么好看嗎？我的人生在做什么？）。鑒于地形中沒有障礙物，薩姆的系統可以簡單地繼續選擇和執行自動化行走行為。然而，沒有任何自動化行為是無限期的，薩姆確實仍需定期檢查障礙物。因此，薩姆仍然頻繁地看向前方道路并重新選擇自動化行走行為。

最終，薩姆注意到一個行人和他們的狗正在靠近。這個人和他們的狗贏得了意識競爭，薩姆的行動選擇現在在多個候選行為之間進行選擇（而自動化行動選擇則確保薩姆仍在行走）。在行動選擇中，走到草地上或站立不動讓狗和主人通過是兩個最顯著的選項。站立不動在行動選擇的競爭中勝出，薩姆讓這個人及其狗在狹窄的小路上通過。選擇這個行為也中斷了自動化行走行為。一個期望代碼元被生成，除其他外，尋找一條清晰的行走路徑，因為這是薩姆行動預期結果。當狗和主人現在位于薩姆身后時，當前情境模型繼續更新。然后，期望代碼元將空路徑結構帶入全局工作空間以競爭廣播。由于薩姆打算行走并期望擁有一條清晰的路徑，該結構具有高激活值，并可能贏得意識競爭。

由于空路徑進入意識，程序性記憶實例化相關圖式，包括一個高層"行走"行為。該行為及其行為流被發送到行動選擇。行動選擇選擇高度相關的自動化"行走"行為并將其發送至自動化行動選擇子模塊。結果，薩姆繼續行走，由自動化行動選擇子模塊負責選擇行動。現在，他再次可以自由地繼續思考加密貨幣、熱門電視節目和存在主義。

駕駛

薩姆結束了他充滿存在主義思考的晨間散步。上午 8:00，薩姆開車去當地一家餐館上班。路線結合了郊區道路和高速公路駕駛，大約需要 20 分鐘完成。部分交通是高峰時段的交通。

薩姆正在利用自動化行為流，以安全距離跟隨他前面的車輛。這當然也包括安全距離跟隨的運動計劃，該計劃正在接受持續的背側流更新。背側流輸入到運動計劃確保薩姆不會將油門踏板踩得太重或太輕。在高峰時段交通中以適當距離跟隨另一輛車涉及對運動命令的持續調整，以向油門踏板施加適當量的壓力。

然而，由于這是高峰時段，薩姆也需要經常踩剎車，并在適當的壓力下踩剎車。這意味著通過意識介導的行動選擇，踩剎車的行為被選擇并在適當的壓力水平上執行。因此，薩姆擁有一個自動化跟車行為圖式和運動計劃，該計劃經常被踩剎車的意識介導行為所中斷，以保持適當距離。每次剎車被踩下時，一個期望代碼元被生成，并幫助車輛之間產生的距離進入意識。車輛之間新的距離被廣播反過來幫助行動選擇要么重新選擇自動化跟隨行為圖式，或者其他一些自動化駕駛行為。

通過意識介導的行動選擇，薩姆決定激活變道的行為流。行動選擇快速地從變道行為流中選擇每個行為。感覺運動記憶為每個變道行為在運動計劃之間進行選擇，運動計劃執行開始執行物理運動。簡而言之，薩姆變道；檢查后視鏡、側視鏡、回頭查看、打開轉向燈、再次檢查、向左轉動方向盤、將方向盤轉回中立位置、重新檢查車窗和后視鏡。

突然，一個正在發短信并駕駛的人偏離車道進入薩姆的車道，觸發了警報。情況的緊急性意味著車輛的靠近繞過了意識廣播的競爭，并被直接發送到程序性記憶。圖式被實例化，行動選擇選擇一個適當的行為流（剎車并轉向）。鑒于情況的緊急性，剎車并轉向行為流具有非常高的顯著性，并輕松贏得行動選擇中的競爭。感覺記憶選擇適當的運動計劃模板并實例化它們，薩姆猛踩剎車并將車轉向避開魯莽的司機。

由于警報負責規避機動，薩姆尚未意識到剛剛發生了什么。大約 100 毫秒后，在事件在當前情境模型中被重建之后，薩姆才"意識到"剛剛發生了什么。然而，在這 100 毫秒期間，由于警報過程的迅速性，剎車并轉向機動已經發生。通過這種方式，薩姆在魯莽司機面前幸存下來。

在警報機動期間，期望代碼元被創建，在當前情境模型中搜索規避機動的預期結果——與迎面而來的司機保持安全距離。由于這種事態獲得，薩姆現在可以使用意識介導的行動選擇，并選擇對分心的司機 aggressively 鳴喇叭——真是開始輪班的絕佳方式。

快餐廚師

薩姆因駕駛遭遇而略顯煩躁地到達工作崗位。他開始他在餐館擔任快餐廚師的輪班。這家餐館有一個柜臺，快餐廚師在柜臺后面，還有幾張桌子。這家餐館在一天中的最初幾個小時特別繁忙（人們進來吃早午餐和宿醉早餐）。薩姆在那段時間全神貫注于工作，同時處理多個訂單。訂單以快速節奏涌入，許多客人對他們的菜品要求修改（額外奶酪、不要奶酪、旁邊加巧克力豆煎餅、旁邊加辣醬、用沙拉代替薯條等）。除了制作各種菜單項目外，幾位常客帶著他們的特殊訂單到達，并期望在他們坐在柜臺時得到問候。

讓我們從第一個訂單開始——兩份班尼迪克蛋、土豆和一份哈羅米沙拉（訂單一）。看到訂單紙條后，一個遠端意圖在當前情境模型中被創建（完成訂單一）——這個意圖提示關于哈羅米沙拉、土豆和班尼迪克蛋的信息進入 CSM。首先，意圖（完成訂單一）贏得意識競爭，在接下來的幾個周期中，關于廚房當前狀態的結構以及包含班尼迪克蛋、土豆和哈羅米蛋信息的結構，各自贏得意識競爭（鑒于認知周期的迅速性，這一切仍然發生在最初的一兩秒內！）。

此時，關于廚房狀態和要做什么的信息現在存在于 CSM 中，并被廣播到程序性記憶。這些信息現在被用于實例化大量的圖式和圖式流。這些候選行為被發送到行動選擇，行動選擇現在必須選擇"做什么"。在這種情況下，對應于水波蛋自動化行為流的高層行動被選擇并發送到 AAS。AAS 從"水波蛋"自動化行為流中選擇行為并將它們發送到感覺運動記憶模塊。感覺運動記憶實例化廚師高度熟練的水波蛋運動計劃，并將其發送到運動計劃執行。這個過程繼續，行為流中的其他行為被自動化行動選擇子模塊選擇，其中每個行動可以被視為調用下一個行動。因此，薩姆最終利用自動化快速攪拌醋水混合物、打碎雞蛋并將它們撈出來。

當薩姆通過自動化水波蛋時，一位常客坐在柜臺旁（大盧）。這位常客的存在對薩姆來說非常顯著，并輕松贏得意識競爭。程序性記憶在接收到全局廣播（包含"常客大盧"的內容）后實例化幾種問候行為，其中一種被行動選擇選擇。同時，水波蛋自動化行為仍在被執行。換句話說，薩姆現在一只手快速攪拌鍋，另一只手將雞蛋打入鍋中，同時將身體朝向顧客，說道："嘿伙計，最近怎么樣？"

大盧試圖隔著柜臺與薩姆握手問候。但由于薩姆雙手占滿，他需要使用補償性行為。伸出的手進入意識并實例化幾種可能的候選行為——其中一種行為是用肘部完成問候。選擇這個行為意味著實例化一個運動計劃，該計劃也考慮到薩姆仍在通過自動化攪拌鍋并打雞蛋。當薩姆將肘部伸過柜臺以便大盧可以與他的肘部擊掌時，薩姆用于攪拌和打雞蛋的運動計劃可以通過背側流信息和/或后續的意識廣播進行大幅調整。

當雞蛋即將完成時，一個新訂單進來：法式吐司和炒雞蛋，配一份培根（訂單二）。這個事實進入意識并為訂單二創建一個遠端意圖，該意圖被存儲在薩姆的瞬態情景記憶以及當前情境模型中以備后續檢索。一旦薩姆完成訂單一，他就可以關注并處理訂單二。然而，此刻薩姆仍需組裝訂單一。訂單二的意圖贏得意識競爭，該意圖在整個模型中被廣播，包括各種短期和長期記憶模塊（薩姆現在處理的是當前情境模型中存在的兩個遠端意圖）。

然而，薩姆仍在處理訂單一。因此，薩姆現在使用意識介導的行動來仔細組裝訂單一的班尼迪克蛋（他需要抓取并組裝英式松餅、火腿、水波蛋和荷蘭醬）。鑒于廚房里有幾位廚師，薩姆不必從頭制作所有東西（例如，一名工人在醬汁站，另一名在肉類站）。然而，薩姆確實需要知道每個組件的位置以及他同事的位置和活動。這些信息在薩姆的當前情境模型中更新，包括環境中的可供性。例如，如果荷蘭醬鍋的蓋子蓋著，醬汁就無法傾倒。然而，如果蓋子傾斜，薩姆從根深蒂固的機構知識中知道他的同事已完成醬汁工作。在這種情況下，鍋因此提供了"可傾倒性"，薩姆利用該信息執行一個意識介導的行動，將一些醬汁倒在雞蛋上。

當薩姆組裝班尼迪克蛋、倒醬汁并調整裝飾時，他將菜肴的當前狀態與班尼迪克蛋通常應該是什么樣子的長期記憶進行比較——呈現效果是成功的一半。此外，當他向菜肴添加每個組件時，期望代碼元持續保持他的注意力在軌道上。

薩姆將完成的菜肴放在服務臺上供服務員取走，并開始訂單二，此時訂單三、四和五也陸續到達。當薩姆使用自動化行動制作更多雞蛋、翻炒煎土豆或攪拌時，他也在跟蹤每個訂單，行動選擇反復發送新的行為向前推進。在自動化行為與意識介導行為之間持續舞蹈的間歇，薩姆可能需要進行深思。例如，薩姆應該處理訂單五而不是訂單四，因為訂單四的所有原料尚未準備好？一個觀念運動過程開始，包含提議者、支持者和反對者。"不，讓我們按先來先做的順序處理菜肴。那樣最簡單""是的，讓我們把訂單四擱置，以便在等待三文魚完成烹飪時處理我們能處理的訂單。"即使薩姆在積極深思，他仍在執行自動化行動和意識介導的行動。最終，在三文魚烹飪期間跳過訂單四贏得了深思過程，行動選擇選擇與制作訂單五相關的行為。

下午 4 點左右，早午餐高峰終于結束，薩姆可以掛起圍裙回家。真是忙碌的一天！

結論

流暢應對是高技能活動（如體育和表演）中的常見現象，但也存在于我們日常導航世界的生活中。流暢應對通常涉及認知活動朝向某個任務或活動的連貫性和集中性（這通常是高度文化決定的）。

學習智能決策代理（LIDA）代理通過交織幾種形式的行動選擇來參與流暢應對，包括：意識介導的行動選擇、意志行動選擇、警報和自動化。自動化是過度學習的行為流，允許在沒有意識干預的情況下選擇行為；概念上是一個行動調用下一個行動。這些自動化也促進了自動化行動執行的并發性。自動化行為流不僅可以并發執行，而且也可以是層級結構化的。流暢應對通常涉及將注意力和適應性偏向任務，以便代理能夠在各種情境中獲得最佳把握。

LIDA 模型包含跨遠端、近端和快速時間尺度的各種反饋循環，以幫助代理實現適應性。符合最近具身和生成式的認知方法，LIDA 代理始終在回答"我接下來應該做什么？"這個問題。通過交織的行動和感知循環，代理追求其議程，并在此過程中在不同時間尺度上達到更高程度的適應性。

流暢應對文獻以及我們在 LIDA 中對流暢應對探索的一個優勢在于，專家行動和日常生活都利用相同的認知資源，因此我們可以在不使用任何額外"特殊"認知資源的情況下，清晰地描繪從新手到專家的進展。事實上，從流暢應對的文獻以及我們在 LIDA 中對流暢應對的概述中，我們可以體會到專家表現和日常認知中所涉及的復雜性。盡管流暢應對執行起來看似輕松，但它對任何認知系統（無論是人工的還是有機的）而言都是一項巨大的成就。

原文鏈接：https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.