網易首頁 > 網易號 > 正文申請入駐

在線動作反映實時決策過程

2026-03-02 19:10:37　來源: CreateAMind

上海舉報

分享至

Online Movements Reflect Ongoing Deliberation

在線動作反映實時決策過程

https://www.jneurosci.org/content/jneuro/45/31/e1913242025.full.pdf

從穿行于擁擠的走廊到滑下險峻的山坡，人類在運動過程中不斷地進行決策。既往富有洞察力的研究讓我們得以窺見運動起始時刻的決策斟酌過程。然而，在運動開始之后且最終決策形成之前，持續的斟酌過程是否能在運動過程中體現出來，目前尚不清楚。本研究驗證了這樣一個觀點：在決策形成之前，持續的斟酌過程會不斷影響運動過程，從而調控實時的運動。我們通過讓不同性別的受試者觀察移入左側或右側目標的標記物，來操縱決策斟酌過程。結果支持了我們的假設，我們發現在決策形成之前，手部的橫向運動反映了斟酌過程。我們還發現，一種賦予后期證據更高權重的決策緊迫性信號，對于預測決策至關重要，并為解釋既往的運動行為提供了新的視角。我們的范式使得持續的斟酌過程能夠通過運動得以顯現，為理解決策與行動之間的相互作用提供了一個強有力的新窗口。

引言

當面對甜糖果或巧克力的選項時，在我們最終做出決定之前，我們的手可能會在這兩個誘人的選項上來回移動。在這個例子中，我們的實時手部運動似乎提供了決策之前持續斟酌過程的讀出。在過去的二十年里，行為學（Chapman et al., 2010a; Gallivan and Chapman, 2014; Wong and Haith, 2017; Alhussein and Smith, 2021）和神經學（Cisek and Kalaska, 2005; Dekleva et al., 2018）發現都支持斟酌與運動規劃交織在一起的觀點。然而，尚未表明持續的斟酌過程——在決策之前——是在實時運動執行過程中體現出來的。

過去的工作有助于闡明運動規劃與決策之間的相互作用。在“知前即動”（go-before-you-know）范式中，參與者被要求發起朝向多個潛在正確目標的伸手運動（Spivey et al., 2005; Hudson et al., 2007; Chapman et al., 2010a; Gallivan and Chapman, 2014; Wong and Haith, 2017; Alhussein and Smith, 2021）。在運動起始時，參與者將他們的伸手動作發起于潛在正確目標之間或直接朝向它們。這些初始運動反映了斟酌過程的先驗，例如每個潛在目標概率的表征和運動速度約束，這些是在運動起始前的運動規劃期間已知的。然后在伸手期間通過證據的突然且離散的變化（例如，目標顏色、語音輸入等）指示正確目標，參與者通常會立即選擇并迅速重新定向他們的運動朝向其中一個目標。在一個不同的范式中，人類同樣被顯示會通過在初始伸手朝向另一個目標之后，將他們的運動迅速重新定向朝向一個目標（Resulaj et al., 2009），來做出“改變主意”。這些快速的運動重新定向是基于伸手前提供的證據，展示了延遲的處理時間，并被解釋為反映了第二次決策。快速的運動重新定向將反映最終決策，但會掩蓋短暫的斟酌及其對運動的潛在影響。這些研究共同提供了關于斟酌先驗如何影響運動規劃和伸手過程中決策時機的重要見解，但尚未表明持續且正在進行的斟酌過程直接影響實時運動。

感知決策研究操縱不確定且連續的證據，例如點（Britten et al., 1992; Shadlen and Newsome, 2001; Ratcliff and McKoon, 2008; Winkel et al., 2014）或標記物（Cisek et al., 2009; Thura et al., 2012; Thura and Cisek, 2014）隨時間向或進入潛在目標的運動，以影響更延長的斟酌和隨后的決策。大量工作表明，在斟酌期間，人類和動物隨時間積累（整合）證據以做出決策（Ratcliff, 1978; Shadlen and Newsome, 2001; Usher and McClelland, 2001; Roitman and Shadlen, 2002; Mazurek et al., 2003; Bogacz et al., 2006; Lokesh et al., 2022）。另一個競爭理論是，隨時間增加的緊迫性信號與證據相乘以導致決策（Cisek et al., 2009; Thura et al., 2012; Thura and Cisek, 2014; Lokesh et al., 2022; Fievez et al., 2023）。感知決策任務的一個特征是，在斟酌期間沒有運動，做出決策，隨后有一個運動來指示選擇。因此，即使存在延長的斟酌，它也沒有機會通過運動表達出來。

以前的研究共同提供了重要的見解，但不是關于持續且正在進行的斟酌過程如何直接影響實時運動。這項工作的目標是闡明斟酌過程是否在決策之前影響實時運動。為了調查此事，我們開發了一種新穎的范式，允許在決策之前通過運動表達持續的斟酌。在三個實驗中，我們允許運動，同時以 15 個跳入左側或右側目標的標記物（Cisek et al., 2009）的形式提供不確定且連續的證據。在實驗 1 中，我們在姿勢保持期間向參與者提供證據，以測試持續的斟酌是否能在決策之前引發運動起始并隨后影響實時運動。在實驗 2 中，我們在運動起始后向參與者提供證據，此時運動系統已經活躍參與，以確定持續的斟酌是否能在決策之前影響實時運動。在實驗 3 中，我們復現了實驗 2 的結果，同時額外測試了緊迫性對斟酌的作用。對于所有實驗，我們預測橫向手部運動將反映斟酌過程，在運動起始之后且決策之前。使用考慮緊迫性的決策和運動模型，我們能夠復現以前關于具有多個潛在目標的運動規劃的工作（Wong and Haith, 2017）。這些作者解釋他們的結果反映了單一靈活的運動計劃，而不是平行運動計劃的平均。通過考慮緊迫性，我們提供了一個替代視角，該視角與單一靈活的運動計劃或平行運動計劃的平均均兼容。總的來說，我們的發現表明，包括緊迫性在內的持續斟酌，直接影響實時運動。

方法

參與者我們總共在三個實驗中收集了 51 名不同性別的參與者。17 名個體（24.8 ± 2.37 歲）參與了實驗 1，17 名個體（21.4 ± 1.76 歲）參與了實驗 2，17 名個體（23.2 ± 2.93 歲）參與了實驗 3。參與者報告其無肌肉骨骼或神經肌肉障礙。所有參與者均提供知情同意書以參與實驗，實驗程序獲得了特拉華大學機構審查委員會的批準。參與者獲得 10 美元補償。

設備在所有三個實驗中，參與者用其優勢手抓握機器人操作裝置的把手（圖 1A；KINARM, BKIN Technologies），以在水平面上執行伸手運動。參與者用非優勢手握持一個手部觸發器。半鍍銀鏡將圖像（起始位置、左右目標、標記物）從 LCD 屏幕投影到運動的水平面上。為評估肌肉活動，我們使用雙極表面電極（單差分電極，Trigno System, Delsys）從非優勢手的拇短屈肌記錄肌電圖（EMG）信號。為獲得估計的決策時間，電壓信號指示拇指按下手部觸發器的時刻。運動學、EMG 和手部觸發器數據以 1,000 Hz 采樣率記錄，并離線存儲用于數據分析。

流程一般任務流程。對于每個試次，參與者視覺上呈現一個白色起始位置（直徑 2 厘米）和兩個目標（直徑 5 厘米）。左右目標分別位于起始位置左側和右側 20 厘米處（圖 1A）。黃色光標（直徑 1 厘米）提供其手部位置的實時反饋。參與者被指示將其光標移入起始位置。在起始位置保持光標 400 毫秒后，參與者聽到一聲提示音，隨后 15 個黃色標記物出現在左右目標之間。在試次起始時（0 毫秒），標記物以 160 毫秒的時間間隔從中心跳入左側或右側目標（Cisek et al., 2009；圖 1C）。參與者必須在 2,400 毫秒之前做出決策，這對應于最后一個標記物移入其中一個目標。一旦他們確信哪個目標最終會擁有最多的標記物，他們被指示同時（i）用非優勢手按下觸發器，以及（ii）朝向并擊中所選目標。一旦參與者按下手部觸發器，剩余標記物的運動對參與者不可見，以防止他們根據后期證據改變決策。手部觸發器對于區分由斟酌或決策引起的運動至關重要。如果參與者選擇了正確的目標，他們會聽到悅耳的叮聲，且所選目標變為藍色。如果參與者選擇了錯誤的目標，他們會聽到刺耳的蜂鳴聲，且所選目標變為紅色。當參與者未在試次開始后 2,400 毫秒內按下手部觸發器和/或進入目標時，兩個目標都會變為紅色。此外，參與者未知的是，該試次將在實驗后期重復進行。

實驗 1 任務流程。實驗 1 的目標是確定當證據在姿勢保持期間啟動時，持續的斟酌是否能在最終決策之前引發并隨后影響運動。目標直接位于起始位置的左側和右側（圖 1A）。參與者在決策前未收到關于其運動的任何指示，并且在開始試次后可以自由移動。參與者在起始位置等待 400 毫秒。在此等待期后，試次起始（0 毫秒）以提示音指示。標記物以 160 毫秒的間隔逐一移入左側或右側目標。總計，參與者在主實驗中經歷了 216 個試次。我們使用了偏向性、偽隨機、晚期和空標記物模式（圖 S1）。

我們主要關注偏向性標記物模式，因為我們嚴格控制了標記物的運動，從而控制了所經歷的不確定且連續的證據。在偏向性標記物模式中，前三個標記物單獨移入左側或右側目標（即左偏或右偏），接下來的三個標記物單獨移入相反的目標，其余標記物以 80% 的概率移入左側或右側目標（即左目標或右目標；圖 2A–D）。在這些偏向性標記物模式中，我們包含了左偏或右偏與左目標或右目標的四種組合。每種偏向性標記物模式呈現 12 次，總共產生 48 個偏向性標記物模式。偏向性標記物模式使我們能夠探究受控的證據模式如何影響斟酌，進而影響運動。

我們還有偽隨機標記物模式，其中每個標記物移入左目標的概率相同。我們設置了 20%、35%、50%、65% 或 80% 概率的偽隨機標記物模式。每種偽隨機標記物模式呈現 12 次，但 50% 條件呈現 24 次，總共產生 72 個偽隨機標記物模式。此外，我們還有空標記物模式（24 個試次）、晚期標記物模式（48 個試次）和晚期空標記物模式（24 個試次）。類似于 Cisek 等人（2009）使用的模糊標記物模式，空偏向性標記物模式在試次開始部分的凈標記物運動接近于零。

實驗 2 任務流程。實驗 2 的目標是確定在運動起始后、當運動系統已經活躍參與時，持續的斟酌是否能在最終決策之前反映在運動中。在實驗 2 中，目標位于起始位置前方 30 厘米、左側和右側各 20 厘米處（圖 1B）。參與者在起始位置等待 400 毫秒，之后聽到提示音。提示音指示參與者可以離開起始位置。一旦參與者離開起始位置，試次起始（0 毫秒）發生。標記物直到試次起始才開始移動。類似于其他人（Wong and Haith, 2017; Alhussein and Smith, 2021），參與者被指示在離開起始位置后不要停止向前移動。實驗 2 使用了與實驗 1 相同的標記物模式。

實驗 3 任務流程。實驗 3 的目標是復現實驗 2 中發現的結果，同時闡明證據積累或緊迫性對斟酌及隨之而來的運動的作用。實驗設置與實驗 2 相同，除了特定的標記物模式（圖 S1）。參與者總共經歷了 336 個試次。試次包括慢速率偏向性（圖 2E–H）、快速率偏向性（圖 2I–L）、偽隨機、晚期和空標記物模式。

在本實驗中，我們主要關注慢速率和快速率偏向性標記物模式，因為我們嚴格控制了它們的運動并經歷了不確定且連續的證據。此外，根據人類如何積累證據和/或在斟酌期間依賴緊迫性，慢速率和快速率標記物模式會導致獨特的決策時間。在慢速率偏向性標記物模式中，前四個標記物單獨移入左側或右側目標（即左偏或右偏），接下來的四個標記物單獨移入相反的目標，其余標記物以 80% 的概率移入左側或右側目標（即左目標或右目標；圖 2E–H）。在快速率偏向性標記物模式中，前四個標記物同時移入左側或右側目標（即左偏或右偏），接下來的四個標記物單獨移入相反的目標，其余標記物以 80% 的概率移入左側或右側目標（即左目標或右目標；圖 2I–L）。對于這些偏向性標記物模式，我們包含了快速率或慢速率、左偏或右偏、以及左目標或右目標的八種組合。每種偏向性標記物模式呈現 12 次，總共產生 96 個偏向性標記物模式。

偽隨機標記物模式與實驗 1 和 2 相同（圖 S1）。類似于實驗 1 和 2，我們也有晚期和空標記物模式。

反應時任務。在進行上述任何實驗之前，參與者執行反應時任務以確定做出和指示決策所涉及的感官和運動延遲。在反應時任務中，目標位置與相應的主實驗相同（如上所述實驗任務流程中描述）。反應時任務使用與相應實驗相同的試次起始。在試次起始時（0 毫秒），所有 15 個標記物跳入左側或右側目標。參與者被指示盡可能快地選擇所有標記物跳入的目標。同樣，參與者通過按下手部觸發器并將光標移入其選擇的目標來指示他們的決策。參與者在反應時范式中執行至少 20 個熟悉化試次，以熟悉實驗設置。在熟悉化試次之后，參與者執行 24 個反應時試次。有 12 個左側反應時試次和 12 個右側反應時試次，以隨機交錯順序呈現。

數據分析

估計決策時間。對于每個試次，當手部觸發器的電壓超過 3 V 時確定觸發器時間。我們在每個試次上找到估計的決策時間，以確定決策何時獨立于伸手運動而做出。我們使用參與者的反應時試次來估計每個參與者的神經 + 機械延遲。對于每個試次的每塊肌肉，我們減去所有反應時試次的全局平均肌肉活動。拇短屈肌肌肉活動經過全波整流，然后進行雙程、六階、低通（20 Hz）和巴特沃斯濾波。我們使用雙閾值法確定 EMG 起始時間，給定臨界幅度閾值和 10 毫秒時間閾值（Walter, 1984）。我們將臨界幅度閾值定義為所有試次中試次起始前 400 毫秒內拇短屈肌肌肉活動的平均值加三個標準差。當 EMG 活動上升并在 10 毫秒內保持在臨界幅度閾值以上時，確定 EMG 起始時間。使用雙閾值法計算起始時間，并通過人工檢查每個反應時試次進行驗證（圖 S2A, B）。我們發現了每個受試者反應時試次中觸發器時間和 EMG 起始時間之間的平均差異（圖 S2C）。每個參與者的神經 + 機械延遲定義為觸發器時間和 EMG 起始時間之間的平均差異加上 20 毫秒的神經傳導延遲（Jo and Perez, 2019）。我們計算主實驗中每個試次的估計決策時間為觸發器時間減去神經 + 機械延遲（圖 S2D）。

運動分析

手部位置數據經過數字雙程、二階、低通（20 Hz 截止頻率）和巴特沃斯濾波。我們的主要焦點是確定斟酌過程是否在最終決策之前影響運動。我們關注在最終決策和隨后動作影響之前的運動。為此，我們觀察了估計決策時間時的橫向手部位置（圖 2）。

統計分析

所有統計分析均在 Python 3.8.5 中執行。我們使用重復測量方差分析（rmANOVA）作為每個因變量的總體檢驗。我們主要關注偏向性標記物模式的估計決策時間、估計決策時間時的橫向手部位置以及選擇率指標。在實驗 1 和 2 中，我們使用 2（偏向：左或右）× 2（目標：左或右）rmANOVA 來分析決策時間、估計決策時間時的橫向手部位置和選擇率。在實驗 3 中，我們使用 2（速率：快或慢）× 2（偏向：左或右）× 2（目標：左或右）rmANOVA 來分析決策時間和選擇率。對于估計決策時間時的橫向手部位置，我們分別對快速偏向模式和慢速偏向模式進行了獨立的 2（偏向：左或右）× 2（目標：左或右）rmANOVA 分析。此處我們使用獨立的 rmANOVA，因為我們發現慢速率和快速率偏向性標記物模式之間的決策時間存在顯著差異。對于實驗 1、2 和 3，我們也關注偽隨機標記物模式，并使用單因素 rmANOVA（左目標概率：20%、35%、50%、65% 和 80%）來分析估計決策時間、估計決策時間時的橫向手部位置和選擇率。對于所有實驗，我們進行了非參數 Bootstrap 假設檢驗以進行均值比較（n = 1,000,000; Gribble and Scott, 2002; Cashaback et al., 2015, 2017a,b, 2019; Coltman et al., 2019; Calalo et al., 2023; Roth et al., 2023）。使用 Holm–Bonferroni 校正來控制 I 類錯誤。我們為所有均值比較計算了通用語言效應量（McGraw and Wong, 1992; Calalo et al., 2023）。統計顯著性設定為 p < 0.05。

結果

個體運動行為我們主要關注估計決策時間時的橫向手部位置。估計決策時間時的橫向手部位置提供了對持續斟酌過程影響運動的一種度量。換句話說，估計決策時間時的橫向手部位置排除了由最終決策及隨后動作導致的運動。估計決策時間是通過從每個試次的觸發器時間中減去神經加機械延遲來計算的（圖 3A, B）。

在實驗 1、2 和 3 中，參與者平均（±1 SD）的神經 + 機械延遲分別為 184.2 (±17.6) ms、186.4 (±23.5) ms 和 196.7 (±18.0) ms。我們發現，在實驗 1、2 和 3 的偏向性標記物模式中，估計決策時間與峰值切向加速度時間 strongly correlated（強相關）（圖 S2E–G）。我們檢查了估計決策時間時的橫向手部位置，以便在不同條件之間進行比較（圖 3C）。

圖 4 展示了各實驗中代表性個體的結果。在實驗 1 中，該參與者未在其估計決策時間之前發起橫向運動（圖 4A–D）。在實驗 2 中，該參與者在估計決策時間之前顯示出與標記物偏向方向一致的橫向運動（圖 4E–H），這反映了在其最終決策之前發生的運動。此外，他們的橫向手部位置與標記物偏向方向一致（圖 4H）。在實驗 3 中，代表性參與者在慢速率偏向（圖 4I–L）和快速率偏向（圖 4M–P）標記物模式中，均顯示出與偏向方向一致的橫向運動。也就是說，實驗 2 和 3 中展示的參與者在最終決策之前隨著證據進行運動，這表明他們的運動受到了持續斟酌的影響。

群體運動行為我們預測橫向手部運動會受到決策前持續斟酌過程的影響。例如，一個正在考慮左側目標的參與者會在最終決策之前向左側目標移動。圖 5 顯示了三個實驗的平均群體運動行為。我們展示了實驗 1、2 和 3 隨時間變化的平均橫向手部軌跡（圖 5A, D, G, J）。然而，檢查估計決策時間時的橫向手部位置非常重要（圖 5B, E, H, K），這反映了最終決策之前由斟酌引起的運動。

當運動系統活躍參與時，手部運動受到斟酌的影響在實驗 1 中，估計決策時間時的橫向手部位置未受到標記物模式的影響（圖 5B）。我們沒有發現偏向的主效應顯著 [F(1, 16) = 3.681, p = 0.073]、目標的主效應顯著 [F(1, 16) = 1.016, p = 0.328]，或偏向與目標之間的交互作用顯著 [F(1, 16) = 0.067, p = 0.799] 對估計決策時間時的橫向手部位置的影響（圖 5C）。實驗 1 的結果不支持斟酌過程持續與運動控制過程相互作用以影響實時運動的觀點，特別是當證據最初在姿勢保持期間呈現時。在實驗 2 中，我們檢查了當運動系統活躍參與時持續斟酌過程對運動控制系統的影響。在此，參與者在估計決策時間時顯示出與標記物偏向方向一致的橫向手部位置（圖 5E）。具體而言，我們發現偏向對估計決策時間時的橫向手部位置有顯著的主效應 [F(1, 16) = 11.533, p = 0.004]。我們沒有發現偏向與目標之間的交互作用 [F(1, 16) = 0.300, p = 0.591]，也沒有發現目標的主效應 [F(1, 16) = 0.255, p = 0.620]。當跨目標合并時，正如預期的那樣，我們發現左偏和右偏標記物模式在估計決策時間時的橫向手部位置存在顯著差異（圖 5F; p < 0.001, = 82.35）。此外，當我們非常保守地回顧更早的時間點時（圖 S3），我們的發現和解釋是一致的，偽隨機標記物模式也是如此（例如，20%、35%、50%、75% 和 80% 左目標概率；圖 S4）。實驗 2 的發現支持以下假設：當運動系統活躍參與時，持續的斟酌過程會在決策之前影響實時運動。

在實驗 3 中，我們復現了實驗 2 的運動行為發現。由于慢速率和快速率標記物模式具有不同的決策時間（見下文群體決策行為部分），我們分別分析了這兩種模式下估計決策時間時的橫向手部位置。對于慢速率標記物模式，我們發現偏向對估計決策時間時的橫向手部位置有顯著的主效應 [F(1, 16) = 14.663, p = 0.001]，但沒有目標的主效應 [F(1, 16) = 0.0875, p = 0.771] 或偏向與目標的交互作用 [F(1, 16) = 0.040, p = 0.844]。對于快速率標記物模式，我們發現偏向有顯著的主效應 [F(1, 16) = 9.114, p = 0.008] 和目標有顯著的主效應 [F(1, 16) = 4.834, p = 0.043] 對估計決策時間時的橫向手部位置，但沒有偏向與目標的交互作用 [F(1, 16) = 1.297, p = 0.272]。我們發現慢速率偏向標記物模式（p < 0.001, = 79.41；圖 5I）和快速率偏向標記物模式（p < 0.001, ^ = 82.35；圖 5L）在左偏和右偏條件之間，估計決策時間時的橫向手部位置存在顯著差異。同樣，橫向手部位置的差異支持以下假設：當運動系統活躍參與時，持續的斟酌過程會在決策之前影響運動。

我們還分析了估計決策時的切向手部速度。對于實驗 1 和 2 中的偏向標記物模式，我們沒有發現偏向和目標對估計決策時間時的切向手部速度有任何顯著的主效應或交互效應（p > 0.164）。在實驗 3 中，我們發現在慢速率 [F(1, 16) = 4.667, p = 0.046] 和快速率 [F(1, 16) = 6.762, p = 0.019] 標記物模式中目標有顯著的主效應。我們沒有發現在慢速率和快速率標記物模式中包含偏向的顯著主效應或交互效應（p > 0.120）。當在慢速率條件下跨偏向合并時，我們沒有發現左目標和右目標在估計決策時間時的切向手部速度存在顯著差異（p = 0.093, = 67.65）。當在快速率標記物模式中跨偏向合并時，我們發現左目標和右目標在估計決策時間時的切向手部速度存在顯著差異（p = 0.006, = 67.65）。因此，在檢查切向速度時，我們沒有觀察到跨實驗的任何一致結果。

綜上所述，我們從實驗 1、2 和 3 得到的結果支持以下觀點：當運動系統活躍參與時，持續的斟酌過程會影響手部運動——在決策之前——但在姿勢保持期間則不會。

群體決策行為人類在做出決策時對早期證據的依賴較少我們也對強調斟酌過程的機制感興趣。圖 6 顯示了每種偏向性標記物模式和實驗的估計決策時間。在實驗 1 中，我們發現偏向對估計決策時間有顯著的主效應 [F(1, 16) = 7.222, p = 0.016]，但在后續均值比較中沒有發現顯著差異（p = 0.053, u ^ u^ = 61.76；圖 6A）。我們沒有發現目標的主效應顯著 [F(1, 16) = 0.606, p = 0.447] 或偏向與目標之間的交互作用顯著 [F(1, 16) = 0.930, p = 0.349] 對估計決策時間的影響。在實驗 2 中，我們沒有發現偏向的顯著主效應 [F(1, 16) = 0.989, p = 0.335]、目標的顯著主效應 [F(1, 16) < 0.001, p = 0.993]，或偏向與目標之間的交互作用顯著 [F(1, 16) = 0.154, p = 0.700] 對估計決策時間的影響（圖 6B）。有趣的是，與實驗 1 相比，參與者在實驗 2 期間做出了更快的決策（p = 0.003, u ^ u^ = 67.76）。我們結果的一種可能性是，當運動系統活躍參與時決策會更快，這支持了決策和運動過程之間的雙向相互作用。與這一概念相輔相成的是，在斟酌期間向其中一個目標移動得更近可能會導致到達該目標的能量成本降低，這反過來可能會促進更快的決策時間。

在實驗 3 中，我們發現速率對估計決策時間有顯著的主效應 [F(1, 16) = 27.18, p < 0.01]（圖 6C）。與直覺相反的是，我們發現與快速率標記物模式相比，參與者在慢速率條件下做出了更早的決策（p < 0.001, u ^ u^ = 89.71；圖 6C, 7A）。我們沒有發現目標的主效應 [F(1, 16) = 0.689, p = 0.419]、偏向的主效應 [F(1, 16) = 0.588, p = 0.454]，或任何顯著的交互作用（p > 0.105）。每種標記物模式的選擇率顯示在圖 S5 和 S6 中。

上述我們沒有發現偏向和目標對估計決策時間有顯著的交互作用。這一模式與 Cisek（2009）提出的緊迫性參與斟酌過程的既往工作一致。提醒一下，緊迫性代表在做出決策時與后期證據相比，對早期證據的依賴較少。有趣的是且與直覺相反的是，我們發現與快速率標記物模式相比，參與者在慢速率標記物模式下做出了更早的決策。這一發現強烈符合以下觀點：與在較早時間呈現的相同信息（即在快速率標記物模式期間較早時間呈現的第二、第三和第四個標記物）相比，決策過程更加重視在較晚時間呈現的信息（即在慢速率標記物模式中的第二、第三和第四個標記物）。然而，如下文決策模型中所示，緊迫性和證據整合的同時存在最能解釋所報告的估計決策時間。

計算建模

我們的核心重點是研究決策與運動控制過程之間的相互作用。為此，我們使用了一個結合決策模型和最優反饋控制模型的計算框架。

決策模型

在結合決策和運動模型之前，我們首先試圖確定最能解釋估計決策時間和選擇率比例的決策模型。下文我們將定義用作決策模型輸入的當前證據或新證據。接下來，我們描述所使用的四類不同的決策模型，同時重點介紹能很好地捕捉我們數據的 Trueblood 模型（Trueblood et al., 2021）。證據是左目標當前正確概率 (p) 的函數，該概率基于左 (L)、右 (R) 和中心 (C) 位置內的標記物數量 (Ni)（公式 1）。

正如 Trueblood 及其同事所示，Trueblood 模型可用于描述一個由緊迫性 (k) 和泄漏 (L) 定義的雙參數空間，該空間包含漂移擴散模型 (k = 0, L = 0) 和帶泄漏的漂移擴散模型 (k = 0, L > 0)。Trueblood 模型還可簡化為帶低通濾波器的標準緊迫性門控模型 (k → ∞, L > 0)，但請注意，當 k 足夠高時（即 k >> 0）也能發現緊迫性。此處我們展示了漂移擴散模型、帶泄漏的漂移擴散模型以及帶低通濾波器的緊迫性門控模型，以突出該領域通常使用的模型。此處我們重點關注實驗 3（圖 7），因為與快速率標記物模式相比，慢速率標記物模式的估計決策時間顯著更早。

我們發現，帶有新證據的 Trueblood 模型和帶有新證據及低通濾波器的緊迫性門控模型是唯一兩個能夠捕捉到慢速率標記物模式相對于快速率模式更早決策時間的模型（圖 7A）。其他最佳擬合模型在兩組不同速率的標記物模式之間發現的決策時間相似。

為了深入了解模型的機制，我們在圖 7C, D 中展示了代表性模型行為。在圖 7B 中，我們展示了快速率右偏左目標和慢速率右偏左目標標記物模式的示例。這兩種標記物模式相似，只是初始偏向的標記物運動速率不同。對于帶有新證據的 Trueblood 模型（圖 7C）和帶有新證據低通濾波器的緊迫性門控模型（圖 7D），我們看到了相似的決策變量趨勢。Trueblood 模型和帶有低通濾波器的緊迫性門控模型都利用緊迫性并整合證據，從而導致相似的行為。對于快速率標記物模式，存在一些初始的證據整合，無論是通過證據積累還是低通濾波器。然而，當最初四個標記物移動時，緊迫性在早期較低，因此決策變量不會立即跨越決策閾值。相反，對于慢速率標記物模式，每個單獨的標記物移動都會導致一定程度的證據整合。關鍵在于，較晚時間的單獨標記物移動受到緊迫性的更重加權，這隨時間累積導致決策變量更早地跨越決策閾值。請注意，對于漂移擴散模型，通過設置高噪聲參數實現了捕捉該趨勢的最佳解決方案，因為它們無法用慢速率標記物模式產生觀察到的更快決策時間。我們選擇使用 Trueblood 模型作為下文直接描述的決策與運動模型的輸入，因為它明確定義了緊迫性和證據積累兩者。

決策與運動模型我們發現持續的斟酌過程影響了實時運動。為了捕捉這種運動行為，我們開發了一個最優反饋控制模型（Todorov and Jordan, 2002; Scott, 2004; Liu and Todorov, 2007; Nashed et al., 2012; Kasuga et al., 2022; Lokesh et al., 2023），該模型使用不斷演變的決策變量來影響正在進行的運動。決策變量是使用帶有新證據的 Trueblood 模型模擬的。

最優反饋控制已經能夠捕捉大范圍的人類伸手運動，通過考慮生物學上合理的目標（如準確性和能量）以涌現的方式選擇反饋增益以處理各種任務需求，使我們在本文中能夠解決該領域中的競爭理論，并且在過去幾十年中一直是感覺運動神經科學中最具影響力的運動理論之一。雖然我們將最優反饋控制視為研究和預測人類行為的有用框架，但我們并不建議大腦執行這些精確的計算。

簡而言之，我們使用了一個最優反饋控制器，該控制器將手導向一個不斷演變且加權平均的目標，該目標是斟酌過程的函數。該模型能夠捕捉個體運動行為（圖 8A–C）和群體運動行為（比較圖 8D–F 與圖 8G–I）。此處我們提供該模型的簡要描述，但請讀者參考文本 S1 以獲取更多細節。

此處，我們將運動建模為一個線性動態系統（公式 5），其中 x 代表系統的狀態（例如，位置、速度和目標位置），u 代表系統的控制輸入，A、B 代表系統的動力學。

利用運動模型重新解釋既往工作

使用我們的決策與運動模型，我們還能夠對 Wong 和 Haith（2017）的“知前即動”（go-before-you-know）任務提出另一種解釋。研究人員將并非直接朝向兩個目標之一的伸手運動定義為中間運動。他們發現，與快速伸手相比，慢速伸手運動導致了更多的中間運動（圖 9）。作者解釋這些發現表明存在單一靈活的計劃以最大化任務表現，因為靜態運動計劃的平均無論運動速度如何都會始終作為中間運動發起（Chapman et al., 2010a）。如上所述，我們使用單一靈活的運動計劃來建模斟酌對運動的影響。然而，我們發現單一靈活的運動計劃在數學上等同于平均兩個并行的控制策略（文本 S1）。此處，我們在考慮緊迫性時為他們的結果提供了另一種解釋。也就是說，緊迫性可以解釋為什么參與者在快速伸手條件下做出的中間運動較少。因此，緊迫性可用于解釋行為，并且與單一靈活運動計劃或并行控制策略平均的提議理論兼容。

我們復現了他們的發現（圖 9C, D），使用了一個與允許伸手時間 (T) 成反比的緊迫性信號 (k)，以及獎勵 (r) 和直接運動相對于中間運動的相對能量成本 (c)（公式 8）。該公式遵循 Carland 等人（2019）的建議，即緊迫性是獎勵、能量和時間的函數。

其中 mi 為標量，z 為直接運動的距離，θ 為兩個目標之間的夾角。為了捕捉在正確選項揭示之前的目標選擇，我們允許斟酌過程在運動起始之前開始，這與 Wong 和 Haith（2017）中看到的實驗范式一致（詳見文本 S1）。特別是，在比較慢速和快速運動速度時，我們的決策與運動模型表明，中間運動的比例源于做出決策的緊迫性。例如，在快速運動條件下緊迫性更高，因為到達目標的時間更少。因此，在這些快速運動期間，即使沒有證據，目標也會被更快速地選擇，因為斟酌噪聲被乘以高緊迫性信號并跨越了決策閾值（即猜測）。相反，在慢速運動條件下，較低的緊迫性不會將噪聲推過決策閾值，參與者可以等待正確目標的證據。

總的來說，我們的實證和計算結果表明，涉及緊迫性的斟酌直接影響實時運動。

我們表明，當運動系統活躍參與時，持續的斟酌過程反映在運動中——即在決策之前。我們還發現，緊迫性對于解釋第三個實驗中的決策時間以及預測文獻中的運動行為是必要的。

在實驗 2、實驗 3 以及圖 S7 中的對照實驗中，我們得以闡明不確定且連續證據的持續斟酌對運動的影響。既往文獻采用了“知前即動”（go-before-you-know）范式，其中參與者被呈現多個潛在目標，并在不完全知曉正確目標的情況下發起運動（Spivey et al., 2005; Chapman et al., 2010a,b; Wood et al., 2011; Gallivan and Chapman, 2014; Wong and Haith, 2017; Alhussein and Smith, 2021）。在這些研究中，正確目標是在伸手過程中途通過證據的突然且離散的變化（例如，目標顏色或位置、語音輸入等）來指示的，這導致參與者做出快速的運動重新定向。這些快速的運動重新定向反映了對證據突然且離散變化的快速決策。在運動發起前呈現的不確定且連續證據（即隨機點運動任務）之后，也觀察到類似的快速運動重新定向（Resulaj et al., 2009; Moher and Song, 2014; Visser et al., 2023）。在一小部分試次中，參與者表現出“改變主意”，即他們快速重新定向朝向另一個目標。有人提出，這些“改變主意”反映了基于延遲感官信息的第二次決策。由于上述工作中的突然決策和快速運動重新定向，很難區分運動是由斟酌引起的，還是僅由基于第二次決策的行動引起的。

人們對伸手中途決策的興趣也有所增加，例如在使用 Kurtzer 等人（2020）的目標分裂范式時。在此任務中，參與者將手移向一個目標，而在運動過程中，這偶爾會變為兩個目標選項。參與者表現出對最接近原始目標的選項的偏好。其他人已表明，伸手中途決策對其他因素敏感，例如相對目標頻率（Ulbrich and Gail, 2023）、獎勵大小（Marti-Marca et al., 2020）和生物力學（Michalski et al., 2020; Cos et al., 2021; Canaveral et al., 2024）。在這些伸手中途決策任務中，參與者通過快速的運動重新定向來指示他們的選擇。然而同樣地，很難區分運動是由斟酌引起的，還是由最終決策引起的。

與上述工作及其他研究（Song et al., 2008; Dotan et al., 2018）不同，我們設計的一個關鍵方面是使用手部觸發器來估計決策時間，這使我們能夠區分運動是由斟酌引起的，還是由最終決策后的動作選擇引起的。未來的工作可以在伸手或步態期間采用此范式，以研究能量學、獎勵（例如，匆忙決策 Derosiere et al., 2022）以及其他可能影響決策的因素的影響，從而通過運動深入了解持續的斟酌過程。

在實驗 1 中，我們發現當最初處于姿勢保持狀態時，持續的斟酌并未在決策前引發運動，至少未達到顯著水平。相反，在實驗 2 和 3 中，我們發現當運動系統已經活躍參與時，斟酌過程會通過運動表達出來。能夠在運動中表達斟酌過程而不能在姿勢保持中表達，這與既往結果一致，既往結果顯示運動和姿勢保持的運動回路存在不同的配置和參與程度（Kurtzer et al., 2005; Cluff and Scott, 2016; Shadmehr, 2017）。一種可能性是，斟酌過程可能未能對姿勢保持回路產生足夠的影響以引發運動起始。雖然我們的范式允許在運動執行期間持續表達斟酌過程，但既往工作表明，有可能從姿勢保持狀態引發斟酌過程的瞬時表達。Selen 及其同事能夠在運動起始時刻獲得斟酌過程的瞬時表達（Selen et al., 2012; Visser et al., 2023）。具體而言，他們在姿勢保持狀態下擾動上肢，并測量了由此產生的長潛伏期牽張反射。他們發現，長潛伏期牽張反射反映了姿勢保持狀態下擾動時刻的斟酌過程。一個潛在的途徑是使用強制反應時任務（Haith et al., 2015），其中參與者必須在斟酌的同時從姿勢保持狀態發起伸手，從而允許讀出斟酌過程對運動活力（即通過手部速度）的瞬時影響。

我們還發現，與實驗 1 中處于姿勢保持狀態相比，參與者在實驗 2 中已經運動時做出了更快的決策。這一發現可能反映了“具身決策”（embodied decisions），即運動系統的當前和未來狀態可以影響決策（Cos et al., 2011, 2021; Nashed et al., 2014; Lepora and Pezzulo, 2015; Marcos et al., 2015; Morel et al., 2017; Reynaud et al., 2020; Grie?bach et al., 2021; Korbisch et al., 2022; Carsten et al., 2023; Daniels and Burn, 2023; Canaveral et al.,）。

斟酌過程以測試其對運動的影響。然而，上述幾個模型將能夠捕捉文獻中報道的具身決策期間認知和運動過程之間的一些雙向關系（Cos et al., 2011; Morel et al., 2017; Reynaud et al., 2020; Grie?bach et al., 2021; Korbisch et al., 2022; Canaveral et al., 2024）。一個特定的具身模型是由 Lepora 和 Pezzulo 提出的，該模型將漂移擴散模型的函數作為一個點的移動，該模型考慮了感官證據和到潛在目標的當前距離。在該模型中，控制器以恒定速度將點移向目標，我們在研究中沒有發現這一點（Lepora and Pezzulo, 2015）。展望未來，重要的是要有一個具身決策的計算模型，該模型能捕捉運動行為（例如，鐘形速度曲線和活力）和決策行為（例如，偏態反應時、速度 - 準確性權衡、希克斯定律和緊迫性）的幾個重要特征。

既往文獻已經考察了決策和運動系統如何解釋和處理多個潛在選項（Cisek, 2007; Wong and Haith, 2017; Dekleva et al., 2018; Alhussein and Smith, 2021）。在“知前即動”（go-before-you-know）任務中，兩個目標之間的中間運動被認為是平行平均運動計劃的結果（Chapman et al., 2010a; Gallivan and Chapman, 2014; Christopoulos and Schrater, 2015），或是單一靈活運動計劃以優化任務表現的結果（Nashed et al., 2017; Wong and Haith, 2017; Alhussein and Smith, 2021）。Wong 和 Haith（2017）將與快速手部速度相比，慢速手部速度下更多的中間運動解釋為反映了單一靈活的運動計劃（Wong and Haith, 2017）。此處我們通過考慮緊迫性提供了一種替代視角。當人們也考慮緊迫性時，無論是單一靈活運動計劃還是平行平均運動計劃，都有可能解釋慢速或快速手部速度之間中間運動的不同比例。

重要的是要考慮，單一靈活運動計劃或平行平均運動計劃是兩個因素的組合：(i) 單一與平行平均，以及 (ii) 靜態與靈活。顯然，單一靜態運動計劃不是處理多個潛在目標的可行選項。Alhussein 和 Smith（2021）排除了靜態運動計劃的平行平均，因為他們的預測基于對每個目標的初始伸手角度。然而，他們的發現并未排除靈活運動計劃平行平均的可能性，其中每個運動計劃（更具體地說，控制策略）可能包含安全裕度。如上所示，通過考慮緊迫性，我們能夠復現 Wong 和 Haith（2017）的結果（Wong and Haith, 2017）。擁有一個反映基于證據的兩個目標加權平均的單一靈活運動計劃，與擁有基于證據加權的靈活平行計劃（控制策略）在數學上是等價的（文本 S1）。目前我們尚不清楚如何通過運動執行在行為上區分單一靈活運動計劃或靈活運動計劃的平行平均，這將是一個富有成果且重要的發現。

另一個潛在的方法是考慮神經空間。關于平行運動計劃或單一靈活運動計劃，存在相互沖突的神經支持證據（Cisek and Kalaska, 2005; Dekleva et al., 2018）。未來的工作若涉及神經記錄，以確定多個目標表征和斟酌過程最終在何處、何時以及如何匯聚以產生單一執行運動，將是有益的。

人類經常必須在運動的同時做出決策。我們發現，當運動系統活躍參與時，斟酌反映在正在進行的運動中——在決策之前。我們發現，一種更重地加權后期證據的緊迫性信號，對于預測決策時間和解釋既往伸手行為至關重要。我們的結果支持以下假設：決策過程在決策之前影響運動。理解決策和運動過程的整合可能使我們能夠更好地理解神經系統疾病，其中認知和運動過程及缺陷可能交織在一起。

原文鏈接：https://www.jneurosci.org/content/jneuro/45/31/e1913242025.full.pdf

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.