推理通常被視為一種依賴“慢思考”的高級認知功能。然而,即使是基礎(chǔ)感知覺,也可能涉及無需“慢思考”參與的自動推理過程——過往經(jīng)驗以近乎無意識的方式影響當(dāng)下知覺。自十九世紀(jì)德國生理學(xué)家赫爾姆霍茲把知覺看作無意識推理后,越來越多證據(jù)表明基于過往經(jīng)驗的推理是大腦的基本工作原理。一個最為突出的例子是“序列依賴效應(yīng)”(serial dependence effect),即連續(xù)任務(wù)中,過往的試次會自動影響當(dāng)前試次的知覺和決策,產(chǎn)生系統(tǒng)性偏差。該效應(yīng)廣泛存在于各種認知任務(wù)中,具有高度普適性,反應(yīng)了大腦利用過去信息進行多目標(biāo)優(yōu)化的適應(yīng)性自動推理。

盡管序列依賴效應(yīng)在行為層面已被廣泛報道,但其動態(tài)神經(jīng)機制并不清楚。羅歡課題組的以往研究(Zhang & Luo, PLoS Biology, 2023)揭示了該效應(yīng)的 “昨日重現(xiàn)”記憶重激活機制,即過去試次的多特征信息會在當(dāng)前試次中被相應(yīng)的特征事件從靜默態(tài)中自動激活,進而影響當(dāng)前信息加工。然而,人腦是一個層級化的復(fù)雜系統(tǒng),涵蓋從初級感覺加工到高級決策的多個階段,而記憶通常以分布式方式存儲。那么,過去的信息如何在不同腦區(qū)被特異性激活?這些信息又如何與當(dāng)前的信息融合進而影響行為?

2025年4月23日,北京大學(xué)心理與認知科學(xué)學(xué)院、IDG麥戈文腦科學(xué)研究所羅歡課題組和方方課題組合作,在PLoS Biology在線發(fā)表論文“Reactivation of previous decisions repulsively biases sensory encoding but attractively biases decision-making”,揭示了人腦自動推理的記憶重激活的“雙重門”機制——過去試次信息首先在早期編碼階段通過感覺皮層的記憶重激活,對當(dāng)前信息加工產(chǎn)生“排斥”影響;隨后在晚期決策階段的前額葉腦區(qū)再次激活,對當(dāng)前產(chǎn)生“吸引”影響(圖1)。該雙重門機制對應(yīng)于有效性編碼和貝葉斯整合的計算理論,為人腦的自動推理機制提供了全新的神經(jīng)證據(jù)和計算模型框架。


圖1 人腦自動推理的“排斥-吸引”雙重門機制

本研究設(shè)計了分離編碼和決策的延遲反應(yīng)任務(wù)以探測序列依賴效應(yīng)可能的發(fā)生階段,并結(jié)合腦電圖(實驗一)和腦磁圖(實驗二)技術(shù)進行高時空精度信息追蹤,從作用來源、作用階段與方式以及發(fā)生腦區(qū)上全面揭示了其動態(tài)作用機制。實驗一采用二維空間位置復(fù)現(xiàn)任務(wù),發(fā)現(xiàn)了當(dāng)前復(fù)現(xiàn)的位置會系統(tǒng)性偏向上一試次的位置(吸引性序列依賴效應(yīng));神經(jīng)上,過去位置在編碼和決策階段都被重新激活,但記憶信息和當(dāng)前信息的表征軸呈現(xiàn)出迥異的非正交關(guān)系:在編碼階段夾角為鈍角,引起排斥性神經(jīng)偏差,而在決策階段則是銳角,引起吸引性偏差,并與行為相關(guān)(圖2AB)。實驗二則通過基于后線索提示的空間比較任務(wù)分離了刺激和選擇并考察任務(wù)相關(guān)性影響,發(fā)現(xiàn)了過去選擇而非刺激影響了當(dāng)下,在編碼階段,信息重激活和過去對現(xiàn)在的排斥性影響更自動化,發(fā)生于視覺皮層,而決策階段的重激活和過去對現(xiàn)在的吸引性影響受任務(wù)相關(guān)性調(diào)節(jié),發(fā)生于前額葉皮層(圖2CD)。這些發(fā)現(xiàn)支持了大腦通過感覺加工中對刺激的有效性編碼(排斥)實現(xiàn)新異刺激檢測和高級腦區(qū)中的貝葉斯整合(吸引)維持知覺穩(wěn)定性的兩階段工作理論。


圖2 兩階段記憶重激活以及過去對現(xiàn)在的先“排斥”再“吸引”影響

智能是智能體在復(fù)雜環(huán)境中的綜合適應(yīng)性能力,而跨時間信息加工能力是關(guān)鍵。人類能在充滿不確定性的動態(tài)環(huán)境中進行實時感知-行動循環(huán),利用記憶中的信息對當(dāng)下進行推理并不斷更新我們內(nèi)部的世界模型,實現(xiàn)對外部世界的持續(xù)學(xué)習(xí)、理解和適應(yīng)。從這個角度看,智能是一個持續(xù)的“積分”過程,而單個認知事件則是“微分”。本研究揭示了大腦使用過去與環(huán)境交互的單次經(jīng)驗對當(dāng)下信息加工進行適應(yīng)性推理的兩階段基本框架,加深了我們對大腦跨時間信息加工的認識,有助于我們理解人類如何實現(xiàn)持續(xù)學(xué)習(xí)和適應(yīng),為類腦學(xué)習(xí)算法的開發(fā)提供了重要啟發(fā)。

北京大學(xué)心理與認知科學(xué)學(xué)院已畢業(yè)博士生羅明浩,北京大學(xué)人工智能研究院助理研究員張惠惠為本文共同第一作者。張惠惠助理研究員與北京大學(xué)心理與認知科學(xué)學(xué)院、IDG麥戈文腦科學(xué)研究所的方方教授、羅歡教授為本文共同通訊作者。本研究獲得國家自然科學(xué)基金創(chuàng)新研究群體項目、國家科學(xué)和技術(shù)創(chuàng)新2030重大項目、國家自然科學(xué)基金重點項目、中國博士后科學(xué)基金項目和北京大學(xué)-清華大學(xué)生命科學(xué)聯(lián)合中心博士后基金資助。


2025-04-28