科技
向研究物件展示的豹子影象(左)和使用生成式人工智慧使用大腦活動重建的影象(右)。 *日本量子科學技術研究所。
想象一下,如果人工智慧(AI)可以讀取人類大腦中發生的事情,你會相信嗎?
本月發表在國際科學雜誌《神經網路》上的一項研究表明,日本科學家已經利用人工智慧技術成功建立了世界上第乙個基於人腦活動的物體和景觀的心理影象。 這項技術被稱為“大腦解碼”,可以基於大腦活動將感知內容視覺化,並有望應用於醫療和福利領域。
隨著腦機介面和神經工程的快速發展,用機器通過分析大腦活動來讀出志願者大腦中發生的事情,已經不再是科幻故事了。 解碼思想的技術越來越成熟,AI“讀心術”的理念越來越接近現實。 與此同時,它也引發了對私隱的擔憂。
複製心理意象。
先前的研究表明,通過功能性磁共振成像(FMRI)測量的大腦活動可以重建人類看到的影象。 但這僅限於特定內容,例如字母、面孔等。
基於之前的方法,來自日本量子科學與技術研究所(QST)和大阪大學的一組科學家開發了一種量化大腦活動的技術,並將生成式AI和**技術相結合,繪製影象以重建複雜的物體。
研究人員向參與者展示了大約1,200張物體和景觀影象,並使用FMRI分析和量化了他們的大腦訊號與視覺刺激之間的關係,然後用於訓練生成式AI來破譯和複製大腦活動中的心理影象。 因此,研究人員使用這種方法產生了生動的影象,例如具有可辨別特徵的豹子,例如耳朵,嘴巴和斑點,以及帶有紅色機翼燈的飛機等物體。
研究人員表示,將心理影象視覺化為自然的任意影象是乙個重要的里程碑。
QST研究人員說,人類已經使用顯微鏡和其他裝置看到了肉眼看不見的世界,但還沒有能夠看到乙個人的內心世界,這是人類第一次窺視另乙個人的思想。 從本質上講,它可以用來幫助創造新的通訊裝置,同時也允許科學家探索和理解幻覺和夢境在大腦中是如何運作的。
解碼語言資料。
今年早些時候,一項新研究發表在《自然神經科學》雜誌上。 德克薩斯大學奧斯汀分校的乙個研究小組在大型語言模型的幫助下開發了一種現代“讀心器”。 他們使用FMRI收集有關三名參與者大腦活動的資訊,並將他們的想法轉化為文字,準確率為82%。
來自 fMRI 掃瞄的血氧水平依賴性訊號顯示大腦不同部位的血流和氧合水平的變化。 通過關注大腦區域和處理語言的網路的活動模式,研究人員發現他們的解碼器可以被訓練來重建連續的語言,包括一些特定單詞和句子的一般含義。
具體來說,解碼器捕獲了三名參與者在聽故事時的大腦反應,並生成了可以產生這些大腦反應的單詞序列。 這些單詞序列很好地抓住了故事的要點,甚至包括確切的單詞和短語。 研究人員還要求參與者在掃瞄大腦時讓電影靜音並想象電影情節。 在這兩種情況下,解碼器通常在**故事和情節的要點上都是成功的。 例如,乙個使用者認為“我還沒有駕照”,解碼器說“她還沒有開始學習駕駛”。 此外,當參與者主動聆聽乙個故事而同時忽略另乙個故事時,解碼器會識別出正在主動聆聽的故事的含義。
讀腦技術是乙個令人擔憂的問題。
可以“讀心術”的技術的想法引發了對心理私隱的擔憂。 西班牙格拉納達大學(University of Granada)生物倫理學教授大衛·羅德里格斯·阿里亞斯·威爾恩(David Rodríguez Arias Welln)警告說,這更接近於機器“可以閱讀和轉錄思想”的未來,但它們可能會違背人們的意願。
在評論德克薩斯大學奧斯汀分校的研究時,Statnews表示,人們經常將這些型別的大腦解碼器描述為“讀心器”,但這是乙個模糊的術語,誇大了他們的能力。 雖然人們的大腦會產生心理過程,但對大多數心理過程在大腦活動中究竟是如何編碼的了解有限。
文章認為,大腦解碼器不能簡單地讀出乙個人的思想內容。 相反,他們學到的是做出心理陳述。 大腦解碼器就像一本字典,可以解釋大腦活動模式和心理內容的描述。 然而,大腦活動會受到直接刺激以外的因素的影響,因此“字典”只能**乙個人的大腦將如何對刺激做出反應。 此外,測量乙個人的大腦對每一種可能的刺激的反應是不可行的。 過程本質上是不完美的,因此解碼器對乙個人的看法可能與該人的實際想法大不相同。
此外,文章強調,大腦解碼器只能“複製”活躍的心理內容。 所有大腦記錄方法都測量與乙個人何時積極處理資訊相對應的訊號。 相比之下,非活動資訊,如長期記憶,被編碼在神經元之間的連線中,人們仍然遠遠無法測量和解碼這些資訊。