據(jù)悉,澳大利亞悉尼科技大學(xué)科學(xué)家開發(fā)出了首款便攜式、非侵入性的人工智能系統(tǒng),可解碼無(wú)聲的想法并將其轉(zhuǎn)化為有形的文本。這項(xiàng)技術(shù)可幫助那些因疾病或受傷(包括中風(fēng)或癱瘓)而無(wú)法說(shuō)話的人進(jìn)行溝通,也有望實(shí)現(xiàn)人與仿生手臂或機(jī)器人等設(shè)備之間的無(wú)縫通信。最新研究代表了將原始腦電圖(EEG)直接翻譯成語(yǔ)言的開創(chuàng)性努力,標(biāo)志著該領(lǐng)域的一次重大突破。
圖為研究人員正在測(cè)試DeWave模型
在最新研究中,參與者佩戴一頂帽子,通過(guò)EEG記錄頭皮的腦電活動(dòng),同時(shí)默讀文本段落。EEG波被分割成不同單元,從人腦中捕捉特定的特征和模式,這一任務(wù)由研究人員開發(fā)的DeWave模型完成。DeWave模型通過(guò)從大量的腦電圖數(shù)據(jù)中學(xué)習(xí),將腦電圖信號(hào)翻譯成單詞和句子。
研究人員指出,這是科學(xué)家首次將離散編碼技術(shù)納入大腦思想轉(zhuǎn)化為文本的翻譯過(guò)程。為此,他們引入了一種創(chuàng)新性的神經(jīng)解碼方法。最新技術(shù)與大型語(yǔ)言模型的集成,也為神經(jīng)科學(xué)和人工智能開辟了新的前沿。
以前將大腦信號(hào)轉(zhuǎn)換為語(yǔ)言的技術(shù)要么需要在大腦中植入電極,比如埃隆·馬斯克的Neuralink,要么需要借助磁共振成像(MRI)設(shè)備掃描大腦,而MRI機(jī)器體積大、價(jià)格貴,難以在日常生活中使用。此外,這些方法也很難在沒(méi)有眼動(dòng)追蹤輔助的情況下將大腦信號(hào)轉(zhuǎn)換為單詞級(jí)片段,因此限制了這些系統(tǒng)的實(shí)際應(yīng)用。而最新技術(shù)既可使用眼動(dòng)追蹤,也可不使用眼動(dòng)追蹤。
最新研究共有29名參與者,這意味著它或許能比以前只在一兩個(gè)人身上測(cè)試過(guò)的解碼技術(shù)更強(qiáng)大、更具適應(yīng)性,因?yàn)椴煌酥g的腦電波不同。
借助佩戴的帽子而非從植入大腦的電極接收EEG信號(hào),意味著信號(hào)的噪音更多。但研究結(jié)果顯示,新系統(tǒng)在腦電圖翻譯方面的表現(xiàn)超過(guò)了之前的基準(zhǔn)。這項(xiàng)研究已被選為12月12日在美國(guó)新奧爾良舉行的NeurIPS會(huì)議的重點(diǎn)論文,該會(huì)議旨在展示領(lǐng)先的人工智能和機(jī)器學(xué)習(xí)研究成果。
(來(lái)源:科技日?qǐng)?bào))