除非機(jī)器具備了
人類大腦的某些特征,
否則它們不會(huì)變得智能。
下面介紹其中的3項(xiàng)特征。
●■●
計(jì)算機(jī)改變了工作和游戲、交通和醫(yī)藥、娛樂和體育。盡管如此,這些機(jī)器仍然無法完成孩子都能完成的簡(jiǎn)單任務(wù),例如在一個(gè)陌生的房間里穿梭或使用鉛筆。●解決方案終于觸手可及了,它將出現(xiàn)在兩個(gè)主要研究方向的交叉點(diǎn):大腦逆向工程和人工智能的新興領(lǐng)域。在未來20年里,這兩個(gè)方面的研究將結(jié)合起來,迎來智能機(jī)器的一個(gè)新紀(jì)元。●我們?yōu)槭裁葱枰私獯竽X如何運(yùn)轉(zhuǎn),來制造智能機(jī)器?雖然深度神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)技術(shù)最近取得了令人印象深刻的成果,但它們離智能、離人類的理解力和行為仍然相距甚遠(yuǎn)。擁有智能、擁有認(rèn)識(shí)世界的能力、能夠計(jì)劃和執(zhí)行的唯一實(shí)例,就是大腦。因此,我們必須了解人類智能的基本原理,并利用它們來指導(dǎo)我們開發(fā)真正的智能機(jī)器。
在我位于加州紅木市的Numenta公司里,我們將新皮質(zhì)——大腦最大的組成部分,也是負(fù)責(zé)智能的主要部分——作為研究對(duì)象。我們的目標(biāo)是了解它如何運(yùn)作,并確定人類認(rèn)知的基本原理。近年來,我們的工作取得了長(zhǎng)足的進(jìn)步,已經(jīng)確定了生物智能應(yīng)該體現(xiàn)在未來的思維機(jī)器中的幾個(gè)特點(diǎn)。
要理解這些原理,我們必須從生物學(xué)的基礎(chǔ)開始。人類大腦與爬行動(dòng)物的大腦相似,都有控制反射行為的脊髓、控制呼吸和心率等自主行為的腦干,以及控制情緒和基本行為的中腦。但是人類(實(shí)際上還有所有哺乳類動(dòng)物)有一樣?xùn)|西是爬蟲類動(dòng)物不具有的:新皮質(zhì)。
新皮質(zhì)是一層褶皺很深的薄層,大約2毫米厚,如果平整攤開,和大號(hào)餐巾紙差不多大。它占人類大腦體積的75%左右。就是它讓我們變得聰明。
人出生時(shí),新皮質(zhì)幾乎一無所知,它通過積累經(jīng)驗(yàn)進(jìn)行學(xué)習(xí)。我們對(duì)世界的一切認(rèn)識(shí),比如開車、使用咖啡機(jī),以及每天成千上萬的交互行為,都存儲(chǔ)在新皮質(zhì)中。它學(xué)會(huì)了認(rèn)識(shí)這些物體,了解它們?cè)谑澜缰械奈恢茫约八鼈內(nèi)绾涡惺隆P缕べ|(zhì)也會(huì)產(chǎn)生動(dòng)作指令,所以當(dāng)你做飯或編寫軟件時(shí),實(shí)際上是新皮質(zhì)控制著這些行為。語言也是由新皮質(zhì)創(chuàng)造和理解的。
新皮質(zhì)像整個(gè)大腦和神經(jīng)系統(tǒng)一樣,由神經(jīng)元組成。因此,要了解大腦是如何運(yùn)作的,需要從神經(jīng)元開始。新皮質(zhì)大約有300億個(gè)神經(jīng)元。典型的神經(jīng)元有一個(gè)尾巴一樣的軸突以及多個(gè)樹狀的延伸物(稱為樹突)。如果把神經(jīng)元看成一種信號(hào)系統(tǒng),軸突就相當(dāng)于發(fā)射器,樹突相當(dāng)于接收器。沿著樹突的分支分布著大約5000到1萬個(gè)突觸,每一個(gè)突觸都與其他成千上萬個(gè)神經(jīng)元的突觸相連。因此有超過100萬億個(gè)突觸連接。
你對(duì)周圍世界的體驗(yàn)——認(rèn)出一個(gè)朋友的面孔、享受一曲音樂、手里拿著一塊肥皂——都是由眼睛、耳朵和其他感覺器官輸入到你的新皮質(zhì),并激活眾多神經(jīng)元的結(jié)果。當(dāng)神經(jīng)元受到刺激時(shí),電尖峰會(huì)沿著神經(jīng)元軸突流動(dòng),并通過突觸傳遞到其他神經(jīng)元。如果一個(gè)接收神經(jīng)元得到足夠的輸入,它就可能進(jìn)入興奮狀態(tài)并激活其他神經(jīng)元。在新皮質(zhì)的300億個(gè)神經(jīng)元中,在任一瞬間,其中的1%或2%的神經(jīng)元都處于興奮狀態(tài),這意味著在任何時(shí)間點(diǎn),都有幾百萬個(gè)神經(jīng)元處于活躍狀態(tài)。當(dāng)你活動(dòng)并與世界互動(dòng)時(shí),活躍神經(jīng)元的集合也會(huì)發(fā)生變化。你對(duì)世界的感知,即你自己所認(rèn)為的意識(shí)體驗(yàn),是由不斷變化的活動(dòng)神經(jīng)元模式?jīng)Q定的。
新皮質(zhì)主要通過形成新的突觸來存儲(chǔ)這些模式。當(dāng)你再次看到以前見過的面孔和地方時(shí),這些存儲(chǔ)使你能夠識(shí)別并回憶起它們來。例如,當(dāng)你想到你朋友的面孔時(shí),新皮質(zhì)中會(huì)出現(xiàn)一種神經(jīng)激活模式,與你真正看到朋友面孔時(shí)的相應(yīng)模式類似。
值得注意的是,新皮質(zhì)既復(fù)雜又簡(jiǎn)單。說它復(fù)雜,是因?yàn)樗粍澐殖蓭资畟€(gè)區(qū)域,每個(gè)區(qū)域負(fù)責(zé)不同的認(rèn)知功能。每個(gè)區(qū)域內(nèi)有多個(gè)神經(jīng)元層,包含幾十種神經(jīng)元類型,神經(jīng)元以錯(cuò)綜復(fù)雜的模式連接。
說新皮質(zhì)簡(jiǎn)單,是因?yàn)槊總€(gè)區(qū)域的細(xì)節(jié)幾乎都是相同的。隨著人類的進(jìn)化,逐漸演化出一種可以應(yīng)用于新皮質(zhì)所有功能的算法。這個(gè)通用算法的存在是令人振奮的,因?yàn)槿绻芘宄@個(gè)算法是什么,我們就可以徹底明白智能意味著什么,并把這些知識(shí)灌輸?shù)轿磥淼臋C(jī)器中。
但這不是人工智能已經(jīng)在做的嗎?大多數(shù)人工智能不就是建立在與之類似的大腦“神經(jīng)網(wǎng)絡(luò)”上的嗎?其實(shí)并非如此。雖然今天的人工智能技術(shù)參考了神經(jīng)科學(xué),但它們使用的是一種過于簡(jiǎn)化的神經(jīng)元模型,不具有真正神經(jīng)元的基本特征,而且,它們的連接方式并不能反映人類大腦實(shí)際的復(fù)雜結(jié)構(gòu)。二者之間的差異有很多,而且非常重要。這就是為什么今天的人工智能可能擅長(zhǎng)標(biāo)記圖像或識(shí)別口頭語言,卻不能以創(chuàng)造性的方式進(jìn)行推理、計(jì)劃和行動(dòng)。
在研究新皮質(zhì)如何運(yùn)作方面,我們最近的進(jìn)展讓我們對(duì)未來思維機(jī)器的運(yùn)作方式有了些新想法。我將介紹如今人工智能大都缺失卻對(duì)生物智能至關(guān)重要的3個(gè)方面:重建回路學(xué)習(xí)、稀疏表示和具身化(指通過身體移動(dòng)來了解世界)。
●■●
重建回路學(xué)習(xí):大腦表現(xiàn)出一些卓越的學(xué)習(xí)特性。首先,我們學(xué)得很快。隨意看幾眼或用手指觸摸幾下,常常足以讓我們學(xué)到新東西。第二,學(xué)習(xí)具有增量性。我們不需要再訓(xùn)練整個(gè)大腦或忘記以前學(xué)過的東西,就可以學(xué)習(xí)新東西。第三,大腦在不斷學(xué)習(xí)。當(dāng)我們?cè)谧邉?dòng)、規(guī)劃和行動(dòng)時(shí),我們一直在學(xué)習(xí)。快速、增量和連續(xù)學(xué)習(xí)是使智能系統(tǒng)適應(yīng)變化世界的基本要素。神經(jīng)元負(fù)責(zé)學(xué)習(xí),而使神經(jīng)元成為強(qiáng)大學(xué)習(xí)機(jī)器的則是它的復(fù)雜性。
近年來,神經(jīng)科學(xué)家們掌握了一些關(guān)于樹突的重要信息。其中之一是,樹突的每個(gè)分支充當(dāng)一組模式檢測(cè)器。事實(shí)證明,每個(gè)分支上只要有15到20個(gè)活躍突觸,就能夠識(shí)別大量神經(jīng)元的活躍模式。因此,單個(gè)神經(jīng)元可以識(shí)別數(shù)百種不同模式。其中,有些模式讓神經(jīng)元變得活躍,有些則改變細(xì)胞的內(nèi)部狀態(tài),并預(yù)測(cè)未來活動(dòng)。
神經(jīng)科學(xué)家過去認(rèn)為,學(xué)習(xí)僅僅是通過修改現(xiàn)有突觸的有效性來實(shí)現(xiàn)的,這樣當(dāng)輸入到達(dá)突觸時(shí),神經(jīng)元細(xì)胞就可能更容易或更難被激活。然而,我們現(xiàn)在了解到,大多數(shù)學(xué)習(xí)是通過“重建大腦回路”而在細(xì)胞之間產(chǎn)生新突觸的結(jié)果。每天,神經(jīng)元中有高達(dá)40%的突觸被新突觸替換。新的突觸使神經(jīng)元之間出現(xiàn)新的連接模式,因此導(dǎo)致新的記憶。由于樹突的分支大多是獨(dú)立的,因此當(dāng)神經(jīng)元學(xué)習(xí)識(shí)別某一樹突上的新模式時(shí),并不會(huì)干擾其他樹突已經(jīng)學(xué)到的東西。
這就是為什么我們能夠?qū)W習(xí)新事物而不干擾舊記憶,為什么我們每次學(xué)習(xí)新東西的時(shí)候不需要重新訓(xùn)練大腦。今天的神經(jīng)網(wǎng)絡(luò)沒有這些屬性。
智能機(jī)器不必模仿生物神經(jīng)元的所有復(fù)雜性,但樹突和重建回路學(xué)習(xí)所實(shí)現(xiàn)的相關(guān)能力是必不可少的。未來的人工智能系統(tǒng)將需要具備這些能力。
●■●
稀疏表示:大腦和計(jì)算機(jī)表示信息的方式很不相同。在計(jì)算機(jī)內(nèi)存中,1和0的所有組合都可能是有效的,所以如果你改變一個(gè)比特,通常就會(huì)出現(xiàn)完全不同的含義。這大致如同把“fire”(火)中的“i”改變成“a”,使它變成一個(gè)毫不相干的詞“fare”(車費(fèi))一樣。這種表示方式非常脆弱。
而大腦使用的是所謂的稀疏分布表示(SDR)。之所以稱其為“稀疏”,是因?yàn)樵谌魏谓o定的時(shí)間,只有相對(duì)較少的神經(jīng)元完全處于活躍狀態(tài)。隨著你移動(dòng)和思考,活躍的神經(jīng)元會(huì)發(fā)生變化,但比例總是很低。如果我們把每個(gè)神經(jīng)元看成1比特,那么大腦會(huì)使用幾千個(gè)比特(比計(jì)算機(jī)使用的8至64個(gè)多得多)表現(xiàn)一條信息,但在任何時(shí)刻都只有其中一小部分的值是1,其余的都是0。
假設(shè)你想用稀疏分布表示來表現(xiàn)“貓”的概念,你可能會(huì)使用1萬個(gè)神經(jīng)元,而其中只有100個(gè)是活躍的。每個(gè)活躍的神經(jīng)元代表貓的某些方面,如“寵物”“毛茸茸”“爪子”。如果少數(shù)神經(jīng)元死亡,或額外的一些神經(jīng)元變得活躍,新的稀疏分布表示仍然能較好地表示“貓”,因?yàn)榛钴S的神經(jīng)元大多數(shù)仍然是相同的。稀疏分布表示不脆弱,且對(duì)誤差和噪聲有內(nèi)在的抵抗力。當(dāng)我們想用硅來制造大腦時(shí),它們應(yīng)具備內(nèi)在的容錯(cuò)能力。
我想說一下稀疏分布表示的兩個(gè)屬性。其一是重疊屬性,能讓其容易識(shí)別兩個(gè)事物的含義有哪些異同之處。設(shè)想有兩個(gè)稀疏分布表示,一個(gè)表示“貓”,另一個(gè)表示“鳥”。它們都具有表示“寵物”和“爪子”的相同活躍神經(jīng)元,但表示“毛茸茸”的則不是它們的共同神經(jīng)元。這只是一個(gè)簡(jiǎn)化的例子,說明重疊屬性很重要,因?yàn)樗尨竽X很快弄清楚這兩個(gè)事物的異同。這一屬性賦予了人類概括能力,而這正是計(jì)算機(jī)所缺乏的。
其二是聯(lián)合屬性,它允許大腦同時(shí)表示多個(gè)想法。想象一下,我看見一只動(dòng)物在灌木叢中移動(dòng),但只看了一眼,所以不能確定我看到的是什么。它可能是一只貓、一只狗或一只猴子。因?yàn)橄∈璺植急硎臼窍∈璧模一ゲ桓蓴_,所以眾多神經(jīng)元可以同時(shí)激活3個(gè)稀疏分布表示而不會(huì)產(chǎn)生困惑。神經(jīng)元具有不斷形成稀疏分布表示聯(lián)合體的能力,因此非常善于處理不確定性。
稀疏分布表示的兩種特性是大腦能夠進(jìn)行理解、思考和規(guī)劃的關(guān)鍵。不接納稀疏分布表示就無法造出智能機(jī)器。
●■●
具身化:新皮質(zhì)接收來自感覺器官的輸入。每當(dāng)我們移動(dòng)目光、四肢或身體時(shí),感官輸入都會(huì)發(fā)生變化。這種不斷變化的輸入是大腦認(rèn)識(shí)世界的主要機(jī)制。假設(shè)我給你一個(gè)你從未見過的物體,為討論之便,假設(shè)我給你的是訂書機(jī)。你將如何認(rèn)識(shí)這個(gè)新物體?或許你會(huì)繞著訂書機(jī)走,從不同的角度觀察它。或許你會(huì)拿起它,用手指觸摸,并在手中擺弄。然后你可能試著拉起或按下它,看它的反應(yīng)。通過這個(gè)互動(dòng)過程,你認(rèn)識(shí)了訂書機(jī)的形狀、感覺、外觀以及作用。你做一個(gè)動(dòng)作,看看輸入如何變化,再做一個(gè)動(dòng)作,看看輸入如何再次改變,不斷反復(fù)。通過動(dòng)作來學(xué)習(xí)是大腦的主要學(xué)習(xí)手段。這將是所有真正智能系統(tǒng)的核心組成部分。
這并不是說智能機(jī)器需要一個(gè)實(shí)體,而是說它需要有能力通過移動(dòng)來改變它的感知。例如,虛擬人工智能機(jī)器可以通過跟蹤鏈接和打開文件,在網(wǎng)絡(luò)中“移動(dòng)”。它可以通過虛擬活動(dòng)來了解虛擬世界的結(jié)構(gòu),就像我們走過建筑物時(shí)所做的那樣。
這讓我們于2016年在Numenta公司取得了重要發(fā)現(xiàn)。在新皮質(zhì)中,感覺輸入是在不同層次的區(qū)域中處理的。隨著感官輸入從一個(gè)層級(jí)被傳遞到另一個(gè)層級(jí),更復(fù)雜的特征被提取出來,直到某一點(diǎn)可以識(shí)別出物體為止。深度學(xué)習(xí)網(wǎng)絡(luò)也使用層次結(jié)構(gòu),但它們往往需要100個(gè)層次的處理才能識(shí)別一個(gè)圖像,而新皮質(zhì)只需要4個(gè)層次就可獲得相同結(jié)果。深度學(xué)習(xí)網(wǎng)絡(luò)還需要上百萬種訓(xùn)練模式,而新皮質(zhì)僅通過少量動(dòng)作和感覺就可以認(rèn)識(shí)新物體。大腦的做法與典型的人工神經(jīng)網(wǎng)絡(luò)有著本質(zhì)的不同,但是大腦是怎么做的呢?
19世紀(jì)的德國(guó)科學(xué)家赫爾曼?馮?亥姆霍茲是最先給出答案的人之一。他觀察到,雖然我們的眼球每秒鐘都動(dòng)三四次,但我們的視覺感知是穩(wěn)定的。他推斷,大腦必須考慮眼球是如何移動(dòng)的,否則在我們眼里整個(gè)世界都好像在瘋狂地跳來跳去。同樣,當(dāng)你觸摸某物時(shí),如果大腦只處理觸覺輸入,而不知道你的手指在同一時(shí)間如何移動(dòng),也會(huì)讓人感到困惑。這種把動(dòng)作與感覺變化相結(jié)合的原則被稱為感覺運(yùn)動(dòng)整合。感覺運(yùn)動(dòng)整合在大腦中何處發(fā)生、如何發(fā)生,目前很大程度上仍然是個(gè)謎。
我們的發(fā)現(xiàn)是,感覺運(yùn)動(dòng)整合發(fā)生在新皮質(zhì)的每個(gè)區(qū)域。它不是一個(gè)單獨(dú)的步驟,而是所有感官處理的組成部分。感覺運(yùn)動(dòng)整合是新皮質(zhì)“智能算法”的重要組成部分。在Numenta公司,我們有一套解釋神經(jīng)元如何運(yùn)作的理論和模型,這個(gè)模型可以很好地映射每個(gè)新皮質(zhì)區(qū)域的復(fù)雜解剖結(jié)構(gòu)。
這個(gè)發(fā)現(xiàn)對(duì)機(jī)器智能有什么影響?想想你可能在計(jì)算機(jī)上看到的兩種文件吧。一種是照相機(jī)生成的圖像文件,另一個(gè)是由歐特克等程序生成的計(jì)算機(jī)輔助設(shè)計(jì)(CAD)文件。圖像文件表示一組二維視覺特征。CAD文件也表示一組特征,但每個(gè)特征都對(duì)應(yīng)著三維空間內(nèi)的一個(gè)指定位置。CAD文件對(duì)完整的物體(而不是物體從某個(gè)角度看上去的樣子)進(jìn)行建模。利用CAD文件,你可以預(yù)知物體在任何角度的樣子,并確定某物體如何與其他三維物體互動(dòng),而用圖像文件則無法做到這些。我們發(fā)現(xiàn),新皮質(zhì)的每個(gè)區(qū)域都能像CAD程序那樣認(rèn)識(shí)物體的三維模型。身體每動(dòng)一次,新皮質(zhì)都會(huì)獲取當(dāng)前的動(dòng)作指令,并將它轉(zhuǎn)換成物體參考系中的位置,然后把該位置與感官輸入結(jié)合起來,以認(rèn)識(shí)世界中的三維模型。
事后看來,這種觀察是有意義的。智能系統(tǒng)需要學(xué)習(xí)世界的多維模型。感覺運(yùn)動(dòng)整合并非只發(fā)生在大腦的幾個(gè)區(qū)域,它是大腦功能的核心原理,是智能算法的一部分。智能機(jī)器也必須如此運(yùn)作。
●■●
新皮質(zhì)的3項(xiàng)基本屬性——重建回路學(xué)習(xí)、稀疏分布表示、感覺運(yùn)動(dòng)整合——將是機(jī)器智能的基石。未來的思維機(jī)器可以忽略生物學(xué)的許多方面,卻不能忽略這3個(gè)方面。毫無疑問,在神經(jīng)生物學(xué)方面還會(huì)有進(jìn)一步揭示認(rèn)知的其他發(fā)現(xiàn),它們將來也需要被納入智能機(jī)器中,但我們可以從今天已經(jīng)知道的開始。
在人工智能的早期發(fā)展階段,批評(píng)者就摒棄了試圖模仿人類大腦的想法,經(jīng)常說“飛機(jī)并不會(huì)扇動(dòng)翅膀”。實(shí)際上,威爾伯?萊特和奧威爾?萊特兄弟倆詳細(xì)研究了鳥類。為了創(chuàng)造升力,他們研究了鳥翼形狀并在風(fēng)洞中進(jìn)行了測(cè)試。對(duì)于推進(jìn)力,他們采用了鳥類所不具備的解決方案:螺旋槳和電機(jī)。為了控制飛行,他們觀察到鳥類在飛行轉(zhuǎn)向時(shí)會(huì)傾斜翅膀,并用尾巴維持高度。所以他們也這么做了。今天,飛機(jī)仍然使用這種方法,只是我們傾斜的是機(jī)翼的尾緣。總之,萊特兄弟研究了鳥類,然后選出了哪些鳥類飛行元素是人類飛行必不可少的,而哪些是可以忽略的。這就是我們?cè)谥圃焖季S機(jī)器過程中要做的。
考慮未來時(shí),我會(huì)擔(dān)心我們?cè)O(shè)定的目標(biāo)不夠高。當(dāng)今計(jì)算機(jī)能對(duì)圖像進(jìn)行分類并識(shí)別口語問詢,這是令人興奮的,但我們離造出真正的智能機(jī)器還相距甚遠(yuǎn)。我相信制造真正的智能機(jī)器是非常重要的。人類未來的成功,甚至是人類的生存或許都取決于它。例如,如果我們要到其他行星上居住,我們將需要機(jī)器代替我們行動(dòng),進(jìn)行太空旅行、修筑建筑物、開采資源,并在人類無法生存的環(huán)境中獨(dú)立解決復(fù)雜的問題。在地球上,我們面臨著疾病、氣候和能源方面的挑戰(zhàn)。智能機(jī)器可以幫助我們。例如,我們應(yīng)該能設(shè)計(jì)出可在分子層面感知和行動(dòng)的智能機(jī)器。這些機(jī)器會(huì)以你我認(rèn)識(shí)電腦和訂書機(jī)那樣的方式,來考慮蛋白質(zhì)折疊和基因表達(dá)。它們能以比人類快100萬倍的速度思考和行事。這種機(jī)器可以治愈疾病,讓我們的世界適宜居住。
在20世紀(jì)40年代,計(jì)算時(shí)代的先驅(qū)們意識(shí)到,未來,計(jì)算機(jī)將變得十分重要和有益于人類,并且可能改變?nèi)祟惿鐣?huì)。但他們無法準(zhǔn)確地預(yù)測(cè)計(jì)算機(jī)將如何改變我們的生活。同樣,我們可以相信,真正的智能機(jī)器將把世界變得更美好,雖然今天我們還不能準(zhǔn)確地預(yù)測(cè)將如何改變。20年后,當(dāng)我們回望時(shí)會(huì)發(fā)現(xiàn),是大腦理論和機(jī)器學(xué)習(xí)的進(jìn)步開創(chuàng)了真正的機(jī)器智能時(shí)代。
作者: Jeff Hawkins
往期推薦