亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現在的位置是:首頁 > 技術閱讀 >  侯世達:讓機器學習思考的人

侯世達:讓機器學習思考的人

時間:2024-01-12

今天,技術正處于黃金時代,卻與思想幾乎無關。


圖源:GREG RUFFING

侯世達(Douglas Hofstadter)是《哥德爾、艾舍爾、巴赫——集異璧之大成》的作者,并以此書獲得普利策獎。他認為我們已經忘記了“人工智能”真正的含義。

“這其實取決于你認為人工智能指的是什么?!焙钍肋_在印第安納布魯明頓的雜貨店里挑選沙拉配料?!叭绻腥苏J為人工智能是指嘗試理解大腦思維,或者制造一些類似人類的東西,他們大概會說人工智能是有史以來唯一有價值的事情。”

侯世達的語氣里帶有一種漫不經心的刻意,因為對他而言,現代人工智能領域最激動人心的項目,那些仿佛是科幻小說里才會出現的產品——例如能夠參加益智競賽的IBM超級電腦沃森,或者iPhone語音助手Siri——其實和人工智能都沒什么關系。在過去的三十年中,侯世達和他的學生都待在印第安納大學西北邊的一個老房子里,試著補上這個研究缺口:通過編寫可以自己思考的程序來探索人類思考的方式。

他們的假設非常簡單:大腦是一個非同尋常的軟件,要明白這個軟件如何運行,最好的方法就是親自寫一遍。計算機非常靈活,足以模擬大腦奇怪復雜的思維,但它只聽命于精確的指示。如果他們的努力有所回報,簡直是一石二鳥:我們終于可以明白自己的思維機制——也可以制造懂得思考的機器了。

侯世達常說,這個改變了他人生的想法是在一次旅途中出現的。當時他是俄勒岡大學粒子物理專業的博士生,博士論文寫得非常不順利,感到“非常迷茫”,于是在1972年的夏天,他收拾行囊,鉆進了他那輛叫“銀色快手”的汽車,一路向東,橫穿北美大陸。

他每晚都在不同的地方搭帳篷,打著手電筒看書。他可以自由地思考他想思考的一切:他選擇了思考“思考”本身。14歲那年,他最小的妹妹茉莉“因為大腦有嚴重障礙”,無法理解語言(她神經系統的這種狀況應該是從出生就存在的,但從未被確診過)。從那之后,他就默默著迷于大腦與事物之間的關系。心理學之父威廉姆·詹姆斯(William James)在1890年時曾將思考形容為“世界上最神秘的事物”——意識怎么會是有實體的呢?那幾磅重的灰質是如何決定我們的思維和自我的呢?

數學家、邏輯學家、哲學家哥德爾(1906-1978)。圖源:Encyclopedia Britannica

駕駛著他的1956年福特水星四處游蕩時,侯世達覺得自己找到了答案——答案就在一個數學證明的核心里。1931年,出生于奧地利的邏輯學家庫爾特·哥德爾(Kurt G?del)提出了一個著名的理論,論證了數學論述不僅可以研究數字,還可以研究這個論述本身。侯世達想說的是,意識也是通過類似的“交叉反饋環”所形成的。有一天下午,他坐了下來,在給朋友的信中寫下了自己的想法。但寫了三十頁紙之后,他決定先不寄信,而是讓這些想法在腦海中繼續醞釀。七年之后,這些想法發展成了一部2.9磅重,777頁厚的著作——《哥德爾、艾舍爾、巴赫——集異璧之大成》。這部處女作也為三十五歲的侯世達贏得了1980年的普利策非虛構類作品獎。

圖源:Evolving Lens Bookseller

這本書又叫《GEB》,在當時引起了很大的轟動?!犊茖W美國人》的知名專欄作家馬丁·加德納(Martin Gardner)在1979年7月刊中寫了一篇熱情洋溢的書評,“每隔幾十年,”加德納在文章的開頭如此寫道,“就會有一個名不見經傳的作者帶來一本深刻、清晰、豐富、機智、優美又獨特的書,立刻得到文學界的認可?!奔s翰·霍蘭德(John Holland)是第一位獲得計算機科學博士學位的美國人,他回憶說,“當時我周圍的人都認為這是一部了不起的著作?!?/span>

《GEB》在當時被人工智能界奉為圣經。侯世達認為計算機程序不僅有能力解決問題,而且還可以很有創造力,他希望可以探索“人類大腦如電腦軟件般的秘密構造”,而他的解讀和藍圖也為人工智能的研究吸引了整整一代充滿熱忱的學生。然而,就在人工智能的研究方向發生改變時,侯世達卻沒有跟著變,他幾乎消失了。

《GEB》的問世恰好趕上人工智能歷史的拐點。這門學科綜合了計算機科學、認知科學、神經系統科學和心理學等多個領域,但在上世紀八十年代初,它正面臨資助緊縮的問題:美國對于長期“基礎科學”的資金投入越來越少,重心都轉移到了更具實用價值的領域。人工智能因其“雄心勃勃”而名聲不好。回到1956年人工智能的起步時期,科學家們瞪大眼睛夸夸其談的情景很常見。當年的達特矛斯會議上,組織者們——包括發明了“人工智能”這個詞的約翰·麥卡錫(John McCarthy)——宣布說,如果一群精心挑選出來的科學家共同努力一個夏天,就可以取得很大進展,制造出擁有以下一種或多種能力的機器:使用語言的能力;形成概念的能力;解決目前只能由人類解決的問題的能力;自我提升的能力。麥卡錫后來回憶起他們失敗的原因,說“人工智能比我們想象的要難”。

隨著冷戰時期的壓力日漸增加,人工智能研究的主要經費來源——國防部的高級研究計劃局(ARPA)——縮減了開支。1969年,國會通過了《曼斯菲爾德修正案》,要求國防部只能支持“與軍事運作有直接和明顯關系的”項目。到1972年,高級研究計劃局變成了國防部高級研究計劃局(DARPA),反映出對軍事相關項目的重視。到了七十年代中期,研究計劃局也在反省:我們在這十年間花了五千萬美元支持的研究對國防工作到底有什么作用?

對于阿蘭·圖靈(Alan Turing)的著名問題——“機器可以思考嗎?”,人工智能學界一直試圖給出肯定的答案。到了八十年代初期,迫切想要交出一份答卷的人工智能研究終于開始成熟了——發展出了以應用為主的軟件工程子領域。越來越多的研究都是為了短期目標,研究人員在做研發的時候腦海中往往已經有了明確的買家。對軍方而言,最受歡迎的項目包括“命令和控制”系統,比如戰斗機上的飛行導航,以及在航拍時能自動識別道路、橋梁、坦克和發射井等的程序。在民用領域,最受歡迎的是“專家系統”(編者注:一種在特定領域內具有專家水平解決問題能力的程序系統,能有效地運用專家多年積累的有效經驗和專業知識,通過模擬專家的思維過程,解決需要專家才能解決的問題),例如可以幫助設計師選擇打地基的材料的“樁柱選擇系統”,還有ACE專家系統(Automated Cable Expertise),可以對電話電報網絡故障進行檢修并推薦適當的策略。

《GEB》一書中,侯世達呼吁人工智能研究不要執著于如何讓機器聰明地解決人類的問題,而應更多關注對人類思想的理解——這顯然帶不來什么收益,所以就被拋棄了。他的明星光環也很快消失了。當時的主流迎來了新的目標:讓機器可以完成各種各樣的工作,而罔顧精神和心理上是否合理。

圖源:Public Radio International

以IBM的超級計算機深藍為例,它雖然擊敗了國際象棋大師加里·卡斯帕羅夫(Garry Kasparov),卻是以蠻力取勝。每走一步之前,它都會先考慮對手下一步會怎么走,再決定如何應對,至少考慮到六步以上。因為計算功能極為強大(深藍在一秒內可以計算出3.3億種走法的得分,而卡斯帕羅夫在下決定之前只能算出其中幾十種),它能在極短時間內計算和評估每一種走法的得分,然后按最高分的那種走法走就行了。

侯世達想問的是:為什么要做毫無勝算的事?他說,“深藍下棋很厲害——又怎樣呢?你能從中了解我們自己是怎么下棋的嗎?你能從中知道卡斯帕羅夫是如何謀劃和理解棋局的嗎?”人工智能的任何一個分支領域如果不嘗試去回答這樣的問題——無論看起來成就有多大——在他看來都是走入了誤區?!皩τ谖疫@樣一個剛剛起步的人工智能研究者而言,”他說,“顯然應該遠離這種旁門左道。人們會把一些看起來很厲害的程序當作人工智能,但我知道它們和智能一點關系都沒有,我完全不想和這種研究扯上關系。而且我也不理解為什么那么多人不這么想。

人工智能產業在八十年代初價值區區數百萬美元,到了八十年代末已經漲到了數十億美元,或許這能夠回答侯世達的困惑。(1997年深藍獲勝之后,IBM的市值上漲了一百八十億美元。)人工智能作為一個工程學科越是古板,取得的成就卻越大。今天,技術正處于黃金時代,卻與思想幾乎無關。人工智能滲入重工業、交通和金融等多個領域。許多Google的核心功能都是由人工智能驅動的,還有Netflix的電影推薦,IBM的沃森人工智能系統,蘋果的人工智能助理Siri,無人機以及自動駕駛汽車等。

“當萊特兄弟和其他人停止模仿鳥類,開始學習空氣動力學時,就是人類飛天夢實現的開端?!彼箞D亞特·羅素(Stuart Russell)和彼得·諾維格(Peter Norvig)在他們所著的教材《人工智能——一種現代的方法》中是這么寫的。人工智能也是在放棄了模仿人類之后才漸入佳境的。既然飛機不需要扇翅膀,計算機為什么要學會思考?

這個觀點很有力。但你得仔細想想我們真正想要的是什么:一個能明白你在搜索時到底想搜什么的Google。羅素是伯克利大學的計算機科學教授,他對我說,“網上所有搜索引擎公司的市值加起來有多少?大概四五千億美元吧。而可以真正提取并理解所有搜索信息的搜索引擎的價值可以達到這個數字的十倍?!?/span>

圖源:Gifer

這就是那個價值億萬美元的問題:目前支撐人工智能領域的研究方向——不模仿大腦,而是以大數據和編程為基礎——可以帶我們到理想的彼岸嗎?如果連自己是如何思考的都不知道,你要如何制造一個能夠理解你的搜索引擎?或許,正如羅素和諾維格在他們教科書的最后一章中非常委婉地承認的,人工智能就像是一個想通過爬樹爬到月亮上的人,“在爬到樹頂之前一路上確實取得了穩步進展。”

計算機至今還無法識別一個手寫的A。事實上,這個任務對計算機來說太難了,所以才會有CAPTCHAs(全自動區分計算機和人類的圖靈測試),也就是所謂的“驗證碼”,很多網站在注冊之前經常要求你輸入一串扭曲變形的字符。

在侯世達看來,這沒什么值得驚訝的。他在1982年的論文中曾經論證,要想知道所有的A有什么共同特點,“需要理解思維范疇的流動本質。”而這,就是人類智慧的核心。

“認知就是識別,”他喜歡這么說。他認為“看作”(see as)是最關鍵的認知行為:你會把幾條線看作“A”,把一塊木頭看作“一張桌子”,把一個會議看作“皇帝的新衣”般的場景,把朋友的撅嘴看作是“酸葡萄”心理的表現,把一個年輕人的穿衣風格看作“新潮”……這就是所謂的理解。理解到底是怎么運作的呢?三十年來,侯世達和他的學生一直試圖尋找答案,建立一個“思維基礎機制的電腦模型”。

《表象與本質》原版書封。圖源:Amazon.com

 “每時每刻,”侯世達在新書《表象與本質》(與Emmanuel Sander合著)中寫道,“我們都面臨數不清的復雜交錯的情形。”我們作為有機體想要生存下去的話,就必須時刻在這混亂中尋求秩序。侯世達很愛運用類比。他的新書封面是一系列不同字體的A,該書的主旨大意就是,“類比”是“思考的燃料和火焰”,也是日常精神生活中的面包和黃油。

“研究一下你們的談話內容,”他說。“反復琢磨幾遍,你會驚訝地發現,談話就是制造類比的過程。”有人說了什么,讓你想起了別的什么;你說了什么,讓別人想起了其他什么——這就是對話,再直接不過,但類比的思維跳躍如此復雜,簡直是一種計算的奇跡:你的大腦就是有辦法透過不相關的表面信息直擊要害,提取核心,然后從你的想法和經歷的資料庫中找到最相關的一個故事或者一句話來進行回應。他寫道,“哦,沒錯,我也遇到過這樣的事!”,這樣的話背后就隱藏著人腦的全部奧秘。

《GEB》出版之后,侯世達就與人工智能分道揚鑣了。今天,若你從書架上抽出《人工智能:一種現代的方法》,翻遍這本超過一千頁的書,你也找不到侯世達的名字。同事們提及他的時候用的是過去時。新的粉絲翻到《GEB》的出版日期,發現作者居然還活著會覺得很驚訝。

按照侯世達的說法,當人工智能領域的所有人都在制造產品時,他和他的團隊卻在對核心問題進行抽絲剝繭的分析。他的哲學家朋友丹尼爾·丹尼特(Daniel Dennett)寫道,“他們的分析很有耐心,很系統,很精彩”。“很少有人對人腦智能如何運作感興趣,”侯世達說,“這正是我們感興趣的——什么是思考?——我們一直都在探索這個問題的答案。”

“我的意思是,誰知道呢?”他說?!盎蛟S將來有人會說,這些事情侯世達早就說過,早就做過,只是我們現在才意識到。”

聽起來很像是輸家的自我寬慰。但面對這樣一個人,你會忍不住想問一句:如果人工智能界最好的想法——侯世達所謂“真正的人工智能”——被丟棄在布魯明頓的一個抽屜里泛黃,一切又將如何呢?

圖源:Rod Searcey

侯世達的一生從一開始就注定與思考為伴。他成長于上世紀五十年代的斯坦福校園,旁邊的社區就叫“教授屯”。父親羅伯特(Robert)是核物理學家,是1961年諾貝爾物理學獎的獲得者,母親南希熱衷于政治,是發育性殘疾兒童的權益倡導者,同時也是阿格紐發展中心的道德委員會委員;妹妹茉莉在阿格紐發展中心生活了超過二十年。

南希長于社交,侯世達一家的客廳被改造成了知識精英們盡情談天和跳舞的地方。知識的盛宴夜夜不斷,小侯世達則盡情饕餮。他被父母朋友口中那些“最小的東西和最大的東西”給迷住了。(八歲的時候,他曾說,他的夢想是成為“一個零質量的中微子”。)他會在四點下午茶的時間去物理系閑逛?!熬秃孟裎沂且粋€12歲的本科生一樣?!彼闷嫘暮苤兀瑢W而不厭,也從來不覺得無聊——“是一個熱愛思考的孩子”——而且他的學習強度非常大。不論過去還是現在,他總是縱情在知識中狂歡:他可以一天練習鋼琴長達七個小時,他會突然決定背誦1200行的《葉普根尼·奧涅金》;他曾花好幾周的時間用一臺錄音機教自己倒著講話,這樣錄音倒播的時候就可以聽到正常的英語;他會花好幾個月浸泡在法語里,或者編寫電腦程序來生成無意義的故事;他還會翻來覆去研究畢達哥拉斯定理的十幾種證法……他每天都在探索這些事情,“沒辦法不去探索。腦海完全被這些想法占據了,完全著迷了”。

侯世達今年68歲,但身上還是帶有一種彼得·潘式的純真。他的一生大部分是在紙上、程序里還有自己的腦海中度過的。這樣的人,即使老了大概也是與眾不同的。他的灰發在后隨意亂翹,看起來虛弱又無精打采,鼻子和上唇之間有一道長長的人中,就像圣誕怪杰一樣。他的自矜和急切的熱誠又是年輕人式的。他是那種會讓所有晚宴客人都吃素食的素食主義者,也會敏感地糾正你的“性別主義用詞”。“他的規矩很多,”與他相識59年的朋友彼得·瓊斯(Peter Jones)解釋說,“比如他特別討厭有人說伙計們(you guys)。如果你要跟他說話,最好別用這個詞?!?/span>

三十多年來,侯世達都在布魯明頓的印第安納大學當教授。去年九月他又結婚了,與妻子林寶芬(Baofen Lin)一起住在距離校園幾個街區的一棟房子里。他與上一任妻子所生的兩個孩子丹尼(Danny)和莫妮卡 (Monica)都已長大成人。盡管他和認知科學項目以及好幾個系所都有緊密的聯系——包括計算機科學、心理學和大腦科學、比較文學以及哲學——卻沒有正式的責任義務?!拔艺J為我的工作是你能想象到最輕松的工作,”他告訴我,“我想做什么就做什么。”

他的大部分時間都消磨在書房里。書房是他房子頂層的兩個房間,鋪了地毯,有點擠,有點亂。很顯然,他的整個精神生活就在這間書房里——整面墻都是書本、畫作、筆記本和檔案,他的思想像化石一樣沉淀了下來,鋪滿了整個房間,很像是紀錄片《強迫性囤積癥患者》中的場景。在這里,他閱讀,聽音樂,學習,繪畫,寫書,回郵件(侯世達每天要花四個小時寫郵件)?!皩ξ叶?,”他說,“寫郵件和寫信是一樣的,一樣正式,樣精煉,一樣認真……所有的郵件我都會不停地重寫、重寫、再重寫?!?/span>

我思考的任何事情都會變成我專業的一部分,”他說。與他合著《心我論》的丹尼爾·丹尼特解釋說,“簡單來說,侯世達是一位現象學家,工作中的現象學家,而且是史上最好的現象學家?!彼麜芯孔约捍竽X內的現象——感覺和內在活動。丹尼特告訴我,“他比其他人都要在行的原因是他非常積極地想要提煉出一個理論,總結思維的形成方式?!?/span>

侯世達的后口袋里永遠放著一根四色圓珠筆和一個小筆記本。他的書房旁邊原本有一個浴室,現在也成了儲物間,里面好幾個書架上都堆滿了這樣的筆記本。他抽出了一本——五十年代末期時用過的一本。里面滿滿都是口誤記錄(speech error)。從少年時代至今,他已經發現了大約一萬個口誤案例,包括發音置換,比如將hypodermic needle(皮下注射的針)發成hypodeemic nerdle;還有荒唐的近音錯誤,比如把runs the gambit(經營策略)發成runs the gamut(全部展示);以及“諺語雜糅”,比如easy-go-lucky就是happy-go-lucky(無憂無慮)和easy-going(性情隨和)的雜糅,諸如此類。里面一半以上的口誤都是侯世達自己犯下的。他把筆記本里面的紙復印下來,剪好,保存在書房的檔案柜或貼了標簽的盒子里。

對侯世達而言,這些都是線索?!皩τ谧约旱南乱庾R思維,誰說的話都不可靠,”他曾經這么寫道,所以廣泛收集錯誤就非常重要。若只看一個錯誤,只能發現思維機制的一點規律;如果收集了大量錯誤,海量的規律加起來就可以讓我們得到一個強大的證據,證明或者否定某種機制。正確的語法沒什么意思,它就像一個表演成功的魔術——效果很好,因為它模糊了人們的焦點,讓人們看不到其中的奧秘。侯世達在尋找的是“兔耳朵和活板門的一角”。

美國哲學家、心理學家威廉姆·詹姆斯。圖源:The Conversation

在這方面,他可謂是現代的威廉姆·詹姆斯。詹姆斯在1890年出版了《心理學原理》,以清晰的內省(他引入了意識流的概念)和利落的解釋而被奉為經典。“我們的思考大部分都會永遠消失,再也找不回來,”詹姆斯是這么寫的,“心理學僅僅是把餐桌上掉下來的碎屑收集了起來。”就像侯世達,詹姆斯也樂于在餐桌下玩耍,愉快地檢查著那些碎屑,并以此為生。差別就在于詹姆斯只能用肉眼檢查,而侯世達則擁有類似顯微鏡的東西。

你可以不將飛機的發明歸功于萊特兄弟在基蒂霍克的滑翔試飛,而歸功于他們在自行車店里用廢棄的金屬和舊輪輻造出來的六英尺高的風洞。當他們的競爭者全力以赴地測試有關安裝翅膀的想法時,萊特兄弟正在用極少的錢進行空氣動力學的實驗。他們的傳記作者弗雷德·霍華德(Fred Howard)說這些實驗是“在這么短時間內用這么少的材料、這么微薄的資金做出來的最關鍵、最有成果的航空學實驗了” 。

在布魯明頓北飛斯大街上有一棟舊房子,侯世達在那里主持流動性類比研究小組(Fluid Analogies Research Group,FARG)的活動。每年的經費是十萬美元。房子布置得很溫馨——在里面走一圈,你可能都注意不到食品儲存室里放著的檔案柜,客廳里嗡嗡作響的復印機,還有書架上貼著的圖書館式的標簽(神經科學、數學、知覺)。但25年來,這個地方一直洋溢著激情,侯世達寫道,“首先是探索創造力的秘密;然后揭開意識的面紗?!?/span>

計算機對于FARG的意義就如同風洞對于萊特兄弟的意義。人類大腦中稍縱即逝的無意識的混沌可以在計算機上慢播、回放、暫停、甚至編輯。在侯世達看來,這是人工智能的絕佳機會??梢杂羞x擇性地將一個程序的一些部分剝離,看看如果沒有這些部分,會給程序帶來什么樣的變化;也可以改變一下參量,看看大腦運作是會加強還是減弱。如果電腦發生的變化讓你驚訝——無論是變得特別有創造性或者特別蠢——你都知道具體是為什么?!拔乙恢倍加X得讓人類徹底明白思維復雜度的唯一希望,”侯世達寫道,“就是在電腦上建立思維過程模型,然后通過這些模型的失敗來學習?!?/span>

這些程序都有同樣的基礎結構——組成和整體風格都源于侯世達在1982年寫的一個程序Jumbo,它可以解決報紙上的填字游戲。(編者注:在這種游戲里,單詞里字母的順序被隨機打亂,然后玩家要找到原來的單詞。)

一個程序居然是用來完成報紙填字游戲的,你的第一反應可能是,未免太大材小用了吧?的確如此——我剛寫了一個足以應付所有單詞的程序,花了四分鐘時間。我的程序是這樣工作的:羅列幾個字母的每一種排列組合方式,直到發現字典里存在的單詞為止。

侯世達花了兩年的時間來編寫Jumbo:他的興趣當然不在填字游戲,而是大腦在這個過程中是怎么運作的。他一直在觀察自己的思維?!拔铱梢愿杏X到字母在我的腦海里打轉,”他告訴我,“它們跳來跳去,組合、分開、又再次組合。我沒有操控它們,而是它們自己在排列組合。它們在努力自己做著什么?!?/span>

侯世達說,Jumbo的模型結構其實是模仿生物細胞內部的活動。字母的組合與分裂是在“酶”的作用下進行的。有的“酶”負責對字母進行重新排序(pang-loss變成pan-gloss或者lang-poss),有的則負責連接(g和h組成gh,jum和ble組成jumble),還有一些則負責拆分(ight被拆分成it和gh)。這種運算方式的獨特之處就在于其流動性。侯世達又給出了一個類比:一大群螞蟻正在森林中漫步,一小撮偵察兵先四處查探一番,然后向小組報告發現。它們的反饋可以有效地幫助蟻群找到食物。這樣的蟻群是非常有活力的——踩死一小撮螞蟻,其他的螞蟻很快就會補上它們的位置。

圖源:The Atlantic

《流動性理念和創造性類比:思維基本機制的電腦模式》(Fluid Concepts And Creative Analogies,編者注:這是美國亞馬遜公司賣出的第一件商品)詳細解釋了程序所用的這種結構、邏輯和機制。讀一讀這本書,你會覺得,侯世達應該因為這本書而出名才對。《紐約時報》的作者曾在1995年的書評中寫道,《流動性理念和創造性類比》的讀者會懷疑印第安納大學那個小組是否正在做一件驚天動地的事情。

但事實上,很少有人知道這本書或者書里提到的那些程序,連《GEB》的崇拜者們也大多不知道??赡苁且驗檫@些程序都太不實用了,看似瑣碎,甚至幼稚,而且它們還沒有哪件任務是完成得比人類要好的。

現代主流人工智能研究從上世紀九十年代初至今一直穩步前進,不斷取得商業成功,這是誰都沒有預料到的悠長春天,而此前的寒冬差點讓整個行業消失。

由此,我們陷入了一個進退兩難的窘境:一方面,我們只會寫秩序井然的程序,就像訓練有素、等級森嚴的軍隊一樣,每一級的指揮官給下一級下達命令,現在的計算機程序也都是這樣向子程序下達命令的。另一方面,我們想要的程序應該是有適應能力的,這樣一來,層層下達命令的規則似乎是個錯誤的想法。侯世達曾經這么總結道,“人工智能的所有努力最終都是為了克服計算機的死板?!?/span>

八十年代末,主流的人工智能界已經沒有研究經費,沒有政治影響力,沒有人參加研討會,沒有人發表論文,也沒有研究見諸報端。當時最有前途的“專家系統”也面臨坍塌的命運。他們的方法從根本上看來是錯誤的,比如機器翻譯(人工智能長久以來的圣杯之一),把語言學家和翻譯者關到小屋子里,將他們的專業知識轉化為程序能夠明白的規則。這種方法最終被證明是一條死胡同:沒有哪一套規則可以涵蓋一門語言。語言太龐大多變,遵循一條規則就必定會打破另一條規則。

如果要讓機器翻譯像商業公司一樣存活下來——如果希望人工智能能夠存活下來——就必須另辟蹊徑。最好是,捷徑。

事實上,人工智能的確幸存了下來。轉機是從1988年開始的。當時IBM有一個項目叫Candide,一個機器翻譯系統,研發人員從一開始就拋棄了當時流行的基于語言規則的方法,因為這種方法對機器的要求太高了——機器必須對語言的產生有極為深入的了解:要了解語義、語法和構詞法,要了解單詞是怎么拼成句子、句子如何組成段落,還要理解詞匯只是通往意義的載體而已。

他們使用的,是一種叫“機器學習”的方法。他們的目標是要制造出一個裝置,輸入一個英語句子,就能吐出一個法語句子。已有的類似裝置當然是人腦,但你又不想跟人腦在“復雜度”上較勁。所以你現在要做的,就是從一個最簡單的機器開始,給它一個英語單詞,它就會隨機吐出法語單詞。

想象一個箱子,上面有數以千計的旋鈕。有的旋鈕控制總體設定:輸入一個英語單詞平均應該吐出多少個法語單詞?有的控制特殊設定:輸入jump這個詞,下一個詞是shot的可能性有多大?問題是,僅僅只是擺弄這些旋鈕,能讓這個機器把英語轉化為通順的法語嗎?

事實證明,可以。你需要做的就是輸入一些已經知道法語翻譯的英語句子。(比如說,Candide就用了220萬組句子,大部分都來自加拿大議會辯論的雙語文件。)一次只處理一組句子。先輸入英語的部分,看看出來的法語句子是什么樣的。如果與正確的翻譯不同,說明機器還不夠精確,需要微調按鈕再次嘗試。經過反復的輸入、嘗試、調整,你對這些旋鈕會越來越熟悉,然后就可以給這些英語句子找到正確的法語翻譯了。

上百萬個句子之后,你的機器會變得越來越精確,即使輸入一個你不知道正確法語翻譯的句子,也能得到正確的結果。這種方法的美妙之處在于,你不需要編寫精準的程序,也不需要弄清楚這些旋鈕為什么要這樣轉或者那樣轉。

“機器學習”并非Candide的發明——事實上,早在六十年代,機器翻譯尚在雛形期間,這個概念就被多次測試過了,只是一直沒有成功,直到Candide問世。Candide的真正突破并不在于解決了什么根本性的問題,而在于它得到了充分的執行。正如Candide小組成員亞當·伯格(Adam Berger)在項目總結中所寫,機器翻譯是“公認的然語言加工中最難的任務之一,在人工智能領域也是如此,因為如果沒有對材料的理解,準確的翻譯幾乎是不可能的”。像Candide這樣簡單直接的軟件也可以解決翻譯問題,說明有效的翻譯機器并不需要理解詞意——它需要的只是大量的雙語文本。

Candide的方法,其實是轉化問題本身——將一個復雜的,需抽絲剝繭方能解決的問題轉化為一個累積足夠多的例子就能搞定的問題。模仿大腦運作太難,Candide的方式卻很簡單,而且隨著時間的流逝,問題似乎越來越簡單了,尤其是到了八十年代末九十年代初,萬維網出現了。

人工智能在九十年代的復蘇并非巧合,而Google這個世界上最大的互聯網公司成為“世界上最大的人工智能系統”也同樣不是巧合。這是彼得·諾維格的原話,他是Google的研究主管,與斯圖爾特·羅素合著了《人工智能:一個現代的方法》——諾維格說,現代的人工智能就是“數據、數據、數據”,而Google的數據比誰都多。

圖源:Gifer

Google翻譯是目前世界領先的機器翻譯系統,使用的也是Candide的運算原則。喬什·埃斯特爾(Josh Estelle)是Google翻譯的軟件工程師,他解釋說,“無論你用的是人工智能初級課程里學到的最簡單的算法,或者學界早已拋棄了的算法,只要把數據從一萬增加到一百億,這些算法都能行得通?!?/span>

這種方式非常有效,即使Google翻譯的大部分語種是團隊成員不懂的,也照樣可以正常工作。“這很劃算,”埃斯特爾說,“與其雇傭母語人才,不如多請點工程師?!?/span>

這就是為什么機器學習會在人工智能界成為美妙的福音:不再需要“理解”,只要掌握好軟件工程的基本知識就可以了。諾維格說,“在Google的發展過程中,這種理念越來越受歡迎。只要將程序的運行速度提高10%,每年就可以省下幾百萬美元的開銷,所以趕緊做吧。怎么做呢?我們先研究數據,然后用機器學習或是數據統計的方法,做出更好的產品?!?/span>

Google也有一些項目是需要深入理解的,比如仿腦生物學的機器學習分支領域;知識圖譜項目,可以將搜索關鍵詞,例如“奧巴馬”,直接映射到人物、地點事物。但十億用戶的需求迫使這家公司更多的舍棄“理解”,而選擇“便捷”。Google翻譯就是一個很好的例子,它為覆蓋面、翻譯速度以及工程上的便利所做的妥協,明眼人一目了然。盡管Google翻譯使用的是人類智慧的成果,它本身卻并沒有智慧,就像巨大的羅塞塔石碑,刻滿了無法辨認的象形文字。

圖源:Dribbble

“制作沃森時,我們有沒有坐下來試圖模擬人類的認知方式?”戴夫·費魯奇(Dave Ferrucci)是IBM沃森研究小組的負責人,他停頓了一下以表強調,“絕對沒有。我們僅僅是試著做出一部可以在《危險邊緣》(Jeopardy!一檔益智競賽節目)中獲勝的機器?!?/span>

對于費魯奇而言,“智慧”的定義很簡單:即程序能完成的任務。“深藍”是有智慧的,因為它擊敗了象棋大師加里·卡斯帕羅夫。沃森也是有智慧的,因為它擊敗了《危險邊緣》最聰明的選手肯·詹寧斯(Ken Jennings)?!斑@就是人工智能,對吧?也就是說是非人類的智慧。你為什么要期望人工智能科學可以發展出人類的智能呢?”

費魯奇對人腦電腦之間的差別看得很清楚。他喜歡說,沃森需要一整間屋子的處理器,外加二十噸重的空調設備;而它的對手們僅需要一個比鞋盒子還小的裝備,靠一份金槍魚三文治就能運行好幾個小時。比賽結束之后,這個裝置可以讓他們站起來,聊幾句,吃個面包,爭論一番,跳個小舞,思考人生——而沃森卻只能默默在屋里嗡嗡作響,又熱又蠢死氣沉沉。

“我們總是低估——五十年代時低估了人工智能,現在還是這樣——這回是人腦?!辟M魯奇說。

侯世達大概會想問一句:既然如此,為什么你不去研究一下呢?

“我對此的感覺很復雜,”去年我問費魯奇這個問題的時候,他是這么說的,“作為一個個體,你能做的事情其實很有限。如果你致力于做某件事的話,一定會問自己這個問題:這是為了什么?我的答案是這樣的,我對人腦內部運作很感興趣,學習認知科學一定很有意思,我很喜歡讀這方面的書,也很希望可以掌握這方面的知識”——他也認為侯世達的書非常有啟發性——“但是,我能在這個方向取得什么成果嗎?我真正想要做的,只是搭建一個可以切實做點事情的計算機系統。我不認為認知理論能帶我快速抵達這個目標?!?/span>

彼得·諾維格的說法幾乎和費魯奇的一模一樣,“我認為他是在努力攻克一個很難的難題,”他談起侯世達時說,“但我還是更愿意去處理簡單一點的問題?!?/span>

在這些回答里,你可以看到人工智能昔日的失敗影響至今。對于本質問題的研究讓人想起早期的難堪。對于聲望的顧慮,尼爾斯·尼爾森(Nils Nilsson)在《人工智能》一書中寫過,已經讓一些人工智能研究者變得毫無用處了。

面對一個問題時,沃森能同時運行成千上萬種算法尋找答案,然后把這些答案匯合,并算出對每一個答案的確信程度。圖源:維基

與諾維格合著《人工智能:一種現代方法》的斯圖爾特·羅素更加激進,“現在正在進行的一些項目都缺乏野心”,他告訴我,“在機器學習領域,八十年代的一大突破就是‘看,這是一些真實數據——我可以用程序來準確預測其余的數據',而現在的機器學習領域似乎把它當成唯一的任務了?!?/span>

被自己的成功所羈絆是很難察覺的。當機器的速度越來越快,得到的數據越來越多,我們就允許自己變得越來越愚蠢。我們不再為最難的難題絞盡腦汁,而只是在數以億計的數據中加入更多的數據。這有點像用圖形計算器來做高中的微積分作業——除非你真正理解微積分的原理,否則它沒什么用。

給Google翻譯輸入的數據從一百億增加到一萬億就能夠讓它變成人腦翻譯機了嗎?似乎不太可能。無論搜索引擎、圖片識別、回答問題、計劃、閱讀、寫作或者任何你寧愿要人腦而不是電腦來完成的任務而言,都是一樣的道理。

在越來越商業化的人工智能界,包括諾維格在內,人們就算沒有隱約感到害怕,也至少是清楚認識到了危機所在?!拔覀兤鋵嵖梢援嬕粭l曲線看看:隨著數據量變大,系統是否會越來越好?答案是,系統依然會變好但進步的幅度明顯變小了?!?/span>

詹姆斯·馬歇爾(James Marshall)是侯世達以前的學生,對他而言道理很簡單,“最終能帶你走向終點的,一定是艱難的那條路。”

侯世達到了三十五歲才開始他第一段長期穩定的感情。他說自己生來“諧振曲線就很窄”,借用了一個物理學概念來形容他的極度挑剔。“的確有一些女人曾對我產生重大影響;她們的臉蛋對我的影響意義重大。我也沒法給你細說具體的長相。但這種情況很少見?!?980年,在度過了他口中“十五年黯淡無光的缺愛歲月”之后,他遇到了卡羅爾·布拉什(Carol Brush)。相識不久,兩人便結婚,并生下兩個小孩。1993年,他們一家到意大利度假時,卡羅爾突然因為腦瘤去世。丹尼和莫妮卡當時分別五歲和兩歲?!拔夷芨械剿诳_爾去世之后彷徨了很久。”侯世達多年的好友潘迪·卡納瓦(Pentti Kanerva)說。

侯世達整整三十年都沒有參加過人工智能界的大會。“我和那些人沒辦法溝通,”他提起他的同行時這么說道,“完全不行。雖說我稱他們為同行,但其實也不能算作同行——我們都沒法進行交談?!?/strong>

侯世達不經意間會讓我覺得有點難相處。他人很好,但并不健談,也不像受歡迎的老師一樣,會擷取你所說的話中最精彩的部分——將你的觀點融入他們的思想,就好像你的觀點對于他們的論證來說不可缺一般。我旁聽了侯世達和學生們的一場圓桌討論會,他幾乎不曾改變自己的觀點,似乎僅僅是來求得他人的認同的。討論會從一開始就像是他群發給記者的一封郵件,他似乎只對最熱情的回復還以最熱情的回應。

“我不喜歡開會,”他對我說,“我不喜歡去參加會議,然后遇到一群固執己見的人,他們的想法我不同意,我的想法他們又不理解。我只想和能有共鳴的人交談。”

從十五歲左右開始,侯世達每十年就會讀一遍《麥田里的守望者》。在2011年的秋天,他在本科生研討課上講述“為什么塞林格的《麥田里的守望者》是一本偉大的小說?”他對霍爾頓·考爾菲德有一種感同身受的親切感。當我提到我高中班上許多同學都不喜歡霍爾頓——他們認為他就只知道抱怨——侯世達解釋說“那或許是因為他們沒有看到他的脆弱”。想象一下侯世達像霍爾頓在小說開頭一樣,獨自站在山頂,看著同學們在山下踢球嬉鬧。“我已經有夠多想法了,”侯世達告訴我說,“并不需要外界的激勵。”

當然了,遠離紛爭帶來的后果是你也沒法參與討論?!翱茖W界很少會有非黑即白的情況,”侯世達過去的學生鮑勃·弗蘭治(Bob French)說,“從板塊構造說到進化論,一切想法都需要有人為其抗爭,因為人們不會輕易同意或接受這些想法。在學術界的混戰中,如果你不捍衛自己的想法,就只能接受被忽視的命運,而其他人如果積極為自己的觀點抗爭,即使不太好的想法也可能成為主流?!?/span>

侯世達從來都不想爭取,也不必爭取,這可以說是他事業的雙刃劍。三十五歲獲得普利策獎之后,他立馬成為了學校的寵兒,獲得終身教職。他不需要在期刊發表論文;不需要讓人審核自己的文章,也不需要回應他人的評論。他的出版社基本書局(Basic Books)隨時愿意出版他的任何作品。

斯圖亞特·羅素很直白地說:“在學術界,并不是說你坐在浴缸里靈光一現,然后其他人就會對你的發現欣喜若狂,奔走相告。也許再過五十年,我們會說,我們當時真該聽侯世達的。但努力讓人們理解并認可自己的想法是任何一個科學家的職責。”

侯世達常常說,“我只是覺得生命短暫。我只想做我的研究,能不能發表無所謂。”他曾跟我說過一個類比。他說愛因斯坦在1905年的時候就提出了光子假說,但一直到1923年才有人接受。“整整十八年,只有愛因斯坦一個人相信光是作為粒子存在的。”

“一定非常孤獨。”

英文鏈接:

www.theatlantic.com/magazine/archive/2013/11/the-man-who-would-teach-machines-to-think/309529/

本文轉載自微信公眾號“利維坦”。譯文原載于《新知》雜志

文章來源:樸返


IEEE Spectrum

《科技縱覽》

官方微信公眾平臺



往期推薦

機器學習預測房價

無人機運送人體器官

斯坦福機器人制造者吳恩達:

生活中的機器人,將是專用機器人

主站蜘蛛池模板: 东城区| 原阳县| 河北区| 兰溪市| 天柱县| 湟源县| 玉溪市| 梅州市| 云梦县| 邓州市| 九江市| 海兴县| 安新县| 十堰市| 万年县| 博湖县| 乌拉特中旗| 宜兰县| 双辽市| 合作市| 济宁市| 嘉兴市| 钦州市| 宁武县| 微博| 永吉县| 防城港市| 托克托县| 明水县| 新龙县| 镇沅| 大洼县| 阿拉善左旗| 萨迦县| 射阳县| 宜宾市| 屏东市| 隆化县| 涿鹿县| 永昌县| 南漳县|