DeepMind在數(shù)學(xué)游戲中獲勝

━━ ━━

一項(xiàng)新研究指出,谷歌的兄弟公司DeepMind的人工智能系統(tǒng)偶然發(fā)現(xiàn)了一種新的方法,可以解決現(xiàn)代計(jì)算的核心數(shù)學(xué)問(wèn)題。研究人員表示,該系統(tǒng)的性能優(yōu)于已有50多年沒(méi)有得到改進(jìn)的算法。

該方法涉及修改DeepMind的AlphaZero,AlphaZero是一款擊敗了國(guó)際象棋和圍棋大師的游戲引擎。其工作原理是被稱為矩陣的數(shù)字網(wǎng)格相乘,這也是處理圖像、識(shí)別語(yǔ)音命令、訓(xùn)練神經(jīng)網(wǎng)絡(luò)、運(yùn)行天氣預(yù)測(cè)仿真和在互聯(lián)網(wǎng)上壓縮共享數(shù)據(jù)的關(guān)鍵運(yùn)算。

“發(fā)現(xiàn)新的矩陣乘法算法可能有助于加快這些應(yīng)用的速度。”該研究的主要作者、DeepMind的研究科學(xué)家阿爾胡賽因?法茲(Alhussein Fawzi)說(shuō),DeepMind是谷歌母公司Alphabet的子公司,總部位于倫敦。

一對(duì)2×2的矩陣相乘,標(biāo)準(zhǔn)技術(shù)需要8步。1969年,德國(guó)數(shù)學(xué)家沃爾克?斯特拉森(Volker Strassen)提出了一種方法,只需要7步。法茲說(shuō),減少一個(gè)步驟,效率就會(huì)高很多,但幾十年來(lái),沒(méi)有人能夠?qū)⑺固乩乃惴ㄍ黄茟?yīng)用到更大的矩陣乘法,哪怕是一對(duì)3×3的矩陣。“我從一開始就感覺(jué)到,機(jī)器學(xué)習(xí)在這個(gè)領(lǐng)域有很大的幫助,可以發(fā)現(xiàn)最佳模式,即矩陣中結(jié)合哪些條目和如何結(jié)合這些條目,從而獲得正確的結(jié)果。”

在新研究中,法茲及其同事研究AI如何幫助自動(dòng)發(fā)現(xiàn)新的矩陣乘法算法。他們以斯特拉森的研究為基礎(chǔ),該研究側(cè)重于將矩陣乘法張量的3D數(shù)組分解為基本分量。

為掌握國(guó)際象棋、圍棋和其他游戲,科學(xué)家開發(fā)了AlphaZero,在此基礎(chǔ)上,他們又開發(fā)了名為AlphaTensor的AI系統(tǒng)。他們將分解張量的問(wèn)題轉(zhuǎn)化為一個(gè)單人游戲,并訓(xùn)練AlphaTensor找到贏得比賽的有效方法。

法茲的團(tuán)隊(duì)指出,該游戲極具挑戰(zhàn)性。AlphaTensor必須考慮的算法數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)宇宙中原子的數(shù)量,即使對(duì)小規(guī)模矩陣乘法來(lái)說(shuō)也是如此。在一個(gè)場(chǎng)景中,游戲的每一步都有超過(guò)1033種可能的走法。

“搜索空間是巨大的。”法茲說(shuō)。

AI系統(tǒng)在開始運(yùn)行時(shí)并不知道現(xiàn)有的矩陣乘法算法。通過(guò)反復(fù)玩游戲并從結(jié)果中學(xué)習(xí),它逐步改進(jìn)提升。法茲說(shuō):“對(duì)于矩陣乘法這樣的基礎(chǔ)任務(wù),AlphaTensor是首個(gè)發(fā)現(xiàn)新穎、高效且正確的算法的AI系統(tǒng)。”

該系統(tǒng)最終發(fā)現(xiàn),它檢驗(yàn)過(guò)的每種尺寸的矩陣中都有數(shù)千個(gè)矩陣乘法算法,說(shuō)明矩陣乘法算法的領(lǐng)域比以往想象得更豐富,其中包括比已知算法更快的算法。例如,AlphaTensor發(fā)現(xiàn)了一種算法,完成4×4矩陣只需47步,改進(jìn)了已有50年歷史的斯特拉森算法(需49步)。

法茲回憶道:“第一次看到我們能夠改進(jìn)已知算法,我們非常激動(dòng)。”

這些新的算法具有不同的數(shù)學(xué)特性和許多潛在的應(yīng)用。為了發(fā)現(xiàn)可在給定硬件設(shè)備(例如英偉達(dá)V100 GPU或谷歌TPU v2)上快速運(yùn)行的算法,科學(xué)家們修改了AlphaTensor。他們發(fā)現(xiàn),在相同硬件上,進(jìn)行大矩陣相乘的算法比常用算法快10%到20%。

法茲說(shuō):“AlphaTensor提供了一個(gè)重要的概念驗(yàn)證,即借助機(jī)器學(xué)習(xí),我們能超越現(xiàn)有的最先進(jìn)算法,因此,機(jī)器學(xué)習(xí)將在未來(lái)的算法發(fā)現(xiàn)領(lǐng)域中發(fā)揮基礎(chǔ)作用。相信在未來(lái)幾年里,我們將在機(jī)器學(xué)習(xí)的幫助下發(fā)現(xiàn)許多新算法,用于日常的基礎(chǔ)計(jì)算任務(wù)。”

最初,AlphaTensor對(duì)其處理的問(wèn)題一無(wú)所知。這提出了一個(gè)有趣的未來(lái)方向,或許可以將其與嵌入相關(guān)問(wèn)題的數(shù)學(xué)知識(shí)相結(jié)合,“這將有可能使系統(tǒng)進(jìn)一步擴(kuò)展。”法茲說(shuō)。

此外,法茲說(shuō):“我們還想將AlphaTensor應(yīng)用到計(jì)算機(jī)科學(xué)的其他基礎(chǔ)運(yùn)算中。計(jì)算機(jī)科學(xué)和數(shù)學(xué)中的許多問(wèn)題與我們研究中的問(wèn)題有相似之處,因此我們相信自己的論文將有所幫助,未來(lái)在機(jī)器學(xué)習(xí)的助力下,數(shù)學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域?qū)a(chǎn)生新的結(jié)果。”

科學(xué)家們于2022年10月5日在《自然》雜志上詳細(xì)介紹了該項(xiàng)研究成果。

作者:Charles Q. Choi

IEEE Spectrum

《科技縱覽》

官方微信公眾平臺(tái)






往期推薦
馬克思的數(shù)學(xué)手稿
埃隆 ? 馬斯克的“智能游戲”
來(lái)自下方的電源,埋入式互連裝置將幫助拯救摩爾定律