
━━ ━━
一項新研究指出,谷歌的兄弟公司DeepMind的人工智能系統偶然發現了一種新的方法,可以解決現代計算的核心數學問題。研究人員表示,該系統的性能優于已有50多年沒有得到改進的算法。
該方法涉及修改DeepMind的AlphaZero,AlphaZero是一款擊敗了國際象棋和圍棋大師的游戲引擎。其工作原理是被稱為矩陣的數字網格相乘,這也是處理圖像、識別語音命令、訓練神經網絡、運行天氣預測仿真和在互聯網上壓縮共享數據的關鍵運算。
“發現新的矩陣乘法算法可能有助于加快這些應用的速度。”該研究的主要作者、DeepMind的研究科學家阿爾胡賽因?法茲(Alhussein Fawzi)說,DeepMind是谷歌母公司Alphabet的子公司,總部位于倫敦。
一對2×2的矩陣相乘,標準技術需要8步。1969年,德國數學家沃爾克?斯特拉森(Volker Strassen)提出了一種方法,只需要7步。法茲說,減少一個步驟,效率就會高很多,但幾十年來,沒有人能夠將斯特拉森的算法突破應用到更大的矩陣乘法,哪怕是一對3×3的矩陣。“我從一開始就感覺到,機器學習在這個領域有很大的幫助,可以發現最佳模式,即矩陣中結合哪些條目和如何結合這些條目,從而獲得正確的結果。”
在新研究中,法茲及其同事研究AI如何幫助自動發現新的矩陣乘法算法。他們以斯特拉森的研究為基礎,該研究側重于將矩陣乘法張量的3D數組分解為基本分量。為掌握國際象棋、圍棋和其他游戲,科學家開發了AlphaZero,在此基礎上,他們又開發了名為AlphaTensor的AI系統。他們將分解張量的問題轉化為一個單人游戲,并訓練AlphaTensor找到贏得比賽的有效方法。
法茲的團隊指出,該游戲極具挑戰性。AlphaTensor必須考慮的算法數量遠遠超過宇宙中原子的數量,即使對小規模矩陣乘法來說也是如此。在一個場景中,游戲的每一步都有超過1033種可能的走法。
“搜索空間是巨大的。”法茲說。
AI系統在開始運行時并不知道現有的矩陣乘法算法。通過反復玩游戲并從結果中學習,它逐步改進提升。法茲說:“對于矩陣乘法這樣的基礎任務,AlphaTensor是首個發現新穎、高效且正確的算法的AI系統。”
該系統最終發現,它檢驗過的每種尺寸的矩陣中都有數千個矩陣乘法算法,說明矩陣乘法算法的領域比以往想象得更豐富,其中包括比已知算法更快的算法。例如,AlphaTensor發現了一種算法,完成4×4矩陣只需47步,改進了已有50年歷史的斯特拉森算法(需49步)。
法茲回憶道:“第一次看到我們能夠改進已知算法,我們非常激動。”
這些新的算法具有不同的數學特性和許多潛在的應用。為了發現可在給定硬件設備(例如英偉達V100 GPU或谷歌TPU v2)上快速運行的算法,科學家們修改了AlphaTensor。他們發現,在相同硬件上,進行大矩陣相乘的算法比常用算法快10%到20%。
法茲說:“AlphaTensor提供了一個重要的概念驗證,即借助機器學習,我們能超越現有的最先進算法,因此,機器學習將在未來的算法發現領域中發揮基礎作用。相信在未來幾年里,我們將在機器學習的幫助下發現許多新算法,用于日常的基礎計算任務。”
最初,AlphaTensor對其處理的問題一無所知。這提出了一個有趣的未來方向,或許可以將其與嵌入相關問題的數學知識相結合,“這將有可能使系統進一步擴展。”法茲說。
此外,法茲說:“我們還想將AlphaTensor應用到計算機科學的其他基礎運算中。計算機科學和數學中的許多問題與我們研究中的問題有相似之處,因此我們相信自己的論文將有所幫助,未來在機器學習的助力下,數學和計算機科學領域將產生新的結果。”
科學家們于2022年10月5日在《自然》雜志上詳細介紹了該項研究成果。
作者:Charles Q. Choi
IEEE Spectrum
《科技縱覽》
官方微信公眾平臺