生成模型(Generative Model)是機(jī)器學(xué)習(xí)領(lǐng)域的重要課題和研究前沿,也被認(rèn)為是通往人工智能的必由之路。歷史上,物理學(xué)為生成型學(xué)習(xí)提供了很多新思路。比如,著名的玻爾茲曼機(jī)(Boltzmann Machine)就來自于統(tǒng)計(jì)物理中的伊辛模型及相關(guān)的反伊辛問題。
━━━━
最近,中國科學(xué)院物理研究所/北京凝聚態(tài)物理國家研究中心研究員范桁、副研究員王磊以及合作者從量子物理的玻恩詮釋中獲得啟發(fā),提出了一類新穎的概率生成模型——玻恩機(jī)(Born Machine)。玻恩機(jī)自然地將研究多體波函數(shù)的量子糾纏視角引入機(jī)器學(xué)習(xí)問題中,是量子機(jī)器學(xué)習(xí)領(lǐng)域的新方向。這項(xiàng)工作采用量子多體計(jì)算中的張量網(wǎng)絡(luò)算法學(xué)習(xí)經(jīng)典數(shù)據(jù)的生成概率。該工作于近期發(fā)表在Physical Review X 雜志上。
生成模型的研究重點(diǎn)是如何從給定的數(shù)據(jù)集合中學(xué)習(xí)到數(shù)據(jù)的聯(lián)合概率分布,以及如何依據(jù)學(xué)習(xí)到的概率分布高效地生成新的樣本。研究團(tuán)隊(duì)提出利用量子波函數(shù)的概率幅模平方來編碼經(jīng)典數(shù)據(jù)的概率分布。進(jìn)一步,他們提出在經(jīng)典計(jì)算機(jī)上使用矩陣乘積態(tài)(Matrix Product States)來模擬學(xué)習(xí)波函數(shù)的過程。矩陣乘積態(tài)的參數(shù)可以通過類似于密度矩陣重正化群的算法進(jìn)行學(xué)習(xí),最終形成一個(gè)具有泛化能力的生成模型。基于矩陣乘積態(tài)的學(xué)習(xí)算法結(jié)合了不同領(lǐng)域各自的優(yōu)點(diǎn):它不僅可以利用圖形處理器(Graphic Processing Unit)高效地學(xué)習(xí)到模型參數(shù),還可以在學(xué)習(xí)過程中靈活動態(tài)地調(diào)節(jié)模型的表達(dá)能力。此外,與傳統(tǒng)的基于統(tǒng)計(jì)物理的生成模型(例如玻爾茲曼機(jī))相比,玻恩機(jī)可以直接抽樣產(chǎn)生無統(tǒng)計(jì)關(guān)聯(lián)的樣本,從而高效地生成新的數(shù)據(jù)或?qū)?shù)據(jù)補(bǔ)全。
基于量子態(tài)的概率生成模型結(jié)合了量子物理與機(jī)器學(xué)習(xí)的思想,是一個(gè)嶄新的研究領(lǐng)域。玻恩機(jī)借助量子態(tài)內(nèi)稟的概率解釋、強(qiáng)大的表達(dá)能力和相對應(yīng)的高效學(xué)習(xí)算法,為機(jī)器學(xué)習(xí)的研究提供了新思路。展望將來,最令人興奮的應(yīng)用前景是在一臺量子處理器(Quantum Processing Unit)上實(shí)現(xiàn)玻恩機(jī),從而以全新的方法對自然圖片和語言進(jìn)行概率建模和學(xué)習(xí)。
研究團(tuán)隊(duì)還包括北京大學(xué)物理學(xué)院的本科生韓兆宇和王峻(共同一作),以及中科院理論物理研究所副研究員張潘。此工作受到科技部(2016YFA0300603)和自然科學(xué)基金委(11774398)的資助。
文章來源:物理研究所 理論物理研究所
IEEE Spectrum
《科技縱覽》
官方微信公眾平臺
往期推薦