雨林在燃燒,冰川在消融,甚至南極的企鵝都在經歷著從未有過的炎熱。前陣子,BBC攝影師在南極拍攝時接受采訪稱“這里很熱”,他們目睹了全球變暖對這里造成的影響,想到這些動物將要面臨的未來,掉下了眼淚。“全球變暖”的話題一直在被熱議。近日,世界氣象組織(WMO)發布了一篇報告,稱2010-2019這10年可以說是“有記錄以來最暖的10年”。人工智能的發展如火如荼,模型訓練時間越來越久,數據集越來越大,機器學習持續被指責——“已經成為了‘碳排放’的重要來源之一”。今年6月的一篇論文指出,機器學習正帶來巨量碳負債,模型訓練二氧化碳排放的相關數據大得驚人。根據論文中的相關計算,完成一個被稱為神經結構搜索的高級轉換模型的訓練和優化,需要排放大約284噸二氧化碳。論文鏈接:
https://arxiv.org/pdf/1906.02243.pdf284噸二氧化碳確實量很大,但人工智能真的應該為“全球變暖”背鍋嗎?TFIE Strategy Inc.的首席戰略官、清潔能源專家Michael Barnard對這篇論文的碳排放計算數據進行了新的評估,并提出了新的結論。他認為,我們當然不該忽視機器學習帶來的碳負債,但考慮到模型的復用價值,機器學習的碳負債遠沒有論文中估計的那么糟糕。Michael文章合集:
https://cleantechnica.com/author/mikebarnard/提出相反意見前,讓我們先來回顧一下6月份這篇研究,以及基于它所做出的假設。這篇論文于今年6月由Strubell、Ganesh和McCallum發表在馬薩諸塞大學阿姆赫斯特分校,文中研究了NLP中深度學習相關的能源和政策問題。雖然這篇論文能夠讓產業界反思人工智能的碳排放,但是卻忽略了一個重要事實,神經網絡模型訓練得少,使用的多。以特斯拉的機器學習模型為例,盡管訓練模型需要一定的消耗,但是一旦完成,目前有超過50萬輛搭載這一神經網絡芯片的汽車使用這一模型。所以,在考慮訓練神經網絡產生的“碳債務“時,必須要考慮到實際執行的次數以及最終目標。如果我們把每輛特斯拉汽車都與一臺油車比較,搭載神經網絡芯片必然會提高汽車的運行效率,那么這類機器學習應用就很值得。Michael Barnard認為,好的機器學習模型能從根本改變碳排放。之前,Michael Barnard寫過一篇文章探討機器學習模型CoastalDEM,用于判斷海平面上升風險。
文章鏈接:
https://cleantechnica.com/2019/11/04/southern-florida-among-spots-at-greater-risk-due-to-sea-level-rise-finds-new-machine-learning-study/在CoastalDEM之前,一直以來,判斷海平面上升情況的傳統方法是通過美國航空航天局(NASA)和國防部國家測繪局(NIMA)聯合測量的SRTM數據,這種方法得出的海拔數據的正垂直偏差會大大低估沿海洪水的風險和暴露程度。今年10月,Scott A. Kulp和Benjamin H. Strauss在自然科學期刊《nature communications》發表了一篇論文,題目為《CoastalDEM:使用神經網絡從SRTM改進得到的全球沿海數字高程模型》。在預測海平面上升風險時,雖然CoastalDEM會帶來相對高一些的碳負債,但是其得到的預測結果要比SRTM準確得多。
到2050年,傳統模型預測的佛羅里達州南部海平面上升風險圖示
使用CoastalDEM更新后的海平面上升風險圖示在這個案例中,CoastalDEM獲取了北美衛星雷達沿海高程數據,并用來自激光雷達的地面實況對其進行了訓練,同時使用澳大利亞激光雷達進行了驗證,然后將應用范圍擴張到全世界。該模型僅執行了幾次,但最終得到的是調整后的沿海海拔靜態數據集,該數據集已在全球范圍內用于政策和氣候行動計劃。在這種情況下,Michael認為CoastalDEM對氣候變化的精準預測以及可供多次利用的結果,帶來的價值超過了碳負債本身。Michael的另一篇文章評估了初創企業Heliogen聚光太陽能發電(CSP)的改進。文章鏈接:
https://cleantechnica.com/2019/11/22/heliogen-is-bill-gates-latest-venture-that-is-only-good-for-oil-gas-part-1/據外媒CNET報道,世界各地的城市不斷需要建造更多的建筑物,但是水泥和鋼鐵等材料的創建是造成碳排放的巨大因素。Bill Gates支持的初創企業Heliogen認為,解決這個問題的辦法在于將太陽能與人工智能相結合。Heliogen使用一種“先進的計算機視覺軟件”來校準“大陣列”鏡子,以將陽光反射到單個目標上。該公司補充說,它最終將能夠產生1500攝氏度的太陽能,從而可以制造出完全清潔的氫氣。Michael發現雖然機器學習的部分很有趣并且可以在其他領域重用,但最終結果產生的價值不大。而且,機器學習提高了CSP加熱效果的案例并未經證實。接下來,讓我們從計算數據入手,詳細看看開頭提到的這項研究所做的假設。(以下部分內容涉及大量數據討論,不感興趣的讀者可以酌情跳過。)
該論文假設模型訓練的假設值為CO2e = 0.954pt(每千瓦時0.954磅二氧化碳當量)。這是美國的平均水平,而當Michael看到的時侯,他認為這個值可能被夸大了。為此,Michael首先將當前每千瓦時二氧化碳量的數據匯總在一起。從圖中可以看出,美國的平均值掩蓋了計算能力方面的巨大差異。一個在Washington被訓練的模型,如果使用直接的電網供電,它的碳負債只有在Wyoming接受培訓的模型的十分之一。Michael的假設是,論文中的許多模型都以加州為基地,而來自加州電網的每千瓦時0.47磅二氧化碳當量僅為美國平均水平的50%。在確定了這一點之后,Michael又深入了一步。他在論文中查看了每一個主要的碳負債計算模型,以了解它們實際上在哪里進行訓練,假設至少有一兩個會在谷歌數據中心接受培訓,谷歌有100%的可再生承諾和補償。而結果大大出乎Michael的預料。
不同論文中提到的模型及其相關訓練產生的碳負債當深入研究所用的計算資源時可以發現,除一種情況外,它們都是用谷歌或微軟Azure訓練的。第3至第6列是本文估計與可能的精確值之間的方差計算。需要明確的是,NAS Evolved Transformer模型仍然可以看到10噸的CO2e,這是相當可觀的,但僅占研究結論的一小部分。今年早些時候,Michael根據公開數據進行了粗略評估,哪些云計算廠商有碳債務,分別是多少?評估發現,在最大的云提供商中,谷歌和微軟Azure的碳債務是迄今為止最低的,它們致力于實現100%碳中和電力,還購買了高品質的碳補償產品。這類企業的運作完全基于風能、太陽能和水電,這使每千瓦時的二氧化碳排放量降低至0.033磅左右。AWS的可再生資源率其實還不夠好,但在2018年,其數據中心的可再生能源占比仍然達到了50%,這意味著其運營排放遠遠低于美國的平均水平。該論文作者則使用了另一種方法來評估數據中心負載——2017年綠色和平組織關于該主題的報告數據。盡管來源可靠,但報告本身使用的數據是實際購買的電力來源的組合百分比。這樣的數據會導致所有主要的云提供商購買的低碳電力比電網的平均水平要高得多,但同時他們仍必須購買由煤炭和天然氣生成的電力。無需質疑綠色和平組織的調查方法,但Michael發現,谷歌和微軟大量購買可再生電力的事實與聲稱其數據中心大量使用天然氣和煤炭發電的說法之間存在很大差異。Michael及其團隊認為,谷歌和微軟正在從可再生能源中購買足夠的電力供其開展業務,但綠色和平組織并未在報告中明確指出。但論文假設的最大問題并不在此。這個假設是,由于亞馬遜的AWS是最受歡迎的云計算平臺,并且其由綠色和平組織計算的細分能源消耗與美國的總體細分大致相同,因此美國的平均值是合適的。但從上表的評估結果可以看出,評估的模型中并沒有使用Amazon的云計算平臺,所以之一結果的可靠性存疑。當然,Michael最后也指出,盡管應該重新考慮相關數據,但是我們仍然應該重視這項研究提出的問題。全球變暖造成的危害,我們能看到的僅僅是冰山一角。盡管科技的進步無人能夠組織,但科技發展與環境保護必須并重。注:Michael稱已經聯系了該研究的主要作者進行評論。如果得到他們的回復,文章將會更新,文摘菌也將持續跟進。相關報道:
https://cleantechnica.com/2019/11/30/no-machine-learning-does-not-have-a-huge-carbon-debt/IEEE Spectrum
《科技縱覽》
官方微信公眾平臺