肖恩?詹姆斯(Sean James)在微軟的數(shù)據(jù)中心從事技術(shù)工作,當(dāng)他向公司提出將服務(wù)器群組完全放到水下時(shí),他的同事有點(diǎn)半信半疑。但對(duì)于之前在美國海軍潛艇服役過的詹姆斯來說,將整個(gè)數(shù)據(jù)中心淹沒在海浪之下意義非凡。●他認(rèn)為,這種策略不僅能降低冷卻機(jī)器所需的成本(對(duì)許多數(shù)據(jù)中心運(yùn)營商來說這是一筆巨大的開銷),還能降低建設(shè)成本,而且可以更方便地使用可再生能源運(yùn)行這些設(shè)施,甚至提高數(shù)據(jù)中心的性能。
詹姆斯與微軟的另一位工程師托德?羅林斯(ToddRawlings)一起,在微軟內(nèi)部發(fā)放了一份白皮書,宣傳這一概念。白皮書解釋了在水下構(gòu)建數(shù)據(jù)中心會(huì)如何幫助微軟及其他云提供商在環(huán)境可承受的條件下管理不斷增長的數(shù)據(jù)中心。
在很多大公司,這樣奇怪的想法恐怕早就不了了之了。但微軟的研究人員歷來喜歡通過創(chuàng)新來迎戰(zhàn)公司所面臨的重要挑戰(zhàn),即使所需的工作遠(yuǎn)遠(yuǎn)超出微軟的核心專長。關(guān)鍵點(diǎn)在于聚集公司內(nèi)外的專業(yè)人員,組建工程隊(duì)伍。
我們4個(gè)人組成了這樣一個(gè)核心團(tuán)隊(duì),負(fù)責(zé)測(cè)試詹姆斯的遠(yuǎn)大想法。2014年8月,我們很快啟動(dòng)了該計(jì)劃,稱之為內(nèi)蒂克(Natick)項(xiàng)目。這樣稱呼并沒有特別原因,只是因?yàn)槲覀兊难芯繄F(tuán)隊(duì)喜歡以馬薩諸塞州的城市給項(xiàng)目命名。僅僅12個(gè)月后,我們就構(gòu)建了一個(gè)位于太平洋底的數(shù)據(jù)中心原型。
━━ ━━
內(nèi)蒂克項(xiàng)目不乏種種需要克服的障礙。首先,當(dāng)然是保持?jǐn)?shù)據(jù)中心大型鋼容器內(nèi)部的干燥;其次是找出利用周圍海水冷卻內(nèi)部服務(wù)器的最佳方法;最后還有一個(gè)問題是,如何處理會(huì)不可避免地粘在水下容器上的藤壺及其他海洋附著生物——如果有人將船只在水中放置一段時(shí)間,一定會(huì)很熟悉這種現(xiàn)象。粘性甲殼類生物將是一大挑戰(zhàn),因?yàn)檫@類生物可能干擾服務(wù)器與周圍海水之間的熱傳遞。最初,這些問題使我們頗為沮喪,但我們逐一解決,采用的辦法通常是那些歷經(jīng)檢驗(yàn)的海洋工業(yè)解決方案。
但是,何苦自找麻煩?確實(shí),使用海水冷卻計(jì)算機(jī)可以降低空調(diào)成本,還可以在其他方面改進(jìn)操作,但是把數(shù)據(jù)中心放入水中也明顯會(huì)增加一些成本,并帶來不便。試圖把數(shù)以千計(jì)的計(jì)算機(jī)放在海底真的有意義嗎?我們認(rèn)為有意義,原因如下。
舉例來說,它可以為像我們這樣的公司隨時(shí)隨地提供快速擴(kuò)容的能力。企業(yè)規(guī)劃人員無須因未來可能需要擴(kuò)容就早早地建設(shè)這些設(shè)施。對(duì)于這樣一個(gè)每年需要花費(fèi)數(shù)十億美元來構(gòu)建不斷增長的數(shù)據(jù)中心的行業(yè),快速擴(kuò)容可以極大地節(jié)約成本。
相比于陸地,在水下可更快地建造數(shù)據(jù)中心,原因很容易理解。如今,每個(gè)數(shù)據(jù)中心的建設(shè)都是獨(dú)特的。設(shè)備或許相同,但每個(gè)地方的建筑規(guī)范、稅收、氣候、勞動(dòng)力、電力供應(yīng)和網(wǎng)絡(luò)連接都不同。這些變量影響著建設(shè)的時(shí)長。我們還注意到它們對(duì)設(shè)備性能的影響,相同的設(shè)備在不同的地點(diǎn),可靠性水平也不盡相同。
正如我們所見,內(nèi)蒂克項(xiàng)目現(xiàn)場(chǎng)有很多大鋼瓶“吊艙”,每個(gè)吊艙可能包含幾千臺(tái)服務(wù)器。它們一起組成了水下數(shù)據(jù)中心,距離海岸幾公里,位于海平面以下50~200米之間的位置。吊艙可以懸浮在海床上方的某一深度,通過電纜系泊到海底;也可以直接被擱置在海底。
一旦數(shù)據(jù)中心吊艙部署完畢,它將保持原地不動(dòng),直到需要淘汰其內(nèi)部的服務(wù)器群組;或者直到市場(chǎng)條件發(fā)生改變,我們決定將其轉(zhuǎn)移到其他地方。這是一個(gè)真正的“熄燈”環(huán)境,意味著系統(tǒng)管理員將進(jìn)行遠(yuǎn)程管理,在整個(gè)吊艙運(yùn)行生命周期內(nèi),沒人進(jìn)行零件修復(fù)或更換。
現(xiàn)在,想象一下,將即時(shí)制造應(yīng)用于這個(gè)概念。吊艙可以在工廠中建造,裝備好服務(wù)器,準(zhǔn)備運(yùn)往世界各地。與陸地上的情況不同,海洋的環(huán)境非常單一,無論身處哪里,環(huán)境都是一樣的。因此,不需要定制吊艙,當(dāng)任何地方出現(xiàn)計(jì)算容量不足時(shí),我們都可以快速安裝吊艙,通過逐漸增加水下安裝的規(guī)模來滿足容量增長的需求。內(nèi)蒂克項(xiàng)目的目標(biāo)是,有能力在世界任何地方的沿海地點(diǎn)建立和運(yùn)行數(shù)據(jù)中心,而安裝期縮短至(從決定部署時(shí)刻起的)90天以內(nèi)。
━━ ━━
大部分新數(shù)據(jù)中心建造在電價(jià)便宜、氣候涼爽、地價(jià)不高以及不打擾附近居民的地方。這種方法的問題是,數(shù)據(jù)中心常常遠(yuǎn)離人口中心,因此限制了服務(wù)器響應(yīng)請(qǐng)求的速度。
對(duì)在線互動(dòng)體驗(yàn)來說,這樣的延遲可能會(huì)產(chǎn)生問題。我們都希望網(wǎng)頁加載迅速,《我的世界》或《光暈》等視頻游戲反應(yīng)利落。未來幾年,會(huì)有越來越多互動(dòng)豐富的應(yīng)用程序,包括由微軟HoloLens及其他混合虛擬現(xiàn)實(shí)技術(shù)所實(shí)現(xiàn)的應(yīng)用。因此,人們真正希望的是服務(wù)器盡可能靠近它所服務(wù)的人群,而這種情況目前還很少見。
世界上幾乎一半的人口居住在距離海洋100公里以內(nèi)的區(qū)域,這或許是一個(gè)令人驚訝的事實(shí)。因此,將數(shù)據(jù)中心設(shè)置在靠近沿海城市的海岸附近,會(huì)比當(dāng)今的做法更接近用戶。
如果這個(gè)理由還不夠,那么請(qǐng)考慮節(jié)約下來的冷卻成本。
以往,這類設(shè)施靠機(jī)械冷卻(如同家用空調(diào))。設(shè)備通常可以將溫度保持在18~27攝氏度,但是用于冷卻的電量有時(shí)幾乎和計(jì)算機(jī)本身使用的電量一樣多。
最近,很多數(shù)據(jù)中心運(yùn)營商轉(zhuǎn)向自由空氣冷卻,也就是不使用機(jī)械方式來冷卻,而是單純地使用戶外空氣。這樣做更經(jīng)濟(jì),冷卻所需的開銷只有原先的10%到30%,但是這種做法意味著計(jì)算機(jī)容易受外部空氣溫度的影響,因?yàn)橛行┑胤较喈?dāng)熱。通常這也意味著不得不將數(shù)據(jù)中心置于高緯度地區(qū),遠(yuǎn)離人口中心。
此外,這些設(shè)施需要消耗大量的水,因?yàn)樗鼈円韧ㄟ^蒸發(fā)來略微降低空氣的溫度,然后空氣才吹向服務(wù)器。對(duì)于干旱多發(fā)地區(qū)來說,這是個(gè)難題,例如美國加利福尼亞。在有些地區(qū),人口的不斷增長耗盡了當(dāng)?shù)睾畬樱S多發(fā)展中國家都面臨類似的情況。即使水資源豐富,空氣中的水蒸氣也會(huì)使電子設(shè)備更易被腐蝕。
內(nèi)蒂克架構(gòu)繞過了上述這些問題。數(shù)據(jù)中心吊艙內(nèi)的標(biāo)準(zhǔn)計(jì)算機(jī)機(jī)架與熱交換器連接,熱交換器將氣體熱量傳遞給某種液體(可能是普通的水)。隨后液體被泵送到吊艙外部的熱交換器,外部的熱交換器又將熱量傳遞到海洋。經(jīng)冷卻的流動(dòng)液體隨后又被送入內(nèi)部熱交換器以重復(fù)該循環(huán)。
當(dāng)然,周圍的海水溫度越低,這個(gè)方案就越行之有效。即便在夏季或熱帶地區(qū),要想得到低溫的海水,也只需要將吊艙放在足夠深的地方。舉例來說,在佛羅里達(dá)東海岸200米深的地方,水溫全年保持在15攝氏度以下。
2015年8月開始,我們對(duì)內(nèi)蒂克吊艙原型進(jìn)行測(cè)試。我們將其命名為“LeonaPhilpot”(根據(jù)Xbox游戲角色命名)。吊艙被浸入加利福尼亞州圣路易斯奧比斯波附近太平洋下僅11米深的地方,水溫在14~18攝氏度之間。
長達(dá)105天的實(shí)驗(yàn)證明,將計(jì)算機(jī)放置水中,至少能維持與機(jī)械冷卻方法相當(dāng)?shù)臏囟龋渌枘芰勘茸杂煽諝饫鋮s法要低得多——只有后者的3%。這種能量消耗值低于我們已知的任何生產(chǎn)或?qū)嶒?yàn)數(shù)據(jù)中心的結(jié)果。
由于不需要現(xiàn)場(chǎng)工作人員,所以數(shù)據(jù)中心無需電燈、空氣、停車場(chǎng)以及針對(duì)緊急情況的紅色按鈕,數(shù)據(jù)中心吊艙中也沒有氧氣。(工作人員在舒適的微軟辦公室控制內(nèi)蒂克吊艙原型。)此外,這里也沒有水蒸氣和灰塵。這為電子產(chǎn)品提供了很好的環(huán)境,最大限度地減少了散熱和連接器腐蝕的問題。
━━ ━━
微軟致力于保護(hù)環(huán)境。例如,在滿足電力需求方面,公司盡可能多地使用可再生能源。在某種程度上做不到的時(shí)候,公司會(huì)購買碳補(bǔ)償。與這一理念一致,我們?cè)噲D將未來的水下數(shù)據(jù)中心部署在近海可再生能源附近——可以是海上風(fēng)電廠,或者是利用潮汐、海浪、洋流發(fā)電。
上述能源在海洋中極其豐富,這意味著我們可以將人群聚集地、水下節(jié)能設(shè)備的安置處,以及大量綠色能源的獲取地結(jié)合在一起。就像當(dāng)今的數(shù)據(jù)中心有時(shí)會(huì)是陸上可再生能源農(nóng)場(chǎng)的主力租戶一樣,未來的海洋能源農(nóng)場(chǎng)也可能如此。
另一個(gè)要考慮的因素是,有時(shí)獲得以傳統(tǒng)方式生成的電力并不容易,尤其是在發(fā)展中國家。例如,撒哈拉以南非洲地區(qū)有70%的人口無法接入電網(wǎng)。所以,如果想建立一個(gè)數(shù)據(jù)中心,使云服務(wù)更接近這些地區(qū)的人群,就可能還要為它提供電力。
通常,電力在10萬伏或更高的電壓下輸送,但最終服務(wù)器使用的是與我們常用的個(gè)人電腦相同的低電壓。將電網(wǎng)電力降低到服務(wù)器可以使用的電壓通常需要3個(gè)單獨(dú)的設(shè)備,還需要備用發(fā)電機(jī)和電池組,以防電網(wǎng)電力故障。
沿著近海能源安放水下數(shù)據(jù)中心有助于簡化工程師的工作。首先,以接近服務(wù)器的電壓生成電力,可以減少一定的電壓轉(zhuǎn)換量。其次,因?yàn)楠?dú)立風(fēng)力或船用渦輪機(jī)都能給計(jì)算機(jī)供電,我們自然而然就有了后備方案。這樣可以大大減少電損耗和資金成本(以及復(fù)雜性),因?yàn)闊o需常規(guī)數(shù)據(jù)中心架構(gòu)所涉及的備用設(shè)施(用于防止局部電網(wǎng)故障)。這種方式的另一個(gè)優(yōu)勢(shì)是,它對(duì)陸上的唯一真正影響就是需要一兩條用于傳輸數(shù)據(jù)的光纜。
━━ ━━
闡述想法時(shí),我們被問到的第一個(gè)問題都是:如何保持電子產(chǎn)品干燥?事實(shí)上,保持干燥并不難。很久以前,甚至早在計(jì)算機(jī)出現(xiàn)之前的很長時(shí)間,海洋工業(yè)就能夠保持海洋中設(shè)備的干燥,而海洋工業(yè)通常面臨的環(huán)境遠(yuǎn)比我們所做或計(jì)劃要做的事情更有挑戰(zhàn)性。
第二個(gè)問題(早期我們也在尋找答案的一個(gè)問題)是如何最有效地冷卻計(jì)算機(jī)。我們探索了一系列奇異的方式,包括使用特殊的介電液體和相變材料,以及特殊的熱傳輸介質(zhì),諸如高壓氦氣和超臨界二氧化碳。雖然這些方式各有好處,但也帶來了一些棘手的問題。
盡管我們?cè)诓粩嘌芯咳绾尾捎锰厥獠牧线M(jìn)行冷卻,但近期并非迫切需要這些材料。內(nèi)蒂克的淡水管道和散熱器式熱交換器提供了非常經(jīng)濟(jì)、高效的冷卻機(jī)制,正適合為標(biāo)準(zhǔn)服務(wù)器降溫。
更為重要的一個(gè)問題我們也預(yù)見到了,那就是水下數(shù)據(jù)中心會(huì)吸引海洋生物,形成人造礁石。海洋生物的這種聚居過程被稱為生物污損。這一過程從單細(xì)胞生物開始,其后是以這些單細(xì)胞生物為食的稍大的生物,以此類推,一直向食物鏈上層延伸。
部署內(nèi)蒂克原型后24小時(shí)內(nèi),螃蟹和魚就開始在容器周圍聚集。我們很高興為這些生物創(chuàng)造了一個(gè)家,所以我們主要的設(shè)計(jì)是考慮如何在不妨礙吊艙保持其計(jì)算機(jī)冷卻能力的情況下,維持這個(gè)生物棲息地。
尤其是,我們知道外部熱交換器上的生物淤積會(huì)妨礙其表面熱量的擴(kuò)散。因此我們探討了各種防污材料和涂層的使用——甚至包括聲音和紫外線等震懾生物的手段——希望生物難以在上附著。雖然可以使用物理方式清潔熱交換器,但依靠這種干預(yù)措施是不明智的,因?yàn)槲覀兊哪繕?biāo)是盡可能簡化操作。
幸運(yùn)的是,盡管是在一個(gè)極具挑戰(zhàn)的地帶(位于淺海,靠近海岸,那是海洋生命最豐富的地方),但內(nèi)蒂克吊艙上的熱交換器在其第一次部署期間保持得比較干凈。不過生物污損仍然是一個(gè)需要積極研究的領(lǐng)域,我們會(huì)側(cè)重于不傷害海洋環(huán)境的解決辦法。
━━ ━━
到目前為止,在測(cè)試部署期間,我們最擔(dān)心的是設(shè)備宕機(jī)。畢竟我們無法派技術(shù)員到某個(gè)服務(wù)器機(jī)架換掉壞掉的硬驅(qū)動(dòng)或網(wǎng)卡,對(duì)硬件故障的響應(yīng)必須遠(yuǎn)程或自主進(jìn)行。即便在微軟現(xiàn)在的數(shù)據(jù)中心,我們和其他人也一直在努力提高設(shè)備在沒有人為干預(yù)的情況下探測(cè)和解決故障的能力。而同樣的經(jīng)驗(yàn)和技術(shù),也將被應(yīng)用到未來的內(nèi)蒂克吊艙。
那么安全性如何呢?如果數(shù)據(jù)中心在水下,數(shù)據(jù)是否安全,是否可以通過網(wǎng)絡(luò)或物理方式被竊取?絕對(duì)安全。內(nèi)蒂克站點(diǎn)提供了與微軟陸地?cái)?shù)據(jù)中心相同的加密級(jí)別和其他安全保證。水下數(shù)據(jù)中心沒有人,傳感器會(huì)敏銳地感知內(nèi)蒂克吊艙周圍的環(huán)境,包括任何意想不到的訪客。
你可能想知道,來自水中數(shù)據(jù)中心的熱量是否會(huì)破壞當(dāng)?shù)氐暮Q蟓h(huán)境。答案是不太可能。內(nèi)蒂克吊艙產(chǎn)生的熱量會(huì)迅速與冷水混合并被潮流帶走。距離內(nèi)蒂克吊艙下部幾米處的水溫最多增加千分之幾攝氏度。
所以對(duì)環(huán)境的影響將是微乎其微的。這點(diǎn)很重要,因?yàn)槲磥肀厝粫?huì)建造更多的數(shù)據(jù)中心。如果我們的方法有效,并最終被大量采用,可能人們也不會(huì)看到那些數(shù)據(jù)中心,因?yàn)樗鼈冊(cè)谒鹿ぷ鳌?/span>
作者:Ben Cutler, Spencer Fowers, Jeffrey Kramer,Eric Peterson
往期推薦