20年的阿里、10年的阿里云,阿里邁向AI也有5年歷史,技術成為阿里巴巴的基因。9月26日上午阿里云主論壇·飛天智能上,阿里云直接獻上了賈揚清、華先勝等十位科學家來全面展示AI能力,不知不覺中,阿里已經成為最大的一家AI公司。
沒想到阿里巴巴已成為一家名副其實的科技巨頭,而這背后是多年來的扎實部署,阿里云是拐點一、達摩院是拐點二、平頭哥是拐點三。9月26日上午云棲大會阿里云主論壇·飛天智能上,阿里的科學家們帶來了阿里AI能力的集體亮相。比起5年前在納斯達克上市的情景——7 位敲鐘人全是阿里電商的買家和賣家,這次主論壇所有演講者全部是AI界“大神”級別的科學家,科技已是成為阿里的基因。阿里巴巴集團首席技術官兼阿里云智能總裁張建鋒曾說過:在很早之前他就堅定的認為,阿里巴巴一直是技術性公司,只是商業做得太成功了,所以人家搞不清楚阿里的底色。所謂的技術底色是不能摻假的實際成果,無論是在學術亦或產業,都要符合技術領域應有的標準,無關已有成就與名氣。阿里云主論壇·飛天智能上,阿里亮出了技術成果:- 平頭哥發布全球最強AI芯片含光800,打破業界紀錄,性能及能效比全球第一
- 全球前三、亞太第一的阿里云已構建起亞洲種類最全、規模最大的人工智能集
- 日處理圖像10億張、日處理視頻120萬小時、日處理語音55萬小時、日處理自然語言5千億句
- 達摩院在國際頂級學術會議上累計發表450多篇論文,在自然語言處理、智能語音、視覺計算等領域算法奪得40多項世界第一
Talk is cheap, show me the tech. 阿里的自研路:阿里云10年“飛天”、平頭哥“含光”出鞘2009 年 9 月 10 日,阿里巴巴十周年,阿里云計算團隊以獨立身份出現, “阿里云” 出生了。從誕生之日起,阿里云面臨的第一個任務就是做一套中國自研的大規模操作系統,取名“飛天”。但作為國內云市場“第一個吃螃蟹的人”,阿里云早期并不被看好。2010年的深圳IT峰會上,BAT三家就針對"云計算"激辯過一次:馬化騰毫不客氣的說那是幾百年、幾千年后的事兒;李彥宏也冷嘲道,云計算是新瓶裝舊酒;只有馬云堅定地說,我們對云計算是充滿信心和希望。做云計算需要投入大量的資金,而且回報周期很長。面對外界的質疑,阿里內部也出現了其他聲音,關于“阿里云要被撤掉”的傳聞此起彼伏。在這樣的壓力下,阿里云一度陷入困境,最嚴重的時候,80%的工程師都進行了“大換血”。就在這時,馬云給大家打了一針強心劑:“我每年給阿里云投10個億,投個十年,做不出來再說。”2013年,飛天5K項目成功,阿里云成為世界上第一個對外提供5K云計算服務能力的公司。2018年雙11期間,阿里云上新增調用的彈性計算能力累計超過1000萬核,相當于10座大型數據中心,創造了“脈沖計算”的新紀錄。現如今,這個每一行代碼都由阿里云程序員自己敲下的飛天云操作系統,服務了全球200多個國家和地區、數以百萬計的政府部門和企業。作為國內規模最大的計算平臺,飛天云操作系統可擴展至10萬臺計算集群,單日數據處理量超過600PB;可將全球數百萬級服務器連成一臺超級計算機,單集群達1萬臺規模。無獨有偶,阿里也在AI芯片領域走上自研路——就如同馬云寫給員工的內部信那樣:“把握未來的最佳方法不是留住昨天或爭取保持今天,而是開創未來。”在昨日的云棲大會主論壇上,阿里第一顆自研芯片誕生。
“這是阿里巴巴第一次用了自己的硬件架構,集成了阿里算法到芯片里面去,也是互聯網公司研發的第一款大的芯片。”

AI芯片就是未來科技的重要方向,開創未來更需要做到提前布局,擺脫外界的固有評價,所謂的“互聯網公司”也能造出自研芯片。含光800是阿里巴巴第一顆自研芯片,也是阿里巴巴平頭哥成立之后第一款正式流片的芯片。它主打推理,主要用于云端視覺處理場景,性能打破了現有AI芯片紀錄,性能及能效比全球第一,號稱“全球性能最強的AI芯片”。含光800有多厲害?拿它和業界頂尖的AI芯片做個對比:在業界標準的ResNet-50測試中,含光800推理性能達到78563 IPS,是我們熟悉的英偉達T4性能的14.5倍,比目前業界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍,用“地表最強”來形容含光800也不為過。含光800已開始應用在阿里巴巴內部核心業務中。從視頻圖像識別、分類、搜索,到城市大腦等,未來還可應用于醫療影像、自動駕駛等領域。云棲大會現場演示了這款芯片的強大性能:在城市大腦中實時處理杭州主城區交通視頻,需要40顆傳統GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms,以一敵十,成本僅為傳統GPU的十分之一。此外,含光800將通過阿里云對外輸出AI算力,基于含光800的AI云服務當天正式上線,相比傳統GPU算力,性價比提升100%。“在全球芯片領域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。”
過去半年,平頭哥先后發布玄鐵910、無劍SoC平臺。隨著含光800的發布,平頭哥端云一體全棧產品系列初步成型,涵蓋處理器IP、一站式芯片設計平臺和AI芯片,實現了芯片設計鏈路的全覆蓋。但阿里的雄心并非只有這些。40 多項世界第一、450 多篇頂會論文,學界大牛助力阿里 AI所謂的技術底色是不能摻假的實際成果,無論是在學術亦或產業,都要符合技術領域應有的標準。
不注重名氣與已有成就的研究領域更嚴格,技術能力是否領先一試便知。平頭哥研發芯片并非從 0 開始。含光 800 硬件層面采用自研芯片架構,軟件層面集成達摩院最先進的算法。硬件架構和軟件算法高度適配,最大地發揮了芯片的價值。平頭哥用最短的時間完成了芯片的設計、流片的整個過程,7 個月完成前端設計,之后僅了 3 個月就成功流片。達摩院研究員焦陽表示:“做到這一步,需要對神經網絡的算法有很深入的了解,沒有達摩院算法團隊在人工智能領域多年的積累,很難想象 NPU 能在很短的時間內迅速找到方向。”也是在昨天,達摩院交出了成立 2 周年的一份亮麗的成績單。截至 2019 年 9 月,達摩院在國際頂級學術會議上累計發表 450 多篇論文,在自然語言處理、智能語音、視覺計算等領域算法奪得 40 多項世界第一,已成為阿里聚集科技人才和基礎技術研發的 “技術基石”。達摩院機器智能實驗室過去兩年構建了完整的算法體系,涵蓋語音智能、語言技術、機器視覺、決策智能等方向,并取得多個世界領先水平的成果,包括自研的語音識別算法(DFSMN)、在機器翻譯的國際頂級大賽 WMT 獲 5 項第一,在被譽為人工智能世界杯的 WebVision 競賽斬獲冠軍……其中特別令人矚目的是,在量子計算領域,達摩院量子實驗室完成了第一個可控的量子比特研發工作,該比特的設計、制備和測量全部由達摩院量子實驗室自主完成。此外,量子實驗室也在著手量子芯片研發。達摩院研究員、語音實驗室負責人鄢志杰在大會現場演示了如何“零時差上云”:上阿里云官網,選擇適用的AI能力,比如“語音合成TTS”,點擊“申請開通”。鄢志杰說:“整個過程就是這么簡單,30分鐘就能夠使用達摩院研發幾年的語音、語言能力!”阿里成為一家獨一無二的、中國最大的 AI 公司背后,人才是堅實后盾。達摩院內 “高手如林”,擁有 10 多位 IEEE FELLOW、30 多位知名高校教授、超過一半的科學家擁有名校博士學歷。最近阿里 AI Labs 吸引了兩位視覺領域頂尖科學家,也引起大眾側目。一位是國際視頻標準華人領軍人物、前高通首席工程師陳穎,任人工智能和邊緣計算首席科學家,負責 IoT 視覺方案;另一位是加拿大西蒙弗雷澤大學終身副教授譚平,任計算機視覺首席科學家,聚焦構建全息世界,建立真實世界的三維數字化版本。今年阿里吸引的 “大牛” 中,最引發廣泛討論的無疑是賈揚清。今年 3 月,AI 架構大神賈揚清正式加入阿里巴巴擔任技術副總裁崗位,領導大數據計算平臺的研發工作。賈揚清以深度學習框架 Caffe 作者的身份聞名,這一框架被微軟、雅虎、英偉達、Adobe 等公司采用。賈揚清加入阿里,讓人期待一個中國的深度學習框架登上大規模 AI 架構的舞臺。接下來,賈揚清帶來了對阿里飛天AI平臺、飛天大數據平臺的進展,以及阿里與Facebook在AI平臺和開源方面的合作。讓AI擁有無限可能的開發平臺,為開發者提供最精良的裝備!無平臺,不普惠!
要知道AI開發門檻很高,很多時候需要開發者十八般武藝樣樣精通。傳統“徒手造車”的方式不僅效率低下,且經常會遭遇數據標注工程量大、模型量不夠、算法理解不深入、部署經驗不足等問題。因此阿里針對不同的開發場景,搭建了多個平臺。在本次阿里云棲大會上,阿里巴巴副總裁、阿里云智能計算平臺事業部總經理、高級研究員賈揚清,以及阿里云智能產品管理部總經理、AIoT事業部產品與解決方案總經理何云飛上臺,給這些平臺做了一次大檢閱。
國內首個云端商業化機器學習平臺:阿里云飛天AI平臺- 學得會,指的是易用性。開發者可以更快更方便的應對多變的數據和業務流程
- 學的快,是對算力的要求。在稀疏推薦系統、傳統深度學、推理的計算能力、資源的利用率這幾個場景中,平臺提供的算力將成為制勝法寶
賈揚清認為數據的多樣性和復雜性,需要一個完整的方法論,從源頭開始清洗建模,最終輸入到AI系統中。平臺的出現,實現了“統一方法論輸出”,并“抬升業務水位”;同時業務經驗也反過來提升平臺能力。接下來,賈揚清介紹了阿里搭建了國內首個云端商業化機器學習平臺:阿里云飛天AI平臺。飛天AI平臺首創了“公共云上可視化建模”,為開發者提供了強大的裝備和補給,極大的降低了AI開發門檻,并在產品能力方面獲得了知名研究機構IDC高度贊揚,認為其“堪稱魁首”!如今,飛天AI平臺支持著上百億特征、千億訓練樣本的超大規模經典算法,封裝200多個機器學習算法,實現公共云上首個交互式操作,為開發者提供接近本地開發的極致體驗,一站式完成數據上傳、數據預處理、特征工程、模型訓練、模型評估到模型發布。此外,飛天AI平臺還集成了阿里巴巴諸多自研技術能力。如自研GPU資源復用技術,降低35%訓練成本;自研深度學習編譯器,提升400%訓練速度;自研大規模圖神經網絡,系統端建圖時間從數小時降至5分鐘。發布至今的六年時間里,對內成功支撐起整個阿里巴巴經濟體AI開發,淘寶、螞蟻金服、阿里健康、菜鳥、天貓精靈、高德地圖等40多個BU的AI開發,每日執行50萬任務,日均調用量超過百億次;對外,服務著金融、互聯網、醫療、政府、零售等領域客戶,使得越來越多的客戶受益。會上還宣布了一個好消息:Facebook和阿里云宣布合作,Facebook旗下的開源深度學習框架PyTorch將進駐阿里云機器學習平臺。PyTorch是全球最受歡迎的深度學習框架之一,但本地部署較為復雜。如今AI開發者們再也不為此頭疼了,點點鼠標在阿里云上就能使用PyTorch框架,體驗模型訓練、預測部署等全流程功能。賈揚清還介紹了國內規模最大的大數據計算平臺:飛天大數據平臺。飛天大數據平臺可擴展至10萬臺計算集群,曾創下六項海量數據排序世界紀錄,支撐了阿里巴巴經濟體的全局數據存儲和計算,單日數據處理量超過600PB!在它加持下的城市大腦,可以實時指揮杭州1300個紅綠燈路口、200多名交警,成功讓杭州摘掉了全國最擁堵城市的帽子。通過飛天大數據平臺打通政務數據,將與老百姓最密切相關的100個事項70多億條數據,實現共通共享共用,極大的提高了辦事效率,甚至實現了老百姓足不出戶即可辦理業務!而何云飛則介紹了早在2014年就投入研發的阿里云AIoT平臺,并在大會上介紹了物聯網操作系統AliOS Things 3.0。
何云飛提到,阿里云AIoT平臺目前已經是國內最開放的智聯網平臺和生態系統,正在為每個企業提供萬物智聯的基礎設施。阿里云AIoT業務已經覆蓋智能城市、智能園區、智能人居、智能制造、智能農業等多個領域。2018年雙11,AIoT平臺上消息總量達上百億次,在阿里巴巴經濟體中接受著極致的商業錘煉!產業AI獨樹一幟:拒絕“PPT AI”,還是那個會做生意的阿里“整個阿里巴巴的AI的調用次數已經達到了1萬億次,服務的人數已經達到了10億人!我們在不知不覺當中,已經成為最大的一家AI公司。”
今天主論壇,阿里云智能副總裁馬勁首次公布的這個數字是阿里AI產業落地最好的證明。目前,以阿里云城市大腦、工業大腦、農業大腦為代表的產業AI,正應用在城市、工業、農業、零售、金融、汽車、航空等全產業場景。2016年,阿里云在杭州首創城市大腦,探索利用人工智能管理城市,被認為是人工智能的登月計劃。目前,全球有23個城市已經引入了城市大腦。阿里云智能副總裁曾震宇在論壇上分享了蕭山機場使用城市大腦后系統性能提升。通過使用阿里云的雷達定位技術和機坪還原技術,分析影響整點率的因素,從而進行機場調度。
工業大腦也已廣泛應用。7月23日,阿里云與瀚藍環境宣布首個管理垃圾焚燒爐的AI投入使用。經過數個月的密集測試,雙方研發合作團隊發現,AI輔助人的方式比單純人工操作,鍋爐穩定性提升了23%。同時,以前操作員4個小時需要操作30次,現在只需要在收到提醒后干預6次即可,這也大大減輕了操作工人的執行壓力。阿里20年,從電商平臺到科技巨頭,在產業AI方面,阿里也把“讓天下沒有難做的生意”貫徹到底。事實上,阿里并未想過撕掉電商的標簽,只是技術底氣會賦予一家公司更多的可能,尊重技術的氛圍、爭奪未來的態度會助力一家公司走得更遠。阿里巴巴在電商上的成功早已不需我們對其重新估值,但需要我們不斷認識一個新的阿里。IEEE Spectrum
《科技縱覽》
官方微信公眾平臺