亚洲乱码一区,国产女同一区二区,中文字幕一区二区av

━━━━

在2013年的電影《她》中，男主結(jié)束了戀愛長(zhǎng)跑之后，愛上了一個(gè)電腦操作的系統(tǒng)女聲，這個(gè)叫“薩曼莎”的姑娘不僅有著略帶沙啞的迷人嗓音，并且幽默風(fēng)趣。

就這樣，他們成了無(wú)話不談的朋友，甚至發(fā)展出一段“畸形”的戀情。

雖然電影是虛構(gòu)的，但這也恰恰證明了，未來(lái)以用戶為中心的交互模式不會(huì)僅僅停留在操作方便等基礎(chǔ)方面，對(duì)于更好地識(shí)別用戶表達(dá)意圖與情感等方面，都將取得重大突破。

問題來(lái)了，當(dāng)人和機(jī)器之間的邊界逐漸模糊，人機(jī)交互的邊界在哪里？未來(lái)人機(jī)交互會(huì)發(fā)展成什么樣子？

在AI Time第七期的辯論中，清華大學(xué)的史元春、中科院軟件所的田豐、中科院計(jì)算所的陳益強(qiáng)、小小牛科技創(chuàng)意公司的CEO曹翔就一起論道了人機(jī)交互與智能的相關(guān)問題。

━━━━

視覺化處理是關(guān)鍵

1945年，在電子計(jì)算機(jī)尚未“出世”時(shí)，范內(nèi)瓦·布什就發(fā)表了題為“As We May Think”的文章，形象描述了未來(lái)個(gè)人電腦——一種被稱為MEMEX的機(jī)器，闡釋了直接交互、超鏈接、網(wǎng)絡(luò)存儲(chǔ)等概念。

1960年，約瑟夫·利克萊德提出“人機(jī)共生”的思想，并在布什的領(lǐng)導(dǎo)下通過(guò)美國(guó)國(guó)家科技計(jì)劃大力支持了人機(jī)共生理念下的圖形與可視化、虛擬對(duì)象操控、互聯(lián)網(wǎng)絡(luò)等研究項(xiàng)目，在他的主導(dǎo)下，個(gè)人電腦、互聯(lián)網(wǎng)絡(luò)的標(biāo)志性關(guān)鍵技術(shù)在六七十年代逐次誕生了。

約瑟夫·立克立德領(lǐng)導(dǎo)的交互式計(jì)算不但研發(fā)了分式操作系統(tǒng)，而且直接引導(dǎo)了圖形技術(shù)。

在范內(nèi)瓦·布什、約瑟夫·利克萊德等先驅(qū)的推動(dòng)下，在語(yǔ)言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)的共同參與下，計(jì)算機(jī)從沒有用戶界面，到有了圖形用戶界面，開創(chuàng)了個(gè)人電腦以及互聯(lián)網(wǎng)絡(luò)等惠及整個(gè)社會(huì)的新產(chǎn)業(yè)。

現(xiàn)在手機(jī)無(wú)需利用鼠標(biāo)，可以利用新的傳感技術(shù)，包括AI技術(shù)，這些都在使得人們能夠更多地感受周圍世界，這也是人機(jī)交互的一部分。

未來(lái)，在新的傳感和多媒體技術(shù)的共同支持下，機(jī)器將可以通過(guò)感知和數(shù)據(jù)處理技術(shù)來(lái)理解我們，來(lái)理解周圍的環(huán)境，實(shí)現(xiàn)更自然、更智能的人機(jī)交互。

━━━━
人機(jī)互動(dòng)的研究領(lǐng)域呈多樣化

曹翔介紹道，他現(xiàn)在的工作可以說(shuō)是“現(xiàn)實(shí)版神筆馬良”，用一張普通的紙和一個(gè)普通的畫筆作畫之后，用手機(jī)采集，瞬間就能轉(zhuǎn)化生成三維動(dòng)畫。通過(guò)技術(shù)把創(chuàng)作的門坎降低，讓普通人能夠表達(dá)自己的創(chuàng)意是研究的初衷。

到目前為止還是普適計(jì)算的時(shí)代，未來(lái)人機(jī)交互會(huì)是多模態(tài)的，可以用鍵盤、語(yǔ)音，也可以用手勢(shì)、表情、唇動(dòng)等。他首先介紹了基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別，原因有二，其一是因?yàn)樽藙?shì)語(yǔ)言太多太泛，沒有清晰的目標(biāo)邊界，其二是因?yàn)橄Ｍ夹g(shù)能服務(wù)于殘障人士的日常交流。

第二個(gè)工作也和多模態(tài)相關(guān)，人機(jī)交互的終極目標(biāo)是希望人機(jī)交互和人人交互一樣。目前通過(guò)多模態(tài)，包括知識(shí)性感知，讓機(jī)器獲知人目前的狀態(tài)，繼而再進(jìn)行下一步行為。未來(lái)可以利用可穿戴設(shè)備，對(duì)人的生理和心理的境況進(jìn)行推斷，然后進(jìn)行交互。

陳益強(qiáng)也認(rèn)為，未來(lái)的人機(jī)交互模式會(huì)是多模態(tài)的。圍繞“多模態(tài)”設(shè)想，他提到了目前工作。一個(gè)是基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別，將面部識(shí)別、手勢(shì)動(dòng)作識(shí)別和手語(yǔ)識(shí)別相融合，用以提高手語(yǔ)識(shí)別精度。二是通過(guò)多模態(tài)手段，使機(jī)器人獲知人類當(dāng)前狀態(tài)。

田豐主要關(guān)注面向教育和醫(yī)療的人機(jī)交互的研究，他分享了再輸入技術(shù)和相關(guān)理論方面的研究成果。由于輸入不可避免地存在不精確性，希望用智能化的方法進(jìn)行改善和幫助。

運(yùn)動(dòng)目標(biāo)的選擇是人機(jī)交互里非常重要的任務(wù)，玩游戲的時(shí)候就知道，相對(duì)靜止來(lái)說(shuō)運(yùn)動(dòng)目標(biāo)的選中更難，怎樣來(lái)提高選中的效率，同時(shí)去理解用戶選擇目標(biāo)的能力。他們首先做了大量的用戶研究，產(chǎn)生了針對(duì)不同速度和尺寸的物體在運(yùn)動(dòng)過(guò)程的落點(diǎn)分布，建立出模型，計(jì)算出用戶選中物體的概率。這個(gè)模型不僅可以分析正常人，對(duì)帕金森病人等也可以用做輔助診斷。

值得一提的是，田豐帶領(lǐng)團(tuán)隊(duì)研發(fā)的筆式電子教學(xué)系統(tǒng)獲得了國(guó)家科技進(jìn)步二等獎(jiǎng)，并與協(xié)和醫(yī)院共同取得了國(guó)家衛(wèi)健委頒發(fā)的醫(yī)療健康人工智能應(yīng)用落地30最佳案例的榮譽(yù)。

史元春介紹道，在使用手機(jī)軟鍵盤時(shí)，26個(gè)字母擠在狹窄的輸入界面里，再配上胖乎乎的手指，點(diǎn)錯(cuò)的經(jīng)歷太多了。這是觸屏這種自然交互界面上典型的難題：胖手指難題。

基于研究工作，他們提出了基于貝葉斯推理的自然用戶意圖理解框架，建模用戶行為特征，在模糊的輸入信號(hào)上推測(cè)用戶的真實(shí)意圖。你點(diǎn)的不準(zhǔn)沒關(guān)系，算法可以猜得準(zhǔn)。利用這項(xiàng)技術(shù)，史元春團(tuán)隊(duì)已經(jīng)研究實(shí)現(xiàn)了手機(jī)、平板、頭盔、電視等一系列接口上的輸入法，輸入準(zhǔn)確度大幅度提高，且?guī)缀醪恍枰曈X瞄準(zhǔn)，進(jìn)而還能支持盲人用戶準(zhǔn)確實(shí)現(xiàn)軟鍵盤輸入。

未來(lái)的接口也會(huì)延伸感知人的操控行為，史教授正在研制的手機(jī)前置攝像頭上就能：“感知到人手在界面上的變化后，我們就能以此做出新的‘輸入法’。”

比如手握手機(jī)的任意邊框或位置，就可以輸入信息、訪問界面，甚至和桌子的交互，也能變成對(duì)手機(jī)的操作。”

━━━━
人機(jī)交互離不開人工智能

針對(duì)交互界面的構(gòu)建是否存在計(jì)算模型的問題，田豐指出，傳統(tǒng)上存在計(jì)算模型，而針對(duì)自然人交互，現(xiàn)在還沒有相應(yīng)的理論計(jì)算模型，但是應(yīng)該朝著這個(gè)方向努力。

史元春教授同意以上觀點(diǎn)，并指出定量評(píng)估的方法雖有，但很不充分。不過(guò)借助相應(yīng)的傳感技術(shù)，定量評(píng)估的原理和技術(shù)都在不斷拓展，這從紅外反射監(jiān)測(cè)血流、血壓參數(shù)、情緒變化等一系列應(yīng)用上就可以看出。

以后的計(jì)算終端是多種多樣的，適配的場(chǎng)景和任務(wù)也是不一樣的，所以完全統(tǒng)一的大而全的模型非常難以建立，但是在特定任務(wù)上，技術(shù)背后的科學(xué)原理一定是有計(jì)算模型的，研究者們都應(yīng)該去努力探索。

此外，定量評(píng)估的方法理論上是存在的，但現(xiàn)在很難說(shuō)是好方法，因?yàn)榻缑嬖跀U(kuò)展，相應(yīng)的實(shí)現(xiàn)技術(shù)、原理和評(píng)價(jià)技術(shù)也都在做擴(kuò)展和變化。

曹翔也指出，因?yàn)槿藱C(jī)交互的任務(wù)多樣，很難去界定效率，更多是用主觀感受衡量。從大方向上講，一定是需要定量數(shù)據(jù)的，人工智能需要數(shù)據(jù)，而人機(jī)交互離不開人工智能。

針對(duì)建模的機(jī)制和限制，曹翔指出，具有明確任務(wù)的工作建模相對(duì)容易，因?yàn)槟繕?biāo)很清晰，但是體驗(yàn)性的、娛樂性的、溝通性的工作比較難用計(jì)算的方式建模，因?yàn)槠渲袏A雜著大量非簡(jiǎn)單人機(jī)交互的內(nèi)容，比如人與人之間的互動(dòng)等。

用大數(shù)據(jù)的方式對(duì)情緒的預(yù)測(cè)更有效果，本身人類對(duì)情緒化的東西也沒有細(xì)分到小單元。反過(guò)來(lái)說(shuō)，大數(shù)據(jù)分析或人工智能分析，能在沒有用明確的細(xì)分模型的情況下做出預(yù)測(cè)，恰恰能解決非標(biāo)準(zhǔn)性任務(wù)。但如果是利用大數(shù)據(jù)解決問題，建立的可能是一個(gè)通用的模型，涉及到個(gè)人也會(huì)一些差別。

陳益強(qiáng)認(rèn)為，人機(jī)交互要做得好，就一定要做到個(gè)性化，也就一定會(huì)用到智能方法。從交互來(lái)說(shuō)，最初鍵盤是確定性交互，鼠標(biāo)是屬于感知層次。往智能上走，語(yǔ)音識(shí)別、手勢(shì)識(shí)別這部分在感知以外加入了知識(shí)性學(xué)習(xí)。到第三部分，即情感智能，在執(zhí)行前還需要加上知識(shí)，或者說(shuō)認(rèn)知。這也與人腦的三個(gè)部分，即中樞神經(jīng)、小腦和大腦相對(duì)應(yīng)。

智能和人機(jī)交互一樣，也是按人也分層次，人機(jī)交互我們從傳統(tǒng)到智能也分層次，可以把它理解為消除不確定性。越往上走，不確定性越大，尤其對(duì)意圖理解，但是我們?cè)趺慈ハ侨藱C(jī)交互上應(yīng)用的一個(gè)探討。

━━━━
人機(jī)交互和人工智能協(xié)同共進(jìn)

人工智能和人機(jī)交互，都有“人”這個(gè)字，對(duì)于二者的關(guān)系，史元春首先指出，這是中文說(shuō)法，英文沒有這樣的詞，但二者的共性在于都是很早很明確地談到人機(jī)關(guān)系。

史元春教授認(rèn)為，人機(jī)交互應(yīng)該讓機(jī)器更好的適應(yīng)人，適應(yīng)人的本性，適應(yīng)人的操控能力、感知能力和認(rèn)知能力。從“人” 的研究?jī)?nèi)容上來(lái)說(shuō)，人機(jī)交互與人工智能有差異，但出發(fā)點(diǎn)是一致的，即“人機(jī)共生”。

目前看，人工智能的研究更多的體現(xiàn)在人的識(shí)別、語(yǔ)言的表達(dá)等數(shù)據(jù)密集型任務(wù)上的處理方法，人機(jī)交互的研究更偏重于對(duì)人的主動(dòng)交互行為和感知能力的建模、傳感和建立適應(yīng)的接口技術(shù)，人機(jī)關(guān)系必定向著共生的方向發(fā)展，這些研究?jī)?nèi)容和方法會(huì)相互影響和適應(yīng)，交疊的研究?jī)?nèi)容會(huì)越來(lái)越多。

“做人工智能最后要接觸人機(jī)交互，做人機(jī)交互最后也要接觸人工智能。”

田豐提到中國(guó)科學(xué)上有一篇觀點(diǎn)性的論文，他指出，人機(jī)交互和人工智能在未來(lái)的趨勢(shì)會(huì)從交替沉浮走向協(xié)同共進(jìn)。國(guó)家人工智能發(fā)展規(guī)劃里一個(gè)核心研究點(diǎn)是人機(jī)協(xié)同，人機(jī)協(xié)同也是人機(jī)交互未來(lái)的方向。從人工智能角度講，自動(dòng)駕駛等也講人機(jī)協(xié)同，其實(shí)是殊途同歸的。

曹翔指出，人工智能和人機(jī)交互的研究?jī)r(jià)值觀、出發(fā)點(diǎn)會(huì)略有不同。人工智能根本上講，終極目標(biāo)是讓機(jī)器能做所有人能做的事情，人機(jī)交互則是指人和機(jī)器的合作，兩者不矛盾，但是要看情境。

針對(duì)人機(jī)交互研究對(duì)AI的貢獻(xiàn)，他指出，首先必須承認(rèn)AI對(duì)人機(jī)交互研究的貢獻(xiàn)。從大趨勢(shì)上講，機(jī)器學(xué)習(xí)中大量的人工標(biāo)注數(shù)據(jù)就是人機(jī)交互的過(guò)程。進(jìn)一步講，AI的一個(gè)挑戰(zhàn)在于可解釋AI，最終擔(dān)心的是可不可被信任，解釋的原因是希望能夠放心地使用。

某種意義上講也許解決AI可信任的問題，在于創(chuàng)造一種方式，讓人和AI的系統(tǒng)在一個(gè)互動(dòng)過(guò)程中慢慢通過(guò)衡量判斷，可能這個(gè)恰恰是人機(jī)交互幫助解決所謂AI可解釋問題的方法。

對(duì)于智能人機(jī)交互的暢想，史元春指出，未來(lái)計(jì)算機(jī)的形態(tài)會(huì)變化，甚至可能不存在了，但計(jì)算機(jī)技術(shù)會(huì)持續(xù)為我們服務(wù)，成為人機(jī)共生的一部分，交互接口、交互任務(wù)會(huì)有很大的變化，但會(huì)更自然，更智能。

她把智能人機(jī)交互集中分為三類，一是手勢(shì)，然后是語(yǔ)音，還有可穿戴設(shè)備，包括手環(huán)、頭盔。在這三類上看到了很多新技術(shù)和新產(chǎn)品，但都還沒有成為主流，也就是說(shuō)，都存在一定的問題。

比如語(yǔ)音交互，不光是識(shí)別率沒有達(dá)到百分之百，同時(shí)語(yǔ)音表達(dá)的帶寬和表達(dá)的數(shù)據(jù)類型還不完整，和空間有關(guān)的數(shù)據(jù)效率低、沒有精度。此外，還有打擾、隱私等，都有很大的限定條件，穿戴更是這樣。

陳益強(qiáng)舉例穿戴設(shè)備可以附著于衣服和鞋子，人機(jī)交互最終將實(shí)現(xiàn)人機(jī)共生。并且，在材料、技術(shù)的進(jìn)步下，能夠完全理解人類自然行為的意圖，甚至幫助解決人口老齡化、阿爾茨海默病等。

曹翔根據(jù)自己目前的研究?jī)?nèi)容，指出，要通過(guò)技術(shù)把每個(gè)人的創(chuàng)造力充分發(fā)揮出來(lái)，創(chuàng)造力在未來(lái)會(huì)成為生存和工作所不可或缺的一部分。

未來(lái)在輸出上或許能獲得更多體驗(yàn)，比如把挖掘出更多感官體驗(yàn)，不只是視覺和聽覺領(lǐng)域，甚至創(chuàng)造一個(gè)幻想的世界，這是十分有趣的。

田豐稱，他對(duì)于如何通過(guò)人機(jī)交互的研究推動(dòng)產(chǎn)業(yè)發(fā)展更為關(guān)心，相關(guān)人口老齡化問題已經(jīng)與協(xié)和醫(yī)院進(jìn)行了深入合作，通過(guò)對(duì)老年人的動(dòng)作進(jìn)行解讀，提供量化的輔助診斷。

針對(duì)人機(jī)交互人才的培養(yǎng)，史元春指出，工業(yè)界是有需求的，但是學(xué)術(shù)界還很迷茫。有博士生畢業(yè)后在工業(yè)界無(wú)法找到與專業(yè)十分匹配的職位，由于工業(yè)界的進(jìn)步會(huì)促使學(xué)術(shù)界對(duì)人才培養(yǎng)建立一套科學(xué)的方法。

史元春教授提到：“我們培養(yǎng)的人才應(yīng)該能夠發(fā)現(xiàn)交互難題，并且能通過(guò)科學(xué)的方法來(lái)解決這個(gè)問題。”

曹翔指出，交互設(shè)計(jì)師、用戶研究員等對(duì)口培養(yǎng)的專業(yè)，不難找工作；難找工作的是把人機(jī)交互作為一個(gè)研究領(lǐng)域去學(xué)習(xí)的學(xué)生，因?yàn)楝F(xiàn)有的一個(gè)蘿卜一個(gè)坑的職業(yè)體系，并不太適合跨學(xué)科的人才，但創(chuàng)業(yè)特別需要這樣的人。

文章來(lái)源：大數(shù)據(jù)文摘