亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁(yè)| 資源下載| 資源專輯| 精品軟件
登錄| 注冊(cè)

您現(xiàn)在的位置是:首頁(yè) > 技術(shù)閱讀 >  你真的明白人機(jī)交互與智能嗎? | 清華AI Time

你真的明白人機(jī)交互與智能嗎? | 清華AI Time

時(shí)間:2024-01-06

━━━━
在2013年的電影《她》中,男主結(jié)束了戀愛長(zhǎng)跑之后,愛上了一個(gè)電腦操作的系統(tǒng)女聲,這個(gè)叫“薩曼莎”的姑娘不僅有著略帶沙啞的迷人嗓音,并且幽默風(fēng)趣。
就這樣,他們成了無(wú)話不談的朋友,甚至發(fā)展出一段“畸形”的戀情。
雖然電影是虛構(gòu)的,但這也恰恰證明了,未來(lái)以用戶為中心的交互模式不會(huì)僅僅停留在操作方便等基礎(chǔ)方面,對(duì)于更好地識(shí)別用戶表達(dá)意圖與情感等方面,都將取得重大突破。
問題來(lái)了,當(dāng)人和機(jī)器之間的邊界逐漸模糊,人機(jī)交互的邊界在哪里?未來(lái)人機(jī)交互會(huì)發(fā)展成什么樣子?
在AI Time第七期的辯論中,清華大學(xué)的史元春、中科院軟件所的田豐、中科院計(jì)算所的陳益強(qiáng)、小小牛科技創(chuàng)意公司的CEO曹翔就一起論道了人機(jī)交互與智能的相關(guān)問題。
━━━━

視覺化處理是關(guān)鍵

1945年,在電子計(jì)算機(jī)尚未“出世”時(shí),范內(nèi)瓦·布什就發(fā)表了題為“As We May Think”的文章,形象描述了未來(lái)個(gè)人電腦——一種被稱為MEMEX的機(jī)器,闡釋了直接交互、超鏈接、網(wǎng)絡(luò)存儲(chǔ)等概念。
1960年,約瑟夫·利克萊德提出“人機(jī)共生”的思想,并在布什的領(lǐng)導(dǎo)下通過(guò)美國(guó)國(guó)家科技計(jì)劃大力支持了人機(jī)共生理念下的圖形與可視化、虛擬對(duì)象操控、互聯(lián)網(wǎng)絡(luò)等研究項(xiàng)目,在他的主導(dǎo)下,個(gè)人電腦、互聯(lián)網(wǎng)絡(luò)的標(biāo)志性關(guān)鍵技術(shù)在六七十年代逐次誕生了。
約瑟夫·立克立德領(lǐng)導(dǎo)的交互式計(jì)算不但研發(fā)了分式操作系統(tǒng),而且直接引導(dǎo)了圖形技術(shù)。
在范內(nèi)瓦·布什、約瑟夫·利克萊德等先驅(qū)的推動(dòng)下,在語(yǔ)言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)的共同參與下,計(jì)算機(jī)從沒有用戶界面,到有了圖形用戶界面,開創(chuàng)了個(gè)人電腦以及互聯(lián)網(wǎng)絡(luò)等惠及整個(gè)社會(huì)的新產(chǎn)業(yè)。
現(xiàn)在手機(jī)無(wú)需利用鼠標(biāo),可以利用新的傳感技術(shù),包括AI技術(shù),這些都在使得人們能夠更多地感受周圍世界,這也是人機(jī)交互的一部分。
未來(lái),在新的傳感和多媒體技術(shù)的共同支持下,機(jī)器將可以通過(guò)感知和數(shù)據(jù)處理技術(shù)來(lái)理解我們,來(lái)理解周圍的環(huán)境,實(shí)現(xiàn)更自然、更智能的人機(jī)交互。

━━━━
人機(jī)互動(dòng)的研究領(lǐng)域呈多樣化

曹翔介紹道,他現(xiàn)在的工作可以說(shuō)是“現(xiàn)實(shí)版神筆馬良”,用一張普通的紙和一個(gè)普通的畫筆作畫之后,用手機(jī)采集,瞬間就能轉(zhuǎn)化生成三維動(dòng)畫。通過(guò)技術(shù)把創(chuàng)作的門坎降低,讓普通人能夠表達(dá)自己的創(chuàng)意是研究的初衷。
到目前為止還是普適計(jì)算的時(shí)代,未來(lái)人機(jī)交互會(huì)是多模態(tài)的,可以用鍵盤、語(yǔ)音,也可以用手勢(shì)、表情、唇動(dòng)等。他首先介紹了基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別,原因有二,其一是因?yàn)樽藙?shì)語(yǔ)言太多太泛,沒有清晰的目標(biāo)邊界,其二是因?yàn)橄M夹g(shù)能服務(wù)于殘障人士的日常交流。
第二個(gè)工作也和多模態(tài)相關(guān),人機(jī)交互的終極目標(biāo)是希望人機(jī)交互和人人交互一樣。目前通過(guò)多模態(tài),包括知識(shí)性感知,讓機(jī)器獲知人目前的狀態(tài),繼而再進(jìn)行下一步行為。未來(lái)可以利用可穿戴設(shè)備,對(duì)人的生理和心理的境況進(jìn)行推斷,然后進(jìn)行交互。
陳益強(qiáng)也認(rèn)為,未來(lái)的人機(jī)交互模式會(huì)是多模態(tài)的。圍繞“多模態(tài)”設(shè)想,他提到了目前工作。一個(gè)是基于多通道或多模態(tài)感知理論的手語(yǔ)識(shí)別,將面部識(shí)別、手勢(shì)動(dòng)作識(shí)別和手語(yǔ)識(shí)別相融合,用以提高手語(yǔ)識(shí)別精度。二是通過(guò)多模態(tài)手段,使機(jī)器人獲知人類當(dāng)前狀態(tài)。
田豐主要關(guān)注面向教育和醫(yī)療的人機(jī)交互的研究,他分享了再輸入技術(shù)和相關(guān)理論方面的研究成果。由于輸入不可避免地存在不精確性,希望用智能化的方法進(jìn)行改善和幫助。
運(yùn)動(dòng)目標(biāo)的選擇是人機(jī)交互里非常重要的任務(wù),玩游戲的時(shí)候就知道,相對(duì)靜止來(lái)說(shuō)運(yùn)動(dòng)目標(biāo)的選中更難,怎樣來(lái)提高選中的效率,同時(shí)去理解用戶選擇目標(biāo)的能力。他們首先做了大量的用戶研究,產(chǎn)生了針對(duì)不同速度和尺寸的物體在運(yùn)動(dòng)過(guò)程的落點(diǎn)分布,建立出模型,計(jì)算出用戶選中物體的概率。這個(gè)模型不僅可以分析正常人,對(duì)帕金森病人等也可以用做輔助診斷。
值得一提的是,田豐帶領(lǐng)團(tuán)隊(duì)研發(fā)的筆式電子教學(xué)系統(tǒng)獲得了國(guó)家科技進(jìn)步二等獎(jiǎng),并與協(xié)和醫(yī)院共同取得了國(guó)家衛(wèi)健委頒發(fā)的醫(yī)療健康人工智能應(yīng)用落地30最佳案例的榮譽(yù)。
史元春介紹道,在使用手機(jī)軟鍵盤時(shí),26個(gè)字母擠在狹窄的輸入界面里,再配上胖乎乎的手指,點(diǎn)錯(cuò)的經(jīng)歷太多了。這是觸屏這種自然交互界面上典型的難題:胖手指難題。
基于研究工作,他們提出了基于貝葉斯推理的自然用戶意圖理解框架,建模用戶行為特征,在模糊的輸入信號(hào)上推測(cè)用戶的真實(shí)意圖。你點(diǎn)的不準(zhǔn)沒關(guān)系,算法可以猜得準(zhǔn)。利用這項(xiàng)技術(shù),史元春團(tuán)隊(duì)已經(jīng)研究實(shí)現(xiàn)了手機(jī)、平板、頭盔、電視等一系列接口上的輸入法,輸入準(zhǔn)確度大幅度提高,且?guī)缀醪恍枰曈X瞄準(zhǔn),進(jìn)而還能支持盲人用戶準(zhǔn)確實(shí)現(xiàn)軟鍵盤輸入。
未來(lái)的接口也會(huì)延伸感知人的操控行為,史教授正在研制的手機(jī)前置攝像頭上就能:“感知到人手在界面上的變化后,我們就能以此做出新的‘輸入法’。
比如手握手機(jī)的任意邊框或位置,就可以輸入信息、訪問界面,甚至和桌子的交互,也能變成對(duì)手機(jī)的操作。

━━━━
人機(jī)交互離不開人工智能

針對(duì)交互界面的構(gòu)建是否存在計(jì)算模型的問題,田豐指出,傳統(tǒng)上存在計(jì)算模型,而針對(duì)自然人交互,現(xiàn)在還沒有相應(yīng)的理論計(jì)算模型,但是應(yīng)該朝著這個(gè)方向努力。
史元春教授同意以上觀點(diǎn),并指出定量評(píng)估的方法雖有,但很不充分。不過(guò)借助相應(yīng)的傳感技術(shù),定量評(píng)估的原理和技術(shù)都在不斷拓展,這從紅外反射監(jiān)測(cè)血流、血壓參數(shù)、情緒變化等一系列應(yīng)用上就可以看出。
以后的計(jì)算終端是多種多樣的,適配的場(chǎng)景和任務(wù)也是不一樣的,所以完全統(tǒng)一的大而全的模型非常難以建立,但是在特定任務(wù)上,技術(shù)背后的科學(xué)原理一定是有計(jì)算模型的,研究者們都應(yīng)該去努力探索。
此外,定量評(píng)估的方法理論上是存在的,但現(xiàn)在很難說(shuō)是好方法,因?yàn)榻缑嬖跀U(kuò)展,相應(yīng)的實(shí)現(xiàn)技術(shù)、原理和評(píng)價(jià)技術(shù)也都在做擴(kuò)展和變化。
曹翔也指出,因?yàn)槿藱C(jī)交互的任務(wù)多樣,很難去界定效率,更多是用主觀感受衡量。從大方向上講,一定是需要定量數(shù)據(jù)的,人工智能需要數(shù)據(jù),而人機(jī)交互離不開人工智能。
針對(duì)建模的機(jī)制和限制,曹翔指出,具有明確任務(wù)的工作建模相對(duì)容易,因?yàn)槟繕?biāo)很清晰,但是體驗(yàn)性的、娛樂性的、溝通性的工作比較難用計(jì)算的方式建模,因?yàn)槠渲袏A雜著大量非簡(jiǎn)單人機(jī)交互的內(nèi)容,比如人與人之間的互動(dòng)等。
用大數(shù)據(jù)的方式對(duì)情緒的預(yù)測(cè)更有效果,本身人類對(duì)情緒化的東西也沒有細(xì)分到小單元。反過(guò)來(lái)說(shuō),大數(shù)據(jù)分析或人工智能分析,能在沒有用明確的細(xì)分模型的情況下做出預(yù)測(cè),恰恰能解決非標(biāo)準(zhǔn)性任務(wù)。但如果是利用大數(shù)據(jù)解決問題,建立的可能是一個(gè)通用的模型,涉及到個(gè)人也會(huì)一些差別。
陳益強(qiáng)認(rèn)為,人機(jī)交互要做得好,就一定要做到個(gè)性化,也就一定會(huì)用到智能方法。從交互來(lái)說(shuō),最初鍵盤是確定性交互,鼠標(biāo)是屬于感知層次。往智能上走,語(yǔ)音識(shí)別、手勢(shì)識(shí)別這部分在感知以外加入了知識(shí)性學(xué)習(xí)。到第三部分,即情感智能,在執(zhí)行前還需要加上知識(shí),或者說(shuō)認(rèn)知。這也與人腦的三個(gè)部分,即中樞神經(jīng)、小腦和大腦相對(duì)應(yīng)。
智能和人機(jī)交互一樣,也是按人也分層次,人機(jī)交互我們從傳統(tǒng)到智能也分層次,可以把它理解為消除不確定性。越往上走,不確定性越大,尤其對(duì)意圖理解,但是我們?cè)趺慈ハ侨藱C(jī)交互上應(yīng)用的一個(gè)探討。

━━━━
人機(jī)交互和人工智能協(xié)同共進(jìn)

人工智能和人機(jī)交互,都有“人”這個(gè)字,對(duì)于二者的關(guān)系,史元春首先指出,這是中文說(shuō)法,英文沒有這樣的詞,但二者的共性在于都是很早很明確地談到人機(jī)關(guān)系。

史元春教授認(rèn)為,人機(jī)交互應(yīng)該讓機(jī)器更好的適應(yīng)人,適應(yīng)人的本性,適應(yīng)人的操控能力、感知能力和認(rèn)知能力。從“人” 的研究?jī)?nèi)容上來(lái)說(shuō),人機(jī)交互與人工智能有差異,但出發(fā)點(diǎn)是一致的,即“人機(jī)共生”。
目前看,人工智能的研究更多的體現(xiàn)在人的識(shí)別、語(yǔ)言的表達(dá)等數(shù)據(jù)密集型任務(wù)上的處理方法,人機(jī)交互的研究更偏重于對(duì)人的主動(dòng)交互行為和感知能力的建模、傳感和建立適應(yīng)的接口技術(shù),人機(jī)關(guān)系必定向著共生的方向發(fā)展,這些研究?jī)?nèi)容和方法會(huì)相互影響和適應(yīng),交疊的研究?jī)?nèi)容會(huì)越來(lái)越多。
“做人工智能最后要接觸人機(jī)交互,做人機(jī)交互最后也要接觸人工智能。
田豐提到中國(guó)科學(xué)上有一篇觀點(diǎn)性的論文,他指出,人機(jī)交互和人工智能在未來(lái)的趨勢(shì)會(huì)從交替沉浮走向協(xié)同共進(jìn)。國(guó)家人工智能發(fā)展規(guī)劃里一個(gè)核心研究點(diǎn)是人機(jī)協(xié)同,人機(jī)協(xié)同也是人機(jī)交互未來(lái)的方向。從人工智能角度講,自動(dòng)駕駛等也講人機(jī)協(xié)同,其實(shí)是殊途同歸的。
曹翔指出,人工智能和人機(jī)交互的研究?jī)r(jià)值觀、出發(fā)點(diǎn)會(huì)略有不同。人工智能根本上講,終極目標(biāo)是讓機(jī)器能做所有人能做的事情,人機(jī)交互則是指人和機(jī)器的合作,兩者不矛盾,但是要看情境。
針對(duì)人機(jī)交互研究對(duì)AI的貢獻(xiàn),他指出,首先必須承認(rèn)AI對(duì)人機(jī)交互研究的貢獻(xiàn)。從大趨勢(shì)上講,機(jī)器學(xué)習(xí)中大量的人工標(biāo)注數(shù)據(jù)就是人機(jī)交互的過(guò)程。進(jìn)一步講,AI的一個(gè)挑戰(zhàn)在于可解釋AI,最終擔(dān)心的是可不可被信任,解釋的原因是希望能夠放心地使用。
某種意義上講也許解決AI可信任的問題,在于創(chuàng)造一種方式,讓人和AI的系統(tǒng)在一個(gè)互動(dòng)過(guò)程中慢慢通過(guò)衡量判斷,可能這個(gè)恰恰是人機(jī)交互幫助解決所謂AI可解釋問題的方法。
對(duì)于智能人機(jī)交互的暢想,史元春指出,未來(lái)計(jì)算機(jī)的形態(tài)會(huì)變化,甚至可能不存在了,但計(jì)算機(jī)技術(shù)會(huì)持續(xù)為我們服務(wù),成為人機(jī)共生的一部分,交互接口、交互任務(wù)會(huì)有很大的變化,但會(huì)更自然,更智能。
她把智能人機(jī)交互集中分為三類,一是手勢(shì),然后是語(yǔ)音,還有可穿戴設(shè)備,包括手環(huán)、頭盔。在這三類上看到了很多新技術(shù)和新產(chǎn)品,但都還沒有成為主流,也就是說(shuō),都存在一定的問題。
比如語(yǔ)音交互,不光是識(shí)別率沒有達(dá)到百分之百,同時(shí)語(yǔ)音表達(dá)的帶寬和表達(dá)的數(shù)據(jù)類型還不完整,和空間有關(guān)的數(shù)據(jù)效率低、沒有精度。此外,還有打擾、隱私等,都有很大的限定條件,穿戴更是這樣。
陳益強(qiáng)舉例穿戴設(shè)備可以附著于衣服和鞋子,人機(jī)交互最終將實(shí)現(xiàn)人機(jī)共生。并且,在材料、技術(shù)的進(jìn)步下,能夠完全理解人類自然行為的意圖,甚至幫助解決人口老齡化、阿爾茨海默病等。
曹翔根據(jù)自己目前的研究?jī)?nèi)容,指出,要通過(guò)技術(shù)把每個(gè)人的創(chuàng)造力充分發(fā)揮出來(lái),創(chuàng)造力在未來(lái)會(huì)成為生存和工作所不可或缺的一部分。
未來(lái)在輸出上或許能獲得更多體驗(yàn),比如把挖掘出更多感官體驗(yàn),不只是視覺和聽覺領(lǐng)域,甚至創(chuàng)造一個(gè)幻想的世界,這是十分有趣的。
田豐稱,他對(duì)于如何通過(guò)人機(jī)交互的研究推動(dòng)產(chǎn)業(yè)發(fā)展更為關(guān)心,相關(guān)人口老齡化問題已經(jīng)與協(xié)和醫(yī)院進(jìn)行了深入合作,通過(guò)對(duì)老年人的動(dòng)作進(jìn)行解讀,提供量化的輔助診斷。
針對(duì)人機(jī)交互人才的培養(yǎng),史元春指出,工業(yè)界是有需求的,但是學(xué)術(shù)界還很迷茫。有博士生畢業(yè)后在工業(yè)界無(wú)法找到與專業(yè)十分匹配的職位,由于工業(yè)界的進(jìn)步會(huì)促使學(xué)術(shù)界對(duì)人才培養(yǎng)建立一套科學(xué)的方法。
史元春教授提到:“我們培養(yǎng)的人才應(yīng)該能夠發(fā)現(xiàn)交互難題,并且能通過(guò)科學(xué)的方法來(lái)解決這個(gè)問題。
曹翔指出,交互設(shè)計(jì)師、用戶研究員等對(duì)口培養(yǎng)的專業(yè),不難找工作;難找工作的是把人機(jī)交互作為一個(gè)研究領(lǐng)域去學(xué)習(xí)的學(xué)生,因?yàn)楝F(xiàn)有的一個(gè)蘿卜一個(gè)坑的職業(yè)體系,并不太適合跨學(xué)科的人才,但創(chuàng)業(yè)特別需要這樣的人。
文章來(lái)源:大數(shù)據(jù)文摘

IEEE Spectrum

《科技縱覽》

官方微信公眾平臺(tái)



往期推薦

人工智能有多聰明?

人工智能將統(tǒng)治無(wú)線電波

人工智能執(zhí)法記錄儀的是與非

主站蜘蛛池模板: 江门市| 德钦县| 崇仁县| 桂林市| 龙川县| 呼伦贝尔市| 盐源县| 得荣县| 寻甸| 明水县| 宜城市| 松江区| 弥勒县| 宜昌市| 阿克苏市| 嵊州市| 淮北市| 鹿泉市| 鱼台县| 湟中县| 萍乡市| 靖边县| 舞钢市| 红桥区| 日喀则市| 成安县| 互助| 涞水县| 拉萨市| 刚察县| 自治县| 贵阳市| 梁山县| 大城县| 广水市| 阜平县| 博乐市| 唐山市| 丁青县| 淳安县| 师宗县|