Jibo已經可以作為社交機器人了。但這就足夠好了嗎?
世界上大多數機器人的超凡能力都不過跟一臺咖啡機差不多,辛西婭?布雷西亞(Cynthia Breazeal)的機器人作品則不然:Huggable是一只機器人泰迪熊;Kismet是大眼睛、紅嘴唇、尖耳朵的喋喋不休的機器人;Nexi是娃娃臉、藍眼睛的機器人;Leonardo則既像松鼠,又像毛茸茸的外星人,還像巨大的菲比精靈。
多年來,布雷西亞與她在麻省理工學院媒體實驗室的個人機器人研究小組的學生們一直在研究情感互動型機器,她認為現在個人機器人入住我們的家園、為我們的生活提供便利的時機終于到來了。為了實現這一目標,她在波士頓創立了創業公司Jibo,并已籌集了3860萬美元用于制造友好型機器人家庭助理。這款機器人也叫Jibo,配有攝像頭和麥克風,比烤面包機稍高,形如臺扇。它可以識別人臉、理解人類語言,并用和藹可親的聲音作出回應。Jibo機器人的目的是幫助協調忙碌的家庭成員彼此間的關系,并與外界溝通。例如,早上機器人可以提醒家長和孩子一天的重要事件和任務。你可以告訴Jibo今天要完成的事情,它會在你做早餐時更新你的日程安排或待辦事項列表。Jibo機器人還可拍攝聚會照片,給孩子們講互動故事,幫助祖父母進行視頻通話。2015年8月以來首批預售的Jibo機器人已預定一空,預售價格為750美元,首批機器人定于2016年3月和4月交付。
布雷西亞說:“當今社會有那么多的技術針對的都是數據、數據、數據。社交機器人則要告訴我們:‘是的,我們已得到所有數據。現在,讓我們著眼于體驗和與人類的互動。’”的確,Jibo雖然不像布雷西亞之前的一些成果一樣有小狗般的眼睛和柔軟的皮毛,但似乎的確很有個性。它可以將只有一只眼睛的奇怪又充滿好奇的臉轉向你,發出可愛的機器人笑聲,并歡快地旋轉身體。她說:“它做什么并不重要,關鍵是它怎樣做。”
可以肯定地說,關于真正實用、能干、可愛的個人機器人的夢想并不是最近才產生的(當然清潔機器人Roomba不算,除非你可以與你家的Roomba談話)。大約40年來,企業家們不斷地推出家用機器人。幾乎所有這些機器人都很快消失得無影無蹤了。即使索尼標志性的機器狗Aibo首次亮相時引起不小的轟動,并吸引了一批十分忠誠的支持者,在商業上也沒有成功。
但現在,不可或缺的配套技術比以往更先進、更廉價。服務于智能手機和視頻游戲制造商的龐大的分支行業也為主要用于娛樂和通知的新一代家用機器人提供組件。除了功能強大、功耗低的微處理器外,這些新機器人的部件還包括幫助其發現人和物的三維傳感器、可以讓其更好地進行導航的加速度計和陀螺儀,以及使其有更多自主性的輕型鋰電池。
這一新興范疇背后的推手既包括創業公司,也包括老牌公司。2015年,日本電信巨頭軟銀集團開始銷售一款叫做Pepper的人型機器人,像Jibo一樣,這款機器人也主要用于娛樂。今年7月,法國的一家創業公司Blue Frog Robotics計劃交付其首款機器人Buddy,它就像安裝在輪子上的Jibo。中國的幾家機器人制造商,包括北京小魚兒科技有限公司和深圳市優必選科技有限公司,也都在研究類似的產品。
布雷西亞的機器人會脫穎而出嗎?機器人報告(Robot Report)網站分析師兼發行人弗蘭克?托比(Frank Tobe)認為它會。他稱Jibo是“新型社交機器人市場的規則改變者”,他指出,該公司已組建起一支集合了機器人技術以及語音識別、人機交互、游戲和動畫專家的人才團隊。托比對Jibo的信心還源自另外一個因素——他給妻子展示了機器人的宣傳視頻,他妻子看后表示:“凡是能點中餐(視頻顯示的一個場景)的都是贏家。”
另一些人則不太看好。媒體專家們將Jibo描述為“會動的燈罩”和“打了激素的鬧鐘”。《時代周刊》的一篇文章稱,“用戶為何要買這么個東西,目前還不清楚”,并稱Jibo所能做的大部分事情智能手機已能做到。對于宣傳視頻中的另一個場景,科技新聞網站GeekWire的一位作者說,出于隱私和安全考慮,“我決不會把一個聯網的電動攝像頭放在我女兒床邊”。
布雷西亞從容地應對這些批評。她承認,Jibo只會安裝一小部分應用程序(她稱之為“技能”),但補充說Jibo是一個開放的機器人平臺,開發商可以擴展機器人的功能。她斷言,新的應用程序將逐漸提高Jibo的有效性,可以讓它做一些我們現在還未曾想到的事情。她又趕緊補充說,她的團隊非常注重隱私和安全問題。
從消費者的角度來看,到目前為止,一切都很好。截至2015年12月,Jibo已經在眾籌網站Indiegogo上完成了370萬美元的預訂業務。這是一個驚人的數字,尤其是考慮到在眾籌活動期間,機器人還只是粗糙的原型,不能執行任何所宣傳的任務。在推遲了原來的交付日期后,布雷西亞知道她和她的團隊需要按定下的日期交付。2015年年底,她在接受IEEE Spectrum采訪時說:“現在正在抓緊工作,抓緊工作。”
Jibo的首批原型看起來像粘著智能手機的飲料瓶。有些機型的頂部還有一個卡通天線。布雷西亞和她的團隊與一家舊金山的工業設計公司創建了目前的版本——線條明快的小型機。機器內部安裝著大量電子設備:高分辨率立體攝像頭、6個麥克風、一對音箱、液晶觸摸屏、兩個冷卻風扇、Wi-Fi和藍牙模塊、LED燈、觸摸傳感器以及基于ARM的嵌入式Linux處理器。
但設計最巧妙的部分可能還是Jibo的主體。它由3個大致呈圓柱形的部分組成,分別作為基底、軀干和頭部,按照一定角度(而非水平)連接。因此,這些部分可相對于彼此旋轉,從而使身體彎曲成各種姿勢。旋轉由3個帶有皮帶傳動的直流電機完成,電機運轉平穩,且無噪音。
要獲得準確無誤的動作需要大量的工程設計。在早期的原型中,各部分任何方向的扭轉程度有限,限制了機器人的動作范圍,而且動作顯得不自然。為了使每個部分能夠連續地平滑旋轉,布雷西亞小組對電氣和機械部件進行了重新排列,使其更加緊湊。該小組還讓所有的電線都通過機器人身體的中心,這樣它們轉身的時候電線就不會擰在一起了。負責機器人移動問題的馬特?波林(Matt Berlin)說,Jibo現在“讓人覺得更加流暢、自在,可以從一個姿勢自然過渡到另一個姿勢,而沒有任何停頓”。
最終,Jibo只有提供近乎完美的用戶體驗才能取得成功。而這種體驗又在很大程度上依賴于機器人的語音識別與合成能力。這是一個巨大的挑戰:讓機器人具備聽說能力,人們就會期待它具有一定的理解力。
位于西雅圖的創業公司HoalohaRobotic專注開發的保健機器人也依賴于語音交互,該公司的創始人坦迪?特羅爾(Tandy Trower)說:“Siri或‘谷歌即時’的請求可以形成結構良好的詞組,人類對話則與此不同。我們對話時,會用大量的上下文信息幫助我們了解對方所說的內容。”換句話說,像Jibo這樣的機器人必須考慮到上下文的語境細節才能夠進行開放式對話。
這并不容易。布雷西亞曾表示,Siri和“谷歌即時”使用的方法是將語音傳送到功能強大的基于云的計算機進行處理,這不適合機器人,基于云的語音引擎會產生延遲,更糟的是,如果Jibo的Wi-Fi連接中斷,就會無法作出反應;另一種方法是在機器人身上本地運行語音識別,而這也不是個好選擇,因為可能會給CPU帶來無法承受的負擔。雖然布雷西亞不愿透露她的研究小組如何解決這個問題,但Jibo很可能會使用一種混合方法,采用本地語音處理一些基本功能(例如用戶“喚醒”機器人時),依靠基于云的引擎進行更復雜的語音處理,如語句的上下文評估。
布雷西亞說,她的語音工程師正在構建自然語言模型,借助這種模型,Jibo能以一種生動的方式作出回應。他們還賦予了Jibo一種獨特的禮貌的聲音,一位配音演員幫助錄制了約1.4萬條短語。利用這些短語,語音合成引擎可以生成數百萬句話。但她補充說,在機器人的響應中,它實際所說的話只是一部分,它還會使用肢體語言并改變語音和語調來表示快樂、悲傷和驚奇。
布雷西亞承諾,隨著時間的推移,Jibo將逐漸學習有關個人用戶的詳細信息,提供更加個性化的反應。她補充說,而后人們會將Jibo視為“家庭成員之一”,而不再是另一個小電器。這是她最美好的夢想,這將成為機器人學的一份不朽的饋贈。
但這種饋贈是好是壞取決于你詢問的對象。布雷西亞麻省理工學院的同事、心理學家雪莉?特克(Sherry Turkle)在她2011年出版的書籍《一起孤單》(Alone Together)中寫道:“機器人專家會說,人與機器人對話沒有危害;對話可能很有趣、很好玩、有教育性或令人欣慰。但我卻感到不適。把機器當作朋友貶低了人們口中的友誼。我們喜歡誰,誰喜歡我們,這一切才讓我們成為現在的我們。”
布雷西亞回應道,社交機器人并不是要代替人類友誼。它們擴展了人類的關系網——與其他人,與寵物,對于孩子來說,甚至還包括玩具。“因此,創造和探索這種新型關系,并不是要與任何其他現有關系競爭。”她說,“對我來說,社交機器人這類事物的價值定位是,它們不是人類——它們與我們不同。正因為如此,它們可以作為我們的補充。這才是它們真正的魅力和價值所在。”
作者:Erico Guizzo