人制造了機(jī)器,而機(jī)器又重新塑造了人,這是一個生生不息的過程。我們無法阻擋,只能在接受和適應(yīng)中,盡力讓機(jī)器和人類都避免異化。
文/猛犸
iPhone 4S一經(jīng)發(fā)布,追捧和調(diào)戲Siri就成了新的大眾娛樂。人們和它開玩笑,向它求愛,還時不時問它“宇宙和一切的終極答案”之類的問題。用戶把和Siri的各種互動發(fā)到視頻網(wǎng)站上,探索著它“智慧”可能性的盡頭,像是發(fā)現(xiàn)了一個能和人類溝通的新物種。
如此受歡迎的Siri,并不是已經(jīng)擁有悠久歷史的語音識別軟件,更像是一個體積微小的“沃森(Watson)”——那個由IBM制造的、在2011年3月的問答游戲中打敗了人類選手的人工智能程序,Siri的重點(diǎn)是在于分析語句的內(nèi)容,找出句子中關(guān)鍵詞之間的關(guān)系,并且自動執(zhí)行網(wǎng)絡(luò)工具或手機(jī)軟件,以滿足用戶的需求。
Siri的歷史可以追溯到2003年。那一年,美國國防部高等計(jì)劃研究署資助了一項(xiàng)名為CALO的計(jì)劃,集合超過22家研究機(jī)構(gòu)的300名研究人員之力,只為解決一個問題:開發(fā)出能夠?qū)W習(xí)、懂得人類語言的軟件,它會根據(jù)經(jīng)驗(yàn)和收集到的其他信息分析使用者的意圖,以幫助用戶完成相應(yīng)的工作。
這一計(jì)劃于2008年完成,Siri則是這一計(jì)劃產(chǎn)物的手機(jī)版——配合3G網(wǎng)絡(luò)的帶寬、更強(qiáng)大的處理器和更加智能的網(wǎng)站內(nèi)容,蘋果公司把這種擁有學(xué)習(xí)和組織能力的軟件稱做“VPS”——虛擬個人助理。這是人機(jī)交互歷史上的一個重大革新。人們喜歡使用各種各樣的問題來為難Siri,并不僅因?yàn)樗鼤o出有趣或者有用的答案,更重要的是它看起來不像是機(jī)器,而像是一個孜孜不倦又無所不能、躲在在機(jī)器里的小精靈?;蛘哒f,她像是一個活著的人。
而人們和機(jī)器之間的溝通,也正在朝著這一目標(biāo)努力:讓機(jī)器更像人。
人機(jī)間高高的門檻
人類希望用機(jī)器模擬自身的設(shè)想,從古代的文學(xué)作品中就能看到端倪。從《列子·湯問篇》中“偃師造人”的傳說,到古希臘、古羅馬的一些虛構(gòu)作品,都能看到給機(jī)器賦予人格特質(zhì)的例子。歷史上最偉大天才之一的達(dá)?芬奇就曾經(jīng)設(shè)計(jì)過機(jī)器人;1748年,法國哲學(xué)家拉?梅特利曾匿名出版了一本《人是機(jī)器》的書,干脆提出人本來就是一部精密機(jī)器的理論。這可能也是當(dāng)條件成熟之后,讓機(jī)器識字、讀書,或者讓機(jī)器能夠和人“對話”的技術(shù)迫不及待發(fā)展起來的主要原因。
傳統(tǒng)的機(jī)器和工具與人的互動簡單而直接,幾乎一眼就能看出它是如何發(fā)生的。比如當(dāng)我們壓下一根杠桿,杠桿的另一端就會翹起來;當(dāng)我們按一個按鈕時,它就會被按下去,然后發(fā)生一些我們意料之中的事情。這樣的直觀性,讓人類學(xué)習(xí)使用機(jī)器和工具的成本一直很低,但是計(jì)算機(jī)的出現(xiàn)改變了這一切——我們需要花大量的時間學(xué)習(xí)這種本來用來幫助人們的工具,本應(yīng)成為大眾工具的機(jī)器卻因?yàn)榧夹g(shù)的高門檻而讓大眾陷入困惑之中。
這與電腦界面一直不符合人類的直覺有關(guān)。計(jì)算機(jī)內(nèi)部發(fā)生的事情對于大多數(shù)人來說,并不直觀,即使連我們在鍵盤上打字或者移動一下鼠標(biāo)這樣看似極簡單的事,其背后也比表面看到的復(fù)雜許多。當(dāng)我們按下鍵盤上的一個鍵時,特定的電路閉合并發(fā)出一個信號,經(jīng)過鍵盤內(nèi)部單片機(jī)的處理發(fā)送給主機(jī)的接口,然后由CPU根據(jù)當(dāng)前運(yùn)行的程序來運(yùn)算,再把結(jié)果發(fā)到屏幕上——可能是屏幕上出現(xiàn)了一個字母,或者是在游戲里走了一步。如果一個原始人穿越到了現(xiàn)代,一定會認(rèn)為我們都是巫師——我們做出奇怪的手勢,面前的鏡子(屏幕)上就會出現(xiàn)神秘的符號和畫面;我們在一塊板子(鍵盤)上敲敲打打,另外一個地方卻出現(xiàn)了變化。
自計(jì)算機(jī)發(fā)明以來,我們已經(jīng)熟悉了這種與它們相處的方式,并且忽視了這一長串的隱匿過程,以為當(dāng)我們在鍵盤上按下一個鍵,屏幕上就會出現(xiàn)相應(yīng)的活動,一切就這么簡單。實(shí)際上,鍵盤和鼠標(biāo)隱藏了人機(jī)交互的復(fù)雜性,以一種接近直觀的方式展示出來。但是,這并不夠,人們一直想要更好的人機(jī)交互方式,想讓計(jì)算機(jī)能夠和人一樣,我們與它們可以進(jìn)行更加自然的交互。要實(shí)現(xiàn)這樣的設(shè)想,需要我們改變一些固有的策略才行。
你就是控制器
過去,計(jì)算機(jī)的運(yùn)算能力是很珍貴的資源,直到今天,計(jì)算機(jī)和用戶之間的交互還是通過一種叫做“中斷”的方式來進(jìn)行,這像是暗示計(jì)算機(jī)的運(yùn)算資源依然很珍貴,我們只能偶爾打擾它一下——就好像它是我們的上司一樣。但是在摩爾定律的幫助下,今天的計(jì)算機(jī)用戶已經(jīng)不再需要這樣小心翼翼了,如今的計(jì)算機(jī)用戶擁有的計(jì)算能力已經(jīng)超過了通常所需,往往只有在玩很精美的3D游戲時,計(jì)算機(jī)運(yùn)算器件的溫度才會有明顯上升,因此以計(jì)算機(jī)為主的模式,可以改變了。今天,在計(jì)算機(jī)和用戶組成的計(jì)算機(jī)系統(tǒng)中,用戶才是更重要的資源,而計(jì)算機(jī)可以退居二線,讓它實(shí)時觀察用戶的動作并且更加及時地做出反應(yīng),才是更合適的途徑。
視線跟蹤軟件就是一例。很顯然,用視線來控制計(jì)算機(jī)不僅能夠讓殘疾人更方便地使用電腦,也會讓那些騰不出手來或者僅僅是犯懶的用戶,能更容易地得到他們想要的信息。
早在19世紀(jì),人們便已經(jīng)發(fā)現(xiàn)視線并非如我們以為的那樣是平滑移動的。其實(shí),人們在看到物體的時候,視線會在大約只有0.1秒的短暫注視后,從一個點(diǎn)跳躍到另一個點(diǎn),其過程就像我們對著不同方向拍了幾張照片,再把它們拼成一張更大的照片一樣。人類的視線能夠準(zhǔn)確觀察到的范圍可能比我們想象的要小得多——大約相當(dāng)于我們伸直手臂時,能夠看到的自己大拇指的長度。在不停地視線跳躍中,我們的大腦會自動把這些圖像拼合起來,讓我們意識不到視線的跳躍。這一發(fā)現(xiàn),展示出了使用視線來控制機(jī)械設(shè)備的可能性。
今天,人們已經(jīng)有了不少方法來判斷瞳孔的位置,進(jìn)而模擬計(jì)算出視線在屏幕上的精確落點(diǎn)。最簡單的方式是使用家用攝像頭首先判斷使用者的面部位置,找到你的眼睛,既而通過虹膜與瞳孔的顏色差,計(jì)算出瞳孔的位置,再根據(jù)距離計(jì)算出瞳孔中心指向的屏幕位置。
2002年5月,英國倫敦的帝國大學(xué)開發(fā)了一種叫做“眼標(biāo)”的設(shè)備,讓用戶能夠使用視線來控制鼠標(biāo)指針。2009年5月,英國蒙特福德大學(xué)的研究者們在計(jì)算機(jī)屏幕邊緣設(shè)置了兩個近紅外線攝像頭,以此精確區(qū)分瞳孔和虹膜部分,通過獲取的兩副紅外圖像的位置差,可以將瞳孔的位置定位得更加精確,讓用戶可以只靠眼睛來玩復(fù)雜的電腦游戲。
德國夫瑯禾費(fèi)協(xié)會(Fraunhofer-Gesellschaft)的光電微系統(tǒng)研究所甚至更進(jìn)一步,開發(fā)出了將攝像機(jī)和屏幕結(jié)合在一起的工具,當(dāng)用戶盯著屏幕時,屏幕也在用無數(shù)的小眼睛盯著用戶,遍布整個屏幕的攝像頭可以把用戶的視線落點(diǎn)計(jì)算得更加精確。雖然這一技術(shù)目前尚未進(jìn)入成熟商用,但已沒有什么根本難題需要解決。
既然視線可以捕捉,那么計(jì)算機(jī)用戶的表情和動作自然也可以捕捉。幾年前,英特爾就已開始嘗試在電視上安裝攝像頭,根據(jù)用戶的表情來控制錄像的播放。例如在一場球賽中,電視“看到”用戶表情比較激動的話,就會把剛才的片段以慢動作重放一次。
家用游戲主機(jī)商們更是早就開戰(zhàn)了人體動作捕捉上的探索,希望把這種以前只用于電影特效的技術(shù)帶入玩家的起居室。任天堂公司就在Wii的手柄中加入了紅外和加速度傳感器,讓手柄變成各種各樣的運(yùn)動器材;索尼的PS Move看起來像個麥克風(fēng),其實(shí)它不僅有加速度傳感器和陀螺儀,而且還能發(fā)光;附加在微軟Xbox 360上的Kinect更是完全拋棄了游戲手柄,僅憑兩部攝像頭、麥克風(fēng)和紅外線傳感器就能跟蹤玩家的肢體動作,還能識別玩家的語音指令。
Kinect用彩色和黑白的兩個攝像頭獲取玩家的立體圖像,通過紅外線感知玩家離電視的大致距離,以判斷玩家的身體動作,并將之轉(zhuǎn)化為游戲中角色的動作。2009年7月,比爾?蓋茨提到,Kinect不僅僅是玩具,還會成為我們操控電腦的新方式?!斑@不僅限于游戲,還可以應(yīng)用在所有基于電子媒體的消費(fèi)品上,甚至包括使用Windows的電腦、視頻會議、協(xié)同工作和通信等?!彼f,“這是3D定位設(shè)備,這是視頻識別,是可以進(jìn)行行為判斷的攝像頭。”的確如此。Kinect發(fā)布沒多久,就有黑客把它移植到家用計(jì)算機(jī)上,微軟也發(fā)布消息,說在Windows 8發(fā)布時,將讓Kinect在PC上也可以使用。
機(jī)器更懂你
不久以后,我們在空氣中比劃手勢就能操作計(jì)算機(jī),就像湯姆?克魯斯在電影《少數(shù)派報告》中所做的那樣。當(dāng)這種技術(shù)真正進(jìn)入商用,《鋼鐵俠》中托尼?史塔克那套空氣投影和動作捕捉結(jié)合的工作環(huán)境將不再是科幻。這種人機(jī)互動技術(shù)使得我們不再需要指揮計(jì)算機(jī),而是徹底由計(jì)算機(jī)隨時“緊盯”我們的動作。這樣會更自然,或者說,更符合我們的直覺。
2009年,麻省理工學(xué)院(MIT)媒體實(shí)驗(yàn)室的印度天才帕納夫?米斯瑞(Parnav Mistry)就展示了一個基于人類直覺的操作系統(tǒng)。這種系統(tǒng)叫做“第六感(Sixsense)”,它由一部手機(jī)、一個微型投影儀、一個攝像頭、幾個不同顏色的智能鼠標(biāo)手指和相應(yīng)的軟件構(gòu)成?!暗诹小痹O(shè)備擁有完整的輸入輸出:用攝像頭拍攝下人們的手勢和面前的一切,并且用它來執(zhí)行相應(yīng)的動作。例如你把一本書放在攝像頭前面,“第六感”就會通過手機(jī)里面的OCR(光學(xué)字符識別)軟件判斷出書名,再去亞馬遜這樣的網(wǎng)上書店中搜尋,把書評直接投影在書的封面上,給你的購買做參考。此外,當(dāng)你看到某個人的時候,它會用圖像搜索程序搜索此人的照片,再提供給你網(wǎng)上關(guān)于此人的相關(guān)資料,幫助你化解對面卻不相識的尷尬。而當(dāng)你用手比出一個取景框姿勢時,它就會拍下你眼前的美景。
雖然以目前手持設(shè)備的計(jì)算能力,要完成“第六感”設(shè)想的計(jì)算還有些難度,但是這種基于人類直覺的操作方式還是讓人眼前一亮。這比Kinect這樣的動作捕捉技術(shù)更近了一步,它能夠讓計(jì)算資源圍繞人的需要而配置,根據(jù)人的周圍環(huán)境而判斷出人們最需要的是什么信息。帕納夫?米斯瑞在發(fā)布“第六感”時曾說:“我相信把信息跟所有物件整合,不僅能幫助我們消除信息鴻溝,還能以某種方式幫助我們保有人性,加強(qiáng)我們與實(shí)體世界的連接,最終我們不會變成坐在一臺機(jī)器面前的另一臺機(jī)器?!?/FONT>
消除信息鴻溝的根本方法,在于讓人們生活的這個由原子構(gòu)成的真實(shí)世界和由字節(jié)構(gòu)成的虛擬世界能夠隨時連接在一起——甚至更進(jìn)一步地疊加在一起。
在日本東京都的立川市,有一棟叫做N Building的建筑,它的墻上刷著一副81平方米的巨型標(biāo)記,這看起來似乎沒有什么意義,但是如果你在智能手機(jī)上安裝一個軟件,再用手機(jī)攝像頭對準(zhǔn)那個標(biāo)記,屏幕上就會顯示出建筑中的店鋪、商品和打折的信息,就像你的手機(jī)變成了一個透視窗口,它讓建筑物內(nèi)部的信息一覽無余。
1992年,波音公司計(jì)算機(jī)研究部門的首席科學(xué)家托馬斯?考德爾(Thomas Caudell)提出了這種被叫做“增強(qiáng)現(xiàn)實(shí)”的設(shè)想。他認(rèn)為,人類可以將所需要的數(shù)據(jù)投射到真實(shí)世界的景物上,以減少人們在真實(shí)世界與虛擬世界之間切換所花費(fèi)的時間。不過,當(dāng)時的計(jì)算能力不足以支持這樣的設(shè)計(jì),但現(xiàn)在已經(jīng)不成問題?,F(xiàn)在,寶馬公司在使用這種技術(shù)培訓(xùn)維修人員,醫(yī)學(xué)院用它來培訓(xùn)外科醫(yī)生,甚至有人在名片背后也印上標(biāo)記,當(dāng)它對著攝像頭時,電腦會顯示出一個立體的網(wǎng)格人物形象,還會主動進(jìn)行自我介紹。
甚至就連雜志也不甘落后——2009年12月的《Esquire》封面是《鋼鐵俠》和《大偵探福爾摩斯》的主演小羅伯特?唐尼,他手指著一個由黑色和白色方塊組成的圖形。當(dāng)你在雜志官網(wǎng)上下載一個軟件,再把封面上的圖形放到攝像頭前,小羅伯特?唐尼就會出現(xiàn)在你的屏幕上,展示這期雜志的更多故事,有視頻、有動畫、有訪談,甚至還有汽車廣告。阿迪達(dá)斯正計(jì)劃推出幾款支持增強(qiáng)現(xiàn)實(shí)的運(yùn)動鞋,讓你能夠和穿同款球鞋的玩家一起玩虛擬游戲。和“第六感”類似,增強(qiáng)現(xiàn)實(shí)技術(shù)讓我們無須努力翻找信息,而是讓信息根據(jù)我們的所需,適時地出現(xiàn)在我們眼前。
美麗新世界,抑或深淵
所有這些讓人機(jī)互動更為友好的技術(shù)都暗示了同一種趨勢——讓計(jì)算機(jī)變得更加像人,機(jī)器不再像過去那樣只會等待人們的提問,它們會像人一樣考慮更多的可能性,然后做出最合適的反應(yīng)。今天,硬件、軟件、人機(jī)交互、微型設(shè)備等領(lǐng)域的進(jìn)展,意味著一種新的人機(jī)交互方式——讓機(jī)器更“懂”人的心思。
隱藏在這種趨勢之下的,是一堆看不見的傳感器、大量程序和互聯(lián)網(wǎng)的協(xié)同工作。隨著計(jì)算設(shè)備能力的提升、電子器件微型化進(jìn)程的進(jìn)展,計(jì)算設(shè)備終將會變成圍繞在我們身邊的一團(tuán)空氣,它們從我們的生活中學(xué)習(xí),自動自發(fā)地做好一切準(zhǔn)備。這些行為是如此自然,人們不會意識到這是大量計(jì)算得出的最優(yōu)結(jié)果,我們不再需要告訴機(jī)器去做什么,它們就會主動“關(guān)照”我們。
這幾乎是已經(jīng)確定的未來。但是人們對這樣的機(jī)器將會產(chǎn)生什么樣的反應(yīng),并不可知。必然有些人會歡欣鼓舞新時代的來到,但是也一定會有人厭煩、擔(dān)心,甚至恐懼。對新技術(shù)的擔(dān)憂可能來自人們固有的心理障礙,不過機(jī)器即使像一個傻頭傻腦的大鐵塊,也并不能保證它就一定招所有人喜歡。對機(jī)器的恐懼,比較合理的解釋也許是人們對看起來有智能的對象會表現(xiàn)出一點(diǎn)感情色彩,我們可能不會對一個電燈開關(guān)關(guān)心備至,但有時會忍不住把自己的計(jì)算機(jī)擬人化。
斯坦福大學(xué)傳播系的學(xué)者也認(rèn)可這種觀點(diǎn)。拜倫?里弗斯(Byron Reeves)和克利福德?奈斯(Clifford Nass)在那本里程碑式的《媒介公式》中,研究了人與信息技術(shù)設(shè)備的關(guān)系,他們用20年的時間和數(shù)十個實(shí)驗(yàn)證實(shí),人們和自己使用的計(jì)算機(jī)之間的確存在類似人類之間的感情。正是基于這些實(shí)驗(yàn),他們幫助微軟開發(fā)出了Word軟件中那個長著兩只大眼睛、曲別針形狀的助手“Clippy”。有些人喜歡它,也有許多人討厭它,但重點(diǎn)是,這個完全沒有生命的小東西喚起了人們強(qiáng)烈的情緒反應(yīng)。卡耐基梅隆大學(xué)和喬治亞理工學(xué)院的研究表明,人們會一廂情愿地將情感投射到機(jī)器上,期盼它們的行為像人類自己一樣。當(dāng)機(jī)器達(dá)不到這樣的要求時,人們會失望和憤怒。
更成熟的人機(jī)交互技術(shù)會讓用戶誤認(rèn)為計(jì)算設(shè)備可能擁有某些人類的特質(zhì),變成某種像是人的“生物”。這種趨勢讓學(xué)者擔(dān)憂這會進(jìn)而改變?nèi)祟悓Υ嫒说姆绞健?011年12月7日,供職于美國??怂剐侣勁_的心理學(xué)家基思?阿布羅發(fā)表了一篇文章,認(rèn)為Siri這樣的工具會弱化人類的正常社交能力,減少人類正常的情感響應(yīng),讓我們的語言和情感最終變得和一臺機(jī)器差不多。不過,這只是一種比較嚴(yán)重的推測,我們只能希望它不會發(fā)生。
人機(jī)交互的確會向著更自然的方式前進(jìn),但是我們也正在受到機(jī)器越來越多的影響,只要看看那些整天“調(diào)戲”Siri而樂此不疲的人,就會對此心中有數(shù)。但是,宛如DNA雙螺旋緊緊纏繞一般,人制造了機(jī)器,機(jī)器又重新塑造著人,這是一個生生不息的過程,我們無法阻擋,只能在接受和適應(yīng)中,盡力讓機(jī)器和人類都避免異化。?