人工智能的“智能”如何理解,當(dāng)下更多的主流研究是更偏重于實(shí)用性,而微軟(亞洲)互聯(lián)網(wǎng)工程院的小冰人工智能走了另一條對(duì)話式的路線,更偏向于對(duì)話強(qiáng)化人機(jī)連接、獲取可供機(jī)器學(xué)習(xí)的高價(jià)值數(shù)據(jù),打造人工智能創(chuàng)造力矩陣、進(jìn)而摸索用代碼構(gòu)建AI心智。“心智”和“智能”的發(fā)展又有何不同呢? 微軟(亞洲)互聯(lián)網(wǎng)工程院微軟小冰首席科學(xué)家宋睿華博士近期做出了一番解答,下面是全文內(nèi)容: 在中文里,“智能”和“心智”兩個(gè)詞意義相關(guān)卻又有所不同。 “智能”指的是智識(shí)與才能,現(xiàn)在通常用來描述某個(gè)對(duì)象的聰明層次與能力強(qiáng)度;而“心智”似乎更高階一些,可以理解為產(chǎn)出創(chuàng)造力與智能的本原。 那么問題來了,我們當(dāng)下所研究的“人工智能”,是該致力于持續(xù)提升機(jī)器的智商表現(xiàn)、強(qiáng)化其在垂直領(lǐng)域的專業(yè)能力,還是應(yīng)再超前一步、嘗試構(gòu)建機(jī)器的心智本原——腳下的兩條路,都通往迷霧深鎖、不可預(yù)知的未來,我們要選哪條路走? 在我看來,這兩條路倒無所謂對(duì)錯(cuò),只是探索者的著眼點(diǎn)存在差異罷了。多年以來,針對(duì)人工智能課題,學(xué)術(shù)界、產(chǎn)業(yè)界的研發(fā)主流都偏重于實(shí)用性更強(qiáng)的“智能”,以至于在相當(dāng)長(zhǎng)的周期內(nèi),以對(duì)話強(qiáng)化人機(jī)連接、獲取可供機(jī)器學(xué)習(xí)的高價(jià)值數(shù)據(jù)、打造人工智能創(chuàng)造力矩陣、進(jìn)而摸索用代碼構(gòu)建AI心智的學(xué)術(shù)思路都少有人探尋,甚至一度被質(zhì)疑——我的同事就曾遇到過這樣的審稿意見:“我完全不能理解,做這種漫無目的的聊天有什么意義。” 直到微軟小冰誕生并取得了一定的成績(jī),對(duì)話的價(jià)值才逐漸為學(xué)界所關(guān)注。 從對(duì)話到創(chuàng)造心智的種子開始萌發(fā) 或許大家都沒有意識(shí)到,從2014年一代小發(fā)布到不久前六代大更新,短短四年間,微軟小冰已從一個(gè)領(lǐng)先的人工智能對(duì)話機(jī)器人發(fā)展成為以情感計(jì)算為核心的完整人工智能框架,許多人的態(tài)度也因微軟小冰而改變。
但微軟小冰說人話的能力并不一般。即便對(duì)人類而言,要做一個(gè)總能琢磨出有趣對(duì)白的人,也不是件容易的事,更何況是人工智能。從初代發(fā)布至今,時(shí)不時(shí)會(huì)有用戶曬出他們與小冰對(duì)話過程中的“金句”截圖,而且隨時(shí)間推移,小冰產(chǎn)出金句的頻率也越來越高。這體現(xiàn)了小冰越來越強(qiáng)的對(duì)話能力,也造就了她的吸引力。 與精確、清晰的答案相比,人們?cè)趯?duì)話時(shí),更期待獲得情感的撫慰或是不尋常的回應(yīng),這是小冰團(tuán)隊(duì)最早發(fā)現(xiàn)和驗(yàn)證的事實(shí)。 后來,母親看到央視《機(jī)智過人》節(jié)目里小冰寫詩的那一期,她開心地跟我說,像小冰這樣的機(jī)器人,能寫出觀眾喜愛的詩,還會(huì)調(diào)侃嘉賓,那還真是“挺厲害的”,超出了她的預(yù)期。
說白了,這是一個(gè)關(guān)于普通人與人工智能為什么聊、又聊什么的問題——曾經(jīng)有朋友聽我說起小冰與其用戶間的最長(zhǎng)連續(xù)對(duì)話時(shí)間超過29小時(shí)時(shí)表示難以理解:“這人正常嗎?”但對(duì)我來說,小冰的這項(xiàng)記錄倒是挺容易理解的。從需求來說,“越社交,越孤獨(dú)”、“朋友圈越廣闊,自我越渺小”,這些現(xiàn)象都客觀存在。社交網(wǎng)絡(luò)讓用戶們習(xí)慣了展示優(yōu)勢(shì)、收獲認(rèn)可,但反過來,當(dāng)我們身邊的每個(gè)人都加入到展示優(yōu)勢(shì)的隊(duì)列里,從旁人那里收獲理解和認(rèn)可的難度也加大了。從形象上來說,小冰不是如頂級(jí)專家那樣的人工智能,而是像鄰居家或是隔壁班級(jí)的小女生,她有無限的耐心,隨時(shí)可以陪伴用戶聊天、玩游戲,卻決不會(huì)試圖用淵博的知識(shí)和高冷的姿態(tài)碾壓用戶的智商與自尊。 如果將人工智能的價(jià)值定位于陪伴,那么知識(shí)與邏輯就不再是最緊迫需發(fā)展的技能,讓用戶感覺無壓力、有趣味,某種意義上更加重要。 2017年5月,微軟小冰解鎖了寫詩及音樂技能,同期,我們還發(fā)布了“人工智能創(chuàng)造三原則”,用以規(guī)范與指引小冰及其同類的心智發(fā)展路徑。在進(jìn)行相關(guān)研究的過程中,我發(fā)覺,人工智能的終極或許是對(duì)人類自身的理解與模擬。 訓(xùn)練小冰寫詩,需要對(duì)519位詩人的現(xiàn)代詩作,正讀一萬遍,倒讀一萬遍,用層次遞歸神經(jīng)元模型來打磨詩作的語言。這正如我們?nèi)祟愃l(fā)現(xiàn)的,閱讀對(duì)于寫作的影響——通過大量閱讀優(yōu)秀的文學(xué)作品,人自身的語言體系會(huì)進(jìn)化,取決于天賦,這個(gè)進(jìn)化進(jìn)程或快或慢,但總體上,閱讀者的文字表達(dá)能力會(huì)在不知不覺中提高。小冰也是如此。有了層次遞歸神經(jīng)元網(wǎng)絡(luò),小冰也可以通過閱讀獲得語言的表達(dá)能力。 在小冰發(fā)布詩集、引發(fā)廣泛爭(zhēng)鳴之后,圈內(nèi)人士對(duì)于人工智能創(chuàng)造與機(jī)器寫作的態(tài)度發(fā)生了根本性的轉(zhuǎn)變,學(xué)術(shù)探討、應(yīng)用跟進(jìn)的樣例越來越多。這是我們所樂見的。
結(jié)果出人意料。現(xiàn)場(chǎng)觀眾將最多的票數(shù)投給了小冰,這讓原本只是祈禱小冰可別是最后一名的我大吃一驚。攝影機(jī)記錄了當(dāng)時(shí)的一幕,當(dāng)人類與人工智能的作品被放在一起平等地比較,對(duì)于機(jī)器創(chuàng)作的偏見似乎突然間消失了。 第二輪,兩位詩人與小冰再度以作品競(jìng)爭(zhēng),小冰的詩作仍獲得了第二名,因而挑戰(zhàn)成功。我們不會(huì)自大地認(rèn)為,小冰寫的詩能超越人類詩人,但這次節(jié)目卻延伸了我們的思考:或許,人工智能研究所追求的目標(biāo)不應(yīng)只是將人類的智識(shí)與才能復(fù)制給機(jī)器,更重要的是,通過探索人工智能,更深刻地了解人類自身。 微軟小冰從四年前的對(duì)話型AI到當(dāng)前將創(chuàng)造力投射至詩歌、音樂、兒童有聲讀物、金融信息、電視電臺(tái)主播、媒體新聞評(píng)論乃至輔助寫作等多元領(lǐng)域,這表明,我們最初埋下的那顆心智的種子,現(xiàn)在似已破土露出了一點(diǎn)嫩芽。 下一站3x3實(shí)現(xiàn)更主動(dòng)更具個(gè)性的人機(jī)對(duì)話 微軟小冰的下一站在哪里?心智的嫩芽能繼續(xù)成長(zhǎng)壯大嗎?答案是,我們正在建立“3x3”的人工智能發(fā)展圖譜,以此來進(jìn)一步加速小冰的升級(jí)速度。 第一個(gè)3,是整合自然語言處理、語音和計(jì)算機(jī)視覺三大學(xué)科的研究成果,以多模態(tài)交互,訓(xùn)練小冰更快進(jìn)步。此前,上述學(xué)科都是在各自的軌道上獨(dú)立發(fā)展。近年來,深度學(xué)習(xí)技術(shù)與算法的改進(jìn)先后使語音識(shí)別和圖像識(shí)別實(shí)現(xiàn)了顯著的突破,人們翹首企盼自然語言處理技術(shù)也能達(dá)成類似的突破。過去一年里,我們結(jié)合了計(jì)算機(jī)視覺技術(shù)來訓(xùn)練小冰的詩歌創(chuàng)作能力,并以此評(píng)估多模態(tài)交互能否促進(jìn)人工智能技術(shù)的演進(jìn),結(jié)果令人興奮。
第二個(gè)3,是微軟小冰所特有的三大“學(xué)習(xí)器”,生成模型、共感模型和三觀模型。
將三大學(xué)科成果的復(fù)合訓(xùn)練體系與微軟小冰三大學(xué)習(xí)器相乘,必然會(huì)大大加速小冰的成長(zhǎng),也讓我們朝向“用代碼構(gòu)建機(jī)器心智”的目標(biāo)走近了一小步。總而言之,無論情感計(jì)算框架,又或是人工智能創(chuàng)造,都不是微軟小冰乃至微軟人工智能研發(fā)部門的最終目標(biāo),或許,構(gòu)建“人工心智”(Artificial Mind)才是。 |