谷歌虛擬腦技術(shù)計算:人工智能的新突破
這一看似高深的技術(shù)以大數(shù)據(jù)處理和海量計算為基礎(chǔ),為人工智能提供計算服務(wù),使得越來越計算成為可能。在今年夏天該技術(shù)因谷歌的貓臉設(shè)別而廣為了解,近日《麻生理工創(chuàng)業(yè)技術(shù)》上刊登了一篇文章,詳細(xì)介紹了該技術(shù)的進(jìn)展,以下是文章全文。
今年夏天,谷歌在人工智能領(lǐng)域獲得突破。谷歌發(fā)明了一個軟件,只需要看一下YouTube上的視頻,就能學(xué)會識別貓和人,還有其他東西。這項技術(shù)根據(jù)腦細(xì)胞的運(yùn)作方式建立,并已開始讓谷歌的產(chǎn)品變得更聰明。而語音識別也成了這一軟件的首個盈利服務(wù)。
谷歌的學(xué)習(xí)軟件基于對一組相互連接的腦細(xì)胞的模擬。這些腦細(xì)胞可以彼此溝通,互相施加影響。當(dāng)把這樣一個神經(jīng)網(wǎng)絡(luò)暴露在數(shù)據(jù)面前,不同神經(jīng)元之間的關(guān)系會發(fā)生改變。這樣,網(wǎng)絡(luò)就會發(fā)育出對某個類別的輸入數(shù)據(jù)作出特定反應(yīng)的能力。通過這種方式,網(wǎng)絡(luò)“學(xué)”到了一些東西。
在過去的幾十年里,神經(jīng)網(wǎng)絡(luò)已被使用在機(jī)器學(xué)習(xí)的領(lǐng)域,例如國際象棋軟件或臉部識別。谷歌的工程師找到了可以利用更多計算力量的方法,這是之前做不到的。他們制造出的神經(jīng)網(wǎng)絡(luò)可以不需要人的幫助,而且還很穩(wěn)定,可以走出實驗室展示階段,進(jìn)入商業(yè)化過程。
谷歌的神經(jīng)網(wǎng)絡(luò)可以自己決定什么類型的數(shù)據(jù)需要特別注意,什么模式特別重要。例如,哪些顏色和特別的形狀是軟件正在識別的物體的重點?所以它無需人類使用者來做決定。
谷歌現(xiàn)在正使用神經(jīng)網(wǎng)絡(luò)來更準(zhǔn)確地識別語音,對于谷歌的智能手機(jī)操作系統(tǒng)安卓來說,這一功能變得越來越重要,對谷歌在蘋果上的搜索應(yīng)用來說也是如此。我們在修正錯誤單詞方面改進(jìn)了20%到25%,”谷歌的語音識別領(lǐng)導(dǎo)文森特•凡豪克(Vincent Vanhoucke)說,“這意味著更多的人會得到無錯的完美體驗?!蹦壳?,神經(jīng)網(wǎng)絡(luò)只對美式英語有效,不過凡豪克表示谷歌正在其他方言和語言上作出相似的嘗試。
其他一些谷歌的產(chǎn)品也會從新型學(xué)習(xí)軟件中受益。例如,谷歌的圖片搜索工具可以更好地理解圖片的內(nèi)容,而不依賴周圍的環(huán)境。而谷歌的無人駕駛汽車和嵌入移動計算機(jī)的眼鏡也能依靠軟件來更好的理解現(xiàn)實世界數(shù)據(jù)。這項新技術(shù)在今年6月登上了很多媒體的頭條。那時,谷歌的工程師發(fā)表了實驗結(jié)果。他們從YouTube的視頻中獲得了1000萬張圖片,并把這些圖片扔到了模擬腦細(xì)胞中,為了完成這一工作,幾千臺計算機(jī)的1萬6千個處理器連續(xù)不斷地工作了10天。
“大部分人只用一臺機(jī)器來建模,但我們希望用一個很大的神經(jīng)網(wǎng)絡(luò)來進(jìn)行實驗,”杰夫•迪安(Jeff Dean)說,他是谷歌幫助領(lǐng)導(dǎo)研究的工程師?!叭绻隳軘U(kuò)大模型和模型處理數(shù)據(jù)的規(guī)模,你就能理解更細(xì)微的差別和更復(fù)雜的特征?!?BR>
通過這種方式產(chǎn)生的神經(jīng)網(wǎng)絡(luò)更加靈活?!斑@些模型可以更好地理解環(huán)境,”迪安說,他給出了一個語音識別世界的例子。例如,如果谷歌系統(tǒng)認(rèn)為它聽到一個人說“我要吃一個荔枝,”但是“荔枝”這個詞卻沒聽清楚,它會從過去的經(jīng)歷中進(jìn)行猜測。因為“荔枝”是一種水果,會在和“蘋果”或“橙子”相同的語境下使用。
迪安介紹說,他的研究團(tuán)隊還在測試可以同時理解圖片和文字的模型。“如果你輸入‘鼠海豚’這幾個字,它就會給你鼠海豚的照片,如果你提供一張鼠海豚的照片,它就會給你‘鼠海豚’這幾個字?!?BR>
下一步,研究人員會讓同一個模型學(xué)習(xí)詞匯的聲音,可以把不同的數(shù)據(jù)關(guān)聯(lián)起來。這些數(shù)據(jù)可以讓語音識別從視頻中收集到額外的線索,也可以讓谷歌的無人駕駛汽車提升性能,因為它可幫助這些汽車結(jié)合不同來源的數(shù)據(jù)(例如對附近障礙的激光掃描和汽車引擎的數(shù)據(jù)),更好地理解周圍環(huán)境。
蒙特利爾大學(xué)(University of Montreal)的教授喬舒亞•本希奧(Yoshua Bengio)表示,谷歌在神經(jīng)網(wǎng)絡(luò)上的工作讓我們朝著人工智能的終極目標(biāo)邁進(jìn)了一小步:匹配動物甚至人類的智慧。本希奧研究的也是類似的機(jī)器學(xué)習(xí)技術(shù)?!斑@條路會通向更加廣義的人工智能,如果你不能把大量關(guān)于這個世界的知識放到機(jī)器里,你就不可能得到一個智能的機(jī)器,”他說。
本希奧還表示,谷歌的神經(jīng)網(wǎng)絡(luò)事實上和哺乳動物的視覺皮層運(yùn)作方式相似。視覺皮層屬于腦部的一部分,負(fù)責(zé)處理視覺信息?!敖Y(jié)果是,[谷歌的]學(xué)習(xí)網(wǎng)絡(luò)的特性和腦部用來發(fā)現(xiàn)物體是否存在的方法相似。”
不過,他很快補(bǔ)充說,即使是谷歌的神經(jīng)網(wǎng)絡(luò)也比腦部要小得多,而且也不能進(jìn)行很多對智能來說必要的活動,例如根據(jù)外部世界收集來的信息進(jìn)行推理。
迪安同樣也很謹(jǐn)慎地不把他構(gòu)建的有限的只能同任何生物腦相比。但是他還是忍不住指出,在某些競賽中,谷歌的神經(jīng)網(wǎng)絡(luò)卻能擊敗人類。
他說,“在一些視覺任務(wù)中,它比人類的表現(xiàn)更好?!钡习才e了一個分類標(biāo)記的例子。在這個任務(wù)中,門牌號碼會出現(xiàn)在谷歌街景汽車拍攝的照片中,這一過程一般來說都會交給很多人來干。
“它們開始使用神經(jīng)網(wǎng)來決定[圖片中的]某一塊區(qū)域是否是門牌號碼,”迪安說,它們表現(xiàn)得比人還好。這只是一個小勝利,但卻凸顯了人工神經(jīng)網(wǎng)絡(luò)和你腦袋里的神經(jīng)網(wǎng)差距是多么的巨大。“很可能這并不那么讓人激動,不過計算機(jī)卻永遠(yuǎn)不會厭倦,”迪安說。真實的智慧卻會厭倦。