【編者按】隨著人工智能的發(fā)展,機(jī)器已經(jīng)可以完成更多的操作,然而讓機(jī)器人如人腦一樣的思考仍遙遙無(wú)期。同時(shí),業(yè)內(nèi)對(duì)“深度學(xué)習(xí)有幫助機(jī)器人大腦進(jìn)化的可能”已達(dá)成共識(shí)。這里我們看Derrick Harris對(duì)“Robotics: Science and Systems”會(huì)議內(nèi)容的總結(jié)。
免費(fèi)訂閱“CSDN大數(shù)據(jù)”微信公眾號(hào),實(shí)時(shí)了解最新的大數(shù)據(jù)進(jìn)展!
CSDN大數(shù)據(jù),專注大數(shù)據(jù)資訊、技術(shù)和經(jīng)驗(yàn)的分享和討論,提供Hadoop、Spark、Imapala、Storm、HBase、MongoDB、Solr、機(jī)器學(xué)習(xí)、智能算法等相關(guān)大數(shù)據(jù)觀點(diǎn),大數(shù)據(jù)技術(shù),大數(shù)據(jù)平臺(tái),大數(shù)據(jù)實(shí)踐,大數(shù)據(jù)產(chǎn)業(yè)資訊等服務(wù)。
以下為譯文:
下次你看到機(jī)器人給人遞咖啡,問(wèn)簡(jiǎn)單的問(wèn)題,甚至開車,千萬(wàn)不要大驚小怪。
是的,很多所謂的智能或?qū)W習(xí)機(jī)器人仍然只能做簡(jiǎn)單的事情,它們不能按照人的大腦的方式工作。然而機(jī)器學(xué)習(xí)確實(shí)很難,大多數(shù)人工智能事實(shí)上非常工程化。發(fā)現(xiàn)人類與機(jī)器人之間的正確的交互方式可能更難。
然而,深度學(xué)習(xí)(當(dāng)今人工智能研究員的常用手段)可能成為機(jī)器人大腦的進(jìn)化途徑。本月早些時(shí)候,我參加了 Robotics: Science and Systems會(huì)議,對(duì)研究機(jī)器人技術(shù)的數(shù)量印象深刻,機(jī)器人技術(shù)似乎都可以用深度學(xué)習(xí)技術(shù)解決,在過(guò)去的幾年,深度學(xué)習(xí)技術(shù)因?yàn)镚oogle、Facebook 以及Microsoft而出名。
大會(huì)幾乎涉及機(jī)器人智能的所有方面,從使用“Tell Me Dave”的工具來(lái)訓(xùn)練機(jī)器人助手完成家務(wù),到教機(jī)器人選擇從點(diǎn)A到點(diǎn)B的最佳路徑。研究人員討論了在自動(dòng)駕駛車輛上的應(yīng)用,從分析土壤類型以增加越野車牽引,到學(xué)習(xí)地理位置的潛在特征(為了在白天、黑夜、下雨或者下雪天識(shí)別它們)。
我最喜歡的一個(gè)演講是關(guān)于機(jī)器人“ikeabot”的,它專注于組裝家具。它的研究人員正在試圖找出機(jī)器人和人類同事交流的最佳過(guò)程。事實(shí)證明,這比教機(jī)器人了解物體或者如何適應(yīng)裝配過(guò)程需要的多得多。例如,機(jī)器人如何請(qǐng)求幫助會(huì)影響人類同事的工作效率和工作流程,甚至?xí)屗麄兏杏X(jué),他們正在和機(jī)器人一起工作,而不僅僅在它旁邊。
數(shù)據(jù)使機(jī)器人更聰明。無(wú)論何種輸入(語(yǔ)音、視覺(jué)或某種環(huán)境傳感器),機(jī)器人都依靠數(shù)據(jù)來(lái)做出正確的決定。研究人員為訓(xùn)練人工智能模型和創(chuàng)建算法使用的數(shù)據(jù)越多越好,他們的機(jī)器人就越聰明。
好消息是有很多好的可用數(shù)據(jù)。壞消息是很難訓(xùn)練這些模型。
基本上,機(jī)器學(xué)習(xí)的研究人員往往需要花費(fèi)幾年的時(shí)間來(lái)確定屬性、特征或重點(diǎn)模型,并編寫代碼使計(jì)算機(jī)能夠理解這些特征。為了創(chuàng)建一個(gè)能夠識(shí)別椅子的機(jī)器人(或算法),需要利用成千上萬(wàn)的圖像訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng),這中間有很多的工作要做。
這是人工智能的新方法(包括深度學(xué)習(xí))起作用了。我們已經(jīng)在許多場(chǎng)合解釋過(guò),目前人們?cè)谙到y(tǒng)方面付出很多努力,這些系統(tǒng)讓他們了解所獲取的數(shù)據(jù)的特點(diǎn)。寫這些算法和優(yōu)化這些系統(tǒng)很不容易(這就是為什么深度學(xué)習(xí)領(lǐng)域的專家享受著頂級(jí)的薪酬待遇),但是他們可以幫助消除大量繁瑣并費(fèi)時(shí)的手工勞動(dòng)。
事實(shí)上,在機(jī)器人技術(shù)大會(huì)上,Andrew Ng指出深度學(xué)習(xí)(不僅限于深度神經(jīng)網(wǎng)絡(luò))是吸收和分析大數(shù)據(jù)的最好方法。Ng作為Coursera的合作創(chuàng)始人出名,在2011年領(lǐng)銜Google Brain項(xiàng)目,并在斯坦福大學(xué)教授機(jī)器學(xué)習(xí)。最近,他加入了中國(guó)搜索巨頭百度,成為其首席科學(xué)家。
但Ng也了解機(jī)器人。事實(shí)上,自從2002年加入斯坦福學(xué)院,他的大部分研究都集中在將機(jī)器學(xué)習(xí)應(yīng)用于機(jī)器人,讓它們行走、飛翔以及看得更清楚。就是這項(xiàng)工作,或者是它的局限性激勵(lì)他花這么多時(shí)間來(lái)研究深度學(xué)習(xí)。
他說(shuō):“如果想在機(jī)器人技術(shù)上取得進(jìn)展,就必須把所有時(shí)間都用在深度學(xué)習(xí)上。”
Ng發(fā)現(xiàn),深度學(xué)習(xí)非常善于學(xué)習(xí)標(biāo)記的數(shù)據(jù)集的特征(例如,被正確標(biāo)記的圖片),也很善于無(wú)監(jiān)督學(xué)習(xí),即在處理大量的未標(biāo)記數(shù)據(jù)的過(guò)程中學(xué)習(xí)。這就是Ng和他的Google Brain同事發(fā)表于2012年的著名論文,關(guān)于如何區(qū)分貓和人臉,同時(shí)也在語(yǔ)言理解中取得巨大的進(jìn)展。
他解釋到:“自然地,當(dāng)我們嘗試創(chuàng)建機(jī)器人時(shí),這些功能很有用,能使機(jī)器人更好的傾聽(tīng)、理解和感知周圍的世界。”Ng展示了一個(gè)例子,是關(guān)于當(dāng)前斯坦福研究汽車上的AI系統(tǒng)的,它可以實(shí)時(shí)區(qū)分轎車與貨車,并且強(qiáng)調(diào)了GPU使一些繁重的計(jì)算工作可以在相對(duì)小型的設(shè)備上進(jìn)行。
隨著深度學(xué)習(xí)的重心移向無(wú)監(jiān)督學(xué)習(xí),它可能對(duì)機(jī)器人專家來(lái)說(shuō)更有用。他談到曾經(jīng)做過(guò)的一個(gè)項(xiàng)目,項(xiàng)目的目的是教機(jī)器人認(rèn)識(shí)位于斯坦福大學(xué)辦公室的物體。該項(xiàng)目包括追蹤50000個(gè)咖啡杯的圖像,用來(lái)訓(xùn)練機(jī)器人的計(jì)算機(jī)視覺(jué)算法。它是很好的研究,并讓研究人員受益匪淺,但機(jī)器人并不總是非常準(zhǔn)確。
Ng解釋到:“對(duì)于很多應(yīng)用程序,我們開始耗盡標(biāo)簽數(shù)據(jù)。”研究人員嘗試將訓(xùn)練數(shù)據(jù)集從50000擴(kuò)大到幾百萬(wàn)來(lái)提高精度,Ng說(shuō):“世界上真沒(méi)有那么多的咖啡杯。” 即使有那么多圖片,它們大多不會(huì)被標(biāo)記。計(jì)算機(jī)需要自己學(xué)習(xí)。
此外,Ng補(bǔ)充到,大多數(shù)專家相信人類的大腦仍然是世界上最令人印象深刻的電腦,有著“非常松散靈感”的深度學(xué)習(xí)技術(shù),在很大程度上以無(wú)監(jiān)督的方式學(xué)習(xí)。他開玩笑說(shuō):“無(wú)論你是多好的父母,都不會(huì)教孩子認(rèn)50000個(gè)咖啡杯。”
原文鏈接: Robots helped inspire deep learning and might become its killer app(翻譯/海霞 責(zé)編/仲浩)