如何讓機器學會保持一個完整的對話始終是人工智慧界最困難的問題之一。因為若想了解一句話或一段文字的真正意義,機器(甚至人)需要對世界有一定程度的理解,它們需要「常識」。
他們發(fā)現(xiàn),當一個機器學習系統(tǒng)學會如何把一種語言翻譯成另外一種語言時,它會自動學會單詞之間的關(guān)系。而若以這個系統(tǒng)為基礎(chǔ),再訓練另外一個應(yīng)用時(比如對話,或察覺文字中的情緒),它的表現(xiàn)將遠好于從零建立的系統(tǒng)。
Salesforce的首席科學家、機器學習專家Richard Socher對此表示:「我們所做的基本上就是把機器翻譯的數(shù)據(jù)拿來,去教一個模型如何理解單詞和情境?!?/div>
有很多「機器學習的創(chuàng)新」可以用來提高機器人的語言能力,Salesforce的研究成果只是其中之一。正如許多基于深度學習的計算機視覺系統(tǒng)都會提前接受網(wǎng)路訓練,Socher認為,機器翻譯對自然語言系統(tǒng)的作用也是類似的。
作為一個集銷售、營銷以及客戶互動管理為一體的大型網(wǎng)路平臺,Salesforce已經(jīng)在其Einstein平臺中提供一系列的人工智慧工具。比如,一個可以對電郵和訊息中的情緒進行自動分類的工具,以及一個根據(jù)員工之前的工作,自動對他需要追查的線索進行優(yōu)化的工具。
Socher相信,他們這個發(fā)現(xiàn)將會提高Einstein平臺的自動語言能力,「對于聊天機器人和自動客服來說,它‘超級’有用?!?/div>
在測試中,研究人員首先需要訓練一個深度學習系統(tǒng)在英語和德語之間進行翻譯。為此,他們給一個多層神經(jīng)網(wǎng)路提供了大量已經(jīng)翻譯好的文件,并慢慢調(diào)試各種參數(shù),直至它可以自行產(chǎn)生不錯的翻譯結(jié)果。
在學會翻譯之后,研究人員們就開始訓練這個「雙語人工智慧」去學習更多的技能了,比如判斷一段文字背后的情緒,對各種問題進行分類,以及回答問題。在對比測試中,經(jīng)過雙語訓練的神經(jīng)網(wǎng)路的成績遠好于沒有經(jīng)過雙語訓練的系統(tǒng)。
由于機器翻譯已經(jīng)是一個成熟的領(lǐng)域,研究人員有大量的數(shù)據(jù)來進行訓練。「翻譯和語言的其他部分之間有著極其重要的關(guān)聯(lián),」Salesforce的研究員Bryan Mc Cann說道:「(翻譯數(shù)據(jù))一般涉及面非常廣,它們包含著各種對自動語言處理有用的信息?!?/div>