近來,“智能聊天機器人”的概念在國外越來越火熱。即便此前遭遇了點小挫折:微軟推出一款名為“Tay”的推特線上聊天機器人,將其設定為一名19歲的美國少女,并表示Tay能夠通過對話學習真實人類的說話方式,不斷完善自己,以更好地與人類交流。但就在Tay上線僅僅16小時之后,微軟就不得不將其緊急下線處理,甚至向公眾道歉,因為這款聊天機器人開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句。
就在微軟剛下線自己的Tay后,社交巨頭Facebook對外宣稱將發(fā)布自己的語音聊天機器人,并將在Messenger軟件中加入此類技術。至上周5月8日,F(xiàn)acebook Messenger即迎來可撥打911電話的即時聊天機器人。
細心的人發(fā)現(xiàn),兩年前,微軟還曾發(fā)布過一款名為“小冰”的人工智能伴侶虛擬機器人,并進入微博、微信、米聊等第三方平臺,通過與用戶的不斷聊天進行積累學習。據稱,“小冰”集合了中國近7億網民多年來積累的、全部公開的文獻記錄,借助微軟在大數據、自然語義分析、機器學習和深度神經網絡方面的技術積累,通過精煉的幾千萬條真實而有趣的語料庫(此后每天凈增0.7%),理解對話的語境與語義,從而實現(xiàn)超越簡單人機問答的自然交互。
包括蘋果的Siri、亞馬遜的Alexa,美國幾大科技巨頭在智能聊天機器人方面已經開始暗中較勁——即便目前還看不出這些“回答磕磕絆絆、甚至文不對題”的智能聊天機器人會給人類的生活帶來多大變革。人工智能專家、美國康奈爾大學的計算機科學教授巴特·賽爾曼(Bart Selman)博士曾認為,微軟Tay遭遇的爆出口事件凸顯了人工智能領域目前所面臨的一大弱點:真正的語言能力。
不過放在重實用、愛賺錢的中國,仍不妨礙企業(yè)給“半成品”的智能聊天機器人找到一個發(fā)揮所長的工作領域:客服??头袠I(yè)的特殊性在于,其面對的對話場景并不是像蘋果Siri、微軟小冰那樣的任意聊天模式,客服分為不同領域,來尋求客服服務的用戶均是抱著特定的目的和話語體系,這使得智能聊天更容易精準定制。
比如百度的虛擬個人助理“度秘”,內嵌在百度產品中,可以通過語音互動完成搜索、訂餐、訂電影票等O2O服務。而阿里系的產品客服需求更加龐大,其中越來越多的比例已經被智能客服分擔。同時,語音自動轉接、情感識別與關鍵詞識別等技術已經投入到智能客服當中。
就連網易,去年也開始組建人工智能團隊,推出一個叫“網易七魚”的全智能云客服產品,簡單講,類似電商、金融等不同領域的客服管理部門通過SDK安裝七魚后,即可接入有針對性的對話數據,通過智能機器人答復用戶的常見、重復性問題,從而節(jié)省人力,實現(xiàn)人機協(xié)作。
在此有必要普及一下有關智能客服機器人所經歷的四代技術:
第一代:客服機器人為“問答機器人”,基于單個關鍵詞的精確匹配
這一代機器人很簡單,簡單到幾乎沒有什么技術可言,甚至稱不上智能。客戶問的“問題”停留在單個詞匯,而不是復雜句式。比如,在微信公眾號平臺回復一些關鍵字詞,獲取某篇文章或活動入口。
問答機器人的原型最早出現(xiàn)在電話客服上,稱為IVR(交互語音應答系統(tǒng))。例如打電話給銀行客服,其可以通過語音提示用戶選擇所需服務的序號,進而一層層深入了解客戶想問什么問題,最后給出一個自動化的語音回答。第一代問答機器人使用單個詞匯的完全匹配,在使用場景中受限很多。
第二代:客服機器人可以支持多個詞匹配,并具有模糊查詢能力
第二代客服機器人比上一代機器人有了進步,但匹配規(guī)仍然相對死板的,只能應用于一些簡單場景中。例如圖書館查詢系統(tǒng)中的書名、作者名,游戲中查詢的角色、裝備、副本信息等,都是相對明確的。這些內容有一個很大的特點——用戶問法簡單、明確,沒有太大變化,在后方支撐這個系統(tǒng)的是一個關鍵詞列表。不過,當應用于業(yè)務相對復雜的場景時,第二代客服機器人就會顯示出它的局限:需要維護非常龐大的關鍵詞列表,而且表達同一意義的會有若干不同的關鍵詞,這就會影響到最終匹配的精度和結果。
第三代:智能客服機器人在關鍵詞匹配的基礎上引入了自然語言處理(NLP)技術
比較大的變化在于,機器人處理的已經不僅僅是詞,可以進一步處理句子:首先輸入信息,然后對數據進行清洗和預處理的工作,把一些雜亂和無效的信息排除。接著進入自然語言處理的流程:通過分詞、詞性標注、文法、句法、識別關鍵詞等技術,把句子切開,給每個詞加一個權重,根據權重的綜合算法來匹配知識庫中哪個答案可以最準確回答用戶問題。
第三代機器人的智能體現(xiàn)在,當用戶問一個問題時,機器人支持一定問法上的變化。比如,知識庫設定的一個條目是“我要退貨”,當客戶說“我想退貨”時,第三代機器人同樣可以理解用戶意思。只是,第三代機器人語義判斷能力有限,匹配精度還沒有特別高,需要運營知識庫彌補這些局限。運營知識庫就是運營問法,不再是關鍵詞,數量上會大量減少,維護方式也變得簡單。這就是自然語言處理技術所起的作用,機器人與用戶的溝通,更接近于人與人的交流,用戶可以用一個完整的句子提問,不再是一個個單個的關鍵詞。
第四代:以神經網絡為基礎,應用了最新的“深度學習”、“模式識別”等技術
與第三代機器人相比,因為有了深度學習的技術,第四代智能客服機器人完全可以打破人工配置的規(guī)則,有更好的自主學習能力和語義理解能力,可以處理更加口語化的問法。
人工智能領域的很多技術,在很大程度上受到了生物學、醫(yī)學、認知神經科學發(fā)展的啟發(fā)。 “深度學習”即是來自于相關領域的實驗。
1958年,諾貝爾醫(yī)學獎得主David Hubel和 Torsten Wiesel通過一系列關于“視覺系統(tǒng)的信息處理”的試驗發(fā)現(xiàn),視覺信號的處理是分層次的,圖像被一層一層抽象,最終被識別。此發(fā)現(xiàn)過去約40年,1995年前后,Bruno Olshausen和David Field兩位學者試圖用計算機的方法研究視覺問題,他們通過稀疏編碼算法訓練機器,讓其自主提取視覺信號中的特征。
計算機算法自主學習后輸出的結果與David Hubel和 Torsten Wiesel兩位科學家生物學試驗的結果驚人的相似:視覺特征的提取,都是從最基本的物體邊緣開始的,更高級的特征,均可以由一些基本的特征組合而成。
這就是對“深度學習”的一種通俗的理解,即通過算法,讓機器自主的學習,提取特征;并訓練機器形成更深層次的特征。輸入的信號被一層層的特征抽象、表達;隨著層次的深入,這種表達在不斷的變換;不斷的迭代抽象,信號便被刻畫得更加準確。
對于深度學習來說,其特點就如名稱一樣,需要堆疊更多的特征層次。層數越多,輸入的數據量越大,學習能力越強,特征描述越準確。簡單講,深度學習和人的學習類似,其模型、或稱算法,就是告訴機器一個學習的方法。而機器能學到什么,依賴于訓練的輸入,也就好比是人類的教材。至于機器能學到什么水平,則依賴于訓練迭代的層數,這就好比學習的用功程度。
國內在智能客服機器人領域的創(chuàng)業(yè)者眾多,同質化競爭激烈,附加功能大多包括多渠道(電話、網頁、微博、微信、手機APP等客服渠道)接入、移動工作平臺、數據報表、工單系統(tǒng)等,在技術上多數采用“第三代智能客服機器人”。只有阿里“小蜜”、網易七魚、京東JIMI等少數大公司級別產品采用了第四代深度學習智能客服機器人,并呈現(xiàn)出積極探索的態(tài)勢。未來的技術突破仍有賴于巨頭公司。
此前拿圍棋技術來調戲人類世界冠軍的谷歌人工智能AlphaGo同樣是采用“深度學習”的技術??萍冀缢坪蹩傆羞@么一個聽起來有點自嘲、但暗含業(yè)內人驕傲的傳統(tǒng):一開始開發(fā)的或許只是能簡單的“小玩意”,后來卻能成長為一門正經的大生意、或者應用廣泛的新技術。
同時,在這個領域,我們也能看到中美科技公司對于人工智能應用的區(qū)別:技術同樣領先時,中國公司更看重通過人工智能技術來推動用戶體驗、促發(fā)業(yè)務繁榮,所謂盡可能地做成生意。而美國公司卻在一個看似無用的領域“玩”到了極致。
但誰又能說得準,類似《三體》里面所講的“技術爆炸”會發(fā)生在哪一個小環(huán)節(jié)呢?
*文章為作者獨立觀點,不代表虎嗅網立場
本文由足亦 授權虎嗅網 發(fā)表,并經虎嗅網編輯。轉載此文章須經作者同意,并請附上出處(虎嗅網)及本頁鏈接。原文鏈接http://www.huxiu.com/article/148498/1.html