近來為什么保定千呼電話機(jī)器人這么火,“智能聊天機(jī)器人”的概念在國(guó)外越來越火熱。即便此前遭遇了點(diǎn)小挫折為什么保定千呼電話機(jī)器人這么火:微軟推出一款名為“Tay”的推特線上聊天機(jī)器人,將其設(shè)定為一名19歲的美國(guó)少女,并表示Tay能夠通過對(duì)話學(xué)習(xí)真實(shí)人類的說話方式,不斷完善自己,以更好地與人類交流。但就在Tay上線僅僅16小時(shí)之后,微軟就不得不將其緊急下線處理,甚至向公眾道歉,因?yàn)檫@款聊天機(jī)器人開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句。
就在微軟剛下線自己的Tay后,社交巨頭Facebook對(duì)外宣稱將發(fā)布自己的語(yǔ)音聊天機(jī)器人,并將在Messenger軟件中加入此類技術(shù)。至上周5月8日,F(xiàn)acebook Messenger即迎來可撥打911電話的即時(shí)聊天機(jī)器人。
細(xì)心的人發(fā)現(xiàn),兩年前,微軟還曾發(fā)布過一款名為“小冰”的人工智能伴侶虛擬機(jī)器人,并進(jìn)入微博、微信、米聊等第三方平臺(tái),通過與用戶的不斷聊天進(jìn)行積累學(xué)習(xí)。據(jù)稱,“小冰”集合了中國(guó)近7億網(wǎng)民多年來積累的、全部公開的文獻(xiàn)記錄,借助微軟在大數(shù)據(jù)、自然語(yǔ)義分析、機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)方面的技術(shù)積累,通過精煉的幾千萬條真實(shí)而有趣的語(yǔ)料庫(kù)(此后每天凈增0.7%),理解對(duì)話的語(yǔ)境與語(yǔ)義,從而實(shí)現(xiàn)超越簡(jiǎn)單人機(jī)問答的自然交互。
包括蘋果的Siri、亞馬遜的Alexa,美國(guó)幾大科技巨頭在智能聊天機(jī)器人方面已經(jīng)開始暗中較勁——即便目前還看不出這些“回答磕磕絆絆、甚至文不對(duì)題”的智能聊天機(jī)器人會(huì)給人類的生活帶來多大變革。人工智能專家、美國(guó)康奈爾大學(xué)的計(jì)算機(jī)科學(xué)教授巴特·賽爾曼(Bart Selman)博士曾認(rèn)為,微軟Tay遭遇的爆出口事件凸顯了人工智能領(lǐng)域目前所面臨的一大弱點(diǎn):真正的語(yǔ)言能力。
不過放在重實(shí)用、愛賺錢的中國(guó),仍不妨礙企業(yè)給“半成品”的智能聊天機(jī)器人找到一個(gè)發(fā)揮所長(zhǎng)的工作領(lǐng)域:客服??头袠I(yè)的特殊性在于,其面對(duì)的對(duì)話場(chǎng)景并不是像蘋果Siri、微軟小冰那樣的任意聊天模式,客服分為不同領(lǐng)域,來尋求客服服務(wù)的用戶均是抱著特定的目的和話語(yǔ)體系,這使得智能聊天更容易精準(zhǔn)定制。
比如百度的虛擬個(gè)人助理“度秘”,內(nèi)嵌在百度產(chǎn)品中,可以通過語(yǔ)音互動(dòng)完成搜索、訂餐、訂電影票等O2O服務(wù)。而阿里系的產(chǎn)品客服需求更加龐大,其中越來越多的比例已經(jīng)被智能客服分擔(dān)。同時(shí),語(yǔ)音自動(dòng)轉(zhuǎn)接、情感識(shí)別與關(guān)鍵詞識(shí)別等技術(shù)已經(jīng)投入到智能客服當(dāng)中。
就連網(wǎng)易,去年也開始組建人工智能團(tuán)隊(duì),推出一個(gè)叫“網(wǎng)易七魚”的全智能云客服產(chǎn)品,簡(jiǎn)單講,類似電商、金融等不同領(lǐng)域的客服管理部門通過SDK安裝七魚后,即可接入有針對(duì)性的對(duì)話數(shù)據(jù),通過智能機(jī)器人答復(fù)用戶的常見、重復(fù)性問題,從而節(jié)省人力,實(shí)現(xiàn)人機(jī)協(xié)作。
在此有必要普及一下有關(guān)智能客服機(jī)器人所經(jīng)歷的四代技術(shù):
第一代:客服機(jī)器人為“問答機(jī)器人”,基于單個(gè)關(guān)鍵詞的精確匹配
這一代機(jī)器人很簡(jiǎn)單,簡(jiǎn)單到幾乎沒有什么技術(shù)可言,甚至稱不上智能??蛻魡柕摹皢栴}”停留在單個(gè)詞匯,而不是復(fù)雜句式。比如,在微信公眾號(hào)平臺(tái)回復(fù)一些關(guān)鍵字詞,獲取某篇文章或活動(dòng)入口。
問答機(jī)器人的原型最早出現(xiàn)在電話客服上,稱為IVR(交互語(yǔ)音應(yīng)答系統(tǒng))。例如打電話給銀行客服,其可以通過語(yǔ)音提示用戶選擇所需服務(wù)的序號(hào),進(jìn)而一層層深入了解客戶想問什么問題,最后給出一個(gè)自動(dòng)化的語(yǔ)音回答。第一代問答機(jī)器人使用單個(gè)詞匯的完全匹配,在使用場(chǎng)景中受限很多。
第二代:客服機(jī)器人可以支持多個(gè)詞匹配,并具有模糊查詢能力
第二代客服機(jī)器人比上一代機(jī)器人有了進(jìn)步,但匹配規(guī)仍然相對(duì)死板的,只能應(yīng)用于一些簡(jiǎn)單場(chǎng)景中。例如圖書館查詢系統(tǒng)中的書名、作者名,游戲中查詢的角色、裝備、副本信息等,都是相對(duì)明確的。這些內(nèi)容有一個(gè)很大的特點(diǎn)——用戶問法簡(jiǎn)單、明確,沒有太大變化,在后方支撐這個(gè)系統(tǒng)的是一個(gè)關(guān)鍵詞列表。不過,當(dāng)應(yīng)用于業(yè)務(wù)相對(duì)復(fù)雜的場(chǎng)景時(shí),第二代客服機(jī)器人就會(huì)顯示出它的局限:需要維護(hù)非常龐大的關(guān)鍵詞列表,而且表達(dá)同一意義的會(huì)有若干不同的關(guān)鍵詞,這就會(huì)影響到最終匹配的精度和結(jié)果。
第三代:智能客服機(jī)器人在關(guān)鍵詞匹配的基礎(chǔ)上引入了自然語(yǔ)言處理(NLP)技術(shù)
比較大的變化在于,機(jī)器人處理的已經(jīng)不僅僅是詞,可以進(jìn)一步處理句子:首先輸入信息,然后對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理的工作,把一些雜亂和無效的信息排除。接著進(jìn)入自然語(yǔ)言處理的流程:通過分詞、詞性標(biāo)注、文法、句法、識(shí)別關(guān)鍵詞等技術(shù),把句子切開,給每個(gè)詞加一個(gè)權(quán)重,根據(jù)權(quán)重的綜合算法來匹配知識(shí)庫(kù)中哪個(gè)答案可以最準(zhǔn)確回答用戶問題。
第三代機(jī)器人的智能體現(xiàn)在,當(dāng)用戶問一個(gè)問題時(shí),機(jī)器人支持一定問法上的變化。比如,知識(shí)庫(kù)設(shè)定的一個(gè)條目是“我要退貨”,當(dāng)客戶說“我想退貨”時(shí),第三代機(jī)器人同樣可以理解用戶意思。只是,第三代機(jī)器人語(yǔ)義判斷能力有限,匹配精度還沒有特別高,需要運(yùn)營(yíng)知識(shí)庫(kù)彌補(bǔ)這些局限。運(yùn)營(yíng)知識(shí)庫(kù)就是運(yùn)營(yíng)問法,不再是關(guān)鍵詞,數(shù)量上會(huì)大量減少,維護(hù)方式也變得簡(jiǎn)單。這就是自然語(yǔ)言處理技術(shù)所起的作用,機(jī)器人與用戶的溝通,更接近于人與人的交流,用戶可以用一個(gè)完整的句子提問,不再是一個(gè)個(gè)單個(gè)的關(guān)鍵詞。
第四代:以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),應(yīng)用了最新的“深度學(xué)習(xí)”、“模式識(shí)別”等技術(shù)
與第三代機(jī)器人相比,因?yàn)橛辛松疃葘W(xué)習(xí)的技術(shù),第四代智能客服機(jī)器人完全可以打破人工配置的規(guī)則,有更好的自主學(xué)習(xí)能力和語(yǔ)義理解能力,可以處理更加口語(yǔ)化的問法。
人工智能領(lǐng)域的很多技術(shù),在很大程度上受到了生物學(xué)、醫(yī)學(xué)、認(rèn)知神經(jīng)科學(xué)發(fā)展的啟發(fā)。 “深度學(xué)習(xí)”即是來自于相關(guān)領(lǐng)域的實(shí)驗(yàn)。
1958年,諾貝爾醫(yī)學(xué)獎(jiǎng)得主David Hubel和 Torsten Wiesel通過一系列關(guān)于“視覺系統(tǒng)的信息處理”的試驗(yàn)發(fā)現(xiàn),視覺信號(hào)的處理是分層次的,圖像被一層一層抽象,最終被識(shí)別。此發(fā)現(xiàn)過去約40年,1995年前后,Bruno Olshausen和David Field兩位學(xué)者試圖用計(jì)算機(jī)的方法研究視覺問題,他們通過稀疏編碼算法訓(xùn)練機(jī)器,讓其自主提取視覺信號(hào)中的特征。
計(jì)算機(jī)算法自主學(xué)習(xí)后輸出的結(jié)果與David Hubel和 Torsten Wiesel兩位科學(xué)家生物學(xué)試驗(yàn)的結(jié)果驚人的相似:視覺特征的提取,都是從最基本的物體邊緣開始的,更高級(jí)的特征,均可以由一些基本的特征組合而成。
這就是對(duì)“深度學(xué)習(xí)”的一種通俗的理解,即通過算法,讓機(jī)器自主的學(xué)習(xí),提取特征;并訓(xùn)練機(jī)器形成更深層次的特征。輸入的信號(hào)被一層層的特征抽象、表達(dá);隨著層次的深入,這種表達(dá)在不斷的變換;不斷的迭代抽象,信號(hào)便被刻畫得更加準(zhǔn)確。
對(duì)于深度學(xué)習(xí)來說,其特點(diǎn)就如名稱一樣,需要堆疊更多的特征層次。層數(shù)越多,輸入的數(shù)據(jù)量越大,學(xué)習(xí)能力越強(qiáng),特征描述越準(zhǔn)確。簡(jiǎn)單講,深度學(xué)習(xí)和人的學(xué)習(xí)類似,其模型、或稱算法,就是告訴機(jī)器一個(gè)學(xué)習(xí)的方法。而機(jī)器能學(xué)到什么,依賴于訓(xùn)練的輸入,也就好比是人類的教材。至于機(jī)器能學(xué)到什么水平,則依賴于訓(xùn)練迭代的層數(shù),這就好比學(xué)習(xí)的用功程度。
國(guó)內(nèi)在智能客服機(jī)器人領(lǐng)域的創(chuàng)業(yè)者眾多,同質(zhì)化競(jìng)爭(zhēng)激烈,附加功能大多包括多渠道(電話、網(wǎng)頁(yè)、微博、微信、手機(jī)APP等客服渠道)接入、移動(dòng)工作平臺(tái)、數(shù)據(jù)報(bào)表、工單系統(tǒng)等,在技術(shù)上多數(shù)采用“第三代智能客服機(jī)器人”。只有阿里“小蜜”、網(wǎng)易七魚、京東JIMI等少數(shù)大公司級(jí)別產(chǎn)品采用了第四代深度學(xué)習(xí)智能客服機(jī)器人,并呈現(xiàn)出積極探索的態(tài)勢(shì)。未來的技術(shù)突破仍有賴于巨頭公司。
此前拿圍棋技術(shù)來調(diào)戲人類世界冠軍的谷歌人工智能AlphaGo同樣是采用“深度學(xué)習(xí)”的技術(shù)??萍冀缢坪蹩傆羞@么一個(gè)聽起來有點(diǎn)自嘲、但暗含業(yè)內(nèi)人驕傲的傳統(tǒng):一開始開發(fā)的或許只是能簡(jiǎn)單的“小玩意”,后來卻能成長(zhǎng)為一門正經(jīng)的大生意、或者應(yīng)用廣泛的新技術(shù)。
同時(shí),在這個(gè)領(lǐng)域,我們也能看到中美科技公司對(duì)于人工智能應(yīng)用的區(qū)別:技術(shù)同樣領(lǐng)先時(shí),中國(guó)公司更看重通過人工智能技術(shù)來推動(dòng)用戶體驗(yàn)、促發(fā)業(yè)務(wù)繁榮,所謂盡可能地做成生意。而美國(guó)公司卻在一個(gè)看似無用的領(lǐng)域“玩”到了極致。
但誰又能說得準(zhǔn),類似《三體》里面所講的“技術(shù)爆炸”會(huì)發(fā)生在哪一個(gè)小環(huán)節(jié)呢?
*文章為作者獨(dú)立觀點(diǎn),不代表虎嗅網(wǎng)立場(chǎng)
本文由足亦 授權(quán)虎嗅網(wǎng) 發(fā)表,并經(jīng)虎嗅網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)作者同意,并請(qǐng)附上出處(虎嗅網(wǎng))及本頁(yè)鏈接。原文鏈接http://www.huxiu.com/article/148498/1.html