POST TIME:2021-07-22 17:04
有些對話機(jī)器人總讓人崩潰,也許是智能級別不夠高。本文,就來一起看看如何判斷一個(gè)機(jī)器人的智能程度。
隨著智能對話技術(shù)的發(fā)展,對話機(jī)器人越來越多地出現(xiàn)在人們的日常工作和生活中。
從企業(yè)的角度,在合適的業(yè)務(wù)場景中使用對話機(jī)器人,能夠極大地提升服務(wù)效率和用戶體驗(yàn)。因此,引入對話機(jī)器人逐漸成為每個(gè)企業(yè)數(shù)字化和智能化轉(zhuǎn)型過程中的重要戰(zhàn)略。
那么,我們應(yīng)該如何來評判一個(gè)對話機(jī)器人的能力,或者更具體一點(diǎn),如何判斷一個(gè)對話機(jī)器人的智能程度呢?
本文介紹一種對話機(jī)器人的分級,讓我們可以更清楚地了解不同等級的對話機(jī)器人分別具有什么能力,適用于什么場景。
對話機(jī)器人的分級
目前業(yè)界并沒有一個(gè)成熟的對話機(jī)器人分級體系,但自動(dòng)駕駛的分級能夠給我們一些啟發(fā)。
根據(jù)行業(yè)標(biāo)準(zhǔn),自動(dòng)駕駛能力被分為L1到L5共5個(gè)等級(L0代表完全人類駕駛,不算在5個(gè)等級之內(nèi)),等級越高代表自動(dòng)駕駛能力越強(qiáng)。比如,L1代表輔助駕駛,L5代表完全自動(dòng)駕駛。
在不同的級別下,駕駛員和車輛所扮演的角色有所不同,級別越高駕駛員需要對車輛的控制越少(如下圖所示)。
圖片來源[1]
參考國外開發(fā)者社區(qū)對于智能助手的分級[2],我們從對話機(jī)器人能夠解決的問題及其應(yīng)用場景出發(fā),將對話機(jī)器人的能力也進(jìn)行分級,分為L1到L5共5個(gè)等級,等級越高代表對話機(jī)器人的能力越強(qiáng)(如下圖所示)。
下面我們分別介紹這5個(gè)等級。
L1 單向推送
機(jī)器人可向用戶推送消息,但沒有對話能力。
L1級別的對話機(jī)器人,只具備向用戶單向推送的能力。今天,我們所使用的App、微信公眾號都會(huì)使用這種方式與用戶交互。
這種方式的好處是受眾廣,效率高;缺點(diǎn)是用戶只能被動(dòng)接收推送,無法和機(jī)器人進(jìn)行對話交互。因此,L1級別的機(jī)器人在嚴(yán)格意義上不能被稱為“對話機(jī)器人”。
L2 單輪問答
機(jī)器人能回答用戶的常見問題,但沒有上下文理解能力,無法主動(dòng)與用戶交互。
L2級別的對話機(jī)器人開始具備對話交互能力,具體體現(xiàn)在它能夠回答用戶的常見問題。最典型的應(yīng)用場景是簡單的問答型客服機(jī)器人,即用戶問一個(gè)問題,機(jī)器人回答答案。
這類對話機(jī)器人通?;谝粋€(gè)特定的知識庫,當(dāng)用戶提出問題后,機(jī)器人需要對用戶的問題進(jìn)行語義理解,并從知識庫中找到對應(yīng)的答案回復(fù)給用戶。
因此,評價(jià)L2級別對話機(jī)器人的效果,主要看召回率和準(zhǔn)確率這兩項(xiàng)指標(biāo)。其中,召回率等于有多少用戶的問題能夠被機(jī)器人回答,準(zhǔn)確率等于機(jī)器人回答的問題中有多少回答正確。
關(guān)于L2級別對話機(jī)器人背后使用的技術(shù),感興趣的讀者可以閱讀之前的文章《對話機(jī)器人平臺智能問答技術(shù)拆解》。
綜合來看,L2級別的對話機(jī)器人適合比較簡單的客服場景,機(jī)器人能準(zhǔn)確回答用戶的問題,用戶問完即走。
L3 多輪對話
機(jī)器人能理解上下文,和用戶進(jìn)行多輪對話,幫用戶完成任務(wù)。
L2級別的對話機(jī)器人經(jīng)過訓(xùn)練后雖然能夠準(zhǔn)確地回答用戶的問題,但仍然存在兩個(gè)明顯的缺陷:
它沒有上下文理解的能力,即機(jī)器人在回答一個(gè)用戶問題時(shí),不會(huì)考慮用戶之前所說的內(nèi)容;
它只能被動(dòng)地回答用戶的問題,無法主動(dòng)發(fā)起與用戶交互,導(dǎo)致機(jī)器人的應(yīng)用場景相對受限。
因此,我們需要更加智能的L3級別對話機(jī)器人。
我們以快遞領(lǐng)域的客服機(jī)器人為例,通過兩個(gè)具體的例子來說明L3級別對話機(jī)器人和L2級別的差別。
L2級別對話機(jī)器人無法理解上下文
因?yàn)槿鄙偕舷挛睦斫饽芰Γ?dāng)用戶問“星期天開門嗎”時(shí),缺少了主語 “中關(guān)村的門店”,L2級別的對話機(jī)器人無法理解用戶其實(shí)是在問“中關(guān)村的自提點(diǎn)星期天開門嗎”,導(dǎo)致機(jī)器人無法回答這個(gè)問題。
對于L3級別的對話機(jī)器人,它能夠理解上下文,從而補(bǔ)全了用戶問題的主語,這樣一來便可以回答出這個(gè)問題。
L3級別對話機(jī)器人能夠理解上下文
有些時(shí)候,機(jī)器人在滿足用戶需求時(shí),不僅要聽懂用戶在說什么,還需要主動(dòng)向用戶發(fā)問,來獲取相關(guān)的信息。
我們來看另一個(gè)例子。
L2級別對話機(jī)器人能夠回答問題,但無法解決問題
上面的例子中,在機(jī)器人回復(fù)的消息里,“預(yù)約取件”是一個(gè)可點(diǎn)擊的鏈接,需要用戶點(diǎn)擊后在一個(gè)新的圖形化用戶界面(GUI, Graphical User Interface)中輸入取件時(shí)間、取件地址、取件電話等信息完成預(yù)約取件,這種需要在CUI和GUI之間來回切換的交互方式顯然不夠高效。
L2級別的對話機(jī)器人之所以要這樣,對話機(jī)器人并不知道取件時(shí)間、取件地址、取件電話等信息,沒有這些信息的情況下,機(jī)器人只能提供一個(gè)鏈接讓用戶自己操作。也就是說,L2級別的對話機(jī)器人有時(shí)候雖然回答了用戶的問題,但并沒有真正幫用戶解決問題。
理想情況下,我們希望機(jī)器人能夠通過對話直接幫助用戶完成任務(wù),這要求機(jī)器人能夠通過多輪對話去理解和澄清用戶的意圖。
L3級別對話機(jī)器人通過多輪對話解決用戶問題
綜上所述,L3級別對話機(jī)器人的核心能力有兩點(diǎn):
能夠理解上下文;
能夠通過主動(dòng)交互澄清用戶意圖,并通過多輪對話幫助用戶完成任務(wù)。
因此,在準(zhǔn)確率和召回率之外,任務(wù)完成率是L3對話機(jī)器人的重要指標(biāo)。
L3級別的對話機(jī)器人適合更加復(fù)雜的業(yè)務(wù)場景,尤其是需要機(jī)器人通過主動(dòng)對話收集用戶信息的場景,例如營銷獲客等。
L4 個(gè)性化對話
機(jī)器人能基于用戶標(biāo)簽,為用戶提供個(gè)性化的對話體驗(yàn)。
理想情況下,對話機(jī)器人在和用戶交互時(shí),不僅需要理解用戶在說什么,也需要知道用戶是誰。
具體而言,機(jī)器人可以基于用戶標(biāo)簽,即用戶的屬性、興趣等,為用戶提供更個(gè)性化的對話體驗(yàn),也提升交互的效率。
我們繼續(xù)以預(yù)約上門取件為例,L4級別的對話機(jī)器人會(huì)以這樣的方式來進(jìn)行對話。
L4級別對話機(jī)器人基于用戶標(biāo)簽提升對話效率
上面的例子中,機(jī)器人曾經(jīng)服務(wù)過這個(gè)用戶,所以它已經(jīng)記錄了用戶的取件地址和取件電話。在這次對話中,機(jī)器人無需再向用戶詢問取件地址、取件時(shí)間、取件電話,大大提升了交互效率和用戶體驗(yàn)。
對于L4級別的對話機(jī)器人,其核心在于能夠?yàn)橛脩舸驑?biāo)簽,并在對話過程中靈活使用用戶標(biāo)簽來提升對話效率和體驗(yàn)。當(dāng)然,如果個(gè)性化的對話體驗(yàn)如果處理得不恰當(dāng),可能會(huì)給用戶帶來困擾,甚至傷害用戶的體驗(yàn)。
因此,對于L4級別的對話機(jī)器人,用戶滿意度是一個(gè)非常重要的指標(biāo)。
L4級別的對話機(jī)器人則更適合機(jī)器人和用戶保持長期關(guān)系的場景,例如智能助手等。
L5 多機(jī)器人協(xié)作
多機(jī)器人相互協(xié)作,滿足更復(fù)雜的用戶需求。在某些情況下,用戶的需求無法被單一的對話機(jī)器人滿足。
以預(yù)訂餐廳為例,用戶可以對一個(gè)智能助手說出需求,智能助手通過對話的方式收集到了用戶要訂哪家餐廳、什么時(shí)間、就餐人數(shù)等信息。此時(shí),智能助手需要再調(diào)動(dòng)另一個(gè)電話機(jī)器人給餐廳打電話進(jìn)行預(yù)訂。
我們可以發(fā)現(xiàn),這個(gè)需求的滿足過程涉及到智能助手和電話機(jī)器人這兩個(gè)對話機(jī)器人的協(xié)作,未來會(huì)有更多的場景和需求需要多機(jī)器人協(xié)作。
另一方面,對話機(jī)器人只是一種形態(tài)的智能機(jī)器人,還有更多種不同類型的智能機(jī)器人。比如,機(jī)器人流程自動(dòng)化(RPA)就是一種能夠控制軟件自動(dòng)完成特定任務(wù)流程的機(jī)器人。對話機(jī)器人和RPA機(jī)器人也有很多可以結(jié)合的場景。
還是回到預(yù)訂餐廳的例子,如果餐廳提供在線預(yù)訂的網(wǎng)站,那么可以由對話機(jī)器人完成信息的收集,由RPA機(jī)器人完成預(yù)訂的操作。
未來趨勢
未來,無論是企業(yè)還是個(gè)人用戶,都可以根據(jù)自己的業(yè)務(wù)場景,使用L2到L4級別的對話能力,來提升交互的效率和體驗(yàn)。
編輯:hfy