POST TIME:2021-09-05 20:38
隨著人工智能技術(shù)的發(fā)展,近半年來涌現(xiàn)了大量基于人工智能的呼叫中心業(yè)務(wù)服務(wù)商和集成商。僅電銷機(jī)器人這一個(gè)方向就至少有近百家公司正在推廣運(yùn)營(yíng),包括百度、訊飛、智齒、硅基、百應(yīng)、箭魚、容聯(lián)等。商務(wù)上的需求非常強(qiáng)烈,整個(gè)市場(chǎng)都飛快地?zé)狒[起來。
一套可提供saas服務(wù)的智能外呼系統(tǒng),看起來功能并不復(fù)雜。一個(gè)網(wǎng)站可注冊(cè)、充值繳費(fèi)開票,登錄后在后臺(tái)頁面選擇或者定制外呼話術(shù)腳本,新建外呼任務(wù)并導(dǎo)入外呼號(hào)碼列表,明確外呼策略(時(shí)間段、重呼次數(shù)),設(shè)置外呼機(jī)器人數(shù)量(同時(shí)撥出幾個(gè)號(hào)碼),點(diǎn)擊開始。然后就可以看著進(jìn)度條走完,外呼機(jī)器人按照列表一個(gè)個(gè)打電話出去。任務(wù)完成后,可以查看外呼結(jié)果列表。
那么如何從零開始搭建一套對(duì)外可以提供saas服務(wù)的智能外呼系統(tǒng)呢?
我們先列出,搭建這樣一整套系統(tǒng)需要哪些技術(shù)和資源:
簡(jiǎn)單關(guān)系示意圖如下:
上圖中四個(gè)主要模塊,其中一些難以自研,只能選擇供應(yīng)商:
明確了涉及到的技術(shù)和資源之后,再明確一下建設(shè)步驟。由于各個(gè)廠商都有各自的資源和能力,建設(shè)方式也各不相同,簡(jiǎn)單來說可以分成以下幾類:
作為初學(xué)者,為了自行從零開始搭建一套對(duì)外可以提供saas服務(wù)的智能外呼系統(tǒng),身份必然是第四種,啥都沒有,啥都要干。
以上這四部分,核心角色是呼叫中心。AI只是插上了想象力的翅膀,但是沒這翅膀,呼叫中心還是呼叫中心,但是AI就只是空中樓閣了。業(yè)務(wù)明確可落地的呼叫中心才是想象力的基石,這一點(diǎn)與CV和安防的關(guān)系很像。
目前對(duì)呼叫中心比較普遍接受的定義是:呼叫中心是以計(jì)算機(jī)電話集成(CTI)技術(shù)系統(tǒng)為基礎(chǔ),將計(jì)算機(jī)的信息處理功能、數(shù)字程控交換機(jī)的電話接入和智能分配、自動(dòng)語音處理技術(shù)、 Internet技術(shù)、網(wǎng)絡(luò)通信技術(shù)、商業(yè)智能技術(shù)與業(yè)務(wù)系統(tǒng)緊密結(jié)合在一起,將公司的通信系統(tǒng)、計(jì)算機(jī)處理系統(tǒng)、人工業(yè)務(wù)代表、信息等資源整合成統(tǒng)一、高效的服務(wù)工作平臺(tái) 。
最新一代呼叫中心架構(gòu)NGCC(Next Generation Call Center)如下圖所示:
具體如何理解呢?
先從最簡(jiǎn)單的說起:個(gè)人A給個(gè)人B打了個(gè)電話。
然后來個(gè)復(fù)雜點(diǎn)的:個(gè)人A給呼叫中心400xxxxxxxx打了個(gè)電話,撥通后先聽到了錄音,“您好,找B類接線員說話請(qǐng)按0號(hào)鍵”。按了0,然后聽到錄音,“排隊(duì)中,請(qǐng)稍后”。幾分鐘后接通,B0026號(hào)接線員接了電話。
流程:A→PSTN→PBX→IVR→ACD→B
解釋:PBX是Private Branch Exchange,用戶級(jí)交換機(jī),這是企業(yè)內(nèi)部的局端用戶級(jí)交換機(jī),整個(gè)呼叫中心的出入口設(shè)備。
PSTN到PBX之間是中繼(分成模擬中繼、數(shù)字中繼、IP中繼),這是將通訊公司的局端交換機(jī)與企業(yè)內(nèi)部的用戶級(jí)交換機(jī)(PBX)相連的通訊線路。
IVR是Interactive Voice Response,互動(dòng)/交互式語音應(yīng)答,我們把它叫語音導(dǎo)航。實(shí)現(xiàn)的是類似撥打10086后聽到錄音說,xx業(yè)務(wù)請(qǐng)按x,這個(gè)環(huán)節(jié)。主要用途是根據(jù)業(yè)務(wù)分流來電,進(jìn)入對(duì)應(yīng)的排隊(duì)機(jī)。
ACD是Automatic Call Distribution,自動(dòng)電話分配,也叫排隊(duì)機(jī)。
再來個(gè)復(fù)雜點(diǎn)的:個(gè)人A給呼叫中心400xxxxxxxx打了個(gè)電話,撥通后先聽到了錄音,“您好,您想找哪類接線員?”
個(gè)人A說,“B~~”。
然后很快接通,“您好,這是B0026號(hào)機(jī)器人,有什么可以幫您?”
個(gè)人A說,“我不想跟機(jī)器人說話,泥奏凱~”
然后聽到錄音,“為您轉(zhuǎn)接很貴的真人客服,排隊(duì)中,請(qǐng)稍后”。
幾分鐘后接通,B1026號(hào)真人接線員接了電話。
流程:A→PSTN→PBX→IVR(→ASR→NLU)→ACD(→ASR→NLU→DM→NLG→TTS)→ACD→B
解釋:現(xiàn)在智能的部分,也就是我們說的語音機(jī)器人的部分,分別在IVR和虛擬坐席處體現(xiàn)。
IVR部分,不再需要提示按鍵,而是直接問來電方需要辦理什么業(yè)務(wù),然后識(shí)別語音、理解意圖后,進(jìn)入對(duì)應(yīng)的業(yè)務(wù)隊(duì)列排隊(duì)。排隊(duì)后可以等待真人客服接待,也可以由機(jī)器人先行接待。
機(jī)器人(實(shí)際是服務(wù)器資源)資源空閑時(shí),直接接待,進(jìn)行語音對(duì)話,對(duì)話過程就是語音識(shí)別、語義理解、語音合成的多次調(diào)用,部分業(yè)務(wù)涉及業(yè)務(wù)數(shù)據(jù)接口對(duì)接調(diào)用,比如查詢?cè)捹M(fèi)、積分。并可以根據(jù)需求自動(dòng)或者選擇轉(zhuǎn)人工,再次進(jìn)入排隊(duì),等候真人客服接待。
其中IVR部分示意圖如下:
上面提到的全部流程中,PBX、IVR、ACD等部分基本都是由我們說的呼叫中心設(shè)備商提供,產(chǎn)品有三種類型:板卡式、交換機(jī)式、VoIP形式。
交換機(jī)式比較適合大型職場(chǎng),例如三五百人以上,硬件價(jià)格五位數(shù)。交換機(jī)領(lǐng)域,主要有:avaya、genesys、cisco、華為、中興,其中最常用的兩家對(duì)比下來,avaya比genesys便宜(參見文章)。
板卡式適合中小型職場(chǎng),比如幾十人到兩三百人,硬件價(jià)格四位數(shù)?;诎蹇ńㄔO(shè)呼叫中心的步驟,可以參考使用三匯板卡的這幾篇(主要前4篇講原理)。
選擇板卡之前,先要確定選用哪種中繼線路,比如:使用常規(guī)的數(shù)字中繼,那么就需要選擇數(shù)字板卡,這個(gè)找板卡的供應(yīng)商問就行了。通常來說呼叫中心要購(gòu)買的一條E1數(shù)字中繼報(bào)價(jià)五位數(shù)/年,由用戶級(jí)交換機(jī)將局端的光信號(hào)轉(zhuǎn)換為30路模擬信號(hào),也就是支持30個(gè)人同時(shí)接打電話,通話費(fèi)會(huì)另外按照實(shí)際呼出分鐘數(shù)收取。
近期一個(gè)實(shí)際落地項(xiàng)目是選擇了數(shù)字中繼+Asterisk(開源VoIP PBX純軟方案),(可參考:安裝配置,調(diào)試)示意圖如下:
具體的軟件業(yè)務(wù)細(xì)節(jié),比如:常規(guī)客服中心需要的管理模塊、配置模塊、工單服務(wù)、坐席服務(wù)、報(bào)表模塊、CRM,還有比如:坐席班長(zhǎng)監(jiān)聽、通話插入、質(zhì)檢,錄音文件管理等整套軟件細(xì)節(jié),不做詳述。
在具體落地中,這個(gè)領(lǐng)域的常規(guī)參與者通常具備呼叫中心能力或者AI能力其中一種,而主要的對(duì)接點(diǎn)也就在于AI能力與呼叫中心設(shè)備去對(duì)接,而ASR/TTS與呼叫中心設(shè)備對(duì)接的常規(guī)協(xié)議主要是mrcp/sip。
媒體資源控制協(xié)議(Media Resource Control Protocol, MRCP)是一種通訊協(xié)議,用于語音服務(wù)器向客戶端提供各種語音服務(wù)(如語音識(shí)別和語音合成)。有兩個(gè)版本的MRCP協(xié)議,版本2使用SIP作為控制協(xié)議,版本1使用RTSP。
實(shí)際對(duì)接的時(shí)候,會(huì)遇到不少技術(shù)問題,有的呼叫中心廠商會(huì)要求ASR/TTS引擎做私有云部署,這樣避免了內(nèi)外網(wǎng)穿透時(shí)防火墻的諸多設(shè)置和語音流的時(shí)延。這對(duì)基于語義起家(并購(gòu)買語音能力)的公司是一個(gè)小小的難題。
現(xiàn)有技術(shù)中實(shí)現(xiàn)一次性語音識(shí)別典型的流程時(shí)序,具體包括一下步驟:
電話渠道的語音流采樣率一般是8k 16bit,這種語音識(shí)別的準(zhǔn)確率遠(yuǎn)遠(yuǎn)低于app等渠道采集音頻的識(shí)別率。再加上人在打電話時(shí)說話方式相對(duì)隨意,導(dǎo)致語音識(shí)別部分成為了影響電話機(jī)器人能力和效果的重要瓶頸。
實(shí)現(xiàn)語音合成典型的流程時(shí)序,具體包括一下部分:
現(xiàn)在主流廠商為了使通話效果盡可能模擬真人外呼,除了涉及業(yè)務(wù)接口調(diào)用的數(shù)據(jù)查詢使用了TTS,基本采取整句錄音的方式。
準(zhǔn)確來說,一個(gè)簡(jiǎn)單的對(duì)話機(jī)器人系統(tǒng)框圖,包括語音識(shí)別(ASR)、語音合成(TTS)、自然語言理解(NLU)、對(duì)話管理(DM)、自然語言生成(NLG)幾個(gè)模塊組成。而這一部分就是智能外呼系統(tǒng)的主流玩家——NLU類(智能客服)廠商的強(qiáng)項(xiàng)了。
對(duì)于呼叫中心從業(yè)者來說,ASR/TTS/NLU如同黑盒一般,只暴露出接口。而國(guó)內(nèi)語音能力的供應(yīng)商,要么很土豪,少量QPS不要錢,要么就是非常標(biāo)準(zhǔn)的報(bào)價(jià)五位數(shù)一條線路/年,實(shí)在也沒有太多可以選擇的余地。
對(duì)于只有NLU能力的廠商來說局面也是一樣,除了需要接入ASR/TTS的能力,還需要去尋找可以合作的呼叫中心,并且想辦法拿到盡可能低的話費(fèi)報(bào)價(jià)。
經(jīng)過一些調(diào)研和競(jìng)品分析,行業(yè)內(nèi)雖然有至少近百家公司在推廣和運(yùn)營(yíng)電銷機(jī)器人,但毫不客氣地說,大部分都不及格。
一星級(jí) ★
二星級(jí) ★★
有錄音可以試聽,但明顯可以聽出來,部分是真人直接對(duì)話錄音,而并非機(jī)器人與真人的通話錄音。部分若干家公司用于試聽播放的錄音文件完全一致,不知道誰抄誰的。
三星級(jí) ★★★
四星級(jí) ★★★★
五星級(jí) ★★★★★
商務(wù)模式比較簡(jiǎn)單粗暴,粗略的成本核算如下:
那么電銷機(jī)器人廠商,競(jìng)爭(zhēng)這么激烈,誰才會(huì)笑到最后呢?
一是要有價(jià)格相對(duì)低廉的運(yùn)營(yíng)商資源和語音能力資源,這樣可以明確的報(bào)出一個(gè)行業(yè)內(nèi)相對(duì)較低的價(jià)格。比如:完全不按照主流友商們1-3w/線/年的報(bào)價(jià)方式,直接來幾毛錢一分鐘隨便打,隨打隨充。
二是呼叫中心資源方,最好是帶客進(jìn)場(chǎng),別從0開始找客戶,直接把現(xiàn)有的呼叫中心B端客戶轉(zhuǎn)化一部分成為機(jī)器人電銷客戶。
三是語義的能力,尤其是話術(shù)模板的設(shè)計(jì)能力。這一塊兒很容易被忽視,但是這反而也是產(chǎn)品經(jīng)理可以出成績(jī)的地方。一般來說可以拿呼叫中心多年積累的語料去分析一套最佳話術(shù)模板(堪比金牌銷售的萬能對(duì)話體系),然后做ABtest也好。
從mvp開始逐漸增加主要話術(shù)分支也好,心理學(xué)基礎(chǔ)必須要有,必要時(shí)可以從游戲成癮機(jī)制等角度入手,《戀與制作人》的對(duì)話技巧學(xué)起來,一句話怎么說能讓接電話的人最大概率的順著自己的思路走,達(dá)成目的,從而形成特定細(xì)分領(lǐng)域機(jī)器人話術(shù)模板,得到最佳的外呼效果(接通率、通話時(shí)長(zhǎng)、電銷意愿、催收意愿)。
這一塊兒雖然很細(xì),但是反復(fù)迭代之后可以以一敵萬,甚至達(dá)到現(xiàn)在各類智能音箱背后核心系統(tǒng)一樣的地位。
四是外呼saas平臺(tái)。這部分是web類產(chǎn)品經(jīng)理的天下了,具體功能點(diǎn)就不詳細(xì)列舉了,友商們的網(wǎng)頁和后臺(tái)過一遍,基本好壞也能判斷出來了。
至于現(xiàn)在此時(shí)此刻被視作亮點(diǎn)的可視化外呼腳本編輯,筆者個(gè)人認(rèn)為其實(shí)是雞肋,普通人根本用不好,腳本邏輯只能做得很簡(jiǎn)單,多輪對(duì)話、跨節(jié)點(diǎn)對(duì)話效果也不好,反而很容易導(dǎo)致客戶放棄。還不如干干脆脆給個(gè)可設(shè)置變量的場(chǎng)景化標(biāo)準(zhǔn)模板(金牌話術(shù)模板由產(chǎn)品經(jīng)理提供),外呼試用效果好,客戶更容易買單。
這一套智能外呼系統(tǒng)搭下來,不僅僅可以做電銷機(jī)器人,可以做各類外呼,也可以做IVR語音導(dǎo)航、呼入電話客服。“NLU+CallCenter”就像這幾年“CV+安防”的結(jié)合一樣,也會(huì)如商湯科技聯(lián)合創(chuàng)始人林達(dá)華所說:
“中間也存在風(fēng)險(xiǎn):一邊是從應(yīng)用端往前走,一邊是從技術(shù)端往后走,大家都想占領(lǐng)技術(shù)上的制高點(diǎn)。這需要大家建立一種信任和共贏機(jī)制,只有這樣合作才能長(zhǎng)久”。
AI雖然火熱受追捧,但具體項(xiàng)目落地并被市場(chǎng)認(rèn)可和買單并不是那么容易。作為入行并不久的初學(xué)者,嘗試借以此文抽絲剝繭梳理了從0開始搭建智能外呼系統(tǒng)的全流程,才疏學(xué)淺囿于見聞,疏漏和不當(dāng)之處在所難免,權(quán)當(dāng)拋磚引玉。