作者簡(jiǎn)介
本文作者為攜程基礎(chǔ)業(yè)務(wù)研發(fā)部呼叫中心團(tuán)隊(duì),其在傳統(tǒng)呼叫中心基礎(chǔ)上,結(jié)合軟交換、智能分配、自動(dòng)語(yǔ)音語(yǔ)義處理等技術(shù),為攜程用戶提供人性化、人機(jī)互動(dòng)、便捷的電話語(yǔ)音服務(wù)。
一、前言
智能手機(jī)早已成為日常生活中不可或缺的一部分,隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,人們的生活習(xí)慣與工作方式也在不斷發(fā)生改變。從移動(dòng)通信、移動(dòng)支付,再到移動(dòng)辦公,“移動(dòng)化”已滲透至各行各業(yè),并逐步成為企業(yè)業(yè)務(wù)發(fā)展的趨勢(shì)。
攜程呼叫中心研發(fā)團(tuán)隊(duì)根據(jù)業(yè)務(wù)的需求,研發(fā)完成了一套完整的呼叫中心移動(dòng)坐席解決方案,使業(yè)務(wù)坐席不再受制于工作時(shí)間、辦公地點(diǎn),隨時(shí)隨地,有網(wǎng)絡(luò)的地方,就有呼叫中心。
二、移動(dòng)辦公呼叫中心系統(tǒng)架構(gòu)
移動(dòng)場(chǎng)景保留了典型的呼叫中心系統(tǒng)架構(gòu),在接入端加入 SBC,用于移動(dòng)呼叫中心語(yǔ)音接入和安全控制。坐席無論身在何處,只需要一臺(tái)電腦、智能手機(jī)或智能設(shè)備,通過 Wifi、3G 或 4G 網(wǎng)絡(luò)登錄坐席 App,即可開啟日常工作。
三、移動(dòng)場(chǎng)景下面臨的挑戰(zhàn)
目前國(guó)內(nèi)企業(yè)的 Intranet 基本為 100M,而自有機(jī)房的核心網(wǎng)絡(luò)可達(dá)到 1000M 甚至雙 1000M。因?yàn)槲锢砭W(wǎng)絡(luò)有著高度可靠的帶寬、網(wǎng)絡(luò)質(zhì)量與穩(wěn)定性,用戶基本無需顧慮帶寬、延時(shí)、網(wǎng)絡(luò)抖動(dòng)等情況。
而相較于物理網(wǎng)絡(luò),移動(dòng)環(huán)境普遍存在著穩(wěn)定性差、帶寬波動(dòng)劇烈、信號(hào)覆蓋不均衡導(dǎo)致網(wǎng)絡(luò)頻繁切換等多個(gè)問題,加之外部環(huán)境的復(fù)雜性與多樣性,通話延遲、卡頓、中斷、回聲與噪聲等問題難以避免,克服這些問題便成為了呼叫中心移動(dòng)化所面臨的巨大挑戰(zhàn)與難點(diǎn)。
四、攜程呼叫中心移動(dòng)坐席解決方案
攜程呼叫中心通過優(yōu)化標(biāo)準(zhǔn)的 SIP 協(xié)議,減少坐席應(yīng)用與后端服務(wù)的交互;深度定制音頻編解碼器,在提高音質(zhì)的同時(shí)降低了數(shù)據(jù)流量;通過丟包補(bǔ)償技術(shù)來提升弱網(wǎng)環(huán)境下的通話質(zhì)量。
基于優(yōu)化后的 SIP 協(xié)議開發(fā)標(biāo)準(zhǔn)的 SDK,應(yīng)用層可快速實(shí)現(xiàn)電話相關(guān)的功能,將原來基于電腦或 IP 電話的 IP-Talk 的方式移植到移動(dòng)智能終端,突破傳統(tǒng)的空間限制,實(shí)現(xiàn)了完全開放的自由移動(dòng)。
1、CCodec
音頻編解碼器,通俗理解就是把自然界的聲音采集,轉(zhuǎn)換成數(shù)字信號(hào),再采用相應(yīng)的壓縮技術(shù),對(duì)得到的數(shù)字信號(hào)進(jìn)行壓縮,即可形成常見的音頻文件,如 wav、mp3、aac 等。
而音頻的數(shù)字化采集與處理,理論上無法實(shí)現(xiàn)完全與自然發(fā)音相同,只是盡可能優(yōu)化算法,使其最大化接近原始發(fā)音。同等條件下,音頻質(zhì)量主要取決于以下技術(shù)指標(biāo):
經(jīng)過相關(guān)的編碼、壓縮算法的處理,音質(zhì)越高所產(chǎn)生的音頻流越大,傳輸所需要的帶寬也越高,與之相對(duì)應(yīng)的,耗費(fèi)的流量也同比上漲。
移動(dòng)場(chǎng)景下,音頻編碼及相關(guān)的壓縮算法需要在提高音質(zhì)保證用戶體驗(yàn)的同時(shí),盡可能降低傳輸帶寬和存儲(chǔ)空間。如果音頻編解碼能支持動(dòng)態(tài)碼率,便能為用戶帶來更好的通話體驗(yàn)。所謂動(dòng)態(tài)碼率支持,即:
攜程呼叫中心研發(fā)團(tuán)隊(duì)通過研究最近的音頻編解碼技術(shù)和相關(guān)壓縮算法,研發(fā)完成了一套有損音頻編碼器——CCodec。
CCodec 是基于開源音頻編解碼算法研發(fā)的有損音頻編解碼器,不僅可以支持動(dòng)態(tài)調(diào)整比特率、音頻帶寬和幀大小,同時(shí)能在編碼的過程中根據(jù)音頻數(shù)據(jù)的復(fù)雜程序即時(shí)確定使用的比特率,在保證質(zhì)量的前提下兼顧編碼后產(chǎn)生文件的大小,即 VBR(Variable Bit Rate)。在保證音頻質(zhì)量的同時(shí),大大降低了數(shù)據(jù)流量,尤其適合互聯(lián)網(wǎng)上的語(yǔ)音實(shí)時(shí)交互和音樂傳輸。
CCodec 可用于較多類型的音頻應(yīng)用,如 VoIP、視頻會(huì)議、游戲內(nèi)的語(yǔ)音聊天、基于實(shí)時(shí)的音樂會(huì)直播等。其主要有以下特性:
經(jīng)過實(shí)驗(yàn)對(duì)比,除以上技術(shù)功能的支持外,它也具有良好的低算法延遲,非常適合實(shí)時(shí)通訊類的應(yīng)用。在平衡音質(zhì)和比特率的情況下,算法延遲可進(jìn)一步降低到 5ms。
質(zhì)量比特率對(duì)比
從比特率與質(zhì)量的對(duì)比曲線中可以看出,CCodec 編解碼不僅在低比特時(shí)對(duì)音頻的保真超越了 iLBC、AMR-NB、Speex、AMR-WB,在高比特率的情況下,音質(zhì)依然越超眾多現(xiàn)有的編解碼。
在移動(dòng)弱網(wǎng)場(chǎng)景下,可以設(shè)置 CCodec 比特率為16-32,優(yōu)先滿足通話功能,進(jìn)行有效溝通。而當(dāng)網(wǎng)絡(luò)狀態(tài)良好的情況下,可以使用32以上的比特率,以適應(yīng)傳輸更高品質(zhì)的音樂等豐富的音頻數(shù)據(jù)流。
比特率遲時(shí)對(duì)比
呼叫中心系統(tǒng)多用于處理用戶的電話咨詢或售后服務(wù),屬于實(shí)時(shí)通信系統(tǒng)。在實(shí)時(shí)通信系統(tǒng)中,音頻的延時(shí)對(duì)雙方的溝通體驗(yàn)會(huì)造成巨大影響,而延時(shí)也是實(shí)時(shí)通訊系統(tǒng)中極為重要的標(biāo)準(zhǔn)。因此,音頻算法的延時(shí)顯得尤為重要。
CCodec 編解碼器算法延時(shí)小的特性,非常適合應(yīng)用于攜程電話、VoIP 或視頻會(huì)議等應(yīng)用場(chǎng)景。
2、CSIP
SIP 是由 IETF 制定的多媒體通信協(xié)議,它是一個(gè)基于文本的應(yīng)用層控制協(xié)議,用于創(chuàng)建、修改和釋放一個(gè)或多個(gè)參與者的會(huì)話,廣泛應(yīng)用于 CS(Circuit Switched,電路交換),NGN(Next Generation Network,下一代網(wǎng)絡(luò))以及 IMS(IP Multimedia Subsystem,IP 多媒體子系統(tǒng))的網(wǎng)絡(luò)中,可支持并應(yīng)用于語(yǔ)音、視頻、數(shù)據(jù)等多媒體業(yè)務(wù)。
而 CSIP 是一個(gè)基于 SIP、SDP、RTP、STUN 等協(xié)議而實(shí)現(xiàn)的通信庫(kù),可以支持音頻、視頻及短消息的傳輸。為適應(yīng)移動(dòng)網(wǎng)絡(luò)的抖動(dòng)、時(shí)延,CSIP 實(shí)現(xiàn)時(shí)加入了以下特性:
-
集成 CCodec 音頻編解碼,抗30%網(wǎng)絡(luò)丟包,支持 250ms 網(wǎng)絡(luò)遲延。在弱網(wǎng)情況下,提升通話體驗(yàn)
-
網(wǎng)絡(luò)狀態(tài)監(jiān)控,動(dòng)態(tài)調(diào)整比特率,保障移動(dòng)網(wǎng)絡(luò)下的穩(wěn)定運(yùn)行
-
斷開自動(dòng)恢復(fù)功能
-
優(yōu)化回聲消除、語(yǔ)音降噪的處理,提升聽覺體驗(yàn)
3、Ctrip PhoneSDK 便捷接入
CSIP 功能強(qiáng)大且靈活,但由于是基于 C 語(yǔ)言開發(fā),接口及使用方式對(duì)于移動(dòng)開發(fā)來說,比較復(fù)雜且不宜使用。PhoneSDK 在 CSIP 的基礎(chǔ)上進(jìn)行了邏輯封裝,提供簡(jiǎn)單且易于使用的接口 API。
考慮到呼叫中心的特殊場(chǎng)景,在 PhoneSDK 的基礎(chǔ)上,團(tuán)隊(duì)進(jìn)一步擴(kuò)展了與坐席相關(guān)的功能,實(shí)現(xiàn)了坐席的登錄、狀態(tài)改變等相關(guān)功能,進(jìn)一步降低了坐席類應(yīng)用的開發(fā)成本。
PhoneSDK 可快速實(shí)現(xiàn)以下網(wǎng)絡(luò)電話相關(guān)的功能:
流量對(duì)比
為了使用 PhoneSDK 適應(yīng)移動(dòng)場(chǎng)景下的音頻傳輸,在音頻壓縮方面采用了有損壓縮算法,在保證音質(zhì)的前提下,大大降低了編碼后的音頻大小。在相同的網(wǎng)絡(luò)環(huán)境下,使用相同的設(shè)備進(jìn)行測(cè)試,在使用 CCodec 48KHz 采樣率的情況下,編碼的音頻僅為微信的1/2,是傳統(tǒng) G711/PCMu 的1/3左右。
五、案例—— “十一貝”呼叫中心私有云
北京十一貝技術(shù)有限公司,主要側(cè)重于保險(xiǎn)營(yíng)銷業(yè)務(wù),提供去哪兒等用戶群不同類型的保險(xiǎn)產(chǎn)品。根據(jù)其業(yè)務(wù)特性及具體需求,以移動(dòng) App 為主題,利用 PhoneSDK 快速研發(fā)了一套坐席 App,提供十一貝業(yè)務(wù)人員使用。