主頁(yè) > 知識(shí)庫(kù) > 基于可編程交換機(jī)的分布式TTS系統(tǒng)

基于可編程交換機(jī)的分布式TTS系統(tǒng)

熱門(mén)標(biāo)簽:想做地圖標(biāo)注怎么做 h5實(shí)現(xiàn)地圖標(biāo)注 電信辦理400電話流程 灤縣地圖標(biāo)注app 百度地圖標(biāo)注怎么調(diào)整色彩 南寧市ai電銷機(jī)器人公司 沼澤地圖標(biāo)注 浦東新區(qū)地圖標(biāo)注商戶入駐 公司地址騰訊地圖標(biāo)注

  一、TTS簡(jiǎn)介

  TTS文語(yǔ)轉(zhuǎn)換用途很廣,包括電子郵件的閱讀、IVR系統(tǒng)的語(yǔ)音提示等等,目前IVR系統(tǒng)已廣泛應(yīng)用于各個(gè)行業(yè)(如電信、交通運(yùn)輸?shù)?。

  TTS所用的關(guān)鍵技術(shù)就是語(yǔ)音合成(Speech Synthesis)。早期的TTS一般采用專用的芯片實(shí)現(xiàn),如德州儀器公司的TMS50C10/TMS50C57、飛利浦的PH84H36等,但主要用在家用電器或兒童玩具中。而基于微機(jī)應(yīng)用的TTS一般用純軟件實(shí)現(xiàn),主要包括以下幾部分:

  文本分析 - 對(duì)輸入文本進(jìn)行語(yǔ)言學(xué)分析,逐句進(jìn)行詞匯的、語(yǔ)法的和語(yǔ)義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的音素的組成,包括文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略語(yǔ)的處理等。語(yǔ)音合成 - 把處理好的文本所對(duì)應(yīng)的單字或短語(yǔ)從語(yǔ)音合成庫(kù)中提取,把語(yǔ)言學(xué)描述轉(zhuǎn)化成言語(yǔ)波形。

  韻律處理 - 合成音質(zhì)(Quality of Synthetic Speech)是指語(yǔ)音合成系統(tǒng)所輸出的語(yǔ)音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進(jìn)行主觀評(píng)價(jià)。清晰度是正確聽(tīng)辨有意義詞語(yǔ)的百分率;自然度用來(lái)評(píng)價(jià)合成語(yǔ)音音質(zhì)是否接近人說(shuō)話的聲音,合成詞語(yǔ)的語(yǔ)調(diào)是否自然; 連貫性用來(lái)評(píng)價(jià)合成語(yǔ)句是否流暢。

  TTS純軟件處理的流程如下:

  

  在語(yǔ)音輸出階段,語(yǔ)音輸出的方式取決于具體的應(yīng)用。

  要合成出高質(zhì)量的語(yǔ)音, 所采用的算法是極為復(fù)雜的,因此對(duì)機(jī)器的要求也非常高。算法的復(fù)雜度決定了目前微機(jī)并發(fā)進(jìn)行多通道TTS 的系統(tǒng)容量。

  二、TTS在CTI 的應(yīng)用中的基本構(gòu)架

  在一般的CTI應(yīng)用系統(tǒng)中,都會(huì)有IVR(交互式語(yǔ)音應(yīng)答系統(tǒng))。IVR系統(tǒng)是呼叫中心的重要組成部分,通過(guò)IVR系統(tǒng),用戶可以利用音頻按健電話輸入信息,從系統(tǒng)中獲得預(yù)先錄制的數(shù)字或合成語(yǔ)音信息。具有TTS功能的IVR可以加快服務(wù)速度,節(jié)約服務(wù)成本,使IVR為呼叫者提供7*24小時(shí)的服務(wù)。

  目前常見(jiàn)的IVR系統(tǒng)大都是通用的工控機(jī)平臺(tái)上插入語(yǔ)音板卡組成,并支持中文語(yǔ)音合成TTS等技術(shù)。

  基本構(gòu)成如下圖所示:

  

  一個(gè)典型的包含TTS服務(wù)的電話服務(wù)流程可分為:

  用戶電話撥入,系統(tǒng)IVR響應(yīng),獲得用戶按鍵等信息。

  IVR根據(jù)用戶的按鍵信息,向數(shù)據(jù)庫(kù)服務(wù)器申請(qǐng)相關(guān)數(shù)據(jù)。

  數(shù)據(jù)庫(kù)服務(wù)器返回文本數(shù)據(jù)給IVR。

  IVR通過(guò)其TCP通訊接口,將需要合成的文本信息發(fā)送給TTS服務(wù)器。

  TTS服務(wù)器將用戶文本合成的語(yǔ)音數(shù)據(jù)分段通過(guò)TCP通訊接口發(fā)送給IVR服務(wù)器。

  IVR服務(wù)器把分段語(yǔ)音數(shù)據(jù)組裝成為獨(dú)立的語(yǔ)音文件。

  IVR播放相應(yīng)的語(yǔ)音文件給電話用戶。

  一般的公網(wǎng)接入(IVR)大都采用工控機(jī)+語(yǔ)音板卡,而合成的語(yǔ)音數(shù)據(jù)則通過(guò)局域網(wǎng)傳給IVR。這種結(jié)構(gòu)只適用于簡(jiǎn)單的應(yīng)用場(chǎng)合。

  如果用這種方式去組建較大的系統(tǒng),則會(huì)存在諸多問(wèn)題:

  1、兩個(gè)瓶頸

  (1)接入瓶頸:

  單臺(tái)工控機(jī)的接入容量一般不超過(guò)8E1為宜。除了運(yùn)行應(yīng)用程序外,它還要控制兩個(gè)實(shí)時(shí)端口:實(shí)時(shí)地通過(guò)局域網(wǎng)接收語(yǔ)音數(shù)據(jù),并要實(shí)時(shí)地將接收到的語(yǔ)音數(shù)據(jù)通過(guò)PCI(或ISA)總線傳遞給語(yǔ)音板卡,如下圖所示。

  

  通過(guò)局域網(wǎng)傳遞語(yǔ)音數(shù)據(jù)本來(lái)就不能保證其時(shí)實(shí)時(shí)性,其結(jié)果就是用戶聽(tīng)到的語(yǔ)音經(jīng)常斷續(xù),保證不了語(yǔ)音質(zhì)量。如果傳遞的語(yǔ)音數(shù)據(jù)是經(jīng)過(guò)壓縮的,語(yǔ)音數(shù)據(jù)本來(lái)就是通過(guò)TTS進(jìn)行合成的,再經(jīng)過(guò)壓縮,則音質(zhì)會(huì)有很大的損傷,因此同樣保證不了語(yǔ)音質(zhì)量。從上圖中我們可以看到,經(jīng)TTS合成的語(yǔ)音數(shù)據(jù)從局域網(wǎng)經(jīng)過(guò)網(wǎng)卡,再通過(guò)主板PCI(或ISA)總線進(jìn)入語(yǔ)音卡,最后進(jìn)入電信網(wǎng),同樣語(yǔ)音數(shù)據(jù)通過(guò)計(jì)算機(jī)主板經(jīng)PCI(或ISA)總線進(jìn)入語(yǔ)音卡也要求是實(shí)時(shí)的。這兩種實(shí)時(shí)性的要求會(huì)導(dǎo)致在接入量比較大的情況下,會(huì)給計(jì)算機(jī)的總線造成很大的負(fù)擔(dān)。因?yàn)榭偩€的帶寬(數(shù)據(jù)吞吐量)是有限的。況且其它的板卡和接口(如聲卡、顯示卡等)也要直接或間接地占用總線。因此在接入量比較大的情況下,計(jì)算機(jī)的總線帶寬會(huì)成為一個(gè)比較關(guān)鍵的瓶頸。即便提高語(yǔ)音板卡的接入能力。在有大量電話接入的情況下,由于語(yǔ)音數(shù)據(jù)實(shí)時(shí)性的要求,也不能保證語(yǔ)音質(zhì)量。

  (2)I/O插槽和語(yǔ)音板卡容量的限制:

  目前計(jì)算機(jī)的I/O插槽,特別是PCI插槽有限,不可能插入大量的語(yǔ)音板卡,再加上語(yǔ)音板卡的容量不會(huì)太高,因此單臺(tái)計(jì)算機(jī)的接入能力相對(duì)較小。要組建比較大的系統(tǒng),就必須采用多臺(tái)計(jì)算機(jī)接入,這就必然會(huì)引入機(jī)間交換的問(wèn)題。用語(yǔ)音板卡和多臺(tái)機(jī)器構(gòu)建大中型CTI系統(tǒng)時(shí),機(jī)器間要通過(guò)電纜連接才能使系統(tǒng)同步運(yùn)行,但交換用的時(shí)鐘同步信號(hào)和數(shù)據(jù)信號(hào)的頻率很高,極易受到外界干擾,造成系統(tǒng)的不穩(wěn)定。

  2、系統(tǒng)復(fù)雜度的限制

  基于語(yǔ)音板卡構(gòu)建較大規(guī)模的應(yīng)用系統(tǒng)時(shí),除了系統(tǒng)穩(wěn)定性的因素外,還要考慮系統(tǒng)的復(fù)雜度。對(duì)一個(gè)應(yīng)用系統(tǒng)來(lái)說(shuō),除上面提到的因素外,復(fù)雜度本身就是影響系統(tǒng)穩(wěn)定性的要素之一。除此之外,系統(tǒng)復(fù)雜度的增加,會(huì)使系統(tǒng)的靈活性和可維性降低,從而導(dǎo)致系統(tǒng)未來(lái)維護(hù)、升級(jí)的成本和難度大大增加。

  3、開(kāi)發(fā)成本的考慮

  很大一部分系統(tǒng)集成商,對(duì)硬件設(shè)備的一次購(gòu)入成本考慮地較多,而開(kāi)發(fā)方面的成本往往容易忽略。隨著人力成本的日益凸顯,使得一個(gè)應(yīng)用系統(tǒng)的開(kāi)發(fā)成本越來(lái)越不容忽視。系統(tǒng)的開(kāi)發(fā)如同搭積木,系統(tǒng)規(guī)模較小,用小積木搭建會(huì)更經(jīng)濟(jì)一些。而用小積木構(gòu)建大系統(tǒng)會(huì)使積木塊的數(shù)量增加,而這些積木塊又要協(xié)同工作,因而對(duì)開(kāi)發(fā)人員能力和經(jīng)驗(yàn)的要求會(huì)增加,同時(shí)系統(tǒng)開(kāi)發(fā)周期也會(huì)加長(zhǎng),而系統(tǒng)的維護(hù)難度也隨之增加。這些因素都會(huì)導(dǎo)致在一個(gè)系統(tǒng)的生命周期內(nèi),其綜合運(yùn)行成本的增加。

  三、鼎銘基于分布式構(gòu)架的可編程交換機(jī)在大容量TTS中的應(yīng)用

  深圳鼎銘電子技術(shù)有限公司推出的基于分布式構(gòu)架的具有高速數(shù)據(jù)傳輸性能的可編程交換機(jī),給CTI應(yīng)用帶來(lái)了革命性的變化,獨(dú)有的分布式傳輸構(gòu)架使其交換機(jī)的整體性能和目前國(guó)內(nèi)外同類可編程交換機(jī)比較,有了根本上的超越。

  鼎銘高速數(shù)據(jù)傳輸板置于其可編程交換機(jī)內(nèi),外部可以和多臺(tái)PC或工控機(jī)相連,因?yàn)榭删幊探粨Q機(jī)可以級(jí)聯(lián),所以可以和外部連接的PC或工控機(jī)理論上沒(méi)有特別限制。這樣可編程交換機(jī)的內(nèi)部I/O總線(類比于PC機(jī)的PCI或ISA總線)就不再傳輸實(shí)時(shí)數(shù)據(jù)(如語(yǔ)音數(shù)據(jù)),而只負(fù)責(zé)非實(shí)時(shí)性的管理和信令數(shù)據(jù),語(yǔ)音或其它實(shí)時(shí)數(shù)據(jù)從外部PC直接傳入可編程交換機(jī)的高速數(shù)據(jù)傳輸板,然后通過(guò)交換直接進(jìn)入外部公共電信網(wǎng)(PSTN)。

  而對(duì)于需要錄音的語(yǔ)音或其它實(shí)時(shí)數(shù)據(jù)則從外部公共電信網(wǎng)(PSTN)通過(guò)可編程交換機(jī)內(nèi)部的交換直接進(jìn)入高速數(shù)據(jù)傳輸板,再輸出到外部PC或工控機(jī)。這就解決了上面提到的實(shí)時(shí)語(yǔ)音數(shù)據(jù)的傳輸瓶頸問(wèn)題。而可編程交換機(jī)本身的優(yōu)勢(shì)就在于它的高密度接入,對(duì)可編程交換機(jī)而言就不存在接入瓶頸問(wèn)題。

  除了解決上述兩個(gè)瓶頸問(wèn)題,我們?cè)賮?lái)看看這種結(jié)構(gòu)的交換機(jī)帶來(lái)的其它優(yōu)勢(shì):

  首先,在解決實(shí)時(shí)數(shù)據(jù)瓶頸問(wèn)題的同時(shí),因?yàn)閷?shí)時(shí)數(shù)據(jù)不再通過(guò)內(nèi)部的I/O總線,從而減輕了I/O總線負(fù)擔(dān),同時(shí)CPU的負(fù)擔(dān)也大大減輕了,而和高速數(shù)據(jù)板連接的外部PC所運(yùn)行的應(yīng)用程序也單一化了(如錄音/放音、TTS、ASR 等),而且具有了很強(qiáng)的可復(fù)制性。從而使基于可編程交換機(jī)構(gòu)建的應(yīng)用系統(tǒng)的復(fù)雜度大大降低,穩(wěn)定性和可靠性大大提高,從而在很大程度地降低了系統(tǒng)的開(kāi)發(fā)成本和運(yùn)行維護(hù)成本。另外,可編程交換機(jī)的專有電源系統(tǒng)也使系統(tǒng)穩(wěn)定性和可靠性大大加強(qiáng)。

  

  另外,鼎銘可編程交換機(jī)的這種構(gòu)架,使整個(gè)交換機(jī)平臺(tái)具備了很強(qiáng)的開(kāi)放性,捆綁獨(dú)立的第三方產(chǎn)品(如TTS、ASR等)非常方便,第三方產(chǎn)品只須改向一下輸出管道就可以了,產(chǎn)品本身無(wú)需作任何改動(dòng),因此更好地實(shí)現(xiàn)了第三方產(chǎn)品的價(jià)值。同時(shí),又降低了最終客戶的系統(tǒng)構(gòu)建成本。

  正是因?yàn)槎︺懣删幊探粨Q機(jī)從技術(shù)上突破了高速實(shí)時(shí)數(shù)據(jù)傳輸?shù)钠款i問(wèn)題,真正意義上實(shí)現(xiàn)了分布式的客戶機(jī)/服務(wù)器體系結(jié)構(gòu),所以也特別適合構(gòu)建大容量的彩話系統(tǒng)、彩鈴系統(tǒng)、電話QQ等電信增值系統(tǒng),以及大容量的錄放音系統(tǒng)、TTS、ASR等應(yīng)用系統(tǒng)。

  下圖示意了基于鼎銘可編程交換機(jī)構(gòu)建的大容量TTS IVR系統(tǒng)。TTS服務(wù)的電話服務(wù)流程變?yōu)椋?/p>

  用戶電話撥入,接入系統(tǒng)(IVR)響應(yīng),獲得用戶按鍵等信息。

  IVR根據(jù)用戶的按鍵信息,向數(shù)據(jù)庫(kù)服務(wù)器申請(qǐng)相關(guān)數(shù)據(jù)。

  數(shù)據(jù)庫(kù)服務(wù)器返回文本數(shù)據(jù)給IVR。

  IVR通過(guò)局域網(wǎng),將需要合成的文本信息發(fā)送給TTS服務(wù)器。

  TTS服務(wù)器將用戶文本合成的語(yǔ)音數(shù)據(jù)直接輸出到可編程交換機(jī)的高速數(shù)據(jù)傳輸板。

  高速數(shù)據(jù)傳輸板再將語(yǔ)音數(shù)據(jù)變成串行數(shù)據(jù)輸出到交換總線(無(wú)需CPU干預(yù))。

  交換總線的語(yǔ)音數(shù)據(jù)通過(guò)接入端口進(jìn)入公用電話網(wǎng)或公用數(shù)據(jù)網(wǎng),電話用戶聽(tīng)取相關(guān)語(yǔ)音。

  


標(biāo)簽:定西 永州 阜新 新鄉(xiāng) 無(wú)錫 遼寧 三沙 鶴崗

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《基于可編程交換機(jī)的分布式TTS系統(tǒng)》,本文關(guān)鍵詞  基于,可編程,交換機(jī),的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《基于可編程交換機(jī)的分布式TTS系統(tǒng)》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于基于可編程交換機(jī)的分布式TTS系統(tǒng)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章