語(yǔ)音合成技術(shù)已進(jìn)入到人們的日常生活,有聲閱讀、智能客服、智能家居等場(chǎng)景都已經(jīng)出現(xiàn)了“它”的身影。有情感的聲音,賦予機(jī)器生命感,讓人機(jī)交互更美好、簡(jiǎn)單。
5月28日,標(biāo)貝科技重磅推出情感合成方案,主打高音質(zhì)及高自然度的情感語(yǔ)音合成效果,滿足有聲閱讀、兒童教育、車載、泛娛樂(lè)等多場(chǎng)景使用。據(jù)悉,標(biāo)貝科技本次打造情感合成方案,是繼3月成功推出留聲機(jī)方案之后,推出的又一全新TTS解決方案,通過(guò)整體提高情感合成聲音效果,提升用戶的交互體驗(yàn)。
AI情感合成讓語(yǔ)音交互更有溫度
聲音的可用性,可以通過(guò)自然度、可懂度、識(shí)別度等維度來(lái)考量。語(yǔ)音技術(shù)的進(jìn)步,讓機(jī)器合成的聲音不再頓挫、冰冷,在自然度和可懂度等方面取得了不錯(cuò)的成績(jī),但當(dāng)前合成效果在合成音的表現(xiàn)力上,特別是語(yǔ)氣和情感方面,還有不足。缺乏情感的聲音,何談傳遞情感,留住用戶?
情感合成,可以具有更進(jìn)一步的聲音表現(xiàn)力,傳遞出文本文字之外更多的信息,做到聲情并茂,以更動(dòng)聽(tīng)的聲音,更富有情感地表達(dá)內(nèi)容。
事實(shí)上,不同場(chǎng)景及文本類型,對(duì)聲音的要求也不同,除了基本的高音質(zhì)、自然度要求外,讓聲音擁有情感是不可或缺的。同樣的文本內(nèi)容,用不同情感表達(dá)出的傳遞出的意思也不盡相同,需要“音”景制宜,以增強(qiáng)用戶的融入感、代入感。例如,這句話“為什么你要這么問(wèn)我?”試想下用生氣、高興、恐懼等情感說(shuō)出效果與表達(dá)的意思。
此外,隨著語(yǔ)音技術(shù)推廣應(yīng)用深入不同的服務(wù)場(chǎng)景,用戶對(duì)聲音提出了更高的要求。智能客服場(chǎng)景,需要親和溫暖的聲音來(lái)提高用戶的滿意度;有聲閱讀場(chǎng)景,需要根據(jù)不同題材搭配出不同聲音,讓用戶感受有聲文本的魅力;智慧生活場(chǎng)景的語(yǔ)音交互,需要有情感的聲音賦予機(jī)器生命力,更懂用戶,感受科技生活的美好。
因此,如何進(jìn)一步提高語(yǔ)音合成的表現(xiàn)力,特別是讓合成語(yǔ)音能夠模擬表達(dá)說(shuō)話人的情感狀態(tài),是語(yǔ)音合成未來(lái)發(fā)展的趨勢(shì),而這也正是標(biāo)貝科技一直努力的方向。
打造高音質(zhì)、高自然度、強(qiáng)表現(xiàn)力的情感合成TTS
據(jù)標(biāo)貝科技語(yǔ)音相關(guān)負(fù)責(zé)人介紹,基于深度學(xué)習(xí)技術(shù)及自有定制情感數(shù)據(jù),標(biāo)貝本次推出情感合成TTS,主打高音質(zhì)、高自然度與多情感,可以呈現(xiàn)出高興、憤怒、恐懼、哀嘆、悲傷等多種情感聲音,在韻律表現(xiàn)、聲音層次感、情感表達(dá)等方面做到更加接近真人情感化表達(dá)的語(yǔ)音效果。標(biāo)貝科技希望通過(guò)語(yǔ)音技術(shù)的不斷創(chuàng)新,打造出更有表現(xiàn)力、更自然、更動(dòng)聽(tīng)的情感合成語(yǔ)音,持續(xù)提升用戶交互體驗(yàn)。
例如有聲閱讀、兒童教育、智能硬件等場(chǎng)景,高音質(zhì)、自然度的情感很重要。標(biāo)貝通過(guò)使用情感TTS技術(shù),力求在語(yǔ)氣、語(yǔ)音、語(yǔ)調(diào)、情感等方面接近真人說(shuō)話,與場(chǎng)景匹配,讓用戶在不同場(chǎng)景和碎片化時(shí)間,進(jìn)行有聲聽(tīng)讀獲取資訊、體驗(yàn)在線學(xué)習(xí)教育獲得優(yōu)質(zhì)體驗(yàn)。
以多角色情感合成為例,由于故事、小說(shuō)等文本素材包含大量角色人物,通過(guò)不同情感合成聲音配合文本內(nèi)容,以展現(xiàn)文學(xué)小說(shuō)人物的的特點(diǎn),讓AI技術(shù)生產(chǎn)的有聲讀物更有“人情味”。
下面通過(guò)一個(gè)多角色多情感的兒童故事合成樣本,來(lái)展示標(biāo)貝情感TTS帶來(lái)不一樣的有聲故事體驗(yàn)。
在故事中,我們可以切實(shí)感受到故事中人物情感的變化情況,更能夠吸引少兒聽(tīng)眾,營(yíng)造一種引人入勝的沉浸感。
來(lái)自易觀發(fā)布《2020年中國(guó)音頻產(chǎn)業(yè)生態(tài)發(fā)展分析報(bào)告》表示,有聲市場(chǎng)呈現(xiàn)增長(zhǎng)的態(tài)勢(shì),越來(lái)越多的用戶開(kāi)始接受有聲閱讀這樣的形式來(lái)收聽(tīng)內(nèi)容。其中,2020年1季度,在某知名有聲書平臺(tái)的播放量和收聽(tīng)人數(shù)上都有顯著增長(zhǎng),兩者環(huán)比分別增長(zhǎng)80.32%和39.82%。此外,用戶在有聲讀物的付費(fèi)購(gòu)買上也更加積極,2019年該平臺(tái)整體有聲書專輯訂單中過(guò)半為付費(fèi)訂單。
毫無(wú)疑問(wèn),有聲市場(chǎng)的爆發(fā)增長(zhǎng),將誕生大量不同類型的有聲內(nèi)容,相信情感語(yǔ)音合成能夠帶來(lái)更加自然和豐富的語(yǔ)音體驗(yàn),為有聲讀物市場(chǎng)提供更有競(jìng)爭(zhēng)力的差異化產(chǎn)品。
自有數(shù)據(jù)庫(kù)加持讓情感合成實(shí)現(xiàn)“可定制”
事實(shí)上,打造自然、高表現(xiàn)力的聲音效果,自然離不開(kāi)語(yǔ)音情感數(shù)據(jù)支持。數(shù)據(jù)庫(kù)是語(yǔ)音合成技術(shù)的基礎(chǔ),也是決定語(yǔ)音合成效果的關(guān)鍵因素之一。據(jù)了解,標(biāo)貝科技本次打造的情感TTS,采用了自有定制的高保真的情感語(yǔ)音庫(kù)。
目前,標(biāo)貝科技自有定制型語(yǔ)音庫(kù)已開(kāi)發(fā)出包括中文女聲情感音庫(kù)、多語(yǔ)種多音色男女聲音庫(kù)、粵語(yǔ)語(yǔ)音庫(kù)、兒童語(yǔ)音庫(kù)、葡萄牙語(yǔ)音庫(kù)、臺(tái)灣普通話語(yǔ)音庫(kù)、日語(yǔ)音庫(kù)、韓語(yǔ)音庫(kù)、明星語(yǔ)音庫(kù)等數(shù)十種類別,IP語(yǔ)音庫(kù)還在不斷豐富和積累中。
基于領(lǐng)先語(yǔ)音技術(shù)+高質(zhì)量的數(shù)據(jù)庫(kù)基礎(chǔ),標(biāo)貝能夠提供業(yè)內(nèi)優(yōu)質(zhì)的情感解決方案,呈現(xiàn)出聲音的多樣性、和個(gè)性化的合成效果體驗(yàn)。這也是因?yàn)闃?biāo)貝科技自成立起,將語(yǔ)音交互效果和數(shù)據(jù)質(zhì)量放在首位,擁有完整的采標(biāo)一體化解決方案,能夠?qū)崿F(xiàn)快速產(chǎn)出高質(zhì)量的語(yǔ)音合成、語(yǔ)音識(shí)別、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等采標(biāo)服務(wù),為行業(yè)提供一站式語(yǔ)音和數(shù)據(jù)服務(wù)。
未來(lái),隨著語(yǔ)音技術(shù)不斷發(fā)展,技術(shù)與場(chǎng)景的關(guān)系變得緊密,而用戶需求變得更加個(gè)性化。標(biāo)貝科技將加大技術(shù)創(chuàng)新投入,打造更有溫度的情感聲音,讓語(yǔ)音交互效果更“聲入人心”。