全球知名語音學(xué)術(shù)大會INTERSPEECH2019于9月15日至19日在奧地利格拉茨城市舉行。
作為全球智能語音及AI數(shù)據(jù)發(fā)展的推動者,標貝科技受邀成為大會黃金級贊助廠商亮相現(xiàn)場。其中,由標貝語音團隊撰寫的《A Mandarin Prosodic Boundary Prediction Model Based on Multi-Task Learning》論文成功入選會議,并在現(xiàn)場向來自全球的語音科研機構(gòu)及企業(yè)廠商展現(xiàn)標貝語音科研創(chuàng)新及產(chǎn)品動態(tài)。
全球語音交流協(xié)會INTERSPEECH是世界上規(guī)模最大、內(nèi)容最全面的語音會議。今年恰逢INTERSPEECH成功舉辦20周年,會議以“Crossroads of Speech and Language”為主題,意在探討語言多樣性、應(yīng)用多樣性以及表達方式多樣性,吸引了來自世界各地的近2000名科研學(xué)者及企業(yè)廠商代表。
歷屆INTERSPEECH會收到來自全球上千家科研機構(gòu)及企業(yè)廠商投稿,而最終入選的數(shù)量卻十分有限。緣由國際權(quán)威評委的嚴格標準。本次標貝論文入選大會,體現(xiàn)了中國AI語音廠商在國際語音領(lǐng)域的不俗實力。該論文提出了一種基于多任務(wù)學(xué)習(xí)(MTL)架構(gòu)的中文普通話韻律邊界預(yù)測模型。研究結(jié)論表明,該模型有效地解決了普通話韻律邊界預(yù)測的任務(wù),整體預(yù)測性能提高了0.8%,模型尺寸減小了約55%。對語音行業(yè)研究中文普通話語音合成效果質(zhì)量提升提供了一定的研究參考價值。
據(jù)了解,標貝科技語音及數(shù)據(jù)核心團隊人員擁有超過15年行業(yè)經(jīng)驗,擁有業(yè)內(nèi)領(lǐng)先的語音合成技術(shù)及數(shù)據(jù)方案能力,為全球客戶提供高品質(zhì)、多類別、多場景的語音合成方案,以及高質(zhì)量、安全與多語種為特點的數(shù)據(jù)服務(wù)。截至目前,標貝科技已為微軟、百度、阿里、騰訊、字節(jié)跳動等海內(nèi)外100余家企業(yè)客戶提供服務(wù),項目累計超過300項,涵蓋汽車、教育、客服、零售、閱讀、智能硬件等應(yīng)用領(lǐng)域。
標貝科技自成立以來,把AI技術(shù)創(chuàng)新放在首位,以“語音連接場景、數(shù)據(jù)服務(wù)技術(shù)為理念”,在技術(shù)、數(shù)據(jù)及應(yīng)用三端不斷創(chuàng)新,確保在語音和數(shù)據(jù)領(lǐng)域的領(lǐng)先地位。
例如,在語音合成方面上,標貝基于Attention機制的深度神經(jīng)網(wǎng)絡(luò)技術(shù),充分利用文本數(shù)據(jù),構(gòu)建前端模塊、選擇合適的聲碼器,降低運算量,創(chuàng)新語音合成模型,提升語音合成質(zhì)量效果,并匹配場景應(yīng)用。以出色的語音技術(shù)實力、場景連接能力,贏得客戶信任與認可。此外,標貝還自主創(chuàng)新研發(fā)TTS評測系統(tǒng),從前/后端為行業(yè)提供評測標準指南,提升語音評測質(zhì)量整體發(fā)展。
同時,在高校科研合作方面,標貝與北京大學(xué)、西北工業(yè)大學(xué)、新加坡國立大學(xué)等國際高校建立合作關(guān)系,以此獲得強有力的產(chǎn)研力量支持。
本屆INTERSPEECH2019,標貝科技收獲了海外多個地區(qū)科研機構(gòu)和海外客戶對標貝自有語音合成方案的認可。未來,標貝科技將與更多科研高校、企業(yè)廠商保持緊密的交流合作,攜手共同推動語音產(chǎn)業(yè)的發(fā)展。
完整版論文鏈接:
https://www.isca-speech.org/archive/Interspeech_2019/pdfs/1400.pdf