CTI論壇(ctiforum.com)(編譯/老秦):我們詢問了我們的常規(guī)撰稿人和專欄作家,2019年哪些語音技術趨勢和故事將占據(jù)頭條新聞。您認為哪些預測將在未來一年實現(xiàn),您認為我們還會在2020年等待哪些預測?
Larson技術服務副總裁兼Speech TEK會議主席James A.Larson:
變聲(Voicemorphing),一個聲音被另一個聲音替換,將出現(xiàn)在新聞中:
變聲軟件可用于移動設備
- 壞人會使用變聲來迷惑和欺負受害者
- 虛假新聞報道將使用變聲來模擬當局的聲音
- 語音數(shù)據(jù)庫將被黑客入侵,因此欺詐者可以使用語音來訓練變聲軟件。
- 規(guī)范機構在制定和執(zhí)行語音盜版法律方面會很慢
- 當用戶聽到此對話將被記錄以保證質(zhì)量時,用戶將掛機,以避免他們的聲音被捕獲并放入語音數(shù)據(jù)庫中
Conversational Technologies的負責人Deborah Dahl:
我認為2019年最熱門的趨勢將是越來越多的應用程序能夠識別并響應用戶的情緒。從語音和語言中識別情感在技術上是可行的,但更有趣的是,它提出了一些重要的設計問題。系統(tǒng)應該對憤怒或不高興的來電者說什么?它應該試圖讓呼叫者冷靜下來,還是會讓事情變得更糟?應用程序設計人員還必須將情緒識別結果的信心考慮在內(nèi)--如果系統(tǒng)誤認為憤怒的中立情緒并開始道歉,那將是不好的!
Vox Peritus董事總經(jīng)理凱文·布朗(Kevin Brown):
企業(yè)內(nèi)人工神經(jīng)網(wǎng)絡(ANN)的使用將在2019年大幅增加。
通過谷歌,微軟,蘋果,亞馬遜等提供的人工神經(jīng)網(wǎng)絡,用戶對語音識別的接受度大大提高。消費者語音識別與當前更糟糕的企業(yè)語音識別能力之間的顯著二分法要求快速改變方法。
對于2019年,ANN將被添加用于創(chuàng)建具有傳統(tǒng)語音識別功能的混合動力,直到第三方ANN供應商選擇他們尊重的利基行業(yè)。結果將是新玩家進入企業(yè)語音識別市場的機會。
Disaggregate總裁Moshe Yudkowsky博士:
歐盟現(xiàn)在要求對涉嫌侵犯版權的所有數(shù)字內(nèi)容上傳進行掃描--換言之,先發(fā)制人的審查制度。這包括任何內(nèi)容,甚至是上傳到開源軟件項目的代碼。在2019年,期望這一授權擴展到語音識別(ASR),以審查不受歡迎的意見和那些被貶低為'仇恨言論'的意見。歐盟或英國可能會強制要求。在美國,社交媒體公司可能會轉(zhuǎn)向ASR來補充他們目前的人類審查大軍。
聲明:版權所有 非合作媒體謝絕轉(zhuǎn)載
作者:Theresa Cramer
原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/Speech-Technology-Predictions-for-2019-129106.aspx