CTI論壇(ctiforum.com)(編譯/老秦):在過去的幾年里,語音技術似乎以光速發(fā)展。隨著人工智能(AI)以更強的能力進一步滲透到該行業(yè),2020年尤為關鍵。自冠狀病毒危機爆發(fā)以來,這些能力肯定受到了考驗。這場危機迫使全球數(shù)百萬人在家工作、購物和娛樂,并日益依賴由人工智能驅(qū)動的語音技術支持的創(chuàng)新應用程序、平臺和在線解決方案。
Cogito的信號處理和機器學習主管JohnKane說,人工智能和語音終于達到了一個新的高度。
這個行業(yè)正在經(jīng)歷重大的勝利,比如能夠準確地從語音中識別文本,創(chuàng)造出聽起來自然的計算機聲音。他說:新產(chǎn)品現(xiàn)在可以分析語言的非言語特征。言語中的許多意義來自于說話的方式,而不僅僅是所說的話。而語音技術讀取和分析這些特征的能力是該行業(yè)向前邁出的一大步。
Orbita首席執(zhí)行官Bill Rogers也同意這一觀點。
如今的機器學習算法可以預測并提出建議,從而實現(xiàn)與人類水平的自動對話。這方面的高級應用包括結合生物標記來理解人類的情緒,并從語調(diào)模式和基于語音識別的用戶識別中得出結論,他解釋道。
其他人也同意,后一點尤為重要。
在同理心和同情心對成功互動至關重要的時代,語音技術的門檻已經(jīng)提高,Interactions的研究與創(chuàng)新總監(jiān)Michael Johnston堅持說?,F(xiàn)代人工智能系統(tǒng)不僅提供日常自動化,而且已經(jīng)開始依靠客戶和座席之間的對話,并以許多新的方式增加價值,例如提供個性化建議和呈現(xiàn)相關信息和內(nèi)容。
最新的統(tǒng)計數(shù)據(jù)強調(diào)了語音和人工智能的重要性:
- Allied Market Research預計,未來7年,全球虛擬助理市場將增長37.7%,到2027年將達到443億美元。
- 根據(jù)insightSLICE的數(shù)據(jù),到2030年,全球語音和語音識別市場預計將達到430億美元。
- 據(jù)谷歌統(tǒng)計,全球27%的在線用戶使用語音搜索;eMarketer顯示,幾乎40%的美國互聯(lián)網(wǎng)用戶和三分之一的總?cè)丝谑褂谜Z音;據(jù)Perficient統(tǒng)計,目前55%的智能手機用戶使用語音搜索。
- 根據(jù)New Vantage的研究,10家企業(yè)中有9家以上正在對人工智能進行投資。
年度回顧
如果不優(yōu)先考慮COVID-19以及它如何迫使人工智能迎接挑戰(zhàn),就不可能評估2020年。
毫不奇怪,冠狀病毒是人工智能采用和語音技術創(chuàng)新的主要催化劑。廣泛的社會隔離以及對遠程通信和連接的需求將會話人工智能推向了中心舞臺,Rogers說。
例如:傳統(tǒng)的聯(lián)絡中心越來越多地轉(zhuǎn)向?qū)υ捠饺斯ぶ悄?,以確保業(yè)務連續(xù)性。
Johnston說:在一個充滿不確定性和混亂的時代,為客戶提供一致、有效服務的能力可能比以往任何時候都更為重要。
醫(yī)療保健組織和提供者也令人印象深刻地采用人工智能和語音技術來清除冠狀病毒的障礙。
Just AI首席執(zhí)行官兼創(chuàng)始人Kiril lPetrov說:以人工智能為動力的聊天機器人和虛擬助理站在對抗COVID的最前線,幫助篩選和分類患者、進行調(diào)查、共享信息,并在人們無法離開家的時候?qū)崿F(xiàn)遠程醫(yī)療。
使用語音分析和護理協(xié)調(diào)團隊,高?;颊咭材軌蚋l繁地聯(lián)系,從而推動實時數(shù)據(jù)和參與。
Cosán集團創(chuàng)始人兼首席營銷和發(fā)展官DavidHunt說:隨著疫情的持續(xù),人們對心理健康的擔憂增加,人工智能技術已經(jīng)被用來提高患者的參與度,監(jiān)測心理健康的變化。
總的來說,2020年讓商界領袖意識到,消費者習慣將繼續(xù)快速演變。
越來越多的公司認識到,人工智能可以幫助應對這些變化,繼續(xù)提供優(yōu)質(zhì)的客戶體驗,從而幫助公司與客戶建立更好的關系。Read Speaker北美區(qū)總裁Matt Muldoon說:公司已經(jīng)開始利用人工智能開發(fā)出更感性、更高質(zhì)量的聲音,品牌也使用了更多的交互式語音廣告,讓他們能夠直接與消費者交談。
2020年的其他亮點也很重要:
- 自動語音識別通過不斷增加的遞歸神經(jīng)網(wǎng)絡傳感器的應用,實現(xiàn)了又一個飛躍,從而提高了準確性,減少了計算量。
- FacebookAI的wav2vec2.0吸引了大量的關注。Kane說:wav2vec2.0是音頻和語音的一項創(chuàng)新,不需要自動語音識別,它為下游的音頻和語音分類任務提供了強大的原材料。
- 引入OpenAI的GPT-3,以實現(xiàn)自然語言的預測和生成。
- 語音克隆得到改進,AI的本地化功能證明了這一點。他們的合成語音克隆可以被訓練說六種語言。這項新功能允許將數(shù)字語音翻譯成其他語言,這將使本地化更加容易,Petrov說。
展望未來
業(yè)內(nèi)專家看好未來幾個月相關技術的快速擴張。
到2021年,我們將看到越來越多地使用會話人工智能來替代人類智能的增強。Johnston預測:我們還將見證對話人工智能從語音和文本渠道不斷擴展到富媒體和多模式交互,智能虛擬助理將能夠通過語音和文本的視覺媒體組合向客戶呈現(xiàn)信息。
Muldoon預測,由于流感大流行而改變的消費者習慣可能會加速人工智能和語音技術的應用,特別是在今年上半年。
我們將開始看到支持語音的人工智能能力的擴展。他說:隨著越來越多的模型繼續(xù)被構建,將會有機會創(chuàng)造出更強大的交互,幾年后,人工智能將成為完成任務的第二種方式,而不是支持性角色。
Kane預計,由于無監(jiān)督的表征學習,諸如聲音事件檢測和語音情感識別等分類問題的準確率會有顯著的提高。
Kane說:今年可能是交互式會話數(shù)據(jù)得到應有的研究和開發(fā)關注的一年,我們看到了更多關于交互式語音合成的學術研究,以幫助語音助理等強大應用。
其他人則希望,人工智能的進步將在智能手機上帶來更好的語音文本轉(zhuǎn)換功能。
現(xiàn)在,當我們要求手機通過語音創(chuàng)建信息時,我們會看到很多錯誤。但隨著創(chuàng)新的繼續(xù)和算法的日益強大,我們將受益于這一應用的準確性提高,這也將影響智能說話者擴大他們對人類語言的理解,以及更廣泛地與用戶交談的能力,Rogers建議。
Wolters Kluwer的應用數(shù)據(jù)科學主管John Langton認為,我們可以預期,今年人工智能和其他技術(如面部識別和語音識別)之間的協(xié)同效應將會增強。
為了改進整合,我們現(xiàn)在可以使用情感計算作為額外的信號到語音輸入,在回答消費者問題時推斷用戶意圖,他說。
許多人同意,人工智能也將繼續(xù)在醫(yī)療保健領域提供更好的患者護理服務。
我們將觀察到為患者提供更加個性化的護理,為提供者提供更加高效和有效的手術。此外,遠程醫(yī)療的迅速采用,加上消費者對語音智能家居技術的廣泛使用,將可能推動交流醫(yī)療AI機器人的發(fā)展,Hunt說。
聲明:版權所有 非合作媒體謝絕轉(zhuǎn)載
作者:Erik J.Martin
原文網(wǎng)址:https://www.speechtechmag.com/Articles/Editorial/Features/The-State-of-Artificial-Intelligence-145107.aspx