據(jù)外媒(venturebeat)報(bào)道,人工神經(jīng)網(wǎng)絡(luò)研究迎來新進(jìn)展,微軟聲稱其所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在人聲語音識(shí)別上已經(jīng)媲美人類。
在周一發(fā)布的公告中,微軟表示其用NIST2000自動(dòng)化系統(tǒng)來同專業(yè)筆記員進(jìn)行能力對(duì)比,首次實(shí)現(xiàn)了機(jī)器出錯(cuò)率小于人類的突破。
優(yōu)化的語音識(shí)別技術(shù)在未來被期待夠給微軟一系列產(chǎn)品注入新的活力?!盁o論是個(gè)人用戶方面還是商業(yè)產(chǎn)品,語音識(shí)別的應(yīng)用前景都很可觀。籍此,Xbox可以實(shí)現(xiàn)快速的語音輸入,語音助手小娜也可以實(shí)現(xiàn)更流暢的對(duì)答?!痹诮瞻l(fā)布的一份更新博客中,微軟如此說道。
微軟CEO薩提亞·納德拉(Satya-Nadella)對(duì)語音識(shí)別不吝贊美之情,稱語音識(shí)別的突破意義不亞于當(dāng)初圖形界面(GUI)被引入電腦。并預(yù)言語音識(shí)別技術(shù)將在未來幾年迅速普及。
語音識(shí)別在近年來連續(xù)迎來突破。今年早些時(shí)候,中國(guó)互聯(lián)網(wǎng)巨頭百度和華盛頓大學(xué)以及斯坦福大學(xué)共同開展對(duì)不同輸入方式的對(duì)比研究。結(jié)果表明百度的深度語音識(shí)別技術(shù)DeepSpeech2能夠?qū)崿F(xiàn)三倍于人類鍵盤手打的輸入速度。另外美國(guó)國(guó)防部下屬的DARPA自1970年代開始就致力于語音識(shí)別技術(shù)的研究,并貢獻(xiàn)良多。DARPA所開展的語音理解研究(SUR)在開發(fā)語音識(shí)別技術(shù)的過程中起了關(guān)鍵作用,影響至今。