人工智能稱得上是當(dāng)前科技界最為熱門百應(yīng)電話機(jī)器人什么會(huì)聽(tīng)懂人說(shuō)話的話題之一。
與以往幾十年技術(shù)發(fā)展不同百應(yīng)電話機(jī)器人什么會(huì)聽(tīng)懂人說(shuō)話的是,這次人工智能的高潮,是伴隨著生活和工作的應(yīng)用而來(lái), 因此也有科學(xué)家認(rèn)為,“我們或許是和人工智能真正共同生活的第一代人”。
與人工智能共同生活,語(yǔ)音識(shí)別技術(shù)就成了其中最重要的一環(huán)。未來(lái),會(huì)不會(huì)出現(xiàn)一幅語(yǔ)言自然交融的場(chǎng)景:人與機(jī)器問(wèn)答自如、說(shuō)著不同語(yǔ)言的人們實(shí)時(shí)對(duì)話百應(yīng)電話機(jī)器人什么會(huì)聽(tīng)懂人說(shuō)話?智能語(yǔ)音技術(shù)正帶領(lǐng)人類前往其中。
不再是一個(gè)需要討論的問(wèn)題
在生活中,智能語(yǔ)音不再是新鮮事。
你可以進(jìn)行語(yǔ)音搜索。比如,對(duì)著手機(jī)說(shuō):“我想給XX打電話”,系統(tǒng)通過(guò)識(shí)別,立即將電話撥出;或者,你只要對(duì)著它輕輕哼唱一段音樂(lè),手機(jī)就能搜索出相應(yīng)的一首歌。
你還可以用語(yǔ)音輸入信息。發(fā)送手機(jī)信息甚至長(zhǎng)篇的電子郵件,只需對(duì)著電子終端說(shuō)話,語(yǔ)言就能變成文字輸入。
下班路上,你可以通過(guò)喚醒語(yǔ)音操控系統(tǒng),將家里的空氣凈化器、空調(diào)、加濕器等電器調(diào)節(jié)到最舒適健康的狀態(tài)。
要開(kāi)一個(gè)重要會(huì)議,合作伙伴來(lái)自美國(guó)、德國(guó)、日本等國(guó)家,語(yǔ)音識(shí)別可以實(shí)時(shí)將多國(guó)語(yǔ)言轉(zhuǎn)化成文字并翻譯在大屏幕上,參會(huì)者可以直接溝通。
這些語(yǔ)音識(shí)別技術(shù)不僅已經(jīng)變?yōu)楝F(xiàn)實(shí),而且每一天都在進(jìn)步。
“語(yǔ)音最大的優(yōu)勢(shì)是,它是人類最自然的交互方式?!鼻鞍俣妊芯吭焊痹洪L(zhǎng)余凱曾在接受媒體采訪時(shí)說(shuō)道,基于自然語(yǔ)言的搜索請(qǐng)求將會(huì)成為移動(dòng)互聯(lián)時(shí)代的主流搜索方式之一。
語(yǔ)音技術(shù)曾經(jīng)并不被人們看好,走過(guò)了漫長(zhǎng)的蟄伏期。但隨著智能手機(jī)崛起,語(yǔ)音技術(shù)應(yīng)用也迎來(lái)了爆發(fā)性增長(zhǎng)。
去年6月初,美國(guó)“互聯(lián)網(wǎng)女皇”(Mary Meeker)發(fā)布的《2016年互聯(lián)網(wǎng)趨勢(shì)報(bào)告》也認(rèn)為,語(yǔ)音將成為最重要的交互入口。去年年初,美國(guó)麻省理工科技評(píng)論評(píng)選出的十大創(chuàng)新預(yù)測(cè)中,語(yǔ)音接口也被列為第三名,被認(rèn)為是能解決重大問(wèn)題、帶來(lái)全新機(jī)遇的希望所在。
你會(huì)發(fā)現(xiàn),近幾年,蘋果推出了Siri(蘋果語(yǔ)音助手),谷歌發(fā)布了Google Now(谷歌語(yǔ)音服務(wù)),微軟的Cortana(微軟小娜,個(gè)人智能助理)也問(wèn)世了,都希望通過(guò)語(yǔ)音助手來(lái)打開(kāi)人工智能的大門。
同樣,在中國(guó),已發(fā)展了20多年的語(yǔ)音技術(shù),也開(kāi)始了一個(gè)前所未有的快速發(fā)展階段。語(yǔ)音的徹底主流化已經(jīng)不是一個(gè)需要討論的問(wèn)題,只是一個(gè)時(shí)間和習(xí)慣轉(zhuǎn)移的問(wèn)題。
那么,在語(yǔ)音識(shí)別率更高、語(yǔ)音合成效果更好的未來(lái),語(yǔ)音會(huì)如觸摸技術(shù)一樣,成為人機(jī)交互的主流方式嗎?
一個(gè)漫長(zhǎng)的征途
如今,我們離人機(jī)交互的時(shí)代還有多遠(yuǎn)?
這是科大訊飛董事長(zhǎng)劉慶峰在采訪中遇到最多的問(wèn)題之一,他每次都很堅(jiān)定地回答: “以語(yǔ)音為主導(dǎo),以鍵盤和觸摸屏為輔助的人機(jī)交互時(shí)代正在到來(lái)?!?/p>
在他描繪的圖景里,未來(lái)的人工智能會(huì)像水和電一樣進(jìn)入每個(gè)行業(yè)。
這其中,“語(yǔ)音是人工智能的重要入口”。
劉慶峰介紹,人機(jī)交互的過(guò)程中主要包括兩類語(yǔ)音技術(shù),一類是語(yǔ)音合成,就是讓機(jī)器“說(shuō)話”,產(chǎn)生人造語(yǔ)音。另一類是語(yǔ)音識(shí)別,就是讓機(jī)器聽(tīng)懂人說(shuō)話,并能像人一樣作出反應(yīng)。
讓機(jī)器人聽(tīng)懂人說(shuō)話,并不容易。
余凱曾這樣解釋:傳統(tǒng)的語(yǔ)音識(shí)別中的語(yǔ)言模型是通過(guò)概率來(lái)“識(shí)別”的,比如用戶說(shuō)“中”字,“國(guó)”字緊隨其后的可能性很大,其他字的出現(xiàn)概率相對(duì)就會(huì)小很多。利用不同的概率及數(shù)據(jù)建立的語(yǔ)言模型能夠幫助機(jī)器識(shí)別語(yǔ)音。但是如果在口語(yǔ)化的環(huán)境下,用戶語(yǔ)序不同或者有方言口音,就會(huì)大大干擾語(yǔ)音的解碼識(shí)別過(guò)程,降低識(shí)別準(zhǔn)確率。
但讓機(jī)器像人一樣作出反應(yīng),更難。很多人不禁問(wèn),從接受語(yǔ)音到識(shí)別語(yǔ)音,再到理解判斷,最后反饋服務(wù)結(jié)果,機(jī)器真的能像人一樣思維嗎?
機(jī)器需要基于大量的“學(xué)習(xí)”,根據(jù)過(guò)去的經(jīng)驗(yàn)進(jìn)行判斷預(yù)測(cè)。這種“學(xué)習(xí)”有兩種方法:通過(guò)在數(shù)據(jù)中找尋類似事例來(lái)提供解決方案,或是通過(guò)歸納出許多數(shù)據(jù)樣本的共性來(lái)對(duì)這件事情做出判斷。這也是語(yǔ)音技術(shù)發(fā)展的難點(diǎn)。
一切都朝著人工智能的大目標(biāo)努力,不過(guò),做出一款類似《超能陸戰(zhàn)隊(duì)》里的大白的產(chǎn)品,能夠完全理解人類的語(yǔ)言和行為,注定是一個(gè)漫長(zhǎng)的征途。
將怎樣改變世界
近幾年,作為國(guó)內(nèi)智能語(yǔ)音的領(lǐng)軍者,科大訊飛走紅了。
今年6月27日,以報(bào)道新興科技與創(chuàng)新商業(yè)為特色的《麻省理工科技評(píng)論》發(fā)布了“全世界最聰明的50家公司”榜單,其中排名全球第六、中國(guó)第一的,不是風(fēng)頭正勁的中國(guó)互聯(lián)網(wǎng)巨頭BAT中的任何一家,而是科大訊飛。
在此之前,科大訊飛曾榮獲2016中國(guó)年度新銳榜“年度企業(yè)”,頒獎(jiǎng)詞是這樣寫的:它的 雄心是從“讓機(jī)器能聽(tīng)會(huì)說(shuō)”到“讓機(jī)器能理解會(huì)思考”,深度改變?nèi)祟愂澜纭?/p>
在位于合肥高新區(qū)的科大訊飛總部大樓二層產(chǎn)品展示中心,一塊顯示屏上不斷跳動(dòng)的數(shù)字顯示,“訊飛開(kāi)放平臺(tái)”正被全國(guó)各地多少位用戶使用。
“無(wú)論在北京還是海南,無(wú)論打車或者叫外賣,或者設(shè)計(jì)一個(gè)新的手機(jī)APP,背后的支撐都有"訊飛語(yǔ)音云"。
”科大訊飛研究院院長(zhǎng)胡國(guó)平這樣說(shuō)。
在智能家居領(lǐng)域,你不僅能夠通過(guò)語(yǔ)音下達(dá)命令,還能隨時(shí)咨詢問(wèn)題,比如,燒菜時(shí),你可以問(wèn)現(xiàn)在該放多少鹽?智能家居就會(huì)立即回答你。
在汽車領(lǐng)域,汽車智能車載系統(tǒng)飛魚(yú)助理,將全景識(shí)別、多輪交互、方言識(shí)別等技術(shù)應(yīng)用于汽車,讓人可以直接通過(guò)語(yǔ)音輸入輕松進(jìn)行導(dǎo)航,收聽(tīng)了解多媒體娛樂(lè)信息,對(duì)車身進(jìn)行控制和信息查詢等服務(wù)。
在教育領(lǐng)域,通過(guò)機(jī)器自動(dòng)閱卷技術(shù),原批閱一份需要40分鐘左右的閱卷工作,現(xiàn)在只需要3分鐘即可完成。此外,目前科大訊飛的人工智能機(jī)器已經(jīng)替代了30%的人工客服,安徽移動(dòng)甚至有75%的客服內(nèi)容都被人工智能的機(jī)器替代了。
改變,正悄然而劇烈地發(fā)生。
很多還處于“弱智能”階段
“我們很榮幸入選"最聰明的公司",但是我覺(jué)得,科大訊飛在過(guò)去十幾年做的幾乎每件事都是挺笨的?!痹凇堵槭±砉た萍荚u(píng)論》揭曉“全世界最聰明50家公司”現(xiàn)場(chǎng)致辭時(shí),科大訊飛高級(jí)副總裁江濤說(shuō)。
2000年以前,中文語(yǔ)音應(yīng)用幾乎都被國(guó)外公司壟斷,國(guó)內(nèi)的語(yǔ)音研究機(jī)構(gòu)壁壘森嚴(yán)、力量分散。“中文語(yǔ)音技術(shù)要由中國(guó)人做到全球最好,中文語(yǔ)音產(chǎn)業(yè)要掌握在中國(guó)人自己手中?!睉阎@個(gè)夢(mèng)想,1999年,以劉慶峰為首的中國(guó)科學(xué)技術(shù)大學(xué)十幾位畢業(yè)生起航創(chuàng)業(yè)。
然而,當(dāng)時(shí)的技術(shù)并不過(guò)關(guān)。劉慶峰記得,當(dāng)時(shí)語(yǔ)音合成出來(lái)的效果是“一頓一頓”的,連續(xù)性不好;而語(yǔ)音識(shí)別和語(yǔ)音解析則更多地停留在實(shí)驗(yàn)室階段。
語(yǔ)音技術(shù)如何賺錢,初創(chuàng)團(tuán)隊(duì)誰(shuí)都說(shuō)不清楚。但讓機(jī)器能聽(tīng)會(huì)說(shuō),成為創(chuàng)業(yè)之初就設(shè)定的目標(biāo)。
2010年,訊飛輸入法正式推出,宣告語(yǔ)音聽(tīng)寫時(shí)代的到來(lái)。劉慶峰還記得,一位記者用福州口音嘗試了訊飛輸入法后激動(dòng)地說(shuō),“中國(guó)終于有個(gè)像Siri(蘋果語(yǔ)音助手)的產(chǎn)品出現(xiàn)了”。
劉慶峰覺(jué)得科大訊飛的“笨”也與人工智能這個(gè)行業(yè)有關(guān)。在他眼中,科大訊飛并不是一家互聯(lián)網(wǎng)公司,而是一家正在爬山的科技公司?!爸砸獜?qiáng)調(diào)二者的區(qū)別,是因?yàn)樵谧鋈斯ぶ悄艿墓竞芟衽郎秸?,需要?jiān)持目標(biāo)、不改方向,一步步地爬到頂峰,我們今天是人工智能公司,昨天是人工智能公司,明天還會(huì)是人工智能公司。但互聯(lián)網(wǎng)公司更像是個(gè)沖浪選手,互聯(lián)網(wǎng)的每一波浪潮都不一樣,它要不停地迎接下一個(gè)浪潮,如果下個(gè)浪潮不是人工智能,也許他們就換了方向?!?/p>
劉慶峰呼吁,中國(guó)要有更多“爬山型”公司:“你要征服的這個(gè)東西要是不可變的。如果你連堅(jiān)守都沒(méi)有,你后面做創(chuàng)新是不可能的?!?/p>
然而現(xiàn)實(shí)卻是,在資本的加持下,許多公司紛紛貼上了人工智能的標(biāo)簽?!斑@是非常不正常的現(xiàn)象?,F(xiàn)在,人工智能領(lǐng)域的泡沫化特別嚴(yán)重?!?/p>
科大訊飛執(zhí)行總裁胡郁認(rèn)為更需探討的問(wèn)題是,在中國(guó),目前的人工智能技術(shù)還處于“弱智能”階段,大多還只能達(dá)到語(yǔ)音助手的水平,要想獲得與人類大腦類似或同等的智慧,擁有自主學(xué)習(xí)、舉一反三的能力,人工智能還需要將深度學(xué)習(xí)、大數(shù)據(jù)等技術(shù)相結(jié)合,實(shí)現(xiàn)“漣漪效應(yīng)”。
“我們的很多創(chuàng)新其實(shí)只是停留在應(yīng)用或者技術(shù)層面上,但沒(méi)在科學(xué)的層面上去發(fā)現(xiàn)和創(chuàng)新,在人工智能的研究上,學(xué)術(shù)界的理論深度還應(yīng)加強(qiáng),如果我們只停留在技術(shù)層面的話,不可能創(chuàng)造未來(lái)?!?/p>
的確,故事才剛剛開(kāi)始,從基礎(chǔ)研究、技術(shù)發(fā)展,到未雨綢繆建立人工智能相關(guān)的倫理規(guī)范,人工智能的未來(lái),還面臨著無(wú)數(shù)挑戰(zhàn)和變化。
“人工智能+”時(shí)代什么樣
解放日?qǐng)?bào)·上觀:大潮來(lái)臨時(shí),人們總是喜歡將目光放在谷歌、蘋果、BAT、小米這些滿身光環(huán)的企業(yè)身上,直到明星企業(yè)家羅永浩在自己的產(chǎn)品發(fā)布會(huì)上對(duì)“訊飛輸入法”演示之后,大多數(shù)人才意識(shí)到:這可能是“離智能時(shí)代最近的中國(guó)企業(yè)”。那么,為什么是科大訊飛呢?
劉慶峰(科大訊飛董事長(zhǎng)):1999年,我們剛創(chuàng)業(yè)的時(shí)候,很多人都質(zhì)疑我們:十幾人的團(tuán)隊(duì),怎么可能成功?但不到20年來(lái),我們從被質(zhì)疑能不能生存下來(lái)到成為人工智能領(lǐng)域的牽頭者,體會(huì)就是一句話:走著彎曲的“直線”,每一步成長(zhǎng)都充滿艱辛和曲折。所有的但凡有前瞻性重大意義的技術(shù),無(wú)不經(jīng)歷這樣一條特殊曲線。
2016年是人工智能正式提出60周年,而前60年可以說(shuō)中國(guó)力量基本是缺席的。2016年底,科大訊飛首先在發(fā)布會(huì)上提出我們已經(jīng)從“互聯(lián)網(wǎng)+”時(shí)代進(jìn)入到“人工智能+”時(shí)代。這次發(fā)布會(huì),3000人的會(huì)場(chǎng)來(lái)了5000多人,100多萬(wàn)人在線觀看,第二天發(fā)布會(huì)現(xiàn)場(chǎng)視頻的傳播超過(guò)600萬(wàn)。2016年成了中國(guó)人工智能元年。
除了在中國(guó),人工智能大潮已經(jīng)在全世界勢(shì)不可擋,從實(shí)驗(yàn)室走向了產(chǎn)業(yè),從專業(yè)領(lǐng)域走向了開(kāi)放的消費(fèi)類市場(chǎng),從大城市走到了鄉(xiāng)村。盡管中國(guó)不是人工智能的策源地,但在當(dāng)前這一輪語(yǔ)音識(shí)別技術(shù)的爆發(fā)中,中國(guó)第一次同科技發(fā)達(dá)國(guó)家站在了同一起跑線上。
解放日?qǐng)?bào)·上觀:在語(yǔ)音識(shí)別領(lǐng)域,我國(guó)已經(jīng)躋身世界先進(jìn)行列,但在人工智能的其他方面,是不是距離國(guó)際先進(jìn)水平還有一定的差距?
劉慶峰:一定意義上,面對(duì)人工智能,中國(guó)和美國(guó)幾乎同時(shí)進(jìn)入了無(wú)人區(qū),包括技術(shù)持續(xù)創(chuàng)新的無(wú)人區(qū),在應(yīng)用中摸索的無(wú)人區(qū),以及配套的政策、法規(guī)、論理、人文的無(wú)人區(qū)。這是一個(gè)非常令人激動(dòng)的時(shí)代機(jī)遇。但中國(guó)的產(chǎn)業(yè)界、媒體界對(duì)人工智能了解更多的是應(yīng)用特性和娛樂(lè)特性,而美國(guó)則深入鉆研人工智能的理論研究,這些研究成果大多難以產(chǎn)業(yè)化,但卻是最原始的理論基礎(chǔ)上的創(chuàng)新。
為什么中外人工智能領(lǐng)域的差異這么明顯?國(guó)內(nèi)人工智能學(xué)術(shù)界因?yàn)橐a(chǎn)業(yè)對(duì)接,所以做了許多技術(shù)應(yīng)用和創(chuàng)新;而產(chǎn)業(yè)界還沒(méi)有更加深入、原創(chuàng)的研究能力,所以很少有單位能做整體性的系統(tǒng)創(chuàng)新。
所以,中國(guó)的人工智能研究應(yīng)該從兩個(gè)方面發(fā)力:研究院所、高校應(yīng)該更加著重于理論鉆研,而產(chǎn)業(yè)界不僅要應(yīng)用人工智能技術(shù),還應(yīng)該去做技術(shù)方面的大規(guī)模的融合創(chuàng)新。
解放日?qǐng)?bào)·上觀:您說(shuō),我們已經(jīng)從“互聯(lián)網(wǎng)+”時(shí)代進(jìn)入到“人工智能+”時(shí)代?!叭斯ぶ悄埽笔且粋€(gè)怎樣的時(shí)代?
劉慶峰:“人工智能+”時(shí)代已經(jīng)到來(lái)了,2016年是中國(guó)人工智能元年,2017年是人工智能應(yīng)用落地年,我們已經(jīng)走上了“人工智能+”的賽道。
我曾經(jīng)去安徽省金寨縣的小學(xué)待了兩天,非常有感觸,我一直想,如果人工智能能使每一個(gè)鄉(xiāng)村學(xué)校都擁有和城市學(xué)校一樣的名師,中國(guó)教育將會(huì)怎樣?通過(guò)“人工智能+教育”就能實(shí)現(xiàn),中國(guó)的教育會(huì)往上邁一個(gè)大臺(tái)階。
“人工智能+醫(yī)療”呢?現(xiàn)在通過(guò)學(xué)習(xí),我們的人工智能已經(jīng)可以達(dá)到一線醫(yī)生的水平。我們的目標(biāo),是要讓人工智能今年能在全球首次通過(guò)國(guó)家執(zhí)業(yè)醫(yī)師資格考試。
“人工智能+法治中國(guó)”,目前已經(jīng)在電信防詐騙領(lǐng)域運(yùn)用一些技術(shù),并已取得成效。通過(guò)人工智能進(jìn)行輔助量刑,使得一線的檢察官具備了大法官、大檢察官這樣的公平判案的能力和水平,使得人工智能自動(dòng)檢查公檢法體系證據(jù)鏈完備,防止冤假錯(cuò)案。
我們提出:要通過(guò)人工智能為每個(gè)人賦能。在第三次人工智能的產(chǎn)業(yè)浪潮中,我們會(huì)不會(huì)失業(yè)?我們能干什么?“人工智能+個(gè)人”,就是我們未來(lái)要做的。圍棋高手和AlphaGo之間比賽圍棋是沒(méi)有意義的,應(yīng)該是每一個(gè)圍棋高手都帶一個(gè)人工智能助手,相互去PK。也就是說(shuō),未來(lái),人工智能會(huì)成為每個(gè)人都能觸摸的助手。所以,今天我們?cè)谘邪l(fā)和產(chǎn)業(yè)設(shè)計(jì)中,就要考慮人機(jī)協(xié)同的機(jī)制,不僅包括腦機(jī)接口,而且是人腦智能和機(jī)器智能的協(xié)作職能,這也是人工智能的倫理和人文道路的選擇。
要讓每一個(gè)人站在人工智能的肩膀之上,而不是被時(shí)代所淘汰和顛覆。
題圖來(lái)源:視覺(jué)中國(guó)責(zé)任編輯:王一圖片編輯:笪曦
作者:王一