未來的人工智能什么樣?現(xiàn)在還沒有確定的答案,但能確定的是現(xiàn)在只是開始??拼笥嶏w執(zhí)行總裁、消費(fèi)者事業(yè)群總裁胡郁表示,人工智能經(jīng)過60多年的發(fā)展,現(xiàn)在剛剛找到了一個可能達(dá)到人類智能的入口。懷揣著“讓世界聆聽我們的聲音”的夢想,科大訊飛依托世界領(lǐng)先的核心技術(shù),引領(lǐng)智能浪潮,服務(wù)億萬用戶,從中國語音產(chǎn)業(yè)的拓荒者一躍成為世界人工智能產(chǎn)業(yè)的領(lǐng)軍者,而最初科大訊飛把語音作為切入點(diǎn)卻是源于偶然……
從智能語音到訊飛超腦
科大訊飛1999年成立的時候,手上只有一項(xiàng)技術(shù)就是語音技術(shù),當(dāng)時的目標(biāo)是讓機(jī)器開口說話。胡郁笑談:“當(dāng)時我們并不知道,我們處于人工智能的范疇,至少自己沒有清晰的概念。我們更加不知道的是,1999年恰恰是人工智能的第二次冬天。就像華為任總以前經(jīng)常講的一句話,華為要是知道通訊行業(yè)這么難做,可能就不會做了。我們當(dāng)時也是,如果知道人工智能處于那樣的環(huán)境,可能就不會創(chuàng)業(yè)了。這既有巧合,又是冥冥之中的注定。”
“2003-2004年以后,人工智能還不是特別熱,我們慢慢意識到我們做的恰好是人工智能最關(guān)鍵的技術(shù)。”人類的智能相對于其他動物或者相對于機(jī)器,最重要的是認(rèn)知智能,而認(rèn)知智能的主要來源是人類對語言的掌握和對知識的表達(dá),然后在這個基礎(chǔ)上進(jìn)行邏輯推理和復(fù)雜的決策。以語音和語言為中心的認(rèn)知革命,是人類智慧的最高水平,也是現(xiàn)在人工智能所面臨的最大挑戰(zhàn)。
作為訊飛超腦的總牽頭人,胡郁作出了這樣的詮釋:“2014年,我們在業(yè)界第一次推出‘訊飛超腦’計(jì)劃,這不僅僅是一個口號。我們同時發(fā)布了對人工智能的定義,即運(yùn)算智能。機(jī)器從發(fā)明的第一天開始,就比人類強(qiáng)很多,比如會下圍棋的機(jī)器,就是機(jī)器運(yùn)算智能的表現(xiàn)。還有類人機(jī)器具有感知智能和運(yùn)動智能,具體表現(xiàn)是機(jī)器能夠看到、聽到、感覺到周圍的世界?,F(xiàn)在的類人和動物的機(jī)器已做得不錯了。但是,人類之所以能夠屹立在地球生物鏈的頂端,是因?yàn)槿祟惖恼Z言能力,我們稱為認(rèn)知智能。這是訊飛超腦計(jì)劃的一個目標(biāo),讓具備感知智能的機(jī)器從能聽會說、能看會認(rèn),過渡到認(rèn)知智能,即能理解,會思考。”
當(dāng)前,“訊飛超腦”利用大數(shù)據(jù)來進(jìn)行訓(xùn)練以提升相關(guān)算法,這其中的“訓(xùn)練”指代的并不是那種填鴨式的數(shù)據(jù)輸入和訓(xùn)練,而是來自于真實(shí)應(yīng)用場景的真實(shí)交互數(shù)據(jù),讓系統(tǒng)能夠依據(jù)真實(shí)數(shù)據(jù)實(shí)現(xiàn)自主學(xué)習(xí)和提升,胡郁稱之為漣漪效應(yīng),就像水滴入水面產(chǎn)生的漣漪一樣,隨著產(chǎn)品覆蓋面的不斷增加,數(shù)據(jù)量級也在快速攀升,進(jìn)而帶來產(chǎn)品體驗(yàn)的快速優(yōu)化迭代,這一切的背后都依賴于“訊飛超腦”這個強(qiáng)大的人工智能引擎。
科大訊飛在語音合成、識別、評測,翻譯等領(lǐng)域都擁有全球領(lǐng)先的核心技術(shù)。2005年至2018年,在全球最高水平的語音合成比賽BlizzardChallenge中,科大訊飛取得13連冠,同時科大訊飛各項(xiàng)關(guān)鍵指標(biāo)均名列第一。在國際機(jī)器翻譯評測IWSLT2014、NIST2015等大賽中科大訊飛連奪冠軍。在過去6年中,科大訊飛的語音識別技術(shù)準(zhǔn)確率從60.2%提升到98%以上。語音技術(shù)上的優(yōu)勢為科大訊飛向人工智能發(fā)展,同時落地行業(yè)與應(yīng)用打下良好的根基。
訊飛在布局當(dāng)前的大數(shù)據(jù)人工智能的同時,也在關(guān)心人工智能發(fā)展的另一方面,即與人腦相結(jié)合,基于類腦計(jì)算,試圖找到人腦智能的奧秘,發(fā)現(xiàn)其中的智能動力學(xué),進(jìn)而真正讓機(jī)器具備像人一樣的智能,同時不受人腦物理空間的局限,以此來實(shí)現(xiàn)人工智能領(lǐng)域真正的突破。
智能交互改變生活
科大訊飛是真正把人工智能的應(yīng)用落地了。在2010年,科大訊飛開發(fā)了世界上第二個、中國第一個語音輸入法,僅次于谷歌,訊飛輸入法主打語音輸入,語音識別準(zhǔn)確率超98%,同時支持22種方言的語音輸入。
在2016年,科大訊飛發(fā)布了第一個智能終端產(chǎn)品訊飛翻譯機(jī)。2018年4月又推出了訊飛翻譯機(jī)2.0,主打中文與33種語言實(shí)時互譯、方言翻譯和拍照翻譯,并獨(dú)家具備4G、Wi-Fi和離線翻譯模式。翻譯機(jī)86%的用戶用于出境游??紤]到用戶可能不會使用標(biāo)準(zhǔn)普通話,訊飛翻譯機(jī)2.0同時搭載了方言和帶方言口音非標(biāo)準(zhǔn)普通話的識別能力,目前已支持粵語、四川話、東北話、河南話四大方言。方言種類還在持續(xù)增加中,并能根據(jù)用戶的不同使用場景與用詞習(xí)慣,準(zhǔn)確識別并給出最符合語境的翻譯結(jié)果,真正做到了落地實(shí)用??梢哉f,訊飛翻譯機(jī)2.0是至今世界上銷量最好、好評度最高的手持式智能翻譯系統(tǒng)。
胡郁說:“有人主張把翻譯功能完全整合到手機(jī)里,沒有必要專門為此做一個硬件,但‘做翻譯機(jī)是科大訊飛深思熟慮的結(jié)果’”。首先,手機(jī)的主要使用場景是近場使用,沒有考慮到在翻譯過程中人可能離得比較遠(yuǎn)、環(huán)境噪聲大等問題;其次,他認(rèn)為智能硬件的精髓在于好用,在于方便快捷,打開即用,一步到位才能有更好的體驗(yàn),而手機(jī)中使用APP的過程繁瑣,操作不便;第三,翻譯場景應(yīng)該有更自然、更親和的交互,將手機(jī)直接放在別人嘴邊也不符合我們的交往禮儀。
為了構(gòu)建未來人工智能產(chǎn)業(yè)生態(tài)體系,在2010年訊飛發(fā)布了語音云平臺。目前平臺上的開發(fā)者已經(jīng)超過86萬,連接19億設(shè)備,每日提供近46億次交互服務(wù),數(shù)以百萬計(jì)的開發(fā)者正在借助科大訊飛的核心技術(shù)開發(fā)智能產(chǎn)品,服務(wù)于我們生活的方方面面。
2015年,科大訊飛進(jìn)一步發(fā)布了對人工智能產(chǎn)業(yè)具有里程碑意義的人機(jī)交互界面——AIUI,重新定義了萬物互聯(lián)時代的人機(jī)交互標(biāo)準(zhǔn)。胡郁說道:“2017年,科大訊飛被宣布作為首批國家新一代人工智能開放創(chuàng)新四大平臺之一,旨在建成依托智能語音的國家新一代人工智能開放創(chuàng)新平臺,這是國家對于訊飛人工智能產(chǎn)業(yè)生態(tài)的高度認(rèn)可。”
專家系統(tǒng)賦能行業(yè)
智能語音和人工智能技術(shù)對傳統(tǒng)行業(yè)賦能方面,科大訊飛也做了很多嘗試,例如公檢法、教育等行業(yè)。
在公檢法領(lǐng)域,科大訊飛通過與最高法、最高檢開展創(chuàng)新合作。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的準(zhǔn)確率極高;人工智能還充當(dāng)起法庭書記員,經(jīng)測試,智能語音識別參與庭審取得實(shí)際效果,庭審時長縮短30%。
在教育領(lǐng)域,人工智能在“改卷子”方面的能力就超乎了人們的想象。在江蘇省的高考智能閱卷驗(yàn)證中,兩個不同的人工智能語文作文閱卷分差小于7分,一致率達(dá)92.82%,比兩位老師的閱卷評分的一致率高出5%以上。在湖南省研究生考試的智能閱卷驗(yàn)證中,兩個不同的人工智能分別對英語作文進(jìn)行閱卷評分,分差小于6分的一致率竟高達(dá)99.83%,比兩位老師的閱卷評分一致率高出了4%以上。胡郁表示,教育部考試中心正聯(lián)合科大訊飛建設(shè)人工智能聯(lián)合實(shí)驗(yàn)室,在教育領(lǐng)域醞釀著更多“黑科技”的誕生。
共建AI未來
科大訊飛與華為公司始終保持著緊密合作,雙方充分依托各自行業(yè)領(lǐng)域的長期積淀優(yōu)勢,在電信平臺、智能終端等領(lǐng)域建立了戰(zhàn)略合作關(guān)系,攜手推動語音及人工智能技術(shù)的深入應(yīng)用。雙方合作在2010年建立了世界上第一個中文語音的開放云平臺。云計(jì)算能力開放以后,眾多公司和開發(fā)者可以面向最終用戶的各種需求,開發(fā)各種各樣的產(chǎn)品,這就形成了生態(tài)的建設(shè)。
2018年5月,華為與科大訊飛簽署戰(zhàn)略合作協(xié)議,未來雙方將在公有云服務(wù)、ICT基礎(chǔ)設(shè)施產(chǎn)品、智能終端、以及辦公I(xiàn)T四大領(lǐng)域開展深度戰(zhàn)略合作。雙方還將面向未來開發(fā)創(chuàng)新AI語音應(yīng)用,拓展全新行業(yè)市場,做大規(guī)模共享收益,共同做強(qiáng)人工智能產(chǎn)業(yè)生態(tài)。
對于消費(fèi)者市場,華為手機(jī)使用的技術(shù)中,有一部分是源于科大訊飛的智能語音技術(shù)加持。華為手機(jī)還將科大訊飛的AI技術(shù)和能力內(nèi)化為華為手機(jī)能力的一部分,為其帶來差異化的競爭優(yōu)勢。雙方將基于科大訊飛的語音識別、語音合成、訊飛聽見、訊飛翻譯等語音AI技術(shù)和能力,圍繞手機(jī)等智能終端產(chǎn)品以及終端云服務(wù)進(jìn)行合作。
對于2B市場,華為在基礎(chǔ)設(shè)施、內(nèi)部辦公產(chǎn)品等使用科大訊飛的技術(shù)與產(chǎn)品,雙方將基于訊飛引擎和華為云資源,共同構(gòu)筑華為云EI平臺。面向未來+智能的時代,胡郁認(rèn)為將來的人工智能都要在云計(jì)算上做。由于云計(jì)算的資源消耗比較大,將來有可能會在端計(jì)算和邊緣計(jì)算上實(shí)現(xiàn)更好的人工智能,也許很快成為技術(shù)上的突破口。人工智能的應(yīng)用也會更多地落地,真正解決問題。
我們有理由相信,未來華為和訊飛可以更好地依托自身優(yōu)勢,結(jié)合產(chǎn)業(yè)發(fā)展,共建更好的人工智能生態(tài)體系,為未來的AI生活增光添彩。