人工智能技術(shù)主要通過兩方面進(jìn)行產(chǎn)業(yè)賦能:一方面它能夠創(chuàng)造虛擬勞動(dòng)力,作為一種新的生產(chǎn)要素可以促進(jìn)生產(chǎn)力的提高,降本增效;二是創(chuàng)造新的需求和增長點(diǎn),促進(jìn)經(jīng)濟(jì)的創(chuàng)新。
日前,捷通華聲董事長、CEO武衛(wèi)東在出席清華企業(yè)家協(xié)會(huì)(TEEC)活動(dòng)中,做了《全方位AI助推新基建,驅(qū)動(dòng)產(chǎn)業(yè)智能化轉(zhuǎn)型》主題分享,就人工智能之于新基建核心價(jià)值進(jìn)行了解讀,并介紹了捷通華聲基于靈云全方位人工智能開放平臺(tái)在技術(shù)、產(chǎn)品與服務(wù)層面的最新進(jìn)展和助推各行業(yè)智能化升級(jí)的成果。
以下為分享實(shí)錄(有整理):
大家好,很高興今天有這樣一個(gè)機(jī)會(huì)和各位T友分享。
今年正好是捷通華聲成立20周年。
在人工智能這條路上,我們經(jīng)歷了很多,由最開始人工智能概念普及,到技術(shù)突破(深度學(xué)習(xí))掀起新一輪浪潮,今年上半年的科技戰(zhàn)疫、復(fù)工復(fù)產(chǎn),再到這次作為新基建7大領(lǐng)域之一被寫入政府工作報(bào)告,每個(gè)階段我們都有參與,有些環(huán)節(jié)更是作為推動(dòng)者在做。
今天要和大家分享的,就是這些年我們?cè)谌斯ぶ悄茴I(lǐng)域的一些經(jīng)驗(yàn)、心得和思考。
人工智能可以理解成讓機(jī)器具備人的各項(xiàng)能力的技術(shù),是人的手眼感知的延伸,但本質(zhì)上是工具而不是人力,是為人類所驅(qū)使的生產(chǎn)勞動(dòng)工具。捷通華聲在創(chuàng)立之初便定位提供多項(xiàng)人工智能技術(shù)。
捷通華聲成立于2000年,是較早進(jìn)入人工智能領(lǐng)域的企業(yè),始終致力于讓機(jī)器能說會(huì)聽、能寫會(huì)看、能辨音會(huì)認(rèn)人、能思考會(huì)判斷。
公司成立前十年是我們完成技術(shù)積累的十年。后來隨著數(shù)據(jù)爆發(fā)式增長、計(jì)算能力提升以及深度學(xué)習(xí)算法的成熟,人工智能開啟了第三次發(fā)展浪潮。
正是這期間,捷通華聲在2011年推出了國內(nèi)首個(gè)定位于全方位人工智能技術(shù)的開放平臺(tái)——靈云,在這個(gè)平臺(tái)上承載了我們當(dāng)時(shí)設(shè)計(jì)研發(fā)的智能語音、智能語義、智能圖像等多方面的人工智能技術(shù)。
現(xiàn)在回過頭來看,多項(xiàng)技術(shù)融合應(yīng)用正是AI與各行各業(yè)交叉融合,實(shí)現(xiàn)產(chǎn)業(yè)智能化升級(jí)的基礎(chǔ),這個(gè)也是新基建的特性之一。
經(jīng)過近10年的發(fā)展,現(xiàn)在我們已經(jīng)擁有語音識(shí)別、語音合成、自然語言處理、語義理解、聲紋識(shí)別、OCR、手寫識(shí)別、人臉識(shí)別、大數(shù)據(jù)分析等15項(xiàng)核心技術(shù),通過靈云平臺(tái)向全產(chǎn)業(yè)開放。
目前,我們已經(jīng)構(gòu)建了全國范圍銷售與研發(fā)網(wǎng)絡(luò),北京總部外,在上海、廣州、深圳、廈門、天津、成都、西安、武漢、長沙、新疆等地成立分公司,為各行業(yè)客戶智能化升級(jí)提供技術(shù)、產(chǎn)品和服務(wù)支持。
產(chǎn)學(xué)研融合發(fā)展,提升核心技術(shù)競爭力
捷通華聲的發(fā)展同時(shí)得到了母校(清華大學(xué))的支持,2013年,清華大學(xué)產(chǎn)業(yè)基金投資捷通華聲,雙方建立靈云科技源自清華戰(zhàn)略合作。2014年,北京清華工業(yè)開發(fā)研究院與捷通華聲聯(lián)合創(chuàng)建清華靈云人工智能研究中心。2015年,清華海峽研究院與捷通華聲聯(lián)合創(chuàng)建人工智能研究中心,由張鈸院士出任研究中心首席科學(xué)家,清華大學(xué)教授張長水出任中心主任。
通過與清華大學(xué)的產(chǎn)學(xué)研合作,靈云AI技術(shù)學(xué)術(shù)研究保持著全球領(lǐng)先,各產(chǎn)品核心技術(shù)性能指標(biāo)都具備很強(qiáng)的競爭力。
在深耕技術(shù)、服務(wù)產(chǎn)業(yè)的過程中,我們也獲得了一些成績和認(rèn)可,先后獲得中關(guān)村高新技術(shù)企業(yè)認(rèn)證、北京市高新技術(shù)企業(yè)認(rèn)證、北京市級(jí)企業(yè)科技研究開發(fā)機(jī)構(gòu)認(rèn)證,2020年度北京市專精特新第一批名單。因?yàn)樵诮衲晟习肽攴酪呖挂?、?fù)工復(fù)產(chǎn)的突出表現(xiàn),還入選2020中關(guān)村首臺(tái)(套)重大技術(shù)裝備試驗(yàn)、示范項(xiàng)目。
期間,我們也有參與國家部委與相關(guān)行業(yè)組織的人工智能標(biāo)準(zhǔn)制定。國產(chǎn)化這一塊也在積極布局,完成與飛騰、兆芯、龍芯等主流處理器,麒麟、統(tǒng)信等主流操作系統(tǒng),華為鯤鵬云服務(wù)的兼容性互認(rèn)證,支持多元異構(gòu)環(huán)境使用。
還有一些行業(yè)協(xié)會(huì)和媒體的認(rèn)可。
人工智能之于新基建核心價(jià)值在于賦能
工信部數(shù)據(jù)顯示,上半年軟件和信息技術(shù)服務(wù)業(yè)實(shí)現(xiàn)收入同比增長6.7%,正是人工智能、5G、物聯(lián)網(wǎng)等技術(shù)和傳統(tǒng)產(chǎn)業(yè)相融合,由產(chǎn)業(yè)質(zhì)變帶來的經(jīng)濟(jì)量變。
在我看來,人工智能技術(shù)主要通過兩方面進(jìn)行產(chǎn)業(yè)賦能:一方面它能夠創(chuàng)造虛擬勞動(dòng)力,作為一種新的生產(chǎn)要素可以促進(jìn)生產(chǎn)力的提高,降本增效;二是創(chuàng)造新的需求和增長點(diǎn),促進(jìn)經(jīng)濟(jì)的創(chuàng)新??偨Y(jié)下來就是開源節(jié)流。
這次政府提出新基建,無論信息基礎(chǔ)設(shè)施還是融合基礎(chǔ)設(shè)施都繞不開人工智能。人工智能被譽(yù)為云端大腦,依靠5G高速公路傳來的信息學(xué)習(xí)和演化,并通過工業(yè)互聯(lián)網(wǎng)連接人和物,推動(dòng)社會(huì)經(jīng)濟(jì)向數(shù)字化、智能化轉(zhuǎn)型,溢出效益明顯。
目前,人工智能已經(jīng)在眾多垂直領(lǐng)域?qū)崿F(xiàn)應(yīng)用,較為成熟的領(lǐng)域包括金融、電信、交通、能源、政務(wù)、醫(yī)療等,而且應(yīng)用場景越來越多,需求也越來越踴躍。
通過靈云平臺(tái),我們將語音識(shí)別、語音合成、語義理解、自然語言處理、OCR等AI能力輸出,讓各個(gè)行業(yè)能夠快速將人工智能技術(shù)引入到實(shí)際業(yè)務(wù)中,實(shí)現(xiàn)AI與細(xì)分場景的結(jié)合,完成產(chǎn)業(yè)智能化升級(jí)。這也是捷通華聲的愿景——賦能百業(yè),共享AI未來。
十五項(xiàng)自主研發(fā)的AI技術(shù)全面開放
基于人工智能發(fā)展趨勢(shì)和市場需求,捷通華聲也在持續(xù)研發(fā)并逐步向市場開放更多的人工智能技術(shù),這里是我們目前在靈云平臺(tái)推出的15項(xiàng)人工智能核心技術(shù),主要覆蓋智能語音、智能語義、智能視覺和大數(shù)據(jù)分析四個(gè)層面。
像語音合成和圖像處理,捷通華聲是國內(nèi)最早投入研發(fā)并實(shí)現(xiàn)商業(yè)化的企業(yè)。最新建成的大興機(jī)場,大家在高鐵站聽到的站內(nèi)廣播,08年奧運(yùn)會(huì),上海世博會(huì),都用了捷通華聲語音合成的聲音。經(jīng)過多年技術(shù)迭代,不僅聲音更逼真,擁有男聲、女聲、童聲、卡通等不同音色,嚴(yán)肅、甜美等不同風(fēng)格,更支持維/藏等少數(shù)民族語言及多國語言的語音合成。
也是得益于先發(fā)優(yōu)勢(shì)和成熟的產(chǎn)學(xué)研合作體系,我們不僅擁有自主知識(shí)產(chǎn)權(quán)的核心技術(shù)還形成了自己的行業(yè)壁壘,就是海量語料、行業(yè)知識(shí)庫和業(yè)務(wù)場景。
大家現(xiàn)在會(huì)覺得從事人工智能這方面的公司越來越多,但實(shí)際上擁有核心技術(shù)的企業(yè)并不多。
一個(gè)原因就是從人工智能發(fā)展角度來講,除了算法算力,還需要數(shù)據(jù)/場景等關(guān)鍵要素,而這些恰恰是需要一個(gè)長期的積累,需要一個(gè)韌性。這也是人工智能企業(yè)與互聯(lián)網(wǎng)經(jīng)濟(jì)、共享經(jīng)濟(jì)或者一些新的商業(yè)模式最大的不同。
舉一個(gè)例子,語音識(shí)別,算法擺在這里,要做一個(gè)通用模型可能很容易,但是深入到b端企業(yè),深入到行業(yè)場景里面,就需要做很多工作,單數(shù)據(jù)加工處理這一塊,我們?cè)谌珖陀袔浊说耐獍鼒F(tuán)隊(duì)在做。沒有深耕這個(gè)行業(yè)的決心和一定的韌性是無法做到長期發(fā)展的。
由技術(shù)層到平臺(tái)層、應(yīng)用層,多維度服務(wù)產(chǎn)業(yè)智能化升級(jí)
當(dāng)然,有了核心技術(shù)還不行,更多的還是通過平臺(tái)對(duì)外展示,與實(shí)際業(yè)務(wù)場景相融合。這些年來,我們通過靈云平臺(tái)包括私有云平臺(tái)和公有云平臺(tái)輸出各項(xiàng)能力,與不同行業(yè)業(yè)務(wù)系統(tǒng)進(jìn)行快速對(duì)接,實(shí)現(xiàn)AI與細(xì)分場景的結(jié)合。
在尋求底層技術(shù)突破的同時(shí),捷通華聲也在進(jìn)行更加契合客戶需求的產(chǎn)品化開發(fā),針對(duì)客戶的特殊需求,推出了不同形態(tài)的應(yīng)用和解決方案,實(shí)現(xiàn)了在技術(shù)層、平臺(tái)層和應(yīng)用層的全產(chǎn)業(yè)鏈布局。
技術(shù)層是以我們完全擁有自主知識(shí)產(chǎn)權(quán)的15項(xiàng)AI能力在支撐,中間平臺(tái)層是我們的私有云和公有云平臺(tái),采用開放式架構(gòu)設(shè)計(jì),客戶可以通過標(biāo)準(zhǔn)的開放接口,靈活調(diào)用單項(xiàng)或組合多項(xiàng)AI能力,滿足客服、營銷、運(yùn)營、管理、生產(chǎn)等不同業(yè)務(wù)部門的需求。
靈云AICC全智能客服助力智慧金融、智慧政務(wù)建設(shè)
在應(yīng)用層,我們有在國內(nèi)率先推出的全智能客服解決方案,針對(duì)客服中心和呼叫中心的一整套智能化解決方案,包括智能客服、智能語音導(dǎo)航、智能外呼、智能語音質(zhì)檢和實(shí)時(shí)坐席輔助。
在這一塊我們已經(jīng)積累了豐富的落地經(jīng)驗(yàn),客戶覆蓋銀行、保險(xiǎn)、能源、電信和政府機(jī)構(gòu),并且每年都保持一個(gè)較高的增長率。
今年上半年,靈云全智能客服解決方案在科技戰(zhàn)疫和復(fù)工復(fù)產(chǎn)過程中也發(fā)揮了很大作用。我們推出的智能外呼疫情防控機(jī)器人,實(shí)現(xiàn)了疫情通知、患者跟蹤、流動(dòng)人員排查、本地居民排查等場景呼出。相比純?nèi)斯さ姆绞?,不僅信息傳遞效率更高,同時(shí)能夠避免工作人員線下調(diào)研、排查被感染的風(fēng)險(xiǎn)。
這套系統(tǒng)也登上了工信部科技司的疫情防控信息公式平臺(tái),同時(shí)也獲評(píng)了2020中關(guān)村的中關(guān)村首臺(tái)(套)重大技術(shù)裝備試驗(yàn)、示范項(xiàng)目。
靈云全智能客服解決方案同時(shí)服務(wù)于大多數(shù)銀行機(jī)構(gòu),在響應(yīng)央行、財(cái)政部、銀保監(jiān)等五部門聯(lián)合提出的加強(qiáng)全國范圍特別是疫情嚴(yán)重地區(qū)的線上服務(wù),引導(dǎo)企業(yè)和居民通過互聯(lián)網(wǎng)、手機(jī)APP等線上方式辦理金融業(yè)務(wù)要求過程中,起到了有力的支撐作用,也獲得了我們客戶的一致好評(píng)。
例如,我們?yōu)槟彻煞葜沏y行搭建的智能語音導(dǎo)航系統(tǒng),日接聽量20萬通,回答準(zhǔn)確率91%,轉(zhuǎn)人工比例下降至20%,轉(zhuǎn)人工等待時(shí)長下降30%,轉(zhuǎn)人工坐席接起率提升至99.78%。實(shí)現(xiàn)了企業(yè)客戶服務(wù)門戶的智能化和扁平化,成功避開了防疫工作中無法集中辦公為客服中心帶來的挑戰(zhàn),同時(shí)提升了服務(wù)效率和服務(wù)體驗(yàn)。
這套全智能客服解決方案在智慧政務(wù)中也有廣泛應(yīng)用,我們已經(jīng)為多省市建設(shè)了12345智能服務(wù)熱線。智能機(jī)器人能夠提供7*24h多渠道智能化服務(wù),將市民電話精準(zhǔn)轉(zhuǎn)接給責(zé)任部門,并對(duì)服務(wù)質(zhì)量進(jìn)行智能監(jiān)督;為政務(wù)人員提供智能外呼機(jī)器人,進(jìn)行社情精準(zhǔn)調(diào)研;通過對(duì)服務(wù)大數(shù)據(jù)分析,來輔助政務(wù)決策和精準(zhǔn)優(yōu)化政府服務(wù)。
這樣的案例還有很多,這只是智慧城市的其中一個(gè)很小的模塊,最近我們?cè)谝恍┏鞘幸舱归_一些更多工作。
高效轉(zhuǎn)寫、字幕投屏,打造數(shù)字時(shí)代智能會(huì)議系統(tǒng)
智能行業(yè)解決方案,包括我們針對(duì)多人會(huì)話場景推出的智能會(huì)議系統(tǒng),它能夠提供會(huì)議發(fā)言的實(shí)時(shí)轉(zhuǎn)寫,字幕投屏展示,會(huì)后能夠快速的輸出會(huì)議紀(jì)要。這套方案在多地黨政系統(tǒng)、企事業(yè)單位都有應(yīng)用。我們通過搭建一套系統(tǒng),面向大概有300個(gè)委辦局、包括下面的地級(jí)市都能夠使用,因?yàn)槭墙y(tǒng)一部署,也更好管理。
靈云智聲一體機(jī)是我們今年重點(diǎn)推出的一款高度集成軟硬一體化的產(chǎn)品,具備多語種識(shí)別及互譯(中-英/日/韓、漢-維/藏等),提供智能語音輸入法,字幕、投屏、音視頻轉(zhuǎn)寫、實(shí)時(shí)翻譯、Office語音模塊等特色功能,適用于日常辦公、演講匯報(bào)、審訊問詢、多人會(huì)議等多種語音場景。
除了功能多,另一個(gè)特點(diǎn)是所有運(yùn)算都是在本地端完成的,不需要聯(lián)網(wǎng),數(shù)據(jù)存儲(chǔ)在本地端也更安全。
讓每個(gè)人都能享受人工智能帶來的輕松與便捷
AIoT智能物聯(lián)網(wǎng)這塊,像華為盒子、智能電視、導(dǎo)航、車載輸入法等很多都是由我們提供的解決方案。
在公有云這方面,我們通過向開發(fā)者提供AI能力,這么多年下來,已經(jīng)積累了10萬+開發(fā)者,服務(wù)用戶超過5個(gè)億。比如出國翻譯官,官方數(shù)據(jù)顯示有幾千萬用戶,日活在20萬,就是用了我們的AI能力。
我們也推出了自己的c端產(chǎn)品,靈云聽語,支持實(shí)時(shí)將聲音轉(zhuǎn)為文字和離線音頻轉(zhuǎn)寫,很受記者、政府公務(wù)員、白領(lǐng)、教師和學(xué)生歡迎,目前也處在一個(gè)快速發(fā)展階段。
賦能百業(yè),共享AI未來
人工智能作為新時(shí)代備受關(guān)注的技術(shù),其本質(zhì)是科技進(jìn)步對(duì)所有產(chǎn)業(yè)的提升,而并非單獨(dú)一個(gè)新興行業(yè),只有當(dāng)人工智能技術(shù)在中國真正普遍地應(yīng)用于傳統(tǒng)行業(yè),而不僅僅屬于科技巨頭時(shí),其經(jīng)濟(jì)潛力才會(huì)充分彰顯。
這就需要上下游產(chǎn)業(yè)鏈的共同努力,捷通華聲始終堅(jiān)持賦能百業(yè)共享AI未來發(fā)展愿景,將繼續(xù)發(fā)揮在人工智能領(lǐng)域的優(yōu)勢(shì),與合作伙伴優(yōu)勢(shì)互補(bǔ),以工匠精神為產(chǎn)業(yè)智能化提供優(yōu)質(zhì)的產(chǎn)品和服務(wù)。
最后感謝大家的聆聽,歡迎大家來捷通華聲參觀指導(dǎo),一起探索AI未來。