自1956年夏天,達特茅斯夏季人工智能研究會議第一次提出人工智能的概念以來,人工智能技術已經有了60年的歷史。
在人工智能的第三次浪潮中,一方面,新技術被應用到創(chuàng)新產品,發(fā)展出新的應用場景,如陪伴機器人、無人駕駛;另一方面在傳統行業(yè),工業(yè)、金融、農業(yè)等簡單、重復及可程序化的環(huán)節(jié)中,智能產品也逐步發(fā)揮更多的作用。
科大訊飛是中國最大的智能語音技術提供商,同時也是中國人工智能領域的代表企業(yè)之一。12月13日,在廣東時代傳媒舉辦的影響力·中國時代峰會2019活動現場,科大訊飛副總裁、智能服務事業(yè)部總經理解飛接受了時代財經的專訪。
科大訊飛副總裁、智能服務事業(yè)部總經理解飛
在人工智能技術及應用領域,解飛有著10余年的從業(yè)經驗,曾先后主持中國移動、平安銀行、建設銀行等大型機構的智能客服及大數據分析平臺項目的規(guī)劃、設計以及建設、運營工作,帶領團隊打造出一系列智能客服軟硬件產品及解決方案。
在這次采訪中,解飛向記者詳細解釋了AI服務目前面臨的技術和應用難點,重申了科大訊飛平臺+賽道的生態(tài)布局,并針對通用型與垂直型人工智能服務的分工表達了自己的看法。他指出,隨著人工智能第三次浪潮的到來,行業(yè)從浮躁到沉淀,已經逐漸趨于理性。
以下為專訪全文:
時代財經:科大訊飛作為中國最大的智能語音技術提供商,是如何輔助金融企業(yè)轉型升級的?
解飛:我們與金融行業(yè)合作有很長的歷史背景。從2003年開始到2010年前后,語音技術的使用還停留在簡單的信息播報。2010年后,越來越多銀行,包括平安、工行、交行、建行、郵儲等,都在自助服務方面使用訊飛的語音識別技術,用來替代了簡單重復的人工工作。
除了在客服,我們也提供自助輔助營銷方案。此外,我們將智能化技術應用到銀行的實體渠道,例如ATM和智能機,使機器可以通過語音的方式進行交互和操控,將以前的柜面業(yè)務轉移到自助設備上來。在銀行內部的運營和效能管理方面,我們與銀行及保險公司合作,利用機器學習技術,開展反洗錢以及騙保的探索。
同時,我們也在探索通過AI的方式提供員工培訓服務。利用語音交互技術結合業(yè)務所需的知識圖譜和專家經驗,來設計不同的模擬講師,幫助客戶訓練新入職的保險營銷員或銀行客戶經理。目前,訊飛已經為某大型保險公司10萬保險從業(yè)人員進行了這樣的訓練,相比傳統培訓,效率能夠提升30%。
時代財經:服務金融行業(yè)客戶,需要有非常深刻的業(yè)務理解。您認為通用型人工智能和提供垂直解決方案人工智能,目前在行業(yè)里的角色分配和各自優(yōu)勢是什么?
解飛:目前人工智能技術方向主要有兩個,一個是感知智能,包括語音識別、語音合成、圖像識別等,另一個是認知智能,是可以快速實現學習、推理、決策的技術。
在感知智能方向上,通用架構已經達到可以適用80~90%的場景。但是感知智能在實際業(yè)務方案中只能發(fā)揮20~30%的價值,如果想要實現AI替代人、幫助人,一定要具備認知能力。例如這次采訪,如果感知智能技術能夠將我們對話內容全部轉寫下來,但這也只是一些基礎的工作。
認知智能是目前比較熱門的方向,起碼現在來看沒辦法在所有場景中得到應用。目前AI應用都是在認知方向上做深度垂直定制,用于解決特定行業(yè)中一個垂直場景中的問題??赡茉龠^3~5年,我們技術取得更大突破以后,可以在相對寬的領域中采用統一的方案。這也是為什么現在看起來很多智能化應用的建設成本非常高,收益卻不是特別的好,因為后端難點更多一點。
時代財經:人工智能模型的訓練需要大量的數據積累。智能語音技術提供服務過程中,最大的技術和應用難點有哪些?
解飛:先說技術難點,一是感知智能依然有10~20%的這樣場景需要優(yōu)化?,F在有一種說法人工智能投入多少人工,才有多少智能,也是一定程度上反映了當前算法的瓶頸和問題,數據訓練是需要很多的數據資源。二是認知智能架構建設往往需要初始化,在復雜的應用場景中,會產生蹺蹺板效應,當一些初始規(guī)則調整后,會影響到其他業(yè)務,單點場景下效果變好,其它場景就會有問題。
應用層面有三個核心問題需要克服。一是項目管理機制,目前的項目管理方法大多按照傳統IT項目進行,但IT項目有很清楚的需求、架構、實現及驗收流程,而好的AI項目很難去定義,是逐漸體現在業(yè)務迭代過程中的。
二是人才方面,很多公司往往從技術角度出發(fā),在項目推動的時候,團隊會考慮用技術方法,實現我們認為的業(yè)務需求,但如果有能從端到端考慮問題的專家,可以通過應用場景的設計變更,來規(guī)避需要投入很大人力才能夠完成的功能和需求。從業(yè)務角度看,如果需求方稍微了解一些技術的實行機制,也可能為應用的實現提供更好的資源和幫助。
第三,以前IT項目交付完之后就進入運維階段,但AI項目上線后進入的是運營階段,需要通過所有上線后的數據優(yōu)化感知計算和認知計算的引擎,讓系統越來越聰明,整個運營過程需要技術和業(yè)務團隊聯合建設。但是往往現有金融機構的管理機制下沒有這樣的職能團隊,他們只有運維團隊,沒有運營的團隊。
目前銀行已經有了一些探索,比如浦發(fā)銀行信用卡中心有一個大數據運營室。這個團隊憑借AI運營分析信息,一共給浦發(fā)銀行信用卡董事會提供了100多份合理化建議。
時代財經:科大訊飛與很多機器人硬件公司合作,一起開發(fā)了覆蓋眾多品牌的服務機器人產品,與此同時,科大訊飛自己也開發(fā)了阿爾法蛋等機器人硬件產品,是否會與生態(tài)伙伴形成競爭關系?
解飛:我們認為公司未來的發(fā)展一定不是單槍匹馬,而是通過產業(yè)生態(tài)構建才能夠持續(xù)成功,所以訊飛的戰(zhàn)略也被定為平臺加賽道戰(zhàn)略。
第一層是訊飛核心生態(tài),具體指一個大的AI中臺,包括語音智能、視覺智能和認知智能三個主要方向,不帶任何業(yè)務屬性,做技術底層研究。在這個平臺之上,我們再聚焦八個賽道,包括智慧城市、智慧教育、智能服務、智慧醫(yī)療、智能汽車等。
第二層生態(tài)是我們入股的公司,因為在八個方向外依然有很多我們非??春茫蟾庞卸畮讉€,我們以生態(tài)公司的方式,成為他們的戰(zhàn)略投資者。阿爾法蛋機器人也是屬于這第二層產業(yè)生態(tài)的。
第三個生態(tài)是我們的開放平臺,通過互聯網對外提供接口和服務,現在在這個平臺上我們提供了有將近200個AI服務能力,為超過110萬的開發(fā)者上提供技術支持,其中有自己產品和應用的有60多萬。如果這些開發(fā)者有了比較成熟的產品,我們也認為非常值得發(fā)展,就會把它往第二層生態(tài)然發(fā)展。
時代財經:縱觀整個人工智能行業(yè),很多AI獨角獸公司除了自己的技術發(fā)展,也開始布局投資,比如科大訊飛已經投了幾十家了,思必馳、曠視等企業(yè)也都在布局,您認為這種趨勢背后的原因是什么?
解飛:整個AI行業(yè),不可能一個公司做所有的事情。構建自己的核心生態(tài),然后把市場和業(yè)務場景快速做大,這是我覺得AI企業(yè)都在下沉投資很多創(chuàng)業(yè)公司的重要原因。
另外,AI應用的場景非常多。單以醫(yī)療場景為例,訊飛有做智慧醫(yī)療,但整個醫(yī)療的行業(yè),在常見的三甲醫(yī)院中,光是細分的科室就有三四十個,從醫(yī)學來看就有200多個,常見疾病有四五千中,加上罕見病可能有十幾萬種,不是一個公司就能把所有的事情都做完。
時代財經:中國的5G基建工作正在全面加速,商用推進速度比預期早了一年,但大多數時候仍需要與人工智能、云計算等技術做融合。未來5G技術會與智能語音技術做怎樣的結合?
解飛:5G建設隨著國家的重視,投入了更多的資源,進度超過預期。最近一年還是基礎設施建設市場為主驅動,明年終端廠商會迎來更大的市場機會,可能兩年之后才會是軟件和應用的發(fā)展。
首先要有能夠觸達客戶的載體,除了手機外,5G時代的硬件載體會更加多元化,這是為什么我們現在與運營商一起推動智慧家庭戰(zhàn)略落地。中國聚集了全球最完整的智能設備產業(yè)鏈,所以我覺得5G在中國有非常大的機會和前景。
時代財經:在過去10年的從業(yè)經歷中,智能語音不論是技術層面還是應用層面,都得到了極大的提升和發(fā)展。作為行業(yè)長期的深度參與者,最令你印象深刻的變化有哪些?
解飛:最為深刻的變化還是技術,2010年之前我們認為很多當時看起來在我們的有生之年都不可能完成的事情,在2012年之后都非??焖俚膶崿F了。這在當時時間節(jié)點上,是很難想象的。
第二還是關于行業(yè)認知,2008年前,我們跟我們的行業(yè)客戶做解決方案溝通的時候,往往要先做半個小時科普,講完之后也對方也不是特別認可,一些技術解決方案甚至會被認為是玄學。
上世紀第二次人工智能浪潮打假的聲音很大,所以90年代,很多人講自己做人工智能,就相當于80年代做氣功一樣。造成一種現象,大家都不說自己是人工智能,改稱機器學習,或者語音識別、模式識別,會講自己具體的分支。直到第三次浪潮,人工智能已被重新正名,大家又開始講自己是做人工智能,整個行業(yè)重新受到關注。
過分樂觀和過分悲觀都是需要修訂的,目前還是需要能夠扎扎實實做落地應用。行業(yè)本身的賽道和領域無限廣闊,不可能每個公司把所有的看到的機會都吃下來??傮w來看,整個行業(yè)趨勢還是逐漸從浮躁到沉淀,從非理性到理性。