2019年中國國際服務(wù)貿(mào)易交易會在北京舉行,該大會也被稱為京交會,是一年一度的國家級擴(kuò)大貿(mào)易和促進(jìn)創(chuàng)新科技普及的盛會。中關(guān)村數(shù)字創(chuàng)意國際創(chuàng)新峰會作為今年京交會的分論壇之一,于5月29日舉行。Chatopera CEO王海良先生以及市場總經(jīng)理張凱先生受邀參加了本次活動,并在數(shù)字創(chuàng)意與未來生活的主題下進(jìn)行了圓桌分享,中國科學(xué)院自動化研究所研究員趙曉光女士作為圓桌活動的主持人,以下是主持人和Chatopera CEO王海良先生的精彩對話。
圓桌分享
主持人:剛剛我們中文在線的專家也分享過,我們有機(jī)器人能夠模仿,用人工智能技術(shù)能夠模仿任何一個人的聲音,現(xiàn)在這個技術(shù)已經(jīng)做的成熟了,在很多產(chǎn)品上在用,其實(shí)機(jī)器人也有一種問答,我們可以一問一答,現(xiàn)在我們訂票、一些咨詢,包括銀行咨詢都有這樣的自動機(jī)器人能回答我們的問題。今天我們也有一位嘉賓,北京華夏春松科技有限公司的CEO王海良先生,就是做相關(guān)的工作。我們也特別想了解在多輪對話機(jī)器人,尤其是聊天機(jī)器人這個技術(shù)當(dāng)中,我們用了哪些非常先進(jìn)的人工智能技術(shù),能達(dá)到什么樣的一個為客戶服務(wù)的效果?
王海良:好的,很高興能夠解答這個問題。因為我在這個領(lǐng)域也從事了幾年的時間,正好有這個機(jī)會跟大家分享一下。首先,我其實(shí)對剛才主持人所介紹的開場的時候聊的幾句話有非常深刻的感悟。主持人說科學(xué)是人體器官的延伸,這個是馬克思說的,還有馬克思說,人是社會關(guān)系的總和。我們?yōu)槭裁醋鲞@個聊天機(jī)器人呢,其實(shí)就是希望能夠用科技去促進(jìn)人和人之間的溝通的效率,我們其實(shí)是非??春脩?yīng)用人工智能技術(shù)改變現(xiàn)有的一些模式,甚至是用嘗試用未經(jīng)證明的技術(shù)去支撐新的商業(yè)模式,我們非常相信未來這個世界,當(dāng)我們走進(jìn)電梯的時候我們所看到的廣告是跟我們息息相關(guān)的,我今天所進(jìn)去看到的廣告通常是我們不想看到的東西。在電梯里面,比如說我們能夠有攝像頭,能夠有語音,我們其實(shí)是可以能夠判斷出這個人的年齡,或者是他的一些喜好等,推給他定制化的更讓他喜歡的廣告。第二個,我們更希望用技術(shù)去做一個改善大家生活的一個事,我們做聊天機(jī)器人,我們也很了解現(xiàn)在的機(jī)器人應(yīng)用的場景,比如說電話銷售的機(jī)器人,我相信很多的人在現(xiàn)在已經(jīng)被這個電話銷售弄的苦不堪言,我自己每天接十個這樣的廣告,甚至周末也不休息,這個是嚴(yán)重的影響大家的生活的。我們也在積極探索,是不是能夠用電話機(jī)器人接電話,讓你不用擔(dān)心每天要處理這么多次打斷,這個都是我們用技術(shù)能夠改善的一些空間,也就是我們非常相信人工智能將會給我們的生活帶來更多美好。所以,我們在去年開始成立,有這樣一個想法,當(dāng)我們看到市場上一些產(chǎn)品沒有發(fā)揮到人工智能的優(yōu)勢的時候,我們是不是可以自己去做一個產(chǎn)品,去完成這樣的一個任務(wù)。
所以,我們花了非常多的時間去做這些人工智能相關(guān)的技術(shù),然后和我們的生活場景相結(jié)合的事。比如說我們?nèi)ツ瓿霭媪艘槐娟P(guān)于深度學(xué)習(xí)與智能問答的書,來幫助人工智能技術(shù)更好的去普及和應(yīng)用。然后我們也推出了一些產(chǎn)品,去幫助大家去快速的構(gòu)建人工智能的應(yīng)用,尤其是聊天機(jī)器人的應(yīng)用。其實(shí)剛才趙老師也強(qiáng)調(diào)了我們是做一個使用多輪對話去完成一個任務(wù)的產(chǎn)品,這個就是我們對未來的一個希望吧。剛剛我們的500Startups的嘉賓也提到了,在創(chuàng)業(yè)公司或者小公司怎么樣去做單點(diǎn)突破,我對Zoom這個產(chǎn)品非常驚訝,因為我發(fā)現(xiàn)了一個中國非常傳統(tǒng)的公司內(nèi)部使用Zoom這么領(lǐng)先的產(chǎn)品進(jìn)行開會,所以我就相信如果你是一個創(chuàng)業(yè)公司,你如果能夠產(chǎn)品做的非常好,單點(diǎn)上就能夠做到極致,未來就有無限的可能,所以我們特別希望能夠在一到兩年之內(nèi)把我們的多輪對話的技術(shù)做到業(yè)內(nèi)領(lǐng)先水平,現(xiàn)在做聊天機(jī)器人有很多種方法,比如說用規(guī)則的,用深度學(xué)習(xí)的,用知識圖譜,或者基于搜索的方式,我們要尋求的目標(biāo)就是我們把所有的技術(shù)難點(diǎn)都解決,讓用戶能夠非常輕易的定義滿足自己流程需求的對話應(yīng)用。我們就可以將一個現(xiàn)在需要20秒鐘,通過網(wǎng)頁填表單做的任務(wù),變成在五秒鐘甚至三秒鐘的音視頻交互完成,這是我們的希望,也是我們的愿景,我們?yōu)槠髽I(yè)提供快速提升智能化和自動化的一些聊天機(jī)器人相關(guān)的服務(wù)。所以我們在經(jīng)過一年的發(fā)展也得到了一些企業(yè)的認(rèn)可,包括在教育行業(yè),因為老師上課或者在課間課中有一些這種話術(shù)是固定的,我們就在將這些非常固定的一些東西,或者說是提高學(xué)生興趣的東西,使用人工智能的方式去完成,這里面確實(shí)是有關(guān)于您提到的對話的意圖分析準(zhǔn)確率的問題,數(shù)據(jù)是人工智能的核心,你準(zhǔn)確率能訓(xùn)練到什么樣的程度,其實(shí)是以數(shù)據(jù)作為天花板的,所以我也是非常的期待,就是比如說中國的數(shù)據(jù)開放運(yùn)動蓬勃的發(fā)展,可以迅猛的發(fā)展,因為我們知道在中國2025年要在人工智能上達(dá)到和領(lǐng)先國家持平的水平,在2030年達(dá)到壓過的領(lǐng)先國家的水平。那么我們其實(shí)作為技術(shù)公司是比較看中一些開放的數(shù)據(jù),或者是一些開源碼社區(qū)發(fā)展,我們作為一家創(chuàng)業(yè)型公司,人手可能不那么多,但是我們也是努力的為開源社區(qū)多做貢獻(xiàn),把我們做的很好的東西拿出來跟大家進(jìn)行分享學(xué)習(xí),包括我們?nèi)戇@書也是有這樣的愿景,包括IBM、微軟在人工智能方面的經(jīng)驗,我們也在積極的學(xué)習(xí)。我希望我們有一天能夠做更多的分享,讓我們的生活能夠更美好。
主持人:現(xiàn)在確實(shí)是騷擾電話太多了,我們分不清楚哪個號碼是我們需要的,可能拿起來一接就是推銷,或者是廣告,您的產(chǎn)品是不是會讓我們在手機(jī)上裝一個自動接電話的機(jī)器人,它來先幫我接電話。
王海良:我們在這個場景已經(jīng)做了一些探索和實(shí)驗,接下來我們會考慮和運(yùn)營商去對話,能不能展開合作,我們的實(shí)驗產(chǎn)品就是這樣的,每個手機(jī)設(shè)定一個呼叫轉(zhuǎn)移,接到電話以后不確定這是不是騷擾電話,或者這個電話看成不緊急的,想稍候再處理它,這個時候你可以呼叫轉(zhuǎn)移到我們設(shè)定的手機(jī)號上,接電話的就是聊天機(jī)器人,會問你有什么事嗎,我在開會,你可以給我留言,然后我收到消息會盡快聯(lián)系您,我們會有五秒鐘的提示音,滴聲之后進(jìn)行留言,其實(shí)這是常用的應(yīng)用,大家如果在國外,語音信箱的功能是做的非常好,我們這個產(chǎn)品里,在它錄完音之后會語音識別成文字,推送到用戶郵箱當(dāng)中,他就會關(guān)注到,文字和圖文都同時進(jìn)入信箱,如果文字不準(zhǔn)可以聽語音。這個時候就會形成一個實(shí)時的,也就是從電話打進(jìn)來之后,到它錄完音立刻能夠看到這個文字,然后進(jìn)行進(jìn)一步的處理,有效的獲取了信息,我個人也在用這個產(chǎn)品。但是我覺得用這個產(chǎn)品之后95%的騷擾電話都進(jìn)不來,因為一聽到是錄音留言他就不打了。
Chatopera聯(lián)合創(chuàng)始人CEO王海良
主持人:智能語音交互機(jī)器人讓我第一個想的就是圖靈測試,圖靈測試應(yīng)該是在1950年的時候科學(xué)家圖靈提出來的,到2014年才有軟件通過了圖靈測試,不是用語音而是用文字的方式,人來判斷對方是人還是機(jī)器人。所以剛剛我們王總提的機(jī)器人尤其多輪問答,現(xiàn)在有很多打來的電話其實(shí)機(jī)器人打來的,用您的智能機(jī)器人接聽電話會是什么樣的狀況呢?
王海良:其實(shí)我們在網(wǎng)上可以找到錄音,我們之前找到了類似的測試,包括在歐美一些國家有人做了一個接電話的機(jī)器人,然后把錄音放到網(wǎng)上,很多人以此為樂,機(jī)器人可以和對方銷售聊15分鐘到半個小時都有的。其實(shí)我不是說以戲弄別人為樂,但是這個是有可能的,你不知道對方是人還是機(jī)器人,你如果聽了錄音之后你會發(fā)現(xiàn)即使你是那個打電話的人也很難判斷,因為這里面有一種套路,機(jī)器人是可以掌握規(guī)律的,在谷歌或者在Facebook他們也在試水一些用機(jī)器人幫你送外賣或者是理發(fā)預(yù)約這樣的場景,它在一個很小的范圍去應(yīng)用。我相信不久的未來基于語音的或者圖像的交互變成新的人機(jī)交互的形式,我剛才也提到了,未來你沖電腦攝像頭眨眨眼它就怎么樣,現(xiàn)在我覺得在Siri有這種交互,我也是非常常用了,我也不是刻意的,Siri是我每天都在用的服務(wù),這是下一代的操作系統(tǒng),大家上去分發(fā)自己做得非常好的東西。國內(nèi)也有公司在推廣類似Siri的產(chǎn)品,把音視頻的交互變成了一個下一代服務(wù)發(fā)布的方式,通過語音和圖像你就可以進(jìn)行對話,完成一個任務(wù)。
車載其實(shí)也是一個好的途徑,我覺得跟一些汽車廠商甚至投資機(jī)構(gòu)聊一些相關(guān)的場景。我覺得通過圖靈測試在一個很多小的任務(wù)上完全分辨不出來,除非你天南海北去問,你一會兒問這個,一會兒問那個,這個對它來說比較難。我們在交流的時候就像是把我們自己腦海中的意思放到一個序列化數(shù)據(jù)里面,這是編碼的過程,機(jī)器要做得就是通過學(xué)習(xí)大量的數(shù)據(jù)進(jìn)行解碼,找到它想要的東西。所以,我剛才算是回答您問題的,小的范圍完全可以通過圖靈的測試。
我還有一個理論和您分享,機(jī)器什么時候可以在更難的任務(wù)上去挑戰(zhàn)人?我看過AIphaGo、AIphaZero和Master,我認(rèn)為它背后的人很聰明,并不代表機(jī)器很聰明,什么時候機(jī)器人可以具有和人一樣的創(chuàng)作能力呢?可能是2045年左右,一本叫做《基點(diǎn)理論》的書這樣描述,人類可訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的規(guī)模和人大腦含有神經(jīng)網(wǎng)絡(luò)的規(guī)模它是一個什么樣的比例?人類可訓(xùn)練的人工神經(jīng)元網(wǎng)絡(luò)不斷增長,什么時候增長到和人的神經(jīng)元的數(shù)目相媲美呢?我們經(jīng)歷過信息革命的階段了,因特爾它做CPU的時候發(fā)現(xiàn)了摩爾定律,它是一個數(shù)學(xué)公式,可以推衍CPU算力歷史發(fā)展的軌跡,按照這個思路進(jìn)行模擬,可能現(xiàn)在人類可訓(xùn)練的的神經(jīng)元數(shù)量只有蚊子大腦的的大小,要達(dá)到人類大腦的水平就要到2045年。我個人對這個不能說完全堅信,但是我希望用這個愿景驅(qū)使我們公司去進(jìn)行挑戰(zhàn),享受其中的快樂。
結(jié)語:因為相信,所以看見,本次Chatopera與各方同仁的交流學(xué)習(xí)讓我們更堅信我們的工作是有巨大意義的,在此感謝中關(guān)村科技園區(qū)管理委員會及北京數(shù)字創(chuàng)意產(chǎn)業(yè)協(xié)會對Chatopera的關(guān)注,謀士眾多,所謀乃成,我們必將以此為契機(jī)創(chuàng)造未來的輝煌樂章!