欧美日韩国产最新一区二区,国产精品密蕾丝视频下载,久久久无码小视频

　　受訪者|楊植麟，循環(huán)智能聯(lián)合創(chuàng)始人

　　記者|徐威龍，編輯|郭芮

　　出品|CSDN（ID：CSDNnews）

　　「AI技術(shù)生態(tài)論」人物訪談欄目是CSDN發(fā)起的百萬(wàn)人學(xué)AI倡議下的重要組成部分。通過(guò)對(duì)AI生態(tài)頂級(jí)大咖、創(chuàng)業(yè)者、行業(yè)KOL的訪談，反映其對(duì)于行業(yè)的思考、未來(lái)趨勢(shì)的判斷、技術(shù)的實(shí)踐，以及成長(zhǎng)的經(jīng)歷。本文為該系列訪談的第12期，通過(guò)和循環(huán)智能聯(lián)合創(chuàng)始人楊植麟的訪談，本文詳細(xì)解讀了XLNet模型等自然語(yǔ)言技術(shù)以及對(duì)話數(shù)據(jù)的應(yīng)用場(chǎng)景等內(nèi)容。

　　近年來(lái)，由于面向大規(guī)模用戶的音頻、視頻、圖像等業(yè)務(wù)急劇增長(zhǎng)，全球數(shù)據(jù)量呈現(xiàn)出爆發(fā)式的增長(zhǎng)，數(shù)據(jù)石油也為無(wú)數(shù)的科技公司提供了覆手為云的發(fā)展契機(jī)。數(shù)據(jù)預(yù)測(cè)，到2020年全球的數(shù)據(jù)量將到達(dá)40ZB，車聯(lián)網(wǎng)、智能制造、智慧能源、無(wú)線醫(yī)療、無(wú)線家庭娛樂(lè)、無(wú)人機(jī)等新型應(yīng)用都將創(chuàng)造出新的數(shù)據(jù)維度。技術(shù)換代下，伴隨著數(shù)據(jù)海嘯而來(lái)的淘金熱也居高不下。

　　事實(shí)證明，數(shù)據(jù)帶來(lái)的機(jī)會(huì)是極為龐大的，但目前人們還未能徹底挖掘出數(shù)據(jù)資產(chǎn)的全部?jī)r(jià)值。在過(guò)去，對(duì)話數(shù)據(jù)的含金量就一直被嚴(yán)重忽視了。

　　隨著自然語(yǔ)言處理技術(shù)的不斷發(fā)展，時(shí)下的對(duì)話數(shù)據(jù)價(jià)值正在逐漸被喚醒，不同領(lǐng)域的最佳行業(yè)實(shí)踐和實(shí)際效果都在逐步提升——而那些富有遠(yuǎn)見的企業(yè)，已經(jīng)開始重視對(duì)話數(shù)據(jù)的價(jià)值了，但是他們之中的很多人仍缺乏利用這些數(shù)據(jù)產(chǎn)生業(yè)務(wù)價(jià)值的最佳實(shí)踐。循環(huán)智能則正是基于此出發(fā)點(diǎn)，填補(bǔ)了這一技術(shù)空缺。

　　基于原創(chuàng)的XLNet模型、Transformer-XL模型等自然語(yǔ)言處理底層技術(shù)，循環(huán)智能打造了領(lǐng)先的AI技術(shù)矩陣。我們做的事情主要就是：從銷售過(guò)程產(chǎn)生的對(duì)話數(shù)據(jù)中，包括跟企業(yè)的IM聊天、微信聊天、電話銷售溝通，進(jìn)行文本的洞察，實(shí)現(xiàn)決策層面的賦能，最終提升銷售的轉(zhuǎn)化率。針對(duì)不同行業(yè)的具體需求，實(shí)現(xiàn)不同的對(duì)話數(shù)據(jù)應(yīng)用場(chǎng)景落地。在本文中，CSDN采訪了循環(huán)智能聯(lián)合創(chuàng)始人楊植麟，其將從對(duì)話數(shù)據(jù)的應(yīng)用場(chǎng)景出發(fā)，為我們?nèi)娼馕鯴LNet模型原理、核心技術(shù)、當(dāng)前NLP的發(fā)展以及AI人才成長(zhǎng)路徑等內(nèi)容。

　　在深度學(xué)習(xí)和自然語(yǔ)言處理領(lǐng)域，楊植麟頗有建樹。作為第一作者，其與卡內(nèi)基梅隆大學(xué)、Google Brain團(tuán)隊(duì)聯(lián)合推出NLP領(lǐng)域熱門的國(guó)際前沿預(yù)訓(xùn)練XLNet模型，在20個(gè)標(biāo)準(zhǔn)任務(wù)上超過(guò)了曾經(jīng)保持最優(yōu)性能記錄的Google BERT模型，并在18個(gè)標(biāo)準(zhǔn)任務(wù)上取得歷史最好結(jié)果，更被稱為BERT之后的重要進(jìn)展。

△楊植麟與兩位導(dǎo)師Ruslan Salakhutdinov（蘋果AI研究負(fù)責(zé)人，右）、William Cohen（谷歌Principal Scientist，左）合影

　　在北京智源人工智能研究院公布的2019年度智源青年科學(xué)家名單中，他還是最年輕的、也是唯一的90后。

　　分析對(duì)話語(yǔ)義，挖掘數(shù)據(jù)價(jià)值

　　發(fā)揮數(shù)據(jù)價(jià)值已成為大多企業(yè)的共識(shí)，在這其中，很多企業(yè)出于提升服務(wù)水平和效率、保存企業(yè)數(shù)據(jù)資產(chǎn)的原因，存儲(chǔ)了大量銷售與客戶、客服與客戶溝通的錄音、文本記錄。如何從對(duì)話數(shù)據(jù)中找到對(duì)企業(yè)有用的信息、挖掘出客戶所表達(dá)內(nèi)容中隱含的潛在產(chǎn)品需求——則是循環(huán)智能的技術(shù)初衷所在。

　　他表示，目前具體有四個(gè)場(chǎng)景：第一，使用對(duì)話數(shù)據(jù)，做高意向銷售線索的挖掘、排序和打分，給每一個(gè)線索做解決方案匹配和產(chǎn)品推薦；第二，從對(duì)話數(shù)據(jù)中抽取客戶畫像，幫助企業(yè)構(gòu)造畫像體系。企業(yè)借助畫像體系可以設(shè)計(jì)針對(duì)性的運(yùn)營(yíng)活動(dòng)；第三，從對(duì)話數(shù)據(jù)中自動(dòng)挖掘銷售的有效話術(shù)，這些有效話術(shù)可以為銷售新人做實(shí)時(shí)輔助，告訴新人更高效地與客戶溝通；第四，監(jiān)測(cè)話術(shù)的執(zhí)行情況，這個(gè)過(guò)程通常被稱為執(zhí)行力監(jiān)督或質(zhì)檢。

　　同時(shí)，我們通過(guò)分析對(duì)話的語(yǔ)義跟最終結(jié)果——是否成單之間的關(guān)系，預(yù)測(cè)哪些對(duì)話有更高的成單意向，從而讓這四個(gè)場(chǎng)景形成閉環(huán)。在實(shí)際案例上，楊植麟分享了一個(gè)比較Top的壽險(xiǎn)公司應(yīng)用，我們的線索評(píng)分上線之后，大概通話時(shí)長(zhǎng)提升了100%，轉(zhuǎn)化率提升了到原來(lái)的270%。

△循環(huán)智能的產(chǎn)品架構(gòu)圖

　　技術(shù)層剖析：XLNet優(yōu)于BERT

　　在技術(shù)實(shí)現(xiàn)層面，我們所做的事情和實(shí)現(xiàn)的場(chǎng)景，跟傳統(tǒng)的對(duì)話機(jī)器人、聊天機(jī)器人或者機(jī)器人客服，都有著極大的差別。

　　楊植麟表示，機(jī)器人主要做的事情是通過(guò)一套模板做簡(jiǎn)單的匹配，匹配之后用規(guī)則去生成接下來(lái)要說(shuō)什么。從技術(shù)上說(shuō)，目前機(jī)器人公司基本上沒有使用新一代技術(shù)，而循環(huán)智能所做的業(yè)務(wù)場(chǎng)景則是幫企業(yè)做產(chǎn)品與客戶的匹配、銷售線索推薦，這些場(chǎng)景直接影響企業(yè)的業(yè)績(jī)，因此企業(yè)對(duì)準(zhǔn)確率非常敏感，必須使用最新一代的、更高準(zhǔn)確率的技術(shù)才可以。我們用了自己原創(chuàng)的XLNet算法去做很大的模型，用很多的數(shù)據(jù)去學(xué)習(xí)，使得標(biāo)注的效率、對(duì)文本長(zhǎng)序列的處理都取得了很大提升，可以來(lái)支撐我們的上層業(yè)務(wù)。此外，還能更好地結(jié)合上下文語(yǔ)義，從溝通對(duì)話數(shù)據(jù)中實(shí)時(shí)提取語(yǔ)義標(biāo)簽，來(lái)做合規(guī)質(zhì)檢、客戶畫像和反饋的自動(dòng)挖掘、銷售和客服的執(zhí)行力監(jiān)督。

　　在楊植麟看來(lái)，相比BERT，XLNet模型有其明顯的優(yōu)越性。原理上，兩者都是屬于預(yù)訓(xùn)練的方法。但從更具體的角度來(lái)說(shuō)，XLNet其實(shí)是融合了兩種不同的預(yù)訓(xùn)練方法：自回歸和自編碼兩種。BERT可以看成是一種自編碼的方法，XLNet則會(huì)克服BERT的一些缺點(diǎn)，主要是兩個(gè)：XLNet不用引入特殊的Mask符號(hào)，所以會(huì)減輕在預(yù)訓(xùn)練和微調(diào)（Fine-tuning）時(shí)候數(shù)據(jù)分布不一致的情況；此外，XLNet可以對(duì)不同詞之間的關(guān)聯(lián)性進(jìn)行建模，而BERT假設(shè)所有要預(yù)測(cè)詞之間都是獨(dú)立的。XLNet通過(guò)一些比較巧妙的、形式上的變化，使得它不需要有這個(gè)假設(shè)。所以XLNet是一個(gè)更通用的模型，去掉了比較嚴(yán)格的假設(shè)，可以對(duì)自然語(yǔ)言里面的上下文關(guān)系進(jìn)行更好地建模。

△XLNet原理圖

　　在具體的產(chǎn)品和解決方案背后，循環(huán)智能同樣面臨著兩方面的技術(shù)難點(diǎn)。一方面，他們需要將自己提出來(lái)的模型用到業(yè)務(wù)場(chǎng)景里面，另一方面是要針對(duì)具體場(chǎng)景里的一些挑戰(zhàn)，針對(duì)性地提出技術(shù)解決辦法。具體來(lái)說(shuō)，第一塊主要是用了我們提出的Transformer-XL、XLNet等一系列通用NLP模型，以及一些主動(dòng)學(xué)習(xí)（ActiveLearning）的算法，作為底層去支撐上層的應(yīng)用。第二塊就是針對(duì)這些具體的場(chǎng)景，它相對(duì)來(lái)說(shuō)會(huì)有一些比較難的地方。

　　難點(diǎn)1：線索評(píng)分會(huì)涉及到怎么去融合多種不同模態(tài)的數(shù)據(jù)。比如除了對(duì)話數(shù)據(jù)，有時(shí)候還會(huì)有行為數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)，需要將不同模態(tài)的數(shù)據(jù)融合到同一個(gè)框架。

　　難點(diǎn)2：怎么對(duì)很長(zhǎng)的對(duì)話結(jié)構(gòu)的文本進(jìn)行建模。用預(yù)訓(xùn)練好的模型通常效果不好，因?yàn)樗粺o(wú)法有效地對(duì)對(duì)話結(jié)構(gòu)進(jìn)行建模，二沒辦法對(duì)很長(zhǎng)的文本序列進(jìn)行建模，所以要對(duì)模型進(jìn)行改進(jìn)，我們現(xiàn)在可以處理長(zhǎng)度幾千個(gè)詞的文本。

　　難點(diǎn)3：規(guī)?；a(chǎn)沒有辦法非常依賴標(biāo)注數(shù)據(jù)，所以需要提升標(biāo)注的效率。通過(guò)小樣本學(xué)習(xí)的思路，上了一套新的系統(tǒng)，現(xiàn)在只用10%的標(biāo)注量，就可以達(dá)到跟以前一樣的效果，這對(duì)規(guī)?；瘡?fù)制業(yè)務(wù)有非常大的幫助。

　　這其中，技術(shù)瓶頸是不可避免的。

　　做實(shí)驗(yàn)的時(shí)候，你每一個(gè)新的想法不一定都能Work。楊植麟認(rèn)為更重要的是在應(yīng)對(duì)瓶頸的時(shí)候，把心態(tài)變得更好。很多時(shí)候，你不是需要追求做實(shí)驗(yàn)一直不失敗，而是要用更快的速度去迭代，用更快的速度取得結(jié)果。

　　NLP輝煌時(shí)代已至

　　最近幾年，語(yǔ)音識(shí)別、計(jì)算機(jī)視覺、語(yǔ)言理解等技術(shù)的崛起使得沉寂了半個(gè)多世紀(jì)的人工智能再次火爆起來(lái)。事實(shí)也證明，人工智能不僅僅是需求驅(qū)動(dòng)，而且是內(nèi)生驅(qū)動(dòng)。

　　楊植麟認(rèn)為，算法和算力其實(shí)是一個(gè)螺旋螺旋式上升的過(guò)程。人工智能的驅(qū)動(dòng)方式是算力和算法螺旋型上升、相輔相成。一開始算力非常小，科學(xué)家只能去研究最好的算法。但是等到算力大的時(shí)候，很多算法就沒用了。很多論文都有這種問(wèn)題：在算力小的情況下跑了一下效果不錯(cuò)，但是算力大的時(shí)候，一點(diǎn)用都沒有。本質(zhì)上，在算法和算力互相迭代的過(guò)程中，最新一代的算法解決了大數(shù)據(jù)和大模型這兩個(gè)問(wèn)題，比如說(shuō)做NLP的話，那大模型就是Transformer，大數(shù)據(jù)就是通過(guò)預(yù)訓(xùn)練來(lái)解決的。

　　也正是大模型+大數(shù)據(jù)的繁榮，直接造就了當(dāng)下NLP的輝煌時(shí)代。

　　他表示最近幾年NLP領(lǐng)域有兩大突破：第一個(gè)突破是從模型的角度看，從簡(jiǎn)單的模型演進(jìn)到了基于Transformer的大模型。Transformer的好處是隨著參數(shù)的變多，效果不斷變好，而且具有非常強(qiáng)的長(zhǎng)距離建模的能力。Transformer模型這兩個(gè)優(yōu)點(diǎn)，使得現(xiàn)在可以做到很多以前做不了的事情。第二個(gè)比較大的進(jìn)步是思維范式上的轉(zhuǎn)變，誕生了基于預(yù)訓(xùn)練的方式，可以有效地利用沒有標(biāo)注的數(shù)據(jù)。簡(jiǎn)單來(lái)說(shuō)，Transformer是模型角度的突破，預(yù)訓(xùn)練方法是思維范式上的突破，前者解決的是如何訓(xùn)練一個(gè)大模型的問(wèn)題，后者解決的是如何解決NLP沒有大數(shù)據(jù)的問(wèn)題。

　　對(duì)于那些想要扎根AI領(lǐng)域的開發(fā)者來(lái)說(shuō)，楊植麟表示把握當(dāng)下的時(shí)代契機(jī)十分重要。想學(xué)習(xí)AI開發(fā)技術(shù)，我覺得可以分兩條路徑：第一條路徑是自上向下的、系統(tǒng)性的學(xué)習(xí)。比如看一本比較系統(tǒng)性的教科書，或者網(wǎng)上的課程，幫助你對(duì)整個(gè)領(lǐng)域的知識(shí)脈絡(luò)有一些系統(tǒng)性的了解；第二條路徑是自底向上、需求驅(qū)動(dòng)的做法。就是說(shuō)，你先遇到現(xiàn)實(shí)中的一個(gè)問(wèn)題，然后從這個(gè)問(wèn)題出發(fā)，通過(guò)各種網(wǎng)上的搜索工具去調(diào)研相關(guān)的文獻(xiàn)。而最最重要的是，一定要去寫代碼！，或者去跑一些真正的代碼，而不僅僅停留在看的層面——實(shí)踐很重要。

　　從人機(jī)單獨(dú)作戰(zhàn)到人機(jī)耦合，AI終將賦能溝通

　　在人工智能領(lǐng)域，我最欣賞‘神經(jīng)網(wǎng)絡(luò)之父’Geofrey Hinton，因?yàn)樗亲钤绲牡旎?，重要性不言而喻。也是他，?qū)使楊植麟多年來(lái)在自然語(yǔ)言處理領(lǐng)域持續(xù)深耕下去，此外，我覺得語(yǔ)言本身比較有意思，語(yǔ)言是人類知識(shí)和認(rèn)知的載體，如果機(jī)器能夠理解語(yǔ)言，然后在理解語(yǔ)言的基礎(chǔ)上進(jìn)行推理，去做出一些決策，其實(shí)是一種很高級(jí)的智能的表現(xiàn)，這也是人工智能領(lǐng)域比較重要的話題。另一方面則跟時(shí)機(jī)有關(guān)，因?yàn)槲宜奈迥昵伴_始做研究的時(shí)候，計(jì)算機(jī)視覺CV或者語(yǔ)音識(shí)別這兩塊已經(jīng)取得突破了，很多效果已經(jīng)做得比較好了。但NLP仍缺少一些突破，我覺得這個(gè)領(lǐng)域會(huì)有更多有挑戰(zhàn)性的問(wèn)題需要去解決。

　　而Google、Facebook等頂尖公司的工作經(jīng)歷，也為他后來(lái)的成功創(chuàng)業(yè)打下了基礎(chǔ)。在這兩家公司有兩個(gè)最直接的收獲：其一就是做了一些研究成果出來(lái)，現(xiàn)在我們也在實(shí)際落地運(yùn)用，包括ActiveLearning（主動(dòng)學(xué)習(xí)）的思想、預(yù)訓(xùn)練模型，都可以直接用上；第二個(gè)收獲，更偏的方法論。就是說(shuō)，遇到一個(gè)問(wèn)題的時(shí)候?qū)W著將大的問(wèn)題拆成小的問(wèn)題，然后逐個(gè)擊破。我覺得其實(shí)創(chuàng)業(yè)跟研究有很多方法論上共通的地方。

　　但在AI真正去賦能溝通的坦蕩前路上，還有一些亟待突破的技術(shù)難點(diǎn)。他表示主要有三個(gè)方面：

　　第一，從人機(jī)單獨(dú)作戰(zhàn)到人機(jī)耦合?，F(xiàn)在市面上做對(duì)話機(jī)器人的公司最多，它們做的事情其實(shí)是人機(jī)單獨(dú)作戰(zhàn)。比如在銷售場(chǎng)景下，把銷售線索先讓機(jī)器人去跟進(jìn)，然后其中比較好的再讓人去跟；在客服場(chǎng)景下也是一樣，先用機(jī)器人去接一些簡(jiǎn)單的問(wèn)題，難的再交給人工客服去接。這其實(shí)是一個(gè)割裂的狀態(tài)，機(jī)器人和人做的是獨(dú)立的任務(wù)，沒有實(shí)現(xiàn)協(xié)同。我們希望讓人和機(jī)器更好地耦合，比如在銷售過(guò)程中，機(jī)器給業(yè)務(wù)員提供輔助，協(xié)助人做決策，或者機(jī)器給人推薦方案，由人去執(zhí)行方案。我覺得人機(jī)耦合最終會(huì)成為銷售場(chǎng)景比較好的形態(tài)，而不僅僅是人和機(jī)器分別作戰(zhàn)。

　　第二，從比較淺層的客戶觸達(dá)到深度的決策輸出。還是對(duì)話機(jī)器人的例子，他們做事情主要是用自動(dòng)外呼機(jī)器人給客戶傳遞一些簡(jiǎn)單信息，或者是問(wèn)一些簡(jiǎn)單問(wèn)題收集一個(gè)問(wèn)卷，或者做個(gè)提醒功能。這些其實(shí)是比較淺層的觸達(dá)，就是說(shuō)機(jī)器人只負(fù)責(zé)傳遞信息，而且是較為淺顯的信息。我們做的事情是讓機(jī)器學(xué)習(xí)或者NLP算法深度參與到最重要的銷售決策過(guò)程，包括應(yīng)該去跟進(jìn)哪些人、給他推什么東西、如何與客戶做溝通等。

　　第三，要讓機(jī)器能有自學(xué)習(xí)的能力。當(dāng)我們做到人機(jī)耦合、機(jī)器可以跟人一起工作，那機(jī)器就需要能根據(jù)人的行為或者人的決策產(chǎn)生的結(jié)果，去自動(dòng)更新和升級(jí)算法模型，形成閉環(huán)，幫助銷售能力一直演進(jìn)下去，而非停留在靜態(tài)模型。

標(biāo)簽：東營(yíng) 牡丹江銅陵資陽(yáng) 巴中錫林郭勒盟營(yíng)口東營(yíng)

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《CSDN專訪楊植麟：“人機(jī)耦合”將是對(duì)話語(yǔ)義應(yīng)用的新趨勢(shì)》，本文關(guān)鍵詞 CSDN,專訪,楊植麟,人機(jī)耦合,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。