POST TIME:2021-07-12 15:55
智能電話機(jī)器人公司在介紹電話機(jī)器人技術(shù)的時(shí)候,都會(huì)提到三大核心技術(shù):ASR、NLP、TTS,也都會(huì)說是公司自主研發(fā)的技術(shù).
然后,市場上大多數(shù)電話機(jī)器人公司的這三大核心技術(shù)都不是自己的,都是租用或者免費(fèi)接入阿里、百度、科大訊飛(002230)的開放版引擎系統(tǒng).
今天,我們來了解一下智能電話機(jī)器人的其中一個(gè)技術(shù):自然語言處理,簡稱為NLP.
什么是自然語言處理?
自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向.它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法.自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué).因此,這一領(lǐng)域的研究將涉及自然語言,即人們?nèi)粘J褂玫恼Z言,所以它與語言學(xué)的研究有著密切的聯(lián)系,但又有重要的區(qū)別.
自然語言處理并不是一般地研究自然語言,而在于研制能有效地實(shí)現(xiàn)自然語言通信的計(jì)算機(jī)系統(tǒng),特別是其中的軟件系統(tǒng).因而它是計(jì)算機(jī)科學(xué)的一部分.
自然語言處理(NLP)是計(jì)算機(jī)科學(xué),人工智能,語言學(xué)關(guān)注計(jì)算機(jī)和人類(自然)語言之間的相互作用的領(lǐng)域.
用一句通俗易懂的話來表達(dá)一下,自然語言處理是智能電話機(jī)器人的大腦,它是聽懂并理解人類語言的關(guān)鍵技術(shù),聽懂人類語言表達(dá)的意思才能夠回應(yīng)人類,產(chǎn)生真正的人機(jī)交互.
哪些公司擁有NLP技術(shù)?
微軟亞洲研究院1998年成立自然語言計(jì)算組,研究內(nèi)容包括多國語言文本分析、機(jī)器翻譯、跨語言信息檢索和自動(dòng)問答系統(tǒng)等.
Google是最早開始研究自然語言處理技術(shù)的團(tuán)隊(duì)之一,作為一個(gè)以搜索為核心的公司,Google對自然語言處理更為重視.
百度自然語言處理部是百度最早成立的部門之一,研究涉及深度問答、機(jī)器翻譯、閱讀理解、語言分析、語義計(jì)算、對話系統(tǒng)等方面.
阿里自然語言處理為其產(chǎn)品服務(wù),在電商平臺(tái)中構(gòu)建知識圖譜實(shí)現(xiàn)智能導(dǎo)購,同時(shí)進(jìn)行全網(wǎng)用戶興趣挖掘,在客服場景中也運(yùn)用自然語言處理技術(shù)打造機(jī)器人客服.
AI Lab是騰訊的人工智能實(shí)驗(yàn)室,研究領(lǐng)域包括計(jì)算機(jī)視覺、語音識別、自然語言處理、機(jī)器學(xué)習(xí)等.
京東在人工智能的浪潮中也不甘落后.京東AI開放平臺(tái)基本上由模型定制化平臺(tái)和在線服務(wù)模塊構(gòu)成,其中在線服務(wù)模塊包括計(jì)算機(jī)視覺、語音交互、自然語言處理和機(jī)器學(xué)習(xí)等.
科大訊飛是一家從事智能語音及語言技術(shù)、人工智能技術(shù)研究、軟件及芯片產(chǎn)品開發(fā)、語音信息服務(wù)的公司,對于語音識別、自然語言處理也有自己的核心技術(shù).
同花順(300033)從2009年開始布局人工智能,經(jīng)過多年在金融證券領(lǐng)域的數(shù)據(jù)積累和近些年來對機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等前沿技術(shù)的大力投入,已經(jīng)在語音識別、自然語言處理領(lǐng)域有了相當(dāng)深厚的技術(shù)積淀.
自研NLP和租用NLP效果一樣嗎?
自然語言處理技術(shù)是智能電話機(jī)器人三大核心技術(shù)之一,那么很多企業(yè)在選擇的時(shí)候,都會(huì)有這么一個(gè)問題:自主研發(fā)的NLP效果和租用或者外部接入的NLP效果一樣嗎?
從理論角度上來說,同一家公司的自然語言處理技術(shù),在自用的情況下和租用的情況下效果是一樣的,幾乎沒有差別.
但從實(shí)際應(yīng)用來說,因?yàn)樽庥玫淖匀徽Z言處理系統(tǒng)并不在本地服務(wù)器上,而是需要通過網(wǎng)絡(luò)傳輸方式去調(diào)用第三方的系統(tǒng),所以自然語言處理的理解準(zhǔn)確度及輸出穩(wěn)定性都是存在巨大風(fēng)險(xiǎn)和差別的.
例如會(huì)因?yàn)榫W(wǎng)絡(luò)的原因?qū)е吕斫庋舆t、部分理解缺失、理解錯(cuò)誤等,還會(huì)存在并發(fā)數(shù)量限制等問題,一條數(shù)據(jù)的處理和N條數(shù)據(jù)的處理完全是兩種不同的狀態(tài).
人們都常說:身體是革命的本錢.
我想說:在人工智能產(chǎn)品不斷更新迭代的市場中,技術(shù)是產(chǎn)品的核心,連核心的技術(shù)都不是自家的,談何產(chǎn)品有多好?