主頁 > 知識庫 > AI唇語識別!人工智能領(lǐng)域的下一個(gè)風(fēng)口

AI唇語識別!人工智能領(lǐng)域的下一個(gè)風(fēng)口

熱門標(biāo)簽:珠海電銷外呼系統(tǒng)供應(yīng)商 鄭州營銷電銷機(jī)器人加盟 梅縣地圖標(biāo)注 江西防封電銷卡辦理靠譜 百度地圖標(biāo)注后怎么保存 樂迪電話機(jī)器人沒辦法定位 海州區(qū)百應(yīng)電話機(jī)器人市場前景 德州電話外呼系統(tǒng)公司 西寧語音外呼系統(tǒng)業(yè)務(wù)

看到別人在低聲討論時(shí),你是不是就想學(xué)習(xí)唇語來看破他們在討論的什么,小編是經(jīng)常有這種想法,不過,現(xiàn)在不需要了,因?yàn)槲覀円呀?jīng)有了AI唇語識別,可以讓每個(gè)人都具備看懂唇語的能力。



什么是唇語識別

所謂的“唇語識別”,其實(shí)并不神秘。

就是通過“觀察別人的嘴型,解讀其表達(dá)語句”的能力。目前,一些聽力障礙者們也會使用這種技巧與他人進(jìn)行交談,補(bǔ)充聽力器官的不足。

但隨著科技的發(fā)展,人工智能在各領(lǐng)域漸次開放,在唇語識別上,機(jī)器已經(jīng)做的比人類好了。

從技術(shù)路徑上,唇語識別是一項(xiàng)集機(jī)器視覺與自然語言處理于一體的復(fù)合型技術(shù)。

唇語識別的研究現(xiàn)狀

2003 年,Intel 就開發(fā)了唇語識別軟件 Audio Visual Speech Recognition(AVSR),開發(fā)者得以能夠研發(fā)可以進(jìn)行唇語識別的計(jì)算機(jī)。

2016 年 Google DeepMind 的唇語識別技術(shù)就已經(jīng)可以支持 17500 個(gè)詞,新聞測試集識別準(zhǔn)確率首次達(dá)到了 50% 以上。

2017年 搜狗推出了一種人機(jī)交互新技術(shù)——“唇語識別”。該系統(tǒng)達(dá)到60%以上的準(zhǔn)確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率。在垂直場景如車載、智能家居等場景下甚至已經(jīng)達(dá)到90%的準(zhǔn)確率。



AI唇語識別技術(shù)原理:

唇語識別技術(shù)從鏡頭輸入到理解輸出,中間最重要的關(guān)鍵是:視覺前段、視覺特征提取、唇動識別。

視覺前段——包括人臉檢測與唇的檢測和定位,先用人臉檢測演算法得到人臉然后有針對性的定位唇動;

或者利用最佳閩值二值化演算法,以唇的邊緣是平滑的,和左右形狀對稱為條件,作為二值化閩值選定的約束條件,得到平滑而對稱的唇圖像。

視覺特征提取——是對獲取的唇圖像進(jìn)行處理得到對應(yīng)特征,特征提取方法主要分為基于圖元的方法和基于模型的方法兩大類;

搜狗所用的基于模型的方法就是,對唇的輪廓建立一個(gè)模型,將特征資訊包含在這個(gè)模型之中,并對模型中特征資訊的變化用一個(gè)小的參數(shù)來描述。

這類方法的優(yōu)點(diǎn)是重要特征被表示成二維參數(shù),不會因光照、縮放、旋轉(zhuǎn)、平移而改變,缺點(diǎn)是忽略了細(xì)微的三維資訊,可能會對后面的識別過程造成影響。

唇動識別——目前采用的技術(shù)大多是隱瑪爾可夫模型( Hidden Markov Model,簡稱 HMM ),該模型認(rèn)為唇動信號在極短時(shí)間內(nèi)是線性的,可以用線性參數(shù)模型來表示,然后將許多線性模型在時(shí)間上串接起來,組成一條瑪爾可夫鏈。

據(jù)了解,在非特定開放口語測試中,目前的通用識別準(zhǔn)確率已經(jīng)在 70% 以上,而在金融風(fēng)控、車載、智能家居等垂直場景下,已達(dá)到超過 90% 的準(zhǔn)確率。


除此之外,唇語識別技術(shù)還能發(fā)揮巨大的公益價(jià)值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達(dá)自己。

標(biāo)簽:盤錦 無錫 拉薩 阜陽 溫州 贛州 恩施 欽州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《AI唇語識別!人工智能領(lǐng)域的下一個(gè)風(fēng)口》,本文關(guān)鍵詞  唇語,識別,人工智能,領(lǐng)域,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《AI唇語識別!人工智能領(lǐng)域的下一個(gè)風(fēng)口》相關(guān)的同類信息!
  • 本頁收集關(guān)于AI唇語識別!人工智能領(lǐng)域的下一個(gè)風(fēng)口的相關(guān)信息資訊供網(wǎng)民參考!
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266