主頁 > 知識庫 > 科大訊飛董事長劉慶峰介紹語音云概念

科大訊飛董事長劉慶峰介紹語音云概念

熱門標簽:電話外呼系統(tǒng)- 南牛網絡 如何注銷地圖標注注冊 龍圖急救中心地圖標注 沈陽智能外呼系統(tǒng) 高德地圖標注標注不了 地圖標注能賺錢嗎 云南呼叫中心外呼系統(tǒng)多少錢 合肥智能電銷機器人 貴陽花溪區(qū)地圖標注

  10月28日消息,“科大訊飛‘語音云’發(fā)布會暨移動互聯(lián)網語音創(chuàng)新論壇”在北京香格里拉飯店召開,圖為科大訊飛董事長劉慶峰介紹語音云概念。

圖:科大訊飛董事長劉慶峰介紹語音云概念

  科大訊飛在本次發(fā)布會上推出全球首個同時提供語音合成、語音搜索、語音聽寫等智能語音交互能力的移動互聯(lián)網智能交互平臺——“訊飛語音云”。   以下為劉慶峰現(xiàn)場講演實錄:   尊敬的各位領導和嘉賓,大家下午好。感謝周光召先生和柳傳志先生的精彩演講,讓我們對我們民族語音產業(yè)的發(fā)展更是充滿了斗志和昂揚的信心。就像剛才兩位領導所說的那樣,語音作為溝通和獲取信息最便捷的手段和方式,具有廣闊的應用前景。而今天伴隨著語音核心技術的不斷突破,伴隨著移動互聯(lián)網終端的不斷升級,以及后臺大規(guī)模服務并發(fā)文件的不斷升級,在當前這個時代,應用新的架構,讓客戶能夠用到最好的語音技術,我們覺得時機已經成熟。那么今天,科大訊飛在業(yè)界率先發(fā)布的包含語音的移動互聯(lián)網的應用和平臺,我們相信一定會對中國語音產業(yè)乃至移動互聯(lián)網的發(fā)展起到非常重要的推動作用。   下面我首先給大家匯報一下語音產業(yè)最新的一些概括,我們這里所講的語音技術,簡單來說就是使得信息時代的各種機器,都能夠像人一樣能聽會說,那么它包括了語音合成,讓機器開口說話;語音識別,讓它能聽懂人講話,比如說命令控制,語音搜索等等。那么隨著社會的信息化,網絡化和智能化的發(fā)展趨勢,語音技術的應用可以深入到社會生活的幾乎所有行業(yè),那么目前已經在電信、銀行等等越來越多的行業(yè)得到了深入的應用。   除此以外,語音技術還在國家的信息安全以及漢語國際推廣領域都有著非常重要的應用,因此語音技術和產業(yè)歷來是世界各國競爭的熱點和焦點。那么2000年以前,中國語音產業(yè)幾乎全部由國外公司主導,98,99年,微軟,英特爾等等,都在中國成立了專門的語音研究機構,應該是產業(yè)形勢非常地危急。就是在這種背景下,以科大訊飛為代表的民族語音產業(yè),在聯(lián)想投資,在科學院以及國家各部委的關心和支持下,我們勇于亮劍,經過十年的發(fā)展,目前中國語音主流市場的80%已經重新回到中國企業(yè)手中。   那么科大訊飛不僅在中文領域獲得了國際領先的成果,而且在英文技術領域方面也取得了國際領先的成就,科大訊飛現(xiàn)在已經發(fā)展為中國語音產業(yè)唯一上市的公司,為下一輪更快更好的發(fā)展奠定了很扎實的基礎。那么今天,我們的語音產業(yè)又面臨著更加廣闊的巨大的發(fā)展機遇,這個機遇就是剛才我們柳總提到的全球已經進入高速發(fā)展的移動互聯(lián)網時代,那么作為產業(yè)界共同公認的,作為移動互聯(lián)網,作為計算機整個產業(yè)發(fā)展的第五次浪潮,它將帶來產業(yè)的整體規(guī)模將是在桌面互聯(lián)網十倍以上速度的遞增,那么在這個過程中,會誕生一大批偉大的公司。那么在互聯(lián)網時代,由于我們的社會越來越小,經常在開車走路的移動狀況下使用,因此語音技術在這個時代就有更加廣闊的前景。我們的移動互聯(lián)網正在以飛快的速度撲面而來,目前我們的8億手機用戶中,已經有將近2億的移動互聯(lián)網用戶,到2012年,我們的3G用戶也將超過2億以上,如此巨大規(guī)模的用戶群,一定會為中國移動互聯(lián)網的發(fā)展提供源源不斷的動力和持續(xù)成長的舞臺。   在這個大的發(fā)展趨勢中我們可以看到,對語音技術的投入力度和市場關注的步伐應該說是前所未有的,我們從IBM,微軟,到現(xiàn)在的蘋果和Google都可以看出明確的趨勢,比如說IBM提出要把他的語音技術推向市場,微軟在多種場合下提出來,他未來看好的三大產業(yè)第一就是語音技術。那么微軟即將推出來的Window7,也已經把語音作為非常重要的一部分,蘋果也正在研發(fā)語音識別技術等等。應該說國際IT巨頭在中文語音領域,在全球范圍內的對語音產業(yè)的高度關注,既促進了這個產業(yè)的更快的發(fā)展,也為我們中國語音企業(yè)提出了更大的挑戰(zhàn),使我們感到更大的發(fā)展的緊迫性。   在這種背景下,我們科大訊飛要發(fā)布我們的訊飛語音云各個,應該說當今的互聯(lián)網發(fā)展,社會各界都已經明顯看到,互聯(lián)網已經發(fā)展到了成年階段,就是越來越表達和反應了一個國家和民族的核心力。所以說各國跟互聯(lián)網時代的網上的話語權和控制力的爭奪越來越激烈,而語音作為文化的基礎和民族的象征,我們認為中國的民族語音企業(yè),一定要在這場競爭中拿出我們的氣魄,做出我們的成果來。那么今天,科大訊飛我們要發(fā)布的訊飛語音云平臺,就是面臨這樣一種產業(yè)競爭的激烈的格局,以及巨大產業(yè)發(fā)展的空間,我們提出來。   那么我們訊飛語音云平臺的總體架構,大家可以看這個圖,我們封裝了包括語音識別,語音合成等等戰(zhàn)略的各種智能語音技術,通過我們云計算平臺接口,統(tǒng)一實現(xiàn)資源管理,存儲管理等等,那么像開發(fā)伙伴提供便捷的開發(fā)環(huán)境和高校的語音服務。   下面給大家介紹并做一些相應的演示,我們在訊飛云平臺中的一些核心技術。首先給大家介紹一下我們語音合成技術的發(fā)展和最新的成果。語音合成技術就是讓機器和各種設備開口說話,最關鍵的指標我們的設備,在車上收到一條短信,我們能夠馬上讀出來,那么讀的效果好壞是一個非常的指標,根據(jù)國際比賽,那么有五分的主觀評價標準,如果機器念的聲音跟我們播音員一樣,就是五分,像普通人一樣就是四分,我們請大家看一看我們語音合成在各個歷史階段的項目。   首先可以請大家聽一下我們在95年的技術。聽起來很像電影里面機器人的聲音,這說明技術難度很大。   看到98年,我們在業(yè)界率先達到了可使用門檻的水平。那么這是以這個系統(tǒng)為基礎,科大訊飛的創(chuàng)業(yè)團隊創(chuàng)辦了訊飛公司,這對我們未來產業(yè)發(fā)展起到了巨大的推動作用。今天非常高興告訴大家,我們的語音合成已經做到4.5分,是業(yè)界唯一超過4.0分的系統(tǒng),也就是說播音員是5分,普通人是4分,計算機是4.5分,我們下面聽一下。   那么剛才大家聽到的,這是863比賽的原文,謝謝。那么目前應該說對基本任意文本我們都可以有這種水平,今天上午,我們針對今天的發(fā)布會,專門合成了一段文章,現(xiàn)在語音已經可以由男聲,女聲,童聲,還有方言,請大家聽一下,謝謝。   那么這都是現(xiàn)場合成的,應該說我們對幾乎任意文本都能做到這樣一個水平。那么除了包括中文的多語言多方言的情況之外,我們加大了國際多語種的研發(fā),我們參加了由美國和日本聯(lián)合發(fā)起的國際英文大賽,這是全球最權威的語音合成比賽,06年科大訊飛成為業(yè)界最大的一匹黑馬,當時包括了參加的有微軟公司等等,那么2006年,又連續(xù)比了四年,我們非常高興地告訴大家,訊飛已經不但是黑馬,所有關注訊飛的情況下,我們連續(xù)四年蟬聯(lián)全球第一名,下面請大家聽一下我們英文合成的效果。   這一段英文合成應該是非常地道,可以給大家看看這張圖,這是2001年國際比賽的結果,科大訊飛是唯一超過4.0分的英文合成系統(tǒng),4.9分是參考對方的美國的播音員的水平。那么4.2是科大訊飛的,應該說我們在英文合成上面的核心技術已經是遠遠領先競爭對手,那么在未來幾年我們還會陸續(xù)推出其他全球最主要的語種。   下面再給大家介紹一下在移動互聯(lián)網時代非常有意義的應用,就是發(fā)音模擬技術,通過這個技術,就可以準確分析他的聲帶特征等等,可以把一個人的聲音變成另外一個人說話,這個我們也做了一個案例,因為涉及到非商業(yè)的,我們這個不是一個商業(yè)的宣傳,因此我們用了我們中央臺著名播音員李瑞英的聲音,請大家聽聽。我們來看看我們模擬的聲音像不像,謝謝。   應該說這樣一種發(fā)音模擬技術和我們語音合成技術相結合,未來在無線互聯(lián)網時代的網絡游戲、網絡教學、乃至于虛擬主持人等等都有非常廣闊的應用。   前面給大家介紹的是語音合成技術,下面再給大家介紹一個,我覺得對語音識別非常有意義和價值的口語評測技術。這個技術簡單來講,就是使得計算機能夠對我們的普通話或者英語發(fā)音等等進行打分,評價和反饋指導。這項技術最早的需求來源是國家語委和教育部,所有的年輕人要想當老師,必須要考普通話等級證書,以前都是人工考,三個老師考一個學生,十分鐘結果才能出來,效率很低,成本很高,讓計算機代替人工來進行測試,這國家語委多年的目標。我今天告訴大家,科大訊飛是唯一的一個能做到的,我們的技術在2009年測試人數(shù)已經超過了100萬人,那么今年國家語委正式下文,大家有興趣可以登錄到我們的網站自己去體驗,不僅可以對你的發(fā)音進行打分,還可以告訴你錯的地方在哪些地方。這些同樣在我們的英語教學,在我們少數(shù)民族教育都有非常重要的應用。同時對我們將要發(fā)布的我們的語音聽寫和搜索起到了很重要的優(yōu)勢,應該是我們非常強的一個核心優(yōu)勢。   那么在相應的技術基礎上,我們科大訊飛在2008年,又開始參加國際上最權威的說話識別和語種識別的大賽,是NIST主辦的,那么這個組織從1996年開始,每兩年一次舉行說話人和語種的比賽,2000年以后是隔年進行,09年是語種識別,語種識別就是一說話我們知道你是哪個國家哪個地區(qū)的人。我們可以看到,我們的所有指標都在全球前三名。我們在通用語種上獲得了全球的亞軍,那么更難的,高混淆方言,我們是全球第一名。這些國際歷史上大賽的頻繁的獲獎,充分的確立了科大訊飛在國際語音技術領域,從合成到識別的全面的領先技術。   那么圍繞上述這些核心技術,我們訊飛面向產業(yè)推出來的命令式識別和語音搜索技術,正在日益廣泛的進入我們日常生活中。比如說在通訊領域,訊飛以音樂搜索為代表,我們的語音搜索業(yè)務已經覆蓋了46個升級運營點,用戶數(shù)超過1億人,擁有上千萬的穩(wěn)定活躍的用戶。此外,電信,移動和聯(lián)通推出了一些典型業(yè)務。另外我們這個技術還從電信延伸到了金融、教育等越來越多的行業(yè),而且在世博會上也發(fā)揮了重要的作用,包括語音識別,大家還看到可愛的海寶,能聽會說的海寶就是我們做的,你說白日依山盡,它就回到黃河入海流,非常聰明。那么在這個基礎上,我們隨著現(xiàn)代的實際應用的發(fā)展和應用中對核心技術提出了越來越高的要求,技術不斷的發(fā)展和進步。   下面請大家看幾個非常典型的演示,第一個演示是在移動的客服電話呼叫導航中的演示,這是一個實際上線的系統(tǒng),請大家看一下。   好,那么大家看到,最早我們在查詢各種各樣呼叫中心的時候,必須要簡單按鍵,那么我們這個語音云技術就非常方便了。相信隨著這個技術從電信往社會生活各個領域的延伸,會對我們整個社會信息的服務起到一個極大的提升。剛才是我們呼叫導航,下面再給大家看兩個非常有趣的演示:一個是在互聯(lián)網電視領域,大家知道現(xiàn)在三網合一成為一個信息產業(yè)發(fā)展非常重要的戰(zhàn)略,這就是我們三網合一的實際的電視機,這個電視機可以通過機頂盒,或者說現(xiàn)在互聯(lián)網電視直接安裝我們的軟件,這是我們配套的一個搖控器,非常低成本的在搖控器上增加一個摁鍵,就可以用語音來控制了。   那么應該說,它對互聯(lián)網電視,對三網合一最大的價值在什么?有了語音識別,我們可以隨意說了,準確率都非常地高。剛才看到的是在電視用的應用,下面在具體的手機中的應用,這是一個智能手機,這個手機中間,我接了一個線,這個線主要的目的是為了投影到上面,唯一的作用就是傳輸我們的屏幕,所有的運算都在我的手機中進行。下面給大家看一個就是在手機中我們實現(xiàn)的搜索,只要在手機中,用戶獲得了我們訊飛語音云平臺的注冊通行證,他在手機中任何的瀏覽器,各種搜索都可以用語音來完成,下面來給大家安裝這個語音瀏覽器,起動了一個,這個是屏幕,我們點擊進入到搜索以后,這是我們訊飛的輸入法,我們在網上已經發(fā)布了,點擊輸入法中的麥克風,我們就可以直接說話了,它的所有運算都是在后臺。   應該說通過這種語音搜索,可以極大的提升我們用戶的使用,剛才給大家看到的就是我們的語音所有剛才的計算全在后臺的云計算平臺來支撐的。我們看到的了我們的搜索的演示以后,有很多的合作伙伴,包括領導要問,如果我們要在移動互聯(lián)網終端要使用語音技術聽寫,就有更大的難處,因為有很多局限,但是我們非常高興。

騰訊科技

標簽:石嘴山 佛山 雙鴨山 南京 新余 承德 揚州 畢節(jié)

巨人網絡通訊聲明:本文標題《科大訊飛董事長劉慶峰介紹語音云概念》,本文關鍵詞  科大,訊飛,董事長,劉慶峰,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《科大訊飛董事長劉慶峰介紹語音云概念》相關的同類信息!
  • 本頁收集關于科大訊飛董事長劉慶峰介紹語音云概念的相關信息資訊供網民參考!
  • 推薦文章