CTI論壇(ctiforum)9月25日消息(記者 李文杰):近日網(wǎng)上辦公室里聊的最多的,就是捷通華聲云智能辦公平臺 —Aioffice,這個平臺是繼捷通華聲靈云平臺開放全部人工智能能力之后,又一個更加開放而且對普通人更加有用的人工智能技術(shù)應(yīng)用平臺。靈云智能辦公平臺集長錄音轉(zhuǎn)寫、文字識別(OCR)、語音合成(TTS)、多語種在線翻譯等技術(shù)為一體,為大眾辦公生活開啟了人工智能時代的奇幻之旅。
辦公生活的新模式 文字工作者的“絕對”福利
許多媒體工作者、記者、速記員、會議記錄員等職位的小伙伴們常常會糾結(jié)于“如何快速將一大段錄音做成文字”,曾有一名從事會議記錄的同學(xué)在網(wǎng)上向大家求助:“我領(lǐng)導(dǎo)剛開了兩個小時的會議,讓我最遲今天整理成文字,錄音太長了,求大家支招”,有人卻回復(fù)說:“你這算什么,我還有一個七小時的錄音在等著……”。
為了更快更好的將錄音轉(zhuǎn)成文字,有些長期和錄音打交道的媒體朋友們甚至總結(jié)出了一套“快速”轉(zhuǎn)寫錄音的“寶典”:“在進行轉(zhuǎn)寫錄音的時候,要善用暫停播放的快捷鍵、要善用txt而不是word、堅決不要倒回去聽……”寶典的最后,又補充了一條:“如果實在時間不夠,那就找一個靠譜的實習(xí)生幫你轉(zhuǎn)寫吧”。
從這些小伙伴們的反饋能看得出把錄音轉(zhuǎn)成文字是一個很費體力和時間的活,幾乎是一個純?nèi)肆Χ哑霾拍芡瓿傻墓ぷ?。在這些職位日常的辦公生活中,錄音轉(zhuǎn)寫成文字占據(jù)了一大半的時間。據(jù)測試,一條30分鐘長度的錄音文件,例如一段新聞聯(lián)播的錄音,熟練的文字工作者把它完全轉(zhuǎn)寫成文字至少需要3個小時的時間。不得不說,錄音的手動轉(zhuǎn)寫為這些職位的員工帶來了很大的困擾??梢韵胂?,一位本來才思如泉涌的記者在經(jīng)過三小時的錄音轉(zhuǎn)寫之后,想必摸鍵盤的心思都沒了。
這個純粹耗費體力和時間的工作,在擁有了靈云智能辦公平臺之后,開始變得輕松有趣起來。靈云智能辦公平臺的長錄音轉(zhuǎn)寫功能,只需要用戶把錄音文件上傳到平臺并創(chuàng)建轉(zhuǎn)寫項目,一盞茶的功夫之后,用戶就會發(fā)現(xiàn)本來很頭疼的一個工作,靈云智能辦公平臺已經(jīng)高質(zhì)量的完成了。
靈云智能辦公平臺的長錄音轉(zhuǎn)寫不僅支持普通話,還能支持維吾爾語、英語等語言的識別,還能支持帶有方言口音的普通話識別,識別正確率能達到96%以上。
靈云智能辦公平臺 辦公技能全面最“能耐”
靈云智能辦公平臺作為一個平臺級的服務(wù)平臺,不是只有長錄音轉(zhuǎn)寫功能,平臺上的文字識別、語音合成、在線翻譯等功能也能分別在辦公工作中起到獨當(dāng)一面的作用。
靈云智能辦公平臺不僅僅在可以在工作中應(yīng)用,在學(xué)校生活中,靈云智能平臺也能起到巨大的作用,例如有時期末復(fù)習(xí)或者考研的時候,總會有很多文檔資料亟需學(xué)習(xí),而紙質(zhì)的資料相對來說查閱較為復(fù)雜,于是有很多同學(xué)為了方便在電腦上閱覽這些資料,就用照片的形式把這些資料拍了下來用圖片方式瀏覽,但圖片式的資料困擾在只能看不能編輯。這時候靈云智能平臺上的文字識別就能幫忙解憂了,靈云文字識別具有強大的圖片處理能力,可以對不同的圖片進行旋轉(zhuǎn)、傾斜校正、版面分析、版面屬性設(shè)置等操作,還可以根據(jù)實際語境對識別結(jié)果進行自動校正,對常用的宋體、仿宋體、楷體、黑體、雅黑等打印字體的識別率會達到99%以上,甚至隸書、魏碑等較難識別的字體也能保證同樣的正確率。
最“牛”的還不止這些,多語種在線翻譯更是大放異彩。有時候用長錄音轉(zhuǎn)寫功能轉(zhuǎn)寫了一段英文的錄音,而轉(zhuǎn)寫好的英文篇章需要翻譯成漢語再進行摘錄編輯,這時候,在線翻譯功能就可以直接派上用場了,靈云智能辦公平臺上在線翻譯功能的使用方式特別簡單方便,轉(zhuǎn)寫文字的文本框旁邊有一個翻譯按鈕,可以選中翻譯方式直接進行翻譯,在線翻譯功能支持漢語和英語、法語、漢語、日語之間的互相翻譯,最人性化的地方在于,為了保證翻譯的準(zhǔn)確性,轉(zhuǎn)寫好的文字和對應(yīng)的翻譯結(jié)果都能在平臺文本框內(nèi)直接編輯修改。
更能讓辦公和生活“繪聲繪色”的功能非靈云智能辦公平臺的語音合成功能莫屬了,該功能可以讓文字發(fā)出自己的聲音。例如有時候,看書累了,可以打開靈云智能辦公平臺,把書里的內(nèi)容往語音合成文本框中復(fù)制,設(shè)置好想要的音色和語速,再泡一杯茶,一個悠哉又充實的午后就這么開始了。靈云智能辦公平臺的語音合成音質(zhì)效果真實、干凈、細(xì)膩,音色的逼真度和音質(zhì)的細(xì)膩度都有一個可觀的體驗,沒有了機器底噪、朗讀更加抑揚頓挫,語種可支持中文普通話、粵語、英語、日語、韓語、德語、法語、俄語等二十幾種語言,音色多種可選。
靈云智能辦公平臺的出現(xiàn),優(yōu)化了辦公工作的質(zhì)量,以質(zhì)變的方式提高了辦公工作的效率。伴隨著捷通華聲人工智能技術(shù)的不斷進步,會有更多的人工智能技術(shù)加入到靈云智能辦公平臺服務(wù)于人們的工作和生活。