4月16日,中國科學院主管、科學出版社主辦的核心雜志《互聯(lián)網周刊》聯(lián)合eNet研究院共同發(fā)布了《2019年度大數(shù)據(jù)產業(yè)分薦》榜單。標貝科技憑借專業(yè)、高精度的AI數(shù)據(jù)采標服務,入選“2019年度AI數(shù)據(jù)綜合采集TOP10”。同時,這也是標貝科技不久前入選以上機構發(fā)布的“2020數(shù)據(jù)標注公司排行”榜單后,獲得的又一行業(yè)殊榮。
據(jù)了解,《2019年度大數(shù)據(jù)產業(yè)分薦》按照大數(shù)據(jù)服務、大數(shù)據(jù)應用、大數(shù)據(jù)相關/綜這三類劃分,通過對2019年度企業(yè)服務能力綜合考量,評選出細分領域的杰出代表。該榜單充分體現(xiàn)了當前人工智能數(shù)據(jù)產業(yè)火熱的發(fā)展趨勢,以及企業(yè)自身發(fā)展實力。
標貝科技專注智能語音交互及AI數(shù)據(jù)服務,以“語音連接場景,數(shù)據(jù)服務技術”為理念,創(chuàng)新AI技術應用,打造了包括語音合成、語音識別、NLP、歌曲等采標服務、以及數(shù)據(jù)可視化眾包平臺-數(shù)據(jù)工場等在內的數(shù)據(jù)服務。本次,雙榜單入選,彰顯標貝科技卓越的數(shù)據(jù)服務能力。
《2019年中國人工智能基礎數(shù)據(jù)服務行業(yè)白皮書》分析指出,2010-2016年為數(shù)據(jù)服務行業(yè)的“初生期”,早期數(shù)據(jù)標注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。自2017年以來,伴隨著AI深入落地到各個應用場景中,數(shù)據(jù)標注行業(yè)了進入成長期,上層應用端的廠商對數(shù)據(jù)標注質的要求不斷提高,如自動駕駛、運動圖像、計算機視覺等領域的數(shù)據(jù)標注難度很高。
標貝科技自成立之初,把數(shù)據(jù)服務質量及數(shù)據(jù)安全放在首位,擁有業(yè)內領先的AI技術及數(shù)據(jù)采標服務能力,為客戶提供高質量、安全、專業(yè)的數(shù)據(jù)設計、數(shù)據(jù)采集、數(shù)據(jù)加工處理、評測分析等服務。
在安全方面,標貝擁有歐盟GDPR通用數(shù)據(jù)保護條例、英國ISO信息安全管理體系標準為指導,以數(shù)據(jù)主體及用戶隱私保護為核心,建立數(shù)據(jù)信息安全體系。實時嚴格監(jiān)管數(shù)據(jù)控制、處理過程,制定數(shù)據(jù)安全性操作指導規(guī)范及應急響應機制,以此保護數(shù)據(jù)主體及用戶數(shù)據(jù)隱私安全。
在數(shù)據(jù)質量方面,經過嚴格專業(yè)的立項設計、數(shù)據(jù)采集加工處理、語音標注校對及結構處理等系列流程,標貝能夠實現(xiàn)快速產出高質量的人工智能數(shù)據(jù),與算法、模型、架構等進行深度匹配,形成可進行落地的產品形態(tài)。
例如,標貝科技創(chuàng)新打造數(shù)據(jù)可視化眾包平臺-數(shù)據(jù)工場。
該產品首次將數(shù)據(jù)格式算法融入其中,通過操作平臺嚴格控制前端采集格式,大幅度提升了數(shù)據(jù)的高質量和準確性,確保數(shù)據(jù)在采集和上傳的過程中無任何壓縮問題。
在數(shù)據(jù)采集方面,可根據(jù)定制化需求,對各類規(guī)定文本、指定圖片,各種環(huán)境下的語音、視頻進行采集;采集過程中可實現(xiàn)對其內容的篩選、文本化等相關任務。可承載千萬級別以上樣本的收集,單日完成10萬+樣本采集。
在數(shù)據(jù)標注方面,通過對圖像、文本、音頻、視頻等信息進行搜集、評估、歸類,最終完成標注;標注過程中可實現(xiàn)對內容進行關鍵詞等內容的提取、清洗、脫敏、校驗等相關任務。企業(yè)客戶通過使用標貝數(shù)據(jù)工場采標效率可提升50%。
2020年,國家層面提出“加快新型基礎設施建設進度”。人工智能作為“新基建”七大領域之一,將為經濟增長提供新動力。而數(shù)據(jù)是人工智能產業(yè)的基礎設施,為“智慧應用、萬物連接”落地打下堅實基礎,發(fā)揮重要性角色。
未來,隨著AI+5G的不斷融合,數(shù)據(jù)價值作用會得到進一步釋放。標貝科技將加大技術投入及創(chuàng)新力度,深耕語音及數(shù)據(jù)產業(yè),打造更為高質量標準的數(shù)據(jù)服務,為行業(yè)發(fā)展賦能,也為新基建發(fā)展做貢獻。