在智能語音行業(yè)里,有不少企業(yè)都開放自己的智能語音平臺給硬件開發(fā)者,這么做不僅給技能開發(fā)者提供了語音交互能力,也能完善以其語音系統(tǒng)的生態(tài)鏈。在技能開放平臺上,擁有豐富優(yōu)質(zhì)的AI內(nèi)容資源,100余種原生對話技能呼叫中心解決方案,也支持接入第三方資源和內(nèi)容等,對于硬件廠商來說,顯著降低了開發(fā)成本。數(shù)了下國內(nèi)目前開放的智能語音平臺,真的還不少呢。
先是BAT巨頭,都有自己的開放平臺:
百度:DuerOS是百度推出的對話式人工智能操作系統(tǒng),即智能語音交互平臺。DuerOS開放平臺是為企業(yè)及開發(fā)者提供的一整套對話式人工智能解決方案的開放平臺,是百度全球領(lǐng)先人工智能技術(shù)的重要應(yīng)用之一。
DuerOS開放平臺包括:智能設(shè)備開放平臺和技能開放平臺。智能設(shè)備開放平臺提供了靈活的分層解決方案呼叫中心解決方案,滿足家居、車載、可穿戴等數(shù)十種設(shè)備和場景需求,并已為數(shù)百家頂級客戶的產(chǎn)品和設(shè)備集成了對話式人工智能的能力。技能開放平臺提供了全套語音技能開發(fā)工具和方案,開發(fā)者利用可視化界面即可高效的完成開發(fā)部署,將技能發(fā)布在搭載DuerOS的硬件中。
阿里巴巴:AliGenie語音開放平臺,是由阿里人工智能實(shí)驗(yàn)室(AI Labs)推出,面向軟硬件廠商和開發(fā)者推出的,將人工智能中ASR語音識別、NLP自然語言處理、TTS語音合成等自然語言處理技術(shù)和能力對外共享的開放式平臺。
主要包括精靈技能市場、硬件開放平臺、行業(yè)解決方案三大部分,全面賦能智能家居、新制造、新零售、酒店、航空等服務(wù)場景。
AliGenie開發(fā)者平臺是阿里巴巴人工智能實(shí)驗(yàn)室(AI-Labs)平臺針對不同類型的開發(fā)者提供了豐富的開發(fā)工具,協(xié)助開發(fā)者完成語音技能的開發(fā)、智能設(shè)備的接入、云端服務(wù)的接入等。
此外,對于線下零售、航空候機(jī)、酒店客房等應(yīng)用場景,AliGenie開放平臺推出了垂直行業(yè)解決方案,例如店鋪精靈,酒店精靈和航旅精靈等,這些個(gè)性化的語音助手將成為服務(wù)業(yè)的得力助手。
騰訊:騰訊云小微語音開放平臺,于2017年騰訊「云+未來」峰會上正式發(fā)布,分為三個(gè)部分,Skill開放平臺,硬件開放平臺和小微客服機(jī)器人。
騰訊云小微的Skill是指它為各種各樣的設(shè)備提供智能語音對話的能力和內(nèi)容;硬件開放平臺是一個(gè)能將語音交互能力輸出給第三方硬件廠商的平臺,即云小微將語音喚醒、語音識別、語義分析、信令收發(fā)以及眾多的內(nèi)置資源及服務(wù),;小微客戶機(jī)器人可以幫助用戶提高效率,降低人力成本。用戶需要導(dǎo)入業(yè)務(wù)領(lǐng)域知識庫信息,建立機(jī)器人知識信息基礎(chǔ),通過逐步調(diào)優(yōu),使得機(jī)器人機(jī)器人實(shí)現(xiàn)常見問題的自動應(yīng)答。
作為網(wǎng)絡(luò)社交的巨頭,騰訊不僅擁有海量的視頻、音樂的內(nèi)容資源,還擁有云端億萬用戶的資源,騰訊云小微從一開始就拿到一副好牌。
大牌語音行業(yè)的科技公司
科大訊飛,訊飛開放平臺致力于為開發(fā)者打造一站式智能人機(jī)交互解決方案。目前,開放平臺以“云+端”的形式向開發(fā)者提供語音合成、語音識別、語音喚醒、語義理解、人臉識別、個(gè)性化彩鈴、移動應(yīng)用分析等多項(xiàng)服務(wù)。
思必馳的DUI(Dialogue User Interface)開放平臺,是以D-對話為核心的一站式交互定制平臺,覆蓋多應(yīng)用場景和第三方內(nèi)容資源,內(nèi)置語音技能庫,為物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和互聯(lián)網(wǎng)的開發(fā)者,提供單項(xiàng)技術(shù)服務(wù)和一站式對話交互定制解決方案。DUI開放平臺擁有青囊系統(tǒng)、天機(jī)系統(tǒng)、紫微系統(tǒng)、玲瓏系統(tǒng)四大系統(tǒng)。
云知聲的開放者平臺,以方案為入口,基于特定應(yīng)用場景打造智能語音交互應(yīng)用的模版。例如智能電視方案、智能汽車方案、音樂搜索方案等。為開發(fā)者提供一個(gè)智能語音交互系統(tǒng)的完整而便捷的開發(fā)環(huán)境。
云知聲是一家專業(yè)的語音交互提供商,在移動互聯(lián)網(wǎng)、智能家居、可穿戴設(shè)備、車載導(dǎo)航、醫(yī)療、教育、呼叫中心等領(lǐng)域有豐富的經(jīng)驗(yàn)。
人工智能時(shí)代,智能語音作為AI最先落地的突破口,迅速成為全球互聯(lián)網(wǎng)巨頭關(guān)注的焦點(diǎn)和角逐的戰(zhàn)場,所以,做傳統(tǒng)語音技術(shù)的科大訊飛、云知聲、思必馳也紛紛轉(zhuǎn)為AI全棧公司。當(dāng)然,也有類似聲智科技、三角獸等語音技術(shù)公司堅(jiān)持定位技術(shù)方案提供商。
其它創(chuàng)業(yè)公司
出門問問,推出的AI開放平臺其通用版本也是向開發(fā)者和硬件廠商免費(fèi)開放,只需登陸平臺網(wǎng)站注冊就可立即下載集成SDK,擁有全棧式語音交互技術(shù)整合,平臺工具操作簡單,適配多場景,且產(chǎn)品集成廠商可根據(jù)自身產(chǎn)品需求,自主針對各自產(chǎn)品進(jìn)行個(gè)性化的功能開發(fā)。出門問問通過產(chǎn)品獲得流量、數(shù)據(jù),而產(chǎn)品則能獲得AI技術(shù)賦能。
Rokid的開放平臺,語音服務(wù)包含Rokid技能開發(fā)工具和Rokid語音接入。Rokid技能開發(fā)工具幫助開發(fā)者為所有搭載Rokid開放服務(wù)的設(shè)備開發(fā)有趣的技能,實(shí)現(xiàn)用戶各式各樣的語音交互需求。Rokid語音接入能夠?yàn)榕溆宣溈孙L(fēng)和揚(yáng)聲器的聯(lián)網(wǎng)硬件設(shè)備開啟Rokid開放服務(wù)所提供的智能、可擴(kuò)展的語音能力。并且,其100%的硬件技術(shù)和70%的代碼將全部開源。
小米水滴平臺,水滴平臺為可以落地的小米全生態(tài)硬件產(chǎn)品提供語音服務(wù),使用它可以為硬件設(shè)備提供功能,使用戶能夠以更直觀的方式使用語音與設(shè)備進(jìn)行交互。這些功能包括播放音樂的能力,回答一般問題的問題,設(shè)置鬧鐘或定時(shí)器等等。
智能語音開放平臺的主要功能,就是賦予硬件或技能應(yīng)用獲得“能聽會說,更智能”的能力。在智能領(lǐng)域內(nèi)的第一梯隊(duì)究竟是具有先發(fā)優(yōu)勢的科技公司?還是占據(jù)著雄厚資本和資源的商業(yè)巨頭?還是努力創(chuàng)新的創(chuàng)業(yè)公司?這也許只有時(shí)間才能給我們答案。