摘要:
只有通過學(xué)習(xí)和積累實際使用智能語音音箱產(chǎn)品的用戶行為大數(shù)據(jù),才有可能完成這個重新思維與再設(shè)計。經(jīng)過這個過程的洗禮,下一個阿里的形態(tài),才有可能浮出水面。阿里巴巴也發(fā)布了本身的首個音箱產(chǎn)品。
2017年7月5日,阿里人工智能實驗室在北京時間博物館發(fā)布了一款名為“天貓精靈”的智能語音音箱。一個智能語音音箱,對于阿里的意義來說卻可大可小。
2003年5月淘寶成立,當(dāng)年10月推出支付寶。此后迄今14年,,淘寶一路超越ebay易趣、雅虎等成為亞洲第一大網(wǎng)絡(luò)零售商。2008年推出淘寶商場,2012年1月更名為天貓,2017年7月“天貓精靈”公測。
阿里公眾與客戶溝通部張啟體現(xiàn),“感覺現(xiàn)在的天貓精靈有點像2003年淘寶剛開始發(fā)展的時候,一切都剛開始?!睆漠?dāng)年淘寶第一版非常丑陋的網(wǎng)頁入口到今天精工細(xì)作的智能語音音箱入口,“天貓精靈”會不會成為阿里的下一個進化奇點?人工智能時代,阿里的進化之路又將如何演進?
阿里的“航天飛船”
2016年,阿里人工智能實驗室(A.I. Labs)成立,負(fù)責(zé)阿里巴巴集團旗下消費級AI產(chǎn)品的研發(fā)。2017年3月,阿里頒布頒發(fā)“NASA計劃”,聚集于核心領(lǐng)域的研究,解決未來10年到20年后的困難。而“天貓精靈”作為阿里自研的硬件產(chǎn)品,實際上承擔(dān)了類似“航天飛船”的硬件功能。
阿里人工智能實驗室負(fù)責(zé)人陳麗娟(花名:淺雪)在“天貓精靈”發(fā)布會上介紹,天貓精靈X1比亞馬遜Echo和蘋果的Homepod都小巧,這樣的設(shè)計是為了進入家庭時沒有侵入感。當(dāng)然,“天貓精靈”的小巧外形很有可能是針對中國家庭的面積而設(shè)計。
為了實現(xiàn)小巧的外形設(shè)計,天貓精靈X1采用了首顆專門為智能語音行業(yè)開發(fā)的芯片,針對需要進行大量音頻處理、聲音合成的工作環(huán)境,定制芯片加入了獨立的NEON處理單元,可加速音頻和語音處理、電話和聲音合成等,帶來更優(yōu)秀的語音識別及音頻處理效果。
天貓精靈X1內(nèi)置中文人機交流系統(tǒng)AliGenie,AliGenie實際上與阿里人工智能大腦ET共享技術(shù)成果。依靠阿里云強大的機器學(xué)習(xí)技術(shù)和計算能力,AliGenie作為人工智能系統(tǒng)就已經(jīng)很成熟。因此,天貓精靈X1的難點并不在語音識別、智能語音交互等人工智能功能,反而在于硬件的設(shè)計、制造、供應(yīng)鏈辦理等阿里之前沒有涉及到的業(yè)務(wù)領(lǐng)域。
陳麗娟體現(xiàn),阿里之所以沒有選擇外包的方式來完成天貓精靈X1的硬件設(shè)計、生產(chǎn)和制造等工作,是因為智能語音音箱涉及到了非常復(fù)雜的軟硬件集成與硬件工程,目前在市場上還找不到一家能夠滿足所有上下游零部件集成研發(fā)、生產(chǎn)與制造的廠商,因此阿里只好本身來承擔(dān)這個硬件產(chǎn)業(yè)集成的角色。
全面激活阿里技術(shù)生態(tài)體系
天貓精靈X1和AliGenie應(yīng)用了阿里積累多年的語音識別、自然語言處理、人機交互等技術(shù)。
基于聲紋識別技術(shù),X1還推出了聲紋購功能,這也是是第一個商用的聲紋購物系統(tǒng)。
阿里人工智能實驗室的語義理解系統(tǒng)還帶有記憶功能和總結(jié)歸納能力,加入了模擬的“長期記憶”和“短期記憶”功能,能夠針對差別的場景和時間度,讓語義理解系統(tǒng)更加貼近用戶。除此之外,阿里人工智能實驗室還已經(jīng)著手其他多個語種的研究。
現(xiàn)在,這些阿里技術(shù)生態(tài)體系,也隨著AliGenie開發(fā)者平臺對外開放,包孕了語音技術(shù)、辦事入口以及硬件方案,并整合阿里生態(tài)體系中豐富的互聯(lián)網(wǎng)辦事和商業(yè)鏈接能力,共同為消費者提供智能體驗。
AliGenie開發(fā)者平臺主要面向四種類型的開發(fā)者:內(nèi)容開發(fā)者、應(yīng)用開發(fā)者、智能家居開發(fā)商和硬件生產(chǎn)商,開放的核心技術(shù)包孕深度學(xué)習(xí)、自然語言處理、搜索/保舉算法、知識體現(xiàn)及推理問答系統(tǒng)等,將免費開放給開發(fā)者和硬件廠商,無需從頭搭建AI語音系統(tǒng)。
至于為什么叫X1,阿里體現(xiàn)在數(shù)學(xué)中“X”代表未知數(shù)和變量,天貓精靈X1作為阿里消費級AI產(chǎn)品的開端,也充滿著未知和變量,阿里人工智能實驗室推出的第一款產(chǎn)品因此命名為X1。
語音交互是思維方式的厘革
自從亞馬遜推出Echo智能語音音箱以來,全世界都把目光投向了下一代人機交互方式:智能語音。本年恰逢iPhone十周年,10年前iPhone用手寫人機交互方式徹底顛覆了之前的鍵盤式人機交互,當(dāng)年很多IT和手機企業(yè)都死守鍵盤交互而最終被甩出歷史的舞臺。
iPhone的手寫人機交互是蘋果公司的首創(chuàng)么?當(dāng)然不是,之前已經(jīng)有包孕微軟在內(nèi)的多家科技公司研發(fā)出了手寫觸屏人機交互技術(shù),但在PC鍵盤思維統(tǒng)治之下,沒有一家公司愿意相信一個沒有鍵盤的手機會成功。蘋果推出第一代iPhone,不但僅是一個技術(shù)和產(chǎn)品路線的選擇,而是思維方式和不雅觀念的徹底厘革。