9月20日-22日,由中國自動化學會智能自動化專業(yè)委員會主辦、江蘇大學承辦的中國智能自動化大會(CIAC)在江蘇鎮(zhèn)江召開。小i機器人聯(lián)合北京郵電大學發(fā)表的論文《Discovering Bursty Events based on Enhanced Bursty Term Detection》在本屆大會上獲得“最佳論文獎”。
關于CIAC-2019
中國智能自動化大會(CIAC)是由中國自動化學會智能自動化專業(yè)委員會發(fā)起的系列學術會議,每一年或兩年舉辦一次,至今已成功舉辦13屆。CIAC-2019旨在為國內外智能自動化領域的研究者提供一個面對面的交流平臺。CIAC-2019邀請了來自高等院校、科研院所和產業(yè)部門的專家匯聚一堂,深入交流前沿學術思想,積極探討技術與產業(yè)的發(fā)展趨勢。
關于獲獎論文
本篇獲獎論文由小i機器人與北京郵電大學聯(lián)合發(fā)表,聚焦基于增強突發(fā)詞檢測的突發(fā)事件檢測方法(Discovering Bursty Events based on Enhanced Bursty Term Detection,Burst_NBT)。
以微博為例,微博作為一種實時交互的社交媒體,能夠提供給用戶作為社交平臺來發(fā)表內容、交換信息。許多真實的事件都是被微博首先揭露,然后再被傳統(tǒng)主流媒體報道,例如滴滴順風車事件、2018年重慶公交車墜江事件。因此,基于微博的突發(fā)事件檢測已經成為了一個研究熱點。
如何從微博中發(fā)現(xiàn)重要的突發(fā)事件目前還存在著挑戰(zhàn)。因為微博內容簡短多變、五花八門,充滿了各種類型的話題。例如對日常天氣的描述、個人心情的表達等。我們如何從微博博文中挖掘重要的突發(fā)事件,過濾掉不重要信息,并且區(qū)分屬于同一主題的不同事件?
目前業(yè)內針對短文本話題檢測已有一些方法。例如BTM直接對詞的共現(xiàn)模式進行建模、BBTM在BTM的基礎上將詞對的突發(fā)性作為先驗知識用于突發(fā)主題建模、Burst_ST抽取事件突發(fā)期間的hashtag,將提取關鍵詞用于描述檢測到的事件等……這些方法雖然對突發(fā)事件檢測的性能有所改善,但問題依然存在,而這些問題正是此次獲獎論文要解決的難點問題。
在本篇獲獎論文中提出的Burst_NBT由兩部分構成。第一部分,增強突發(fā)詞的檢測;第二部分,突發(fā)詞聚類與突發(fā)事件排序。增強突發(fā)詞的檢測由兩部分構成,分別是有意義字符串字典的構建與突發(fā)詞得分的計算。Burst_NBT利用微博中的hashtag與標題等信息構建有意義字符串字典,并利用突發(fā)詞的先驗信息計算突發(fā)詞得分,然后利用微博博文評論數(shù)平滑后的對數(shù)表示博文影響力。在大量數(shù)據(jù)集上的實驗結果驗證了Burst_NBT在突發(fā)事件檢測準確率以及事件描述準確性上均優(yōu)于其他方法。
注重產學研深度結合推動技術創(chuàng)新應用
經過多年的建設,小i機器人目前已經形成了三級技術研發(fā)體系:研究院—產品研發(fā)中心—解決方案中心。同時,小i機器人也非常重視產學研的深度結合,其中除了與華東師范大學、中國科學院軟件所、香港科技大學等建立了聯(lián)合實驗室外,也與中國科技大學、復旦大學、北京郵電大學、北京大學等建立了深度合作關系,在自然語言處理、文本挖掘及情感交互等多方面開展了深度研究工作。
小i機器人也一直將最新的認知智能技術研究成果和落地應用展示于國際頂級學術會議和賽事中。例如,小i機器人研究院團隊在今年7月的國際權威機器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中獨立參賽斬獲全球第三的成績;于今年8月再次參加IJCAI,分享在認知智能相關技術領域的突破等。
小i機器人核心技術的不斷突破與進階,將持續(xù)為社會、行業(yè)和客戶帶來更多價值。未來,小i機器人也將不斷加強與學界的合作,進一步提升人工智能技術水平,確保以更成熟的人工智能技術為更多的行業(yè)企業(yè)客戶提供服務。