圖靈測(cè)試的著名目標(biāo)是測(cè)試人類與人交談和與機(jī)器交談時(shí)的任務(wù),從而測(cè)試人工智能的能力。它測(cè)試了AI充分理解人類語(yǔ)言以進(jìn)行自然的對(duì)話的能力。
任何試圖與AI聊天機(jī)器人或虛擬助手進(jìn)行對(duì)話的人都可以證明,在技術(shù)掌握這種最人類能力之前,還有一段路要走。馬里蘭大學(xué)的一項(xiàng)新研究旨在通過(guò)識(shí)別約1200個(gè)問(wèn)題來(lái)幫助AI進(jìn)步,這些問(wèn)題雖然對(duì)人類來(lái)說(shuō)很容易回答,但傳統(tǒng)上卻阻礙了當(dāng)今可用的最佳技術(shù)。
研究人員解釋說(shuō):大多數(shù)回答問(wèn)題的計(jì)算機(jī)系統(tǒng)都無(wú)法解釋為什么它們以自己的方式回答,但是我們的工作可以幫助我們了解計(jì)算機(jī)真正理解了什么。此外,我們已經(jīng)產(chǎn)生了一個(gè)數(shù)據(jù)集以在計(jì)算機(jī)上進(jìn)行測(cè)試,這將揭示計(jì)算機(jī)語(yǔ)言系統(tǒng)是否實(shí)際上正在閱讀并進(jìn)行人類能夠進(jìn)行的相同類型的處理。
更智能的機(jī)器
研究人員解釋說(shuō),當(dāng)今運(yùn)行的許多問(wèn)答系統(tǒng)都依靠人或計(jì)算機(jī)來(lái)生成旨在訓(xùn)練系統(tǒng)的問(wèn)題。這種方法的問(wèn)題在于,很難理解為什么計(jì)算機(jī)努力地正確回答問(wèn)題。研究人員認(rèn)為,通過(guò)更好地了解機(jī)器的殘端,我們可以更好地設(shè)計(jì)數(shù)據(jù)集進(jìn)行訓(xùn)練。
團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)系統(tǒng),該系統(tǒng)能夠在嘗試回答每個(gè)問(wèn)題時(shí)顯示其思維過(guò)程,他們認(rèn)為,該系統(tǒng)不僅可以洞悉計(jì)算機(jī)正在經(jīng)歷的過(guò)程,而且如果部署在實(shí)際環(huán)境中,則可以讓人類提問(wèn)者修改其查詢范圍。
人與機(jī)器之間的伙伴關(guān)系使1,213項(xiàng)已被計(jì)算機(jī)擊敗的問(wèn)題得以成功回答。
作者解釋說(shuō):三到四年來(lái),人們已經(jīng)意識(shí)到計(jì)算機(jī)問(wèn)答系統(tǒng)非常脆弱,很容易被愚弄。但是這是我們知道的第一篇論文,實(shí)際上是使用機(jī)器來(lái)幫助人類打破模型本身。
該團(tuán)隊(duì)認(rèn)為,這些問(wèn)題將成為有價(jià)值的數(shù)據(jù)集,以更好地指導(dǎo)自然語(yǔ)言處理工作,同時(shí)還可以充當(dāng)訓(xùn)練數(shù)據(jù)集,尤其是當(dāng)這些問(wèn)題揭示了使基于AI的系統(tǒng)感到困惑的六個(gè)不同現(xiàn)象時(shí)。
這些失敗出現(xiàn)在語(yǔ)言領(lǐng)域,例如釋義或意想不到的上下文,或者推理能力的失敗,例如問(wèn)題中各個(gè)元素的三角剖分或在得出結(jié)論時(shí)要求使用多個(gè)步驟。
研究人員解釋說(shuō):人類能夠進(jìn)行更多的概括,并看到更深的聯(lián)系。他們沒(méi)有無(wú)限的計(jì)算機(jī)存儲(chǔ)空間,但是他們?nèi)匀荒軌蛟谏种锌吹綐?shù)木。對(duì)計(jì)算機(jī)存在的問(wèn)題進(jìn)行分類有助于我們理解我們需要解決的問(wèn)題,以便我們實(shí)際上可以使計(jì)算機(jī)開(kāi)始通過(guò)樹(shù)木看森林,并以人類的方式回答問(wèn)題。
可以說(shuō),在這種情況出現(xiàn)之前,還有很長(zhǎng)的路要走,但是這項(xiàng)研究有趣地表明,在使機(jī)器更好地導(dǎo)航人類語(yǔ)言的細(xì)微差別方面取得了進(jìn)展。