正在考慮入手的新家附近有多少公園?餐館里最佳的晚餐-酒搭配是什么?這些日常問題都需要關系推理——一種更高級思考的重要成分,而這卻是人工智能(AI)難以掌握的?,F(xiàn)在,谷歌DeepMind的研究者提出了一種處理這種推理的簡單方法,并在復雜圖像理解測試中擊敗了人類。
人類通常很擅長關系推理,利用邏輯連接和比較位置、順序和其他實體。但兩種主要AI——統(tǒng)計和符號,在發(fā)展類似的能力方面一直進展緩慢。統(tǒng)計AI,或者叫機器學習,善于模式識別,但不善于使用邏輯。而符號AI則能利用預定規(guī)則推理關系,但不善于學習。
credit: 煎蛋畫師六翼
新研究提出了一種縮小差距的方式:進行關系推理的人工神經網絡。類似于大腦中神經元的連接方式,神經網絡利用小型程序合作發(fā)現(xiàn)數據中的模式,針對圖像處理、語法分析或者游戲學習有特定的架構。在這種應用中,新的“關系網絡”單獨比較場景中的每一對目標。論文共同作者、在倫敦的DeepMind計算科學家Timothy Lillicrap說道:“我們明確要求網絡發(fā)現(xiàn)目標之間存在的關聯(lián)。”
他和他的團隊利用幾個任務測試了關系網絡。第一個是回答單幅圖像內物體之間的關系,比如立方、球形和圓柱的圖形。例如:“在這個藍色的東西前面有個物體,它的形狀和那個灰色金屬球右邊的小型青色物體的形狀一樣嗎?”針對這個任務,關系網絡與其他兩種神經網絡相結合了:一個識別圖像中的物體,另一個翻譯這個問題。研究者在上周發(fā)表在預覽商arXiv的論文中稱,通過進行眾多圖像和問題測試,發(fā)現(xiàn)其他機器學習方法的正確率大概是42%到77%,人類的正確率則是可敬的92%。而新的關系網絡正確率是96%,真是一個超越人類的成績。
DeepMind團隊還利用一個語言任務進行了測試。這個任務中網絡將接收到一些陳述,比如“Sandra撿起了那個足球”和“Sandra去辦公室了”。隨后就會提出一些問題比如:“球在哪里?”(辦公室)。該網絡在這些問題上的表現(xiàn)和其他類型問題上的一樣好,但最大放異彩的是所謂的推理問題:“Lily是一只天鵝。Lily是白色的。Greg是一只天鵝。Greg是什么顏色?”在這些問題上,關系網絡正確率為98%,而其競爭者的正確率約為45%。最后,該方法分析了10個到處亂蹦的球體的動畫,其中某些球體之間被不可見的彈簧或者棍子連接到一起。單單使用運動模式,該網絡就能鑒定出90%多的連接。然后使用相同的訓練去鑒定僅利用移動點表示的人類形態(tài)。
波士頓大學計算科學家Kate Saenko并未參與該新網絡的設計,但最近也合作提出了一種回答關于圖像的復雜問題的方法。他說道:“他們方法的一個優(yōu)點是概念上十分簡單。” Lillicrap稱其中大部分進步都可以用一個簡單的方程來表示,這種簡單性使其容易與其他網絡相結合,正如在上述物體比較任務中那樣。論文將其稱為“一個即插即用的模塊”,能使系統(tǒng)的其他部分專注于它們擅長的方面。
加利福尼亞帕洛阿爾托的斯坦福大學計算機科學家Justin Johnson合作設計了上述物體比較任務,并且合作提出了一種在該任務上表現(xiàn)良好的方法,他說道:“我深深為此成果而折服。” Saenko補充道,關系網絡未來可以幫助研究社交網絡,分析監(jiān)視視頻,或者導引交通流中的汽車。
Johnson說道,為了接近類人靈活性,該網絡還需要學會回答更多挑戰(zhàn)性的問題。做到這一點可能需要不僅僅比較一對事物,而是三個,四個或者更大集合中的某些對。他說道:“我對研究能自己提出新策略的模型很感興趣。DeepMind正在建立特殊類型推理的模型,而不是追求更一般化的關系推理。但這仍然是正確方向上的重要一步?!?/p>
論文原文:arXiv:1706.01427
本文譯自sciencemag,由譯者 CliffBao 基于創(chuàng)作共用協(xié)議(BY-NC)發(fā)布。Matthew Hutson
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )