AAAI 2020 開幕:百度28篇論文入選 涉及NLP、機器學習、視覺等領域

立春剛過,人工智能行業(yè)迎來2020年的第一個頂級學術大會,2月7日,AAAI 2020在美國紐約拉開了帷幕。本屆大會百度共有28篇論文被收錄,較AAAI 2019的15篇入選成績提升近一倍,本次入選論文涉及機器學習、自然語言處理、計算機視覺等多個領域,原計劃有多位百度重量級科學家、研究者將受邀赴會發(fā)表演講。受疫情影響,眾多中國學者將缺席本次大會,百度作為中國人工智能行業(yè)“頭雁”,通過積極的遠程參與,向世界展示技術、學術能力,提振中國AI開年信心。

自1979年成立至今,AAAI已舉辦34屆,大會匯集了全球頂尖的人工智能領域專家學者,可謂是人工智能行業(yè)的科研風向標。本屆會議共收到的有效論文投稿超過8800篇,其中7737 篇論文進入評審環(huán)節(jié),最終錄取數量為1591篇,錄取率為20.6%。其中百度入選28篇論文,再創(chuàng)百度參會入選論文數歷史新高,這一成績在全球范圍中也處于第一梯隊。此次入選的28篇論文覆蓋機器學習、自然語言處理、計算機視覺等領域,完成了在數量上和研究方向的雙向突破,創(chuàng)新科研能力可見一斑。

在NLP預訓練領域,百度入選論文《ERNIE 2.0: A Continual Pre-training Framework for Language Understanding》也被選做Oral進行展示。ERNIE 2.0是持續(xù)學習的語義理解框架,該框架可以增量地學習海量數據中的知識,持續(xù)提升語義理解效果。在ERNIE 2.0中,知識可通過預訓練任務的形式加入到訓練框架,每當引入新任務時,該框架可在學習該任務的同時,不遺忘之前學到過的信息。基于該框架,ERNIE 2.0模型通過命名實體預測、句子排序結構重建、語義邏輯關系預測等預訓練任務,從大規(guī)模訓練數據中獲取到詞法、句法、語義等多個維度的知識,大幅提升了通用語義理解水平。

ERNIE 2.0同現(xiàn)有的預訓練模型在英文數據集合GLUE和9個中文任務上進行了實驗。 模型在英語任務上幾乎全面優(yōu)于之前的SOTA模型BERT和XLNet,在7個GLUE任務上取得了最好的結果;中文任務上,ERNIE 2.0模型在所有9個中文NLP任務上全面優(yōu)于BERT。去年 12月,基于ERNIE 2.0改進的模型在GLUE上首次突破90大關,超越人類基線3個點拿到全球第一。

機器閱讀理解領域,百度入選論文《A Robust Adversarial Training Approach to Machine Reading Comprehension》,討論了機器閱讀理解模型面臨對抗攻擊時的效果魯棒性問題甚至安全問題。通過人工方式發(fā)現(xiàn)、總結并生成用于訓練對抗樣本的方式會產生需要人工參與的缺點,且不可能通過規(guī)則的方式枚舉出所有可能的對抗樣本類型及其規(guī)則。針對此,論文提出一種模型驅動的方式,使用自動對抗的方法無需人工參與,能夠自動地發(fā)現(xiàn)未觀察過的對抗樣本類型并最終提升閱讀理解的效果魯棒性。

該方法可以簡單地劃分為三個步驟:(1)對每個訓練樣本我們利用對抗的方法生成一個干擾向量輸入,使得它能夠誤導當前的閱讀理解模型;(2)采用貪心策略從干擾向量的詞匯權重中采樣得到對應的離散化的干擾文本;(3)使用干擾文本構建用于訓練的對抗樣本,并重新訓練閱讀理解模型并重復上述步驟直至收斂。

經實驗驗證,運用上論文中的對抗訓練方法后,在不同的對抗數據集上均有非常顯著的效果提升。并發(fā)現(xiàn)論文提出的模型驅動的方法確實能夠生成多樣性更加豐富的對抗樣本,從而補充人工規(guī)則的不足。同時也發(fā)現(xiàn)使用該方法生成的對抗樣本case仍然較為雜亂,并不具備很好的流利度甚至完全不是自然語言,因此當前對抗生成的方法仍然有較大提升空間。

在計算機視覺領域,百度入選論文《ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object Detection》,并選為oral進行展示。該論文提出了一個全新的雙目3D檢測框架ZoomNet,通過巧妙的利用自適應縮放來降低遠距離的深度估計誤差,以及學習部位特征來進一步提高3D檢測的表現(xiàn)。在主流的KITTI數據集3D檢測任務上,ZoomNet在驗證集上的平均精度(IoU閾值為0.5)超過Pseudo-LiDAR(CVPR19)近10個百分點。對于遠距離(>40m)的車輛,3D檢測精度比Pseudo-LiDAR高了120% 。

論文表示,對于每一個實例,ZoomNet在獲取左右邊界框后,首先對該實例在2D上做細粒度的分析。然后,2D上的前景像素點會被投影到3D空間中用于位姿的回歸。為了充分利用RGB圖像中豐富的紋理提示來進行更準確的視差估計,ZoomNet引入了一個概念簡單的模塊——自適應縮放,該模塊同時將2D實例邊界框的大小調整為統(tǒng)一的分辨率,并相應地調整了相機的固有參數,以實現(xiàn)從調整分辨率后的圖像中估計出更高質量的視差圖,以及對不同深度的實例構建相似密度的點云。此外,論文還提出通過學習實例的部位特征來提高對遮擋的魯棒性,極大的提高了3D檢測的性能。

入選論文數量的增加可以看出百度AI的學術能力已經獲得國際認可,而在技術研發(fā)、產業(yè)落地等方面,百度AI更是拿出實打實的“成績單”。

在過去一年中,百度深度學習平臺——百度飛槳,累計服務150多萬開發(fā)者,發(fā)布模型達到16.9萬個,成為中國首個也是目前國內唯一開源開放、功能完備的產業(yè)級深度學習平臺;百度大腦已經升級成“軟硬一體AI大生產平臺”,對外開放240項核心AI能力,服務超過150萬開發(fā)者,日均調用量突破1萬億次,語音、人臉、NLP、OCR 調用量中國第一;百度 Apollo已跑入23個城市,測試里程已經突破300萬公里,智能駕駛專利1237項,位列全國第一;截至2019年6月,搭載小度助手的智能設備激活數量已突破4億臺,小度助手語音交互超過36億次,前三季度,小度有屏音箱出貨量穩(wěn)居全球第一。

百度作為AAAI 2020的金牌贊助商,在全面展示論文研究成果的同時,百度展臺現(xiàn)場也十分火爆,現(xiàn)場交流者眾多,宣傳材料已被“搶光”。

作為中國AI的領軍者,百度AI既是中國AI的底氣,也是中國AI的信心。2020年伊始,百度AI憑借強有力的技術、科研實力,向全世界注入中國AI強心劑。未來,百度將繼續(xù)沖在前面,“產研”結合推動技術創(chuàng)新,帶領中國AI起舞于國際舞臺。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2020-02-11
AAAI 2020 開幕:百度28篇論文入選 涉及NLP、機器學習、視覺等領域
立春剛過,人工智能行業(yè)迎來2020年的第一個頂級學術大會,2月7日,AAAI 2020在美國紐約拉開了帷幕。

長按掃碼 閱讀全文