大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室發(fā)布XLearning平臺

近兩年人工智能技術(shù)發(fā)展迅速,以Google開源的TensorFlow為代表的各種深度學(xué)習(xí)框架層出不窮。為了能讓國內(nèi)人工智能技術(shù)更好的落地,并且人工智能也是大數(shù)據(jù)分析的主要方法,作為大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室牽頭公司的360,其系統(tǒng)部大數(shù)據(jù)團隊與人工智能研究院基于長期的研究和實踐成果,開發(fā)了基于Hadoop大數(shù)據(jù)能力的人工智能平臺XLearning。大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室是國家發(fā)改委批準建設(shè)的國家級大數(shù)據(jù)安全研究創(chuàng)新平臺,是大數(shù)據(jù)領(lǐng)域唯一的由民營企業(yè)承擔的國家工程實驗室。該實驗室目前由360公司牽頭,主要負責大數(shù)據(jù)基礎(chǔ)架構(gòu)、安全防護和應(yīng)用領(lǐng)域方面的研究。

360 XLearning項目負責人李遠策表示, XLearning對于開發(fā)者意義重大,因為同行業(yè)公司都會有類似開發(fā)需求,XLearning則可以幫助他們實現(xiàn)調(diào)度的統(tǒng)一和服務(wù)器資源的復(fù)用。隨著平臺算法庫的不斷增容和優(yōu)化,開發(fā)者工作難度將大大降低。他們將有更多精力,用于功能的實現(xiàn)和代碼的優(yōu)化。此外,除了人工智能平臺XLearning之外,360在大數(shù)據(jù)開源技術(shù)領(lǐng)域也不斷創(chuàng)新,如Poseidon系統(tǒng)、pika系統(tǒng)等均是360在大數(shù)據(jù)領(lǐng)域的獨創(chuàng)開源技術(shù)。

圖1: 大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室

圖2: 360深度學(xué)習(xí)調(diào)度平臺XLearning

XLearning平臺將大數(shù)據(jù)與深度學(xué)習(xí)相融合,基于Hadoop Yarn完成了TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost等常用深度學(xué)習(xí)框架的集成,是典型的“AI on Hadoop”的實現(xiàn)。XLearning從今年4月份正式開發(fā)上線運行,經(jīng)多次版本迭代更新,為各學(xué)習(xí)框架的使用者提供了統(tǒng)一、穩(wěn)定的調(diào)度平臺,實現(xiàn)了資源共享,極大的提高了資源利用率,并且具有良好的擴展性和兼容性。

圖3:XLearning架構(gòu)

其中,Client是XLearning客戶端,負責啟動作業(yè)及獲取作業(yè)執(zhí)行狀態(tài); ApplicationMaster主要負責輸入數(shù)據(jù)分片、啟動及管理Container、執(zhí)行日志保存等; Container是作業(yè)的實際執(zhí)行者,負責啟動Worker或PS(Parameter Server)進程,監(jiān)控并向AM匯報進程狀態(tài),上傳作業(yè)的輸出等。對于TensorFlow類型作業(yè),還負責啟動Tensoard服務(wù)。

XLearning雖然架構(gòu)簡潔,但具有豐富的功能方便用戶進行模型訓(xùn)練,并依托于Yarn提供有作業(yè)資源的統(tǒng)一管理。首先,Xlearning平臺支持TensorFlow、MXNet分布式和單機模式,支持所有的單機模式的深度學(xué)習(xí)框架,如Caffe、Theano、PyTorch等;其次,XLearning提供多種模式用于數(shù)據(jù)的輸入、輸出,包括數(shù)據(jù)的流式讀寫、直接HDFS讀寫等,可根據(jù)作業(yè)處理的數(shù)據(jù)量與集群機器硬盤容量,視情況決定所采用的讀寫方式;再者,為方便用戶查看作業(yè)信息,XLearning提供可視化界面用于展示作業(yè)執(zhí)行進度和輸出日志等內(nèi)容;另外,XLearning還支持TensorFlow分布式模式的ClusterSpec自動分配構(gòu)建,單機模式和其他深度學(xué)習(xí)框架代碼不用做任何修改即可遷移到XLearning上,便于用戶快速使用;最后,利用深度學(xué)習(xí)框架本身的Checkpoint機制和直接讀寫HDFS數(shù)據(jù)功能,XLearning方便用戶實現(xiàn)訓(xùn)練恢復(fù)繼續(xù)執(zhí)行。

作為國內(nèi)人工智能領(lǐng)域的先行者,360公司以平臺開源的形式,實現(xiàn)了行業(yè)已有資源的集成和優(yōu)化。相信未來,以360公司牽頭的大數(shù)據(jù)安全協(xié)同技術(shù)國家工程實驗室將為提升我國網(wǎng)絡(luò)安全和大數(shù)據(jù)人工智能產(chǎn)業(yè)和學(xué)界的整體水平貢獻更多力量。


免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-12-14
大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室發(fā)布XLearning平臺
近兩年人工智能技術(shù)發(fā)展迅速,以Google開源的TensorFlow為代表的各種深度學(xué)習(xí)框架層出不窮。為了能讓國內(nèi)人工智能技術(shù)更好的落地,并且人工智能也是大數(shù)據(jù)分析的主要方法,作為大數(shù)據(jù)協(xié)同安全技術(shù)國家工程實驗室牽頭公司的360,其系統(tǒng)部大數(shù)據(jù)團隊與人工智能研究院基于長期的研究和實

長按掃碼 閱讀全文