AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
2019 年 10 月 27 日-11 月 2 日,全球計(jì)算機(jī)視覺頂級會議之一 ICCV(IEEE International Conference on Computer Vision,國際計(jì)算機(jī)視覺大會)在韓國首爾順利舉行,7500 余位來自 59 個國家的計(jì)算機(jī)視覺學(xué)者齊聚現(xiàn)場,共享盛會。今年的會議不論是在參會人數(shù)還是論文提交數(shù)量,相較去年都足足增加了一倍。此外,根據(jù)官方數(shù)據(jù)顯示,在大會接收論文中,此次中國學(xué)者的研究成果數(shù)量排名第一,遙遙領(lǐng)先。
專注于計(jì)算機(jī)視覺技術(shù)研發(fā)與落地的碼隆科技今年共有 4 篇第一單位論文入選,研究方向涵蓋弱監(jiān)督學(xué)習(xí)算法、文字檢測與識別模型及服裝圖像生成框架的搭建等細(xì)分領(lǐng)域,包括:
Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation
Convolutional Character Networks
FiNet: Compatible and Diverse Fashion Image Inpainting (Oral)
ClothFlow: A Flow-Based Model for Clothed Person Generation
并憑借“The iMaterialist Fashion Attribute Dataset”研究成果獲得了“Computer Vision for Fashion, Art and Design”主題分會(workshop)頒發(fā)的最佳論文。
探索邊界,學(xué)術(shù)成果獲肯定
ICCV 2019 共有 1075 篇論文被接收,一向以接收率低而著稱的它,此次接收率也僅為25%,其中口頭報告論文更是僅有4.6%。碼隆科技此行收獲頗豐,其作為第一單位共有4篇論文被接收,其中包含一篇口頭報告論文。
1
10 月 31 日,碼隆科技在備受關(guān)注的主會場(Main Conference)分享了 ICCV 2019 口頭報告論文“FiNet: Compatible and Diverse Fashion Image Inpainting”的研究內(nèi)容。
AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
近年來,專注于時尚分析的計(jì)算機(jī)視覺研究發(fā)展快速,其中視覺上的兼容與協(xié)調(diào)對其尤為重要,然而現(xiàn)有的時尚圖像生成系統(tǒng)在此方面卻仍然有所欠缺。碼隆科技在 ICCV 2019 口頭報告論文中指出可通過時尚圖像修復(fù)來對視覺上的搭配兼容性進(jìn)行顯式的建模,并提出了 Fashion Inpainting Networks(FiNet,時尚圖像補(bǔ)全網(wǎng)絡(luò))。這是一個兩階段的圖像到圖像生成框架,能夠?qū)崿F(xiàn)視覺上兼容協(xié)調(diào)但不失多樣化的圖像修復(fù)技術(shù),這一研究可為服裝重建和時尚風(fēng)格遷移等相關(guān)任務(wù)提供有力的工具。
AIDQg56+H6K665paH5YWl6YCJIElDQ1YgMjAxOe+8jOWJjeayv+Wtpuacr+aIkOaenOi1i+iDvembtuWUrg=="/>
2
11 月 1 日,碼隆科技專注于服飾生成算法的研究“ClothFlow: A Flow-Based Model for Clothed Person Generation”在 Poster 環(huán)節(jié)進(jìn)行了展示。
在該學(xué)術(shù)工作中,碼隆科技提出了一種基于外觀流的生成模型 —— ClothFlow,這一模型能夠合成特定姿態(tài)的人物服裝圖像,以用于基于姿態(tài)引導(dǎo)的人物圖像生成和虛擬試衣。通過估計(jì)源服裝區(qū)域和目標(biāo)服裝區(qū)域之間的稠密流場,ClothFlow 模型能夠有效地針對幾何形變進(jìn)行建模,并自然地進(jìn)行外觀遷移以合成與眾不同的服裝圖像,如下圖所示。
3
近年來,弱監(jiān)督學(xué)習(xí)越來越受到學(xué)界和業(yè)界的關(guān)注。10 月 30 日,碼隆科技專注于弱監(jiān)督學(xué)習(xí)算法的論文“Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation” 向參會者展示了與其日常工作緊密相關(guān)的算法研究。
這一研究致力于在僅僅給定圖像級別標(biāo)簽的情況下精確地檢測與分割物體實(shí)例。因?yàn)槭止?biāo)注大量訓(xùn)練數(shù)據(jù)代價高昂,與監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)等方式相比,它是更適用于現(xiàn)實(shí)應(yīng)用的技術(shù)。與以前那些包含多個離線模塊的方法不同的是,本篇論文提出了序列化標(biāo)簽傳播與增強(qiáng)網(wǎng)絡(luò)(縮寫為 Label-PEnet)。Label-PEnet 基于一種由粗到細(xì)的方式,可以遞進(jìn)地將圖像級別的標(biāo)簽轉(zhuǎn)化成像素級標(biāo)簽,極大程度地提升了圖像數(shù)據(jù)在工業(yè)場景中的應(yīng)用效率。
4
自然場景下的文字檢測與識別是近年來的熱點(diǎn)研究方向之一,但相較于技術(shù)已經(jīng)相對成熟的打印文檔文字識別,自然場景中的文本識別仍具困難,比如文字的呈現(xiàn)可以有多種方向、多樣的顏色和字體等,這些情況都為文字檢測與識別技術(shù)在現(xiàn)實(shí)生活中的應(yīng)用帶來了挑戰(zhàn)。
11 月 1 日,主題為“Convolutional Character Networks”的論文在 Poster 展示環(huán)節(jié)中詳盡地呈現(xiàn)了碼隆科技在 ICCV 2019 上提出的一種單階段模型——卷積字符網(wǎng)絡(luò) - CharNet (Convolutional Character Networks)。CharNet 第一次實(shí)現(xiàn) one-stage 模型的文字檢測和識別。
此外,11 月 2 日,碼隆科技還受邀參加了“Computer Vision for Fashion, Art and Design ”主題分會(workshop)。此前,碼隆科技與 GoogleAI 聯(lián)合發(fā)布了 iFashion 數(shù)據(jù)庫,其相關(guān)研究“The iMaterialist Fashion Attribute Dataset”本次也斬獲了該場 workshop 最佳論文的榮譽(yù)。
暢聊AI,技術(shù)落地進(jìn)展獲關(guān)注
作為 ICCV 2019 的黃金贊助商,碼隆科技在展會期間展示了 RetailAI 系列智能零售解決方案,如智能貨柜解決方案、資產(chǎn)保護(hù)解決方案、智能稱重解決方案等,進(jìn)一步與參會者分享了前沿技術(shù)在工業(yè)界的扎實(shí)應(yīng)用,獲得了大家的廣泛關(guān)注。
展會現(xiàn)場,碼隆科技成員們與眾多計(jì)算機(jī)視覺學(xué)者就其研究方向與落地進(jìn)展進(jìn)行了深入交流。同時,在會議期間,眾學(xué)者前往碼隆展臺就其關(guān)于弱監(jiān)督學(xué)習(xí)算法、文字檢測與識別模型、服裝圖像生成框架的研究工作進(jìn)行探討。
眾多計(jì)算機(jī)視覺研究者前來碼隆科技展位交流技術(shù)進(jìn)展
結(jié)語
自2014年創(chuàng)立以來,碼隆科技持續(xù)專注于計(jì)算機(jī)視覺技術(shù)在商品識別領(lǐng)域的研發(fā)與落地應(yīng)用。至今,碼隆科技在計(jì)算機(jī)視覺領(lǐng)域的頂級會議 ICCV、CVPR、ECCV上發(fā)表了十余篇學(xué)術(shù)論文,引起了眾多知名學(xué)者的關(guān)注。未來,碼隆科技將繼續(xù)攜手學(xué)術(shù)界,努力拓展技術(shù)邊界,并與工業(yè)界一同致力于推進(jìn)前沿技術(shù)在真實(shí)世界的應(yīng)用與落地,全方位實(shí)現(xiàn) AI 前沿技術(shù)的創(chuàng)新價值。
- 蔚來新ET5/ET5T/EC6冠軍紀(jì)念版上市:運(yùn)動化調(diào)教+專屬套件,價格親民!
- 華為鴻蒙智駕半年行駛里程超16億公里:80萬輛車見證智能出行新篇章
- 領(lǐng)克10 EM-P智能電混亮眼登場:四驅(qū)+激光雷達(dá),科技與性能的完美融合
- 蘋果自研云芯大突破:降降亞馬遜云高價,重塑行業(yè)格局
- iPhone新功能遭熱議:制冷模式能否拯救炎炎夏日?
- Lumo AI合規(guī)助手:讓奇富科技告別繁瑣合規(guī)管理,效率提升20倍
- 現(xiàn)代汽車揭幕韓國氫能新篇章:2028投產(chǎn)氫燃料工廠,綠色未來已觸手可及
- 揭秘ChatGPT名稱由來:OpenAI高層道出背后故事,人工智能如何從無到有?
- 格力高管回應(yīng)董明珠掉出《財(cái)富》榜單:影響力不等于財(cái)富,傳奇仍在繼續(xù)
- ASML獨(dú)家披露:EUV光刻機(jī)僅售5臺,Intel悄然轉(zhuǎn)變,光刻機(jī)不再那么重要了
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。