推出面向企業(yè)的ProductAI 商品識別領(lǐng)域的AI賦能者

凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預(yù)測的是,人工智能將是未來20年內(nèi)最重要的技術(shù)趨勢,創(chuàng)業(yè)企業(yè)的方向應(yīng)該很明確,就是將人工智能應(yīng)用于某個領(lǐng)域。

近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關(guān)注于如何讓自家的產(chǎn)品更加智能,但有這么一家公司卻立下 flag,要做商品識別領(lǐng)域的人工智能賦能者,讓別人的產(chǎn)品更加智能。

專訪 AI,這家公司要做商品識別領(lǐng)域的 AI 賦能者" />

Matt Scott

在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網(wǎng),和其他人工智能公司不同,碼隆科技是將商品識別方面的技術(shù)開放給其他企業(yè),使得他們能夠運(yùn)用這些技術(shù)去搭建屬于自己的商品識別引擎。

而碼特提及的人工智能技術(shù),碼隆科技已將其搭建成一個人工智能平臺—ProductAI。

什么是ProductAI 平臺?

商品識別

在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網(wǎng),大家都熟悉人臉識別,通過人工智能分類技術(shù)可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領(lǐng)域來說,通過人工智能技術(shù)可以提取出服飾的材質(zhì)、色彩、風(fēng)格等特征。

但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領(lǐng)域,碼特說。

專訪

ProductAI 的登錄界面

ProductAI

碼特告訴雷鋒網(wǎng),商品識別技術(shù)的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運(yùn)用適用于這個行業(yè)的算法去搭建這些垂直領(lǐng)域的模型,由此產(chǎn)生針對垂直領(lǐng)域的商品識別結(jié)果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。

企業(yè)能夠運(yùn)用這些功能去搭建他們自己的商品識別服務(wù),而碼隆則將上述提供的服務(wù)進(jìn)行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運(yùn)用人工智能商品識別服務(wù)的入口。

專訪

ProductAI的核心技術(shù)服務(wù)

據(jù)碼特介紹,針對垂直領(lǐng)域,ProductAI有兩大核心技術(shù)服務(wù):

垂直領(lǐng)域圖像檢索(Vertical AI Image Retrieval)

垂直領(lǐng)域自動標(biāo)注(Vertical Auto-Tagging)

垂直領(lǐng)域商品檢索服務(wù)

在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領(lǐng)域,碼特告訴雷鋒網(wǎng),現(xiàn)在又新增了在車輛、酒類、家具等垂直領(lǐng)域的模型,未來還將持續(xù)擴(kuò)充人工智能在商品識別的垂直場景。

在擴(kuò)充了使用場景后,問題也隨之而來:這個橫跨多領(lǐng)域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調(diào)用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:

第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務(wù)中,選擇所屬行業(yè)的場景服務(wù),然后運(yùn)用到自己的產(chǎn)品中,以獲得最好的性能。提到圖像檢索服務(wù),人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領(lǐng)域?qū)S谜Z言(Domain Specific Language)進(jìn)行搜索引擎搭建,通用模型的商品檢索精確度往往差強(qiáng)人意。

第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎(chǔ)上,我們使用了多任務(wù)的深度度量學(xué)習(xí)(Deep Metric Learning)來訓(xùn)練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領(lǐng)域,能夠獲得更加精確的檢索結(jié)果。

關(guān)于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內(nèi)遙遙領(lǐng)先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準(zhǔn)點(Public Benchmarks)進(jìn)行比較。

第三點:速度。我們花費(fèi)了非常多的精力將二值神經(jīng)網(wǎng)絡(luò)和分布計算的技術(shù)運(yùn)用在深度學(xué)習(xí)網(wǎng)絡(luò)當(dāng)中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。

第四點:費(fèi)用。我們一直在努力降低服務(wù)成本,以便讓更多企業(yè)能夠受益于這項服務(wù)。

垂直領(lǐng)域的商品圖像自動標(biāo)注服務(wù)

專訪

如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術(shù)還能對圖片進(jìn)行實體檢測,定位圖中實體,同時提供可定制的標(biāo)注信息,碼特告訴雷鋒網(wǎng)。

說起圖像標(biāo)注,碼特說,讓我們來聊一個當(dāng)下比較熱的話題:如何提升訓(xùn)練數(shù)據(jù)的效率?

對于人工智能公司而言,想要獲取到海量的有標(biāo)注數(shù)據(jù)難度是比較大的,我們內(nèi)部有專門的團(tuán)隊負(fù)責(zé)這部分的信息收集,從而提供數(shù)以百萬計的標(biāo)注數(shù)據(jù),目前做得很不錯。

這個就是業(yè)界普遍在做的監(jiān)督學(xué)習(xí),但我們同時也正在往半監(jiān)督學(xué)習(xí)(Semi-supervise Learning) 的階段前進(jìn),生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Networks)就是一種很好的方法。

有了生成對抗網(wǎng)絡(luò),我們就可以不需要像過去那么多高質(zhì)量的標(biāo)簽數(shù)據(jù),而是通過一些技術(shù)去獲取這些數(shù)據(jù)。在以一定數(shù)量的標(biāo)注數(shù)據(jù)作為訓(xùn)練基礎(chǔ)的情況下,將這些技術(shù)應(yīng)用于訓(xùn)練分割、檢測、分類、圖像檢索這些任務(wù),從而減輕訓(xùn)練海量標(biāo)注數(shù)據(jù)的負(fù)擔(dān)。

有哪些實際的應(yīng)用?

以圖搜圖

1、布料搜索

專訪

顧名思義,通過在 ProductAI 平臺上建立的 “以圖搜布” 面料商品圖像搜索引擎,人們只需要對著想要購買的面料拍攝一張照片,系統(tǒng)會先識別出面料的圖形與花色,然后生成相應(yīng)的購買鏈接。碼特說道,這個案例是 ProductAI 的第一個應(yīng)用,目前中國前 10 大紡織面料企業(yè),有 7 家已經(jīng)接入了這個服務(wù)。

圖像搜索引擎有非常廣闊的行業(yè)應(yīng)用空間,尤其針對一些難以用語言描述的場景,比如布料的花紋和質(zhì)地,用視覺方式檢索就會很直接。碼特補(bǔ)充道。

2、時尚商品搜索

專訪

只要將服裝網(wǎng)站上的喜歡的款式截圖,復(fù)制粘貼到基于 ProductAI 的圖像搜索引擎上,便可以迅速得到服裝的批發(fā)購買鏈接。即使服裝商品圖片經(jīng)過PS、翻轉(zhuǎn)、變形,即使有些相同衣服的模特不同,也能夠搜索出來。同時,同樣款式的衣服可以一起被搜索出來,供消費(fèi)者進(jìn)行比價挑選。

時尚分析與趨勢預(yù)測

專訪

作為面料紡織行業(yè)權(quán)威機(jī)構(gòu),中國紡織信息中心需要預(yù)測流行色等未來的趨勢,再把預(yù)測信息和整個產(chǎn)業(yè)進(jìn)行分享,起到引領(lǐng)風(fēng)潮的作用。通過自動抽取海量T臺圖像信息中的主體色彩,ProductAI 能夠在短時間內(nèi)完成顏色分析,總結(jié)出整體趨勢,減少了人力觀測成本,碼特說。

出版物識別

專訪

ProductAI 還可以提供出版物識別技術(shù),一個典型的例子是《光明日報》在嵌入人工智能識別技術(shù)后,只要對著報紙拍一張照片,便可實時識別出與之相關(guān)聯(lián)的全媒體信息,如視頻等,搭建起了虛擬與現(xiàn)實的橋梁。

碼隆科技創(chuàng)業(yè)路線

2014年7月,黃鼎隆與曾經(jīng)微軟的同事Matt Scott(碼特) 聯(lián)合創(chuàng)立了碼隆科技,可以看出公司的名稱就是兩位創(chuàng)業(yè)者名字的結(jié)合。

2015年1月,碼隆科技入選微軟創(chuàng)投加速器。同時推出了面向C端的以圖搜圖的移動應(yīng)用StyleAI,希望用圖像識別結(jié)合深度學(xué)習(xí)來破解時尚密碼。

2015年3月,達(dá)晨創(chuàng)投和遠(yuǎn)鏡創(chuàng)投共同為碼隆科技注入1200萬元天使投資。

2016年7月,碼隆科技完成了6200萬人民幣的A輪融資。

2016年10月,碼隆科技正式發(fā)布人工智能視覺應(yīng)用平臺—ProductAI 。

對中美人工智能發(fā)展的看法

專訪

專訪

作為一個在中國創(chuàng)業(yè)的美國人,碼特?fù)碛?40 多項中美專利、發(fā)表了 13 篇國際頂級論文,有著十多年的開發(fā)經(jīng)驗和微軟亞洲研究院高級研發(fā)主管的工作經(jīng)歷,所以談及中美在人工智能方面學(xué)術(shù)與商業(yè)化的話題,他感觸頗深:

就學(xué)術(shù)研究而言,根據(jù)2016年美國白宮發(fā)表的人工智能戰(zhàn)略報告,自2014年起,中國在人工智能領(lǐng)域所發(fā)表的論文與期刊數(shù)量,及被引用文章數(shù)皆已位居世界之首。中國近幾年在人工智能領(lǐng)域的研究發(fā)展已超越美國,成為世界領(lǐng)先的代表。

商業(yè)化方面,因為中國更大、人更多、企業(yè)也更多,同時中國專注于某些美國不會重點關(guān)注的領(lǐng)域,如:制造業(yè)、硬件等。在中國,人工智能更有機(jī)會在垂直行業(yè)中發(fā)揮更大的影響力。當(dāng)人工智能遇上攝像頭這類的硬件產(chǎn)品,會發(fā)揮巨大的價值。而當(dāng)人工智能助力制造業(yè)時,對全世界都能夠帶來更大的影響力。舉例來說在中國深圳,這個制造業(yè)之鄉(xiāng),機(jī)器人產(chǎn)業(yè)最為繁榮的中國城市,現(xiàn)階段達(dá)到如此巨大規(guī)模的發(fā)展,放眼世界,只有在中國才可能發(fā)生。

當(dāng)雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))問及碼隆下一步的計劃時,碼特的回答簡潔而有力,我們希望能夠在垂直領(lǐng)域做得更加深入,并進(jìn)軍國際市場。

凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預(yù)測的是,人工智能將是未來20年內(nèi)最重要的技術(shù)趨勢,創(chuàng)業(yè)企業(yè)的方向應(yīng)該很明確,就是將人工智能應(yīng)用于某個領(lǐng)域。

近兩年,人工智能創(chuàng)業(yè)公司如雨后春筍一般不斷涌現(xiàn),但是大部分的企業(yè)是關(guān)注于如何讓自家的產(chǎn)品更加智能,但有這么一家公司卻立下 flag,要做商品識別領(lǐng)域的人工智能賦能者,讓別人的產(chǎn)品更加智能。

專訪

Matt Scott

在2017年北京GMIC大會期間,碼隆科技聯(lián)合創(chuàng)始人兼 CTO 碼特(Matt Scott)告訴雷鋒網(wǎng),和其他人工智能公司不同,碼隆科技是將商品識別方面的技術(shù)開放給其他企業(yè),使得他們能夠運(yùn)用這些技術(shù)去搭建屬于自己的商品識別引擎。

而碼特提及的人工智能技術(shù),碼隆科技已將其搭建成一個人工智能平臺—ProductAI。

什么是ProductAI 平臺?

商品識別

在弄清楚 ProductAI 平臺之前,需要先介紹一下商品識別的概念。碼特告訴雷鋒網(wǎng),大家都熟悉人臉識別,通過人工智能分類技術(shù)可以提取出如性別、年齡、種族等信息,那么商品識別也類似,拿時尚領(lǐng)域來說,通過人工智能技術(shù)可以提取出服飾的材質(zhì)、色彩、風(fēng)格等特征。

但是區(qū)別之處在于,商品里既包含酒瓶、車輛、家具這樣的剛性物體,也包含服飾面料等易折疊的柔性物體。除了易褶皺這樣的屬性,柔性物體上的面料紋路和圖案也不盡相同,所以相對介于剛性和柔性之間的人臉,柔性物體的識別難度更大,而這個也正是碼隆科技投入大量精力去鉆研并且擅長的領(lǐng)域,碼特說。

專訪

ProductAI 的登錄界面

ProductAI

碼特告訴雷鋒網(wǎng),商品識別技術(shù)的背后需要有海量商品數(shù)據(jù)的支持,通過收集針對某些垂直行業(yè)的商品圖像數(shù)據(jù),運(yùn)用適用于這個行業(yè)的算法去搭建這些垂直領(lǐng)域的模型,由此產(chǎn)生針對垂直領(lǐng)域的商品識別結(jié)果,如:分類(Classification)、檢測(Detection)、分割(Segmentation)、檢索(Retrieval)等等。

企業(yè)能夠運(yùn)用這些功能去搭建他們自己的商品識別服務(wù),而碼隆則將上述提供的服務(wù)進(jìn)行整合,搭建成一個人工智能平臺—ProductAI。也就是說,ProductAI是企業(yè)運(yùn)用人工智能商品識別服務(wù)的入口。

專訪

ProductAI的核心技術(shù)服務(wù)

據(jù)碼特介紹,針對垂直領(lǐng)域,ProductAI有兩大核心技術(shù)服務(wù):

垂直領(lǐng)域圖像檢索(Vertical AI Image Retrieval)

垂直領(lǐng)域自動標(biāo)注(Vertical Auto-Tagging)

垂直領(lǐng)域商品檢索服務(wù)

在圖像檢索方面,除了上文中提到的碼隆擅長的時尚、紡織面料等領(lǐng)域,碼特告訴雷鋒網(wǎng),現(xiàn)在又新增了在車輛、酒類、家具等垂直領(lǐng)域的模型,未來還將持續(xù)擴(kuò)充人工智能在商品識別的垂直場景。

在擴(kuò)充了使用場景后,問題也隨之而來:這個橫跨多領(lǐng)域的智能識別系統(tǒng),如何能保證其既能實時處理上億數(shù)據(jù),又能處理不同類別的調(diào)用請求? 還能保證高性價比?對此,碼特分享了碼隆的做法:

第一點:我們首次提出“場景選擇” (Scenario Selection)的概念,用戶可在圖像檢索服務(wù)中,選擇所屬行業(yè)的場景服務(wù),然后運(yùn)用到自己的產(chǎn)品中,以獲得最好的性能。提到圖像檢索服務(wù),人們會想到谷歌和百度的以圖搜圖功能,但是他們大多使用的是通用模型,相較于我們使用垂直領(lǐng)域?qū)S谜Z言(Domain Specific Language)進(jìn)行搜索引擎搭建,通用模型的商品檢索精確度往往差強(qiáng)人意。

第二點:算法。除了擁有億級以上的垂直行業(yè)圖像數(shù)據(jù)以外,在每個垂直行業(yè)的基礎(chǔ)上,我們使用了多任務(wù)的深度度量學(xué)習(xí)(Deep Metric Learning)來訓(xùn)練端到端的圖像檢索模型,這使得我們相較于其他人工智能公司,在商品識別方面,特別是難度最大的柔性商品識別領(lǐng)域,能夠獲得更加精確的檢索結(jié)果。

關(guān)于精確度的考量,可以說碼隆現(xiàn)已在業(yè)內(nèi)遙遙領(lǐng)先,而且我們有信心與 CVPR, ICCV, ECCV 等國際頂尖論文的公開基準(zhǔn)點(Public Benchmarks)進(jìn)行比較。

第三點:速度。我們花費(fèi)了非常多的精力將二值神經(jīng)網(wǎng)絡(luò)和分布計算的技術(shù)運(yùn)用在深度學(xué)習(xí)網(wǎng)絡(luò)當(dāng)中,以實現(xiàn)大規(guī)模且高效率的查詢檢索。

第四點:費(fèi)用。我們一直在努力降低服務(wù)成本,以便讓更多企業(yè)能夠受益于這項服務(wù)。

垂直領(lǐng)域的商品圖像自動標(biāo)注服務(wù)

專訪

如上圖所示,除了商品檢索之外,ProductAI 的圖像識別技術(shù)還能對圖片進(jìn)行實體檢測,定位圖中實體,同時提供可定制的標(biāo)注信息,碼特告訴雷鋒網(wǎng)。

說起圖像標(biāo)注,碼特說,讓我們來聊一個當(dāng)下比較熱的話題:如何提升訓(xùn)練數(shù)據(jù)的效率?

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-05-19
推出面向企業(yè)的ProductAI 商品識別領(lǐng)域的AI賦能者
凱文·凱利曾說,未來20年最偉大的事情可能還沒有出現(xiàn),但可以預(yù)測的是,人工智能將是未來20年內(nèi)最重要的技術(shù)趨勢,創(chuàng)業(yè)企業(yè)的方向應(yīng)該很明確,就是將人工智能應(yīng)用于某

長按掃碼 閱讀全文