2022 年的 3 月,或將被寫入自動駕駛史冊——美國頒布無人駕駛法規(guī),中國也許將從政策層面允許 L3 自動駕駛乘用車上路,國內首條支持自動駕駛的快速路通車運營…… 毫無疑問,自動駕駛已經逐漸從快速迭代邁入大規(guī)模落地階段。在這個 “臨門一腳” 的關鍵時刻,想要讓汽車本身的算法做到處理更多、更復雜的場景,不可或缺的是海量的場景數據支撐。
通過對話國內唯一 A 股上市數據服務商—海天瑞聲,透視 AI 數據在助推自動駕駛實現的路上,所面臨的機會與挑戰(zhàn)。
一、自動駕駛數據迎來爆發(fā)期
2022 年將會是自動駕駛商業(yè)化轉折點。
回溯 2021 年底,北京成為國內首個明確認可 「 RoboTaxi 」 商業(yè)化試點的城市,標志著國內自動駕駛賽道迎來商業(yè)化運營階段。
相關數據和圖片來自 36 氪、漢能投資發(fā)布的《2022 中國自動駕駛行業(yè)研究報告》
Gartner 公司 2022 年汽車行業(yè)十大業(yè)務趨勢
常規(guī)自動駕駛汽車服務啟動,挑戰(zhàn)隨之而來,也是值得關注的業(yè)務趨勢之一
目前,自動駕駛主流算法模型主要以有監(jiān)督學習為主,這需要大量的標注數據對模型進行訓練和調優(yōu)。只有通過各個場景的數據迭代,自動駕駛才可能真正落地。
是否能高效獲取大量標注數據直接決定了各家能否獲得自動駕駛市場上的先發(fā)優(yōu)勢。
盡管一些行業(yè)頭部企業(yè)已經內部搭建起數據標注團隊,訓練數據服務商依然是它們背后無法忽略的存在。
作為國內訓練數據行業(yè)的領頭羊,海天瑞聲近幾年也開始與一些傳統(tǒng)車企、造車新勢力以及頭部自動駕駛技術公司合作,探索如何幫助合作伙伴最大程度釋放自動駕駛數據的價值。
IDC 預測,到 2025 年,中國人工智能數據采標服務市場規(guī)模將達到 123.4 億元人民幣。市場的發(fā)展驅動力一方面來源于人工智能市場的迅猛發(fā)展,另一方面來源于行業(yè)用戶加大數據采集力度。
IDC 數據顯示,自動駕駛也是 AI 基礎服務市場當中最具增長潛力的行業(yè)
二、把好「第一關」:數據方案的設計能力
與智能家居、新零售、安防等垂直領域相比,自動駕駛的數據需求格外“苛刻”,對數據服務商也提出了新的挑戰(zhàn)。
例如,數據樣本豐富度層面,場景覆蓋全面的數據集對自動駕駛系統(tǒng)安全性至關重要。想象一下,如果高速路上突然出現一群野象,或者突然有人橫穿馬路,自動駕駛汽車該如何應對?
這類 Corner case 數據很難采集,我們不可能真的找一群野象去高速上漫步,然后采集數據。
對于這些現實生活中完全有可能發(fā)生的情況,系統(tǒng)如果識別不了,將會導致嚴重的后果甚至生命損失。所以,相應的數據必不可少,無論是通過技術手段合成還是模擬,數據方案的設計能力都尤為重要。
此時,海天瑞聲作為綜合數據服務商的顯著優(yōu)勢就凸顯出來:總的說來,行業(yè)現階段訓練數據采集標注的定制化需求較多,海天瑞聲在基礎研究上的多年積累,使得其能夠更好把握現有技術方向,深入了解客戶對訓練數據的運用邏輯和需求痛點,保證客戶算法取得盡可能好的落地效果。
具體到自動駕駛項目需求上,海天瑞聲在項目啟動前會安排專業(yè)團隊先根據需求設計好訓練數據集結構,讓容量有限的訓練數據集能夠覆蓋盡可能多的現象,并制定相應合理的數據比例。
比如,項目如果涉及卡車,覆蓋高速路場景的比例會很高,上下閘道之類的相關場景也要考慮到;如果涉及市內乘用車,設計方案時需要覆蓋各種路口情況,諸如三叉路的十字路口、轉向線等,有沒有掉頭的,或者不是兩側掉頭的,甚至左轉道在最右側等罕見情況,都要覆蓋到。
為了讓數據集更完整、豐富,諸如道路兩側場景、路上障礙物,車輛擁擠、稀疏以及行人多少之類情況也要提前考慮,特別是一些突發(fā)情況,比如突然橫穿馬路,盡管這種場景的覆蓋難度會更大。
海天瑞聲自動駕駛數據業(yè)務的主要內容
有時,客戶也并不清楚什么樣的數據方案更符合算法需求。例如較之經驗相對豐富的互聯(lián)網大廠,傳統(tǒng)車企更需要擁有豐富方案設計經驗的服務商,幫忙引導、梳理并細化出具體需求。
比如,面對突發(fā)狀況司機踩剎車,對于自動駕駛決策系統(tǒng)來說,急剎車之前多少秒的數據更有價值?低可視度惡劣天氣場景的數據量需要多少?需要以何種方式采集?以多少秒一幀的速度采集?
通過技術對技術、算法層面的反復溝通,海天瑞聲可以幫助客戶找到更加貼合使用場景的數據方案,縮減研發(fā)周期、加快落地進程,同時避免客戶花費更多成本。
三、「人機耦合」下的精度、效率與規(guī)模
高質量自動駕駛訓練數據,除了來自樣本豐富度的“刁難”,還要面臨標注過程高精度、高效率規(guī)?;鳂I(yè)帶來的挑戰(zhàn)。
舉例來說,同樣是 99% 精準度,對語音合成任務中的大多場景來說已經足夠優(yōu)質,但對于自動駕駛場景來說,卻極有可能埋下安全隱患。
基于對安全性的嚴苛要求,智能駕駛數據(主要是艙外)正朝著多模態(tài)的方向發(fā)展,所謂多模態(tài),是指多維時間、空間、環(huán)境數據的感知與融合。比如,一輛車可能配置少則 4-5 個、多則十幾個攝像頭,外加雷達(激光雷達、毫米波雷達、超聲波雷達等)。
市面采用的激光雷達基本都是 64 線甚至以上,受限于各種硬件設備,傳回來的數據很難做到完全同步。由于點云是一個連續(xù)幀的概念,標注多路數據如果不一致,會影響到算法模型訓練。另一方面,3D 激光雷達數據和 2D 普通攝像頭數據標注如何同步,也是一個難點。這些都成為橫亙在高精度標注需求面前的難題。
與此相對應的卻是標注環(huán)節(jié)生產力的落后。
訓練數據生產過程示意圖
《2019 年中國人工智能基礎數據服務行業(yè)白皮書》分析指出,2010-2016 年早期數據標注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。直到今天,絕大部分數據服務商還處于解決「數據標注工具有無」的階段。
很多團隊依靠開源工具完成絕大部分項目,不僅沒有點云標注工具,基本流程管理也沒有(比如,哪類數據應該被篩選?質量不合格的標注該怎么辦?),根本不可能交付自動駕駛所需的高質量、高精度數據集。
而伴隨 AI 在出行領域的深入落地,智能駕駛級別越高,所需的傳感器數量則越多、精度要求也越高,相應的數據量就會急劇增加,一個項目動輒數百萬條的數據處理量,早已不是作坊式作業(yè)可以應對。
例如,Waymo Open Dataset 有 16.7 個小時的視頻數據,3,000 個駕駛場景,60 萬視頻幀,將近 200 萬 3D 多邊形和 2200 萬 2D 多邊形標注,而這只是 Waymo 大量私有自動駕駛數據集的一小部分。
快速變化的市場環(huán)境,對數據交付工期的要求也更為苛刻,只有更加自動化、智能化、平臺化的數據服務,才能更好地滿足客戶需求。
作為浸潤行業(yè)十幾年的頭部服務商,海天瑞聲從成立之初,就在摸索各環(huán)節(jié)人機協(xié)作的可能,實現數據標注服務質量、速度和規(guī)模化的最佳平衡。
一體化數據處理平臺示意圖
其十多項核心技術應用于訓練數據生產的設計、采集、加工、質檢中,自主研發(fā)一體化數據處理平臺,將項目流程管理、質量把控、數據安全管理融入其中,并嵌入上千款自主開發(fā)積累的,適用于各種業(yè)務場景訓練數據處理需求的工具,充分提高了數據訓練的生產效率與質量控制水平。
具體到自動駕駛場景,一般人眼中,3D 點云只是一片點狀物,很難直觀看出具體是什么。但資深標注員會就同一個連續(xù)幀的前、后幾幀來回看,有時還會搭配 2D 圖片一起看,「腦補」點云數據無法呈現的部分。
海天瑞聲自動駕駛標注平臺有一個叫做「輔助構建物體腦補框」的工具,能幫助標注員進行更為精確的「腦補」。比如,拉框后,系統(tǒng)會自動就同一個連續(xù)幀的前、后幾幀內容進行預判,還會給出一些諸如車輛大小的參考。
其次,這一標注平臺覆蓋自動駕駛場景下不同類型數據的標注工具,能夠大幅提升標注效率。例如,平臺支持 3D 點云標注、3D 點云連續(xù)幀標注、3D 連續(xù)幀與 2D 聯(lián)合的標注、3D 語義分割等,還可根據客戶的個性化需求對平臺工具進行二次開發(fā),當屬業(yè)內領先。
海天瑞聲 3D 點云標注平臺
3D 點云連續(xù)幀標注時,前兩幀標注的物體,自動化工具會在第三幀上自動預測物體位置。由于算法會先介入做判斷,標注員的工作很大程度上是一個校正過程,效率和準確率都有極大的保證。
最后,一體化數據處理平臺的先進性不僅在于提供了統(tǒng)一入口和統(tǒng)一風格,有助于提升數據采集、加工效率,還將公司多年行業(yè)深耕經驗沉淀到平臺上,不僅簡化并統(tǒng)一了訓練數據生產流程,模塊式的項目生成和管理方式使得生產人員可以根據實際項目需求有機結合、靈活調整。
四、系統(tǒng)化平臺:落腳質保與安全
除了精度、效率和規(guī)模化,一體化平臺還能為數據標注質量保駕護航。
質量檢測和控制理念被嵌入到平臺各環(huán)節(jié)工具之中:比如在采集環(huán)節(jié),采集工具可對原始數據質量進行即時質檢,不符合要求的原始數據會被系統(tǒng)工具提示因某項要求不達標,無法錄入;中端加工環(huán)節(jié),運用自動標注工具 + 人工校對檢驗的方式,對數據標注情況進行檢查,提升數據質量;在后端大規(guī)模質檢環(huán)節(jié),運用全自動校驗技術,實現大規(guī)模訓練數據集 100% 的質檢需求。
目前,海天瑞聲一體化平臺已經沉淀數百個質檢點,可滿足所有日常業(yè)務場景需求,如檢驗圖片、視頻文件格式是否正確、物體種類數量是否達標,打點標框準確率是否符合要求等。
其實,人機協(xié)作下的高效率、高質量數據標注,只是數據服務整體流程中的一部分。數據集管理、項目管理、團隊人員管理等與數據安全、合規(guī)息息相關,同樣不可忽略。
與一體化數據處理平臺相配合,海天瑞聲還建立了全時日志庫及終端人管理系統(tǒng),實現平臺內操作留痕、透明可追溯和平臺內不同角色的嚴格權限分級,確保數據安全。
針對不同安全等級的訴求,海天瑞聲可以提供不同級別的解決方案??蛻艨梢园褦祿旁诤L斓钠脚_上來做,也可以部署到自己服務器,甚至還能提供入場標注。
隨著國家大舉培養(yǎng)數據要素市場、數據流通持續(xù)改善,《網絡安全法》《數據安全法》與《個人信息保護法》等上位法的陸續(xù)發(fā)布,數據安全與隱私保護也得到社會各界越來越多的關注。
海天瑞聲也率先通過了 ISO/IEC 27701 認證,這意味著,其數據生產過程中個人隱私信息安全管理和保護能力符合「重要的全球性隱私保護標準」,也通過了「最嚴苛資質的審核」。
如今,個人信息從設計、采集、處理、質檢到交付均已嚴格管控在平臺范圍內,并通過標準化的數據脫敏、嚴格的終端人管理系統(tǒng)、隱私程度分級及權限隔離、全時自動監(jiān)控等措施全流程保障個人隱私信息的安全。
長遠來看,只有在安全、合規(guī)的角度下樹立數據服務標桿,才能在行業(yè)里實現良幣驅逐劣幣,真正讓人工智能成為新一輪技術革命的引擎。
五、面對未知:摸石頭過河的底層能力
對數據生產效率、數據質量保證和數據隱私安全的嚴格把控,幫助海天瑞聲在市場競爭中脫穎而出。
除了這些,還有一項異常重要的底層能力—與客戶一起摸著石頭過河、共同探索全新業(yè)務挑戰(zhàn)的實力與勇氣。
20 年前,人工智能商業(yè)落地還處在起步階段,真實場景下的泛化能力有限。
海天瑞聲歷經數千個項目的打磨,服務全球 500 余家大型科技公司、頭部 AI 企業(yè)和科研院所,積累了大量行業(yè) Know-how,探索出幫助 AI 項目大幅縮短落地周期、降低成本的技術與方案能力,這也是其能夠探索 “未知” 領域的底氣所在。
就自動駕駛數據標注市場來說,當前大多數客戶的痛點之一在于如何實現駕駛中的數據閉環(huán),這些數據服務商的要求已經遠遠超越了簡單的采集和標注能力,需要集技術、資金、經驗等綜合實力于一體的數據服務商與客戶一起摸索、試錯。
如同蒸汽時代的蒸汽機、電氣時代的發(fā)電機、信息時代的計算機和互聯(lián)網,人工智能正成為推動人類進入智能時代的決定性力量。
隨著人工智能邁入「數據 + 知識」雙輪驅動的新一代,數據要素的市場地位被高度認同,市場空間廣闊。根據艾瑞、IDC 等第三方機構對 AI 訓練數據行業(yè)的研究,中國市場規(guī)模預計在 2025 年達到 100 + 億,全球訓練數據市場規(guī)模約在 500 億以上。
麥肯錫中國區(qū)數字化咨詢業(yè)務近期預測,未來幾年中國自動駕駛商業(yè)化會比預期更早來臨。
在邁向商業(yè)化的征途中,海天瑞聲會與企業(yè)共同摸索出加速模型訓練、產品落地和迭代更新的最佳路徑,更好地服務于未來社會。(作者:吳昕)
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )