手勢(shì)識(shí)別能否成為車(chē)內(nèi)交互方式的新寵?

從汽車(chē)被發(fā)明以來(lái),人車(chē)交互的方式在不斷變化。而在最近幾年,這種趨勢(shì)開(kāi)始變得越來(lái)越明顯。僅僅在車(chē)載信息娛樂(lè)系統(tǒng)中,交互方式也開(kāi)始從最早的實(shí)體按鍵,轉(zhuǎn)向包含按鍵、觸屏以及語(yǔ)音等等方式在內(nèi)的多維交互方式。

雖然交互方式在變,但遵從的邏輯從來(lái)都沒(méi)變:方便與安全。比如擴(kuò)大了手觸面積的卡片式 UI、智能后視鏡、抬頭顯示、智能 AI 語(yǔ)音、AR 導(dǎo)航等等,都是為了讓駕駛員在開(kāi)車(chē)的時(shí)候盡可能方便地傳遞指令,減少注意力的分散,保證安全。

目前來(lái)看,車(chē)載語(yǔ)音交互已經(jīng)比較普及,很多新車(chē)型上都有搭載。但它還是有自己的局限性,比如識(shí)別率、識(shí)別速度、對(duì)自然話術(shù)的支持等等都還不完善。這樣一來(lái),有時(shí)候反而會(huì)給駕駛造成額外的負(fù)擔(dān)。

這時(shí)如果能像科幻片里那樣,動(dòng)動(dòng)手指就能下達(dá)某些指令,可能會(huì)是一種更好的解決方案。

事實(shí)上,主機(jī)廠們也確實(shí)再往這個(gè)方向發(fā)展。2015 年,寶馬率先發(fā)布了搭載手勢(shì)識(shí)別的 7 系,而且前前后后也不斷有 OEM 在嘗試推出搭載這項(xiàng)功能的量產(chǎn)車(chē)(比如奔馳、拜騰、君馬)和 demo(奧迪、福特、大眾等),所以這更加深了我們對(duì)手勢(shì)識(shí)別的好奇心。

手勢(shì)控制正在成為一種更值得期待的車(chē)內(nèi)交互方式。

手勢(shì)識(shí)別在車(chē)內(nèi)都能做什么?

通過(guò)不同的手勢(shì),手勢(shì)交互可以實(shí)現(xiàn)接掛電話、調(diào)節(jié)音量、選擇歌曲、控制導(dǎo)航、控制車(chē)輛(空調(diào)、座椅、窗戶等)等功能,還包括主駕和副駕、后排乘客交互的多種場(chǎng)景。

雖然手勢(shì)控制能實(shí)現(xiàn)的功能不少,甚至和語(yǔ)音交互的功能還有一定重復(fù)。但是在我看來(lái),手勢(shì)和語(yǔ)音的關(guān)系絕不是非此即彼,一定是互相成就。想象一下,當(dāng)你目視前方,用手指著天窗說(shuō)打開(kāi),然后天窗就打開(kāi)了,是不是還挺有意思的?

未來(lái)人機(jī)交互一定是多維度的。例如寶馬全新 5 系就配備了「五維人機(jī)交互界面」,其中包括自然語(yǔ)音識(shí)別、手勢(shì)控制、觸控屏幕、iDrive 系統(tǒng)和熱敏按鍵。

這種多模態(tài)交互才是未來(lái)。

另外,如果我們把視線從駕駛員的手勢(shì)擴(kuò)散開(kāi)來(lái),類(lèi)似的技術(shù)在駕駛場(chǎng)景還能實(shí)現(xiàn)更多功能。

除了駕駛員的手勢(shì)之外,手勢(shì)識(shí)別的技術(shù)還能識(shí)別車(chē)外人員的動(dòng)作。以后,這個(gè)功能也許還能識(shí)別交警指揮車(chē)輛的動(dòng)作,或者周?chē)T自行車(chē)的人做出的手勢(shì)。這樣既能增加駕駛的安全性,又能促進(jìn)自動(dòng)駕駛的發(fā)展。

這些技術(shù)還可以實(shí)現(xiàn)駕駛員監(jiān)測(cè),是和目前手機(jī)的面部識(shí)別解鎖類(lèi)似的技術(shù)原理。從全球來(lái)說(shuō),法律規(guī)定在 L2 向 L3 級(jí)別的自動(dòng)駕駛方案過(guò)渡時(shí),駕駛員必須時(shí)刻監(jiān)控車(chē)輛駕駛,所以隨時(shí)監(jiān)控駕駛員的狀態(tài)在未來(lái)一定是必需的部件,而且這個(gè)未來(lái)很快就要到了。

既然手勢(shì)交互和背后的技術(shù)對(duì)于駕駛有這么多幫助,所以我們有必要了解一下背后的原理。

實(shí)現(xiàn)手勢(shì)識(shí)別的 3 種方案

前方高能,所以請(qǐng)準(zhǔn)備好開(kāi)始燒腦。

根據(jù)硬件實(shí)現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的手勢(shì)識(shí)別大致有三種:光飛時(shí)間(Time of Flight)、結(jié)構(gòu)光(Structure Light)以及雙目立體成像(Multi-camera)。

光飛時(shí)間(Time of Flight):通過(guò)光的飛行時(shí)間來(lái)計(jì)算距離。

光飛時(shí)間的原理很簡(jiǎn)單,先用紅外發(fā)射器發(fā)射調(diào)制過(guò)的光脈沖,再用接收器采集反射回來(lái)的光脈沖,最后根據(jù)往返時(shí)間計(jì)算物體間的距離,從而判斷手勢(shì)。

其實(shí)主要就是依據(jù)距離=光速*時(shí)間。光速是一定的,就可以通過(guò)時(shí)間差推算距離差。

結(jié)構(gòu)光(Structure Light):主動(dòng)投射已知編碼圖案,再計(jì)算物體位置。

結(jié)構(gòu)光要先通過(guò)紅外激光器,將具有一定結(jié)構(gòu)特征的光點(diǎn)投射到目標(biāo)物體上,再由紅外攝像頭收集反射的結(jié)構(gòu)光圖案。

因?yàn)檫@些光斑投影在被觀察物體上的大小和形狀根據(jù)物體和相機(jī)的距離和方向而不同,所以根據(jù)三角測(cè)量原理可以計(jì)算出物體各個(gè)點(diǎn)的具體位置,根據(jù)前后位置差異從而能夠判斷手勢(shì)。

雙目立體成像(Multi-camera):兩個(gè)攝像頭采集位置信息,再將畸變數(shù)據(jù)計(jì)算成可用數(shù)據(jù)。

雙目立體成像非常依賴算法,而且算法的難度和分辨率和檢測(cè)精度掛鉤。分辨率和檢測(cè)精度越高,計(jì)算就越復(fù)雜,還會(huì)導(dǎo)致實(shí)時(shí)性較差。它主要分兩個(gè)步驟:采集信息和計(jì)算畸變數(shù)據(jù)。

1. 采集圖像信息。通過(guò)兩個(gè)攝像機(jī)提取出三維位置信息,并進(jìn)行內(nèi)外部參數(shù)的匹配。(攝像機(jī)本身存在畸變,如果不經(jīng)過(guò)標(biāo)定,原本的矩形會(huì)顯示成不規(guī)則的圓角四邊形)

2. 計(jì)算畸變數(shù)據(jù)。通過(guò)對(duì)比經(jīng)過(guò)校準(zhǔn)的立體圖像,獲得視差圖像,再利用攝像機(jī)的內(nèi)外參數(shù)進(jìn)行三角計(jì)算獲取深度圖像,根據(jù)前后位置的區(qū)別進(jìn)行手勢(shì)識(shí)別。

像分辨率、成本、測(cè)量精度這種問(wèn)題,三種方案雖然有高有低,但基本都還說(shuō)得過(guò)去,功耗在車(chē)內(nèi)也不是大問(wèn)題。

要判斷哪種方案合適,要從以下幾點(diǎn)著手:1. 是否能適應(yīng)各種環(huán)境?2. 是否具有優(yōu)異的實(shí)時(shí)性?3. 在樣本范圍內(nèi),數(shù)據(jù)誤差是否可控?4. 成本是否可控?5. 體積是否可控?6. 硬件插件是否成熟?

前三點(diǎn)是非常重要的,因?yàn)槠?chē)會(huì)處在各種環(huán)境內(nèi),所以抗干擾性、數(shù)據(jù)實(shí)時(shí)性、數(shù)據(jù)準(zhǔn)確性非常重要。

結(jié)構(gòu)光的分辨率高,計(jì)算量少,功耗也比較低,此前有很多成型的解決方案,還有 Inter 支持的 RealSense SDK,開(kāi)發(fā)周期較短。但是它受限于主動(dòng)投射的原理,非常容易受到強(qiáng)光和光滑平面(如鏡子)的影響,室外基本不能使用,這點(diǎn)算是致命的。

雙目立體成像的硬件成本比較低,但是它過(guò)于依賴圖像特征匹配(后期計(jì)算),需要很高的計(jì)算資源。想要更高的分辨率,計(jì)算就越復(fù)雜,這就導(dǎo)致它實(shí)時(shí)性比較差。而且它在光照較暗、過(guò)度曝光或者場(chǎng)景本身缺少紋理的情況下,很難進(jìn)行特征提取匹配。和結(jié)構(gòu)光一樣,在抗干擾性這點(diǎn)上它做的不好。

TOF 方案的分辨率很低,測(cè)量精度也不如其他兩種方案,但是對(duì)于車(chē)內(nèi)手勢(shì)識(shí)別來(lái)說(shuō)已經(jīng)夠了。因?yàn)樾枰饩€的全面照射,所以功耗很高,但是這在汽車(chē)環(huán)境中也不算大事。而且它的體積可控;測(cè)量誤差在整個(gè)范本內(nèi)比較固定;雖然計(jì)算量大,但是算法難度較低;最重要的是它受外界環(huán)境干擾較小。綜合來(lái)看,TOF 方案是個(gè)比較實(shí)用的選擇,也是很多供應(yīng)商都在努力的方向。

12下一頁(yè)>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2019-01-30
手勢(shì)識(shí)別能否成為車(chē)內(nèi)交互方式的新寵?
從汽車(chē)被發(fā)明以來(lái),人車(chē)交互的方式在不斷變化。而在最近幾年,這種趨勢(shì)開(kāi)始變得越來(lái)越明顯。僅僅在車(chē)載信息娛樂(lè)系統(tǒng)中,交互方式也開(kāi)始從最早的實(shí)體按鍵,轉(zhuǎn)向包含按鍵、觸屏以及語(yǔ)音等等方式在內(nèi)的多維交互方式。

長(zhǎng)按掃碼 閱讀全文