聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

2018年11月1日,騰訊全球合作伙伴大會,以“開放·共生”為主題,在南京開幕。聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂受邀出席,并與來自全球的科技、文化與商業(yè)領域數(shù)百位國際大咖和萬名行業(yè)精英,以及騰訊微信、QQ、騰訊云、騰訊開放平臺、騰訊企鵝號、騰訊應用寶、騰訊AILab、騰訊車聯(lián)、騰訊自動駕駛、騰訊微瓴互聯(lián)、騰訊動漫等業(yè)務條線的合作伙伴,共商未來人機互聯(lián)戰(zhàn)略布局與發(fā)展之道。

聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂表示:“未來,我們將置身于人工智能語音交互時代,繼續(xù)朝著‘語音即搜索,語言即服務’方向演進。物理世界與數(shù)字世界的有機融合會進一步加速,日益形成更加智能化的萬物互聯(lián)的人機世界。實現(xiàn)這一美好智能圖景的關鍵在于,實現(xiàn)智能語音交互在更多真實復雜場景中的應用與落地。聲智科技,自2017年初成為騰訊人工智能生態(tài)合作伙伴以來,依托聲智科技自主研發(fā)的軟硬件一體的遠場語音交互技術勢能,先后為騰訊打造了騰訊智能音箱、智能車機系統(tǒng)以及全球首款王者榮耀智能機器人等產品,助力騰訊深化在家居、車載和機器人三大領域的人工智能布局與落地。”

聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

全球首創(chuàng)的穿透式遠場語音交互解決方案

王者榮耀智能機器人,游戲人物戰(zhàn)神呂布為原型,是國內首款人工智能與游戲結合的智能機器人。搭載聲智科技為騰訊獨家定制的全球首創(chuàng)的穿透式遠場語音交互解決方案,采用全球首款人偶型音腔結構設計,由獨立的人偶和底座兩部分構成,底座裝有旋轉裝置,人偶可以追隨玩家用戶的聲源,并且旋轉定位;通過獨家的6麥環(huán)形倒置麥克風陣列(InverseArray)設計,內置穿透式波達方向估計(PenetratedDOA),動態(tài)聲場的回聲消除(VibratedAEC)等獨家定制的AI聲學算法,成就了具備“聽”、“說”感知能力的AI游戲達人——王者榮耀智能機器人!在騰訊全球合作伙伴大會上,王者榮耀智能機器人驚艷亮相展區(qū),為現(xiàn)場觀眾帶來了真實不凡的語音交互體驗。

(1)6麥環(huán)形倒置麥克風陣列(InverseArray)

聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

為了戰(zhàn)斗時,給游戲玩家身臨其境的聽覺享受,王者榮耀機器人將揚聲器設置于人偶的頭部。區(qū)別于常規(guī)智能語音設備(比如音箱、機頂盒)麥克風陣列置于頂端、揚聲器位于底部的“上聽下說”且“聽說一體”的圓柱或立方體的中空音腔結構,王者榮耀智能機器人的麥克風陣列設計位置只能置于底座,從而形成獨特的“下聽上說”且“聽說分離”的不規(guī)則非中空音腔結構。這樣的結構設計,也給麥克風陣列的結構設計與聲學AI算法適配帶來了巨大的難度。

同時,為了讓王者榮耀機器人可以隨時定位玩家位置,底盤設置了旋轉電機裝置,電機極為靠近麥克風陣列,當人偶被喚醒后進行大角度旋轉時,會產生電機噪音,影響麥克風陣列的準確拾音。

為此,聲智科技為騰訊的王者榮耀機器人量身研制了“倒置麥克風陣列(InverseArray)”技術?;诼曋强萍级ㄖ蒲邪l(fā)的6麥環(huán)形的倒置麥克風陣列,進一步加強麥克風陣列的聲音信號處理能力,對抗人偶機器人對于麥克風陣列的遮擋,以及其產生的聲反射和聲衍射的干擾,有效抑制自噪聲和其他外部噪音。在真實的環(huán)境中,王者榮耀智能機器人可拾取3-5米遠場距離聲音,并實現(xiàn)的360度全方位的語音喚醒與識別。

(2)穿透式波達方向估計(PenetratedDOA)

聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

王者榮耀智能機器人獨特的設計,使人偶身體處在麥克風陣列正上方,成為直接障礙物,形成了大量因不規(guī)則外形的人偶身體產生的聲反射和聲衍射,導致了多徑傳播情況的普遍發(fā)生,極大影響了王者榮耀智能機器人的準確定位功能。

為了應對這些結構性挑戰(zhàn),進一步加強麥克風陣列的聲音信號處理,有效抑制自噪聲和其他外部噪音,提高聲源測向的準確度,聲智科技最新研發(fā)了穿透式波達方向估計(PenetratedDOA)技術。即使在噪音干擾大,強混響,強反射面的條件下,王者榮耀智能機器人可實現(xiàn)360度全方位的測向,定位誤差在10度以內,隨時響應“主公”的呼喚。

(3)動態(tài)聲場的回聲消除(VibratedAEC)

聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲

傳統(tǒng)智能音箱等產品的設計揚聲器在底部,而王者榮耀智能機器人的揚聲器位于頭部兩側,一側指向性的揚聲器為全頻段發(fā)聲器件,承擔主動發(fā)聲功能,另一側為低頻共振被動膜片被動發(fā)聲,以達到較佳的低音效果。而這樣的特殊設計,導致位于揚聲器垂直下方的環(huán)形麥克風陣列單元拾取到的揚聲器系統(tǒng)自噪聲直達聲信號不一致,這無疑增大了語音喚醒與識別的難度。

而且,主動揚聲器的聲音會干擾麥克風陣列進行聲源側向,進一步影響人偶旋轉角度的準確性。同時,旋轉裝置的電機,極為靠近麥克風陣列,當人偶被喚醒后進行大角度旋轉時,產生的電機噪音影響麥克風陣列的拾音。

為此,聲智科技研發(fā)了最新的動態(tài)聲場回聲消除(VibratedAEC)技術,可有效提升音樂狀態(tài)或語音合成(TTS)狀態(tài)下的喚醒率,以及在5米內的噪音環(huán)境下的遠場語音喚醒和識別率。搭配聲智科技自主知識產權的混響消除、寬場景高靈敏語音喚醒等專屬聲學AI算法,可在保護主方向語音不失真的前提下,去除環(huán)境中的語音等非穩(wěn)態(tài)噪聲以及空調等其他平穩(wěn)噪聲的干擾,自適應計算混響的能量,予以抑制,去除由于房間混響造成的語音拖尾,增強語音清晰度,同時解決弱參考信號或者無參考信號等復雜場景中的回聲抵消(自噪聲抑制)問題,在雙工語音交互(DoubleTalk)的情況下仍然魯棒。

所以,王者榮耀智能機器人在保證高喚醒率的同時,能有力降低誤喚醒率,實現(xiàn)輕松喚醒,隨時打斷、隨時喚醒,無懼環(huán)境,想說就說,聲隨心動,為用戶打造完美的遠場語音交互的體驗。

語音交互技術的創(chuàng)新,只有依托真實的場景,才能真正釋放技術的潛能,發(fā)揮技術的應用價值,推動人工智能朝著普惠化方向發(fā)展,讓更多人切實地感受到科技的智能、快捷與便利。聲智科技,將繼續(xù)堅持引領技術服務場景的創(chuàng)新路線,攜手生態(tài)合作伙伴,為不同的垂直行業(yè)打造適配多元場景的遠場語音交互系統(tǒng)方案。

關于聲智科技

聲智科技是全球領先的聲學語音技術和語言智能服務科技創(chuàng)新公司,專注于聲學前沿技術和人工智能交互,秉持“聽你所言,知你所想”的技術理念,致力于通過不斷引領真實環(huán)境下的人機交互體驗,實現(xiàn)“聲音連接智能未來”的使命,“更自由的人機互聯(lián)”愿景。

聲智科技主要提供融合遠場語音交互和遠場實時通話技術的SoundAIVoiceKit(SVK)語音交互系統(tǒng),從端到云的智能語音交互技術和服務方案,以及芯片、模組、開發(fā)板到量產產品的智能語音應用方案。目前與百度、阿里、騰訊、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企業(yè)深度合作,深耕智能家居、智能汽車、智能安防、智能金融、智能教育、智能醫(yī)療和機器人等行業(yè),服務小米、百度、阿里、華為、騰訊、聯(lián)想、創(chuàng)維、金蝶、浪潮、中國移動、奇虎360、中央人民廣播電臺等客戶,是國內服務用戶最多、應用場景最全和覆蓋地域最廣的遠場語音交互系統(tǒng)供應商。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2018-11-01
聲智全球首創(chuàng)穿透式遠場語音技術,實力奏響騰訊合作伙伴“共生”樂曲
2018年11月1日,騰訊全球合作伙伴大會,以“開放·共生”為主題,在南京開幕。

長按掃碼 閱讀全文