不久前,百度輸入法在北京舉辦了主題為“AI輸入,開啟全感官輸入時代”的發(fā)布會。會上,百度副總裁AI技術(shù)平臺體系(AIG)總負責(zé)人王海峰出席并為大會致辭。隨著AI技術(shù)進步,進一步滲入到輸入法中,百度AI輸入開啟了全感官輸入時代的序幕。
百度AI輸入
百度副總裁AI技術(shù)平臺體系(AIG)總負責(zé)人王海峰在大會致辭中指出“隨著AI的到來,全感官輸入時代的序幕已經(jīng)拉開。”
輸入法本質(zhì)上是一種人與機器交流的媒介,也是用戶高頻使用的重要工具??v觀歷史,隨著技術(shù)的發(fā)展,人與機器交流的媒介和形式也在不斷變化升級。隨著語音、手寫等輸入方式的出現(xiàn),輸入法也幾經(jīng)變化,而真正為輸入法帶來質(zhì)的突破的,是AI技術(shù)。
百度從誕生之日起就已經(jīng)和AI息息相關(guān),而百度輸入法是百度AI的重要產(chǎn)品,也是百度AI技術(shù)率先落地應(yīng)用的產(chǎn)品之一,王海峰在大會中用“AI技術(shù)應(yīng)用的橋頭堡”形容百度輸入法的價值所在?;诎俣阮I(lǐng)先的AI語音技術(shù),百度輸入法實現(xiàn)了又準又快的語音輸入,并支持多語種、場景化、長語音、輕聲識別等功能創(chuàng)新,這些功能應(yīng)用在實際場景中,將實實在在改變用戶生活。
全感官輸入時代的序幕已經(jīng)拉開,未來將會有更多AI能力應(yīng)用到輸入法中。
一項技術(shù)突破,兩大全新功能
此外,作為此次發(fā)布會的亮點之一,百度語音技術(shù)部總監(jiān)高亮,在大會上發(fā)布了百度語音技術(shù)的最新突破——Deep Peak 2模型。該技術(shù)全稱為“基于 LSTM 和 CTC 的上下文無關(guān)音素組合建?!?,該模型突破了沿用十幾年的傳統(tǒng)模型,能夠更充分地發(fā)揮神經(jīng)網(wǎng)絡(luò)模型的參數(shù)優(yōu)勢,大幅提升中英文、多種口音、多種風(fēng)格(如朗讀、聊天、輕聲)混合輸入的識別準確率,聊天場景下的相對正確率較行業(yè)領(lǐng)先水平提升20%,讓機器更輕松適應(yīng)用戶的自然對話。
同時,百度輸入法負責(zé)人蔡玉婷在大會中宣布了百度輸入法v8.0版本的正式上線,該版本在此前已有的AI功能上增加了“語音速記”和“AR表情”兩大全新AI功能。
其中,“語音速記”在輸入法領(lǐng)域獨家首發(fā)了“聲紋識別”技術(shù),該技術(shù)針對2-3人小型會議場景,可根據(jù)聲紋自動區(qū)別發(fā)言人,實現(xiàn)智能化的語音識別。而“AR表情”功能基于百度領(lǐng)先的人臉識別技術(shù)和 AR 技術(shù),用戶不僅可根據(jù)相機或相冊進行人臉識別、制作表情包,還支持用戶通過自己的表情控制虛擬人物形象。制作出來的AR表情,可以直接通過輸入法搜索、語音輸入和鍵盤輸入時展示出來。
百度輸入法 更懂你的表達
當AI技術(shù)深入落地輸入法,其所加持的各種功能讓它已不再僅僅是“輸入工具”。
當記者面對人物采訪時,百度輸入法語音速記功能高效、精準的記錄,可幫助記者進行實時記錄,從而提升了記者的工作效率,彌補了傳統(tǒng)手記在速度上的滯后。也避免了事后需要聽打來整理錄音的不便。
12下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )