人才戰(zhàn)略奏凱,百度語音技術(shù)獲突破

近日,百度僅有十人的語音識別研究小組,在康奈爾大學圖書館網(wǎng)站上發(fā)表了一篇論文。文中顯示,百度已在語音識別領(lǐng)域取得重大突破,在語音的正確識別率上已超越谷歌、蘋果及必應。

此事迅速在美國科技界引起關(guān)注,媒體隨之跟進展開報道,百度深度學習研究院院長吳恩達也在隨后對外確認了這一消息,他認為,從語音識別系統(tǒng)的標準測試來看,百度語音識別技術(shù)的準確率已超過谷歌及蘋果10%,處于領(lǐng)先水平。眾所周知,吳恩達是今年上半年才剛剛加入百度的新成員,而在如此短的時間內(nèi)就能取得這樣的成績,想必除了研發(fā)團隊的傾力之外與Robin對技術(shù)和人才的高度重視以及穩(wěn)健策略是分不開的。

噪音語音識別技術(shù)是百度深度學習研究院成立至今,除百度大腦外的第二次重大技術(shù)突破,意義深遠。百度的語音識別系統(tǒng)DeepSpeech,能夠在嘈雜環(huán)境下實現(xiàn)比谷歌和蘋果語音技術(shù)更高的識別率,證明語音技術(shù)正跨越使用門檻,向著大眾需求的方向疾步行進,而非像以前一樣躺在實驗室里,或只提供給企業(yè)用戶使用。

過去的語音識別系統(tǒng),僅能解決寬松環(huán)境下的語音識別問題,在良好的語音環(huán)境下,各家都能做到相當不錯的識別率。但用戶的使用環(huán)境是具有多樣性的,以嘈雜環(huán)境為主,交互性始終做不好,因此語音識別系統(tǒng)更多應用在企業(yè)而非大眾市場。

之所以說百度這次在語音識別上出現(xiàn)重大技術(shù)突破,是由于百度深度學習突破了限制語音技術(shù)發(fā)展的一個瓶頸,提升了用戶使用語音進行人機交互過程中的主要問題,使得這項技術(shù)向著大眾應用的方向邁出一大步,這相當于提升了技術(shù)研發(fā)的層次,跳出過去的舊模式,打開了一扇新的大門。

這一突破所帶來的效應是不難預見的,隨著語音識別技術(shù)走向大眾,其商業(yè)價值和社會價值會更大程度上發(fā)揮出來,而這必將促使企業(yè)更多在這個方向投入研發(fā)力量,最終引領(lǐng)在該領(lǐng)域的大規(guī)模創(chuàng)新,真正讓語音技術(shù)對人類的生活產(chǎn)生重大影響與改變。

在人類越來越傾向于拋棄文字指令,偏好語音指令的今天,語音識別技術(shù)已變得越來越重要。而百度深度學習研究院所出的成果,恰恰是將語音技術(shù)的重要性更上層樓。除了各種智能終端設(shè)備外,物聯(lián)網(wǎng)和各種以網(wǎng)絡為基礎(chǔ)的自動控制裝置,將會越來越多使用語音作為控制指令,說這項技術(shù)能夠改變?nèi)祟惿?,是不為過的。

更為令人興奮的是,吳恩達還排除了該技術(shù)要用很長時間投入應用的可能,外界普遍預期明年即可投入應用,首先為百度的用戶提供語音音樂搜索服務,然后再逐步將應用擴展到其他領(lǐng)域。不僅如此,吳恩達率領(lǐng)的30人研究團隊還將大規(guī)模擴編,為世界各主要語言開發(fā)語音識別及翻譯等服務。

在語音識別領(lǐng)域的重大突破,只能說進一步鞏固了百度作為國內(nèi)領(lǐng)先的技術(shù)創(chuàng)新導向型企業(yè)的形象,這使得中國互聯(lián)網(wǎng)的技術(shù)創(chuàng)新面目為世界所知。李彥宏本人對技術(shù)創(chuàng)新的重視,形成了百度與生俱來的技術(shù)基因,并促使百度近年來在技術(shù)研發(fā)方面發(fā)展迅速,成果卓著。

2013年初李彥宏決定在美國硅谷設(shè)立深度學習研究院時,面臨著諸多挑戰(zhàn)。企業(yè)主導的科技研發(fā),已被歷史經(jīng)驗證明叫好不叫座,大多數(shù)科研成果無法有效轉(zhuǎn)化,惠普研究院就是個很好的例子。在技術(shù)研發(fā)上的大量投入,也勢必會對商業(yè)活動造成影響,從中找到一個完美平衡,并不是件容易的事。

李彥宏在之后主導了百度人才戰(zhàn)略的制定和實施,引進了包括吳恩達、徐偉、吳韌在內(nèi)的一批各個領(lǐng)域的世界頂級專家,組建了了強大的科技研發(fā)團隊。百度最近幾個季度的研發(fā)投入一直在猛增,每季度十幾億的費用,使得百度成為國內(nèi)研發(fā)投入比例最高的企業(yè)。

從李彥宏為數(shù)不多的幾次公開發(fā)言中可以看出,百度已將深度學習提升到百度技術(shù)創(chuàng)新的核心地位,愿意為深度學習的理論發(fā)展和應用價值開發(fā)投入大量資源。百度未來的商業(yè)模式中,很可能會極度依賴這些科技成果,而現(xiàn)有的技術(shù)力量已不足以滿足移動互聯(lián)網(wǎng)的發(fā)展速度。

李彥宏在技術(shù)創(chuàng)新上的思路,基本能被視為百度這家公司的未來發(fā)展方向,即百度的科研戰(zhàn)略不是為研發(fā)而研發(fā),而是要盡量把新技術(shù)應用到大眾領(lǐng)域,讓技術(shù)發(fā)展幫助傳統(tǒng)企業(yè)應對移動互聯(lián)網(wǎng)帶來的變革,也要讓普通人能從科技發(fā)展進程中受益,用技術(shù)改變大多數(shù)人的生活。

百度在語音技術(shù)上的創(chuàng)新與突破,并不是百度這些年來取得的第一個重大科研成果,當然也不會是最后一個。從百度目前的科技創(chuàng)新戰(zhàn)略來看,這家公司擁有在多個領(lǐng)域取得重大成果,并將之投入應用的巨大潛力。李彥宏所描畫的那個屬于百度的未來技術(shù)藍圖,正在按部就班地一一實現(xiàn),并很有可能會給人們帶來更多驚喜。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2014-12-20
人才戰(zhàn)略奏凱,百度語音技術(shù)獲突破
近日,百度僅有十人的語音識別研究小組,在康奈爾大學圖書館網(wǎng)站上發(fā)表了一篇論文。文中顯示,百度已在語音識別領(lǐng)域取得重大突破,在語音的

長按掃碼 閱讀全文