從人機共生體的視角,重新理解機器人產業(yè)方法論

原標題:從人機共生體的視角,重新理解機器人產業(yè)方法論

提到機器人,大家腦海中第一時間會浮現(xiàn)出怎樣的事物?

大概率情況下,要么是工業(yè)級/服務級機器人,以機械臂、簡單驅動型為主角,不講究外形美觀,動作也往往不怎么連貫,常常被冠以“人工智障”的美稱;

要么則是仿人機器人,它們總是出沒在伯克利或波士頓動力等高大上的實驗室里,能夠以七十二般武藝讓人類忍不住發(fā)出“滅絕警告”,但必需的編程和持續(xù)作業(yè)能力,以及技能的泛化程度,卻都達不到大規(guī)模應用的可能。

人與智能機器之間,有沒有第三種可能呢?

其實早在1960年,約瑟夫·利克萊德(J. C. R. Licklider)就曾提出了一個觀點——人機共生(Man-computer symbiosis)。

簡單來說,就是人類和電子設備以親密合作的方式生活在一起,甚至結成緊密的聯(lián)盟。兩者的結合,可以創(chuàng)造一種高產且生機勃勃的合作關系。

“人類機器命運共同體”,聽起來是不是很心動?可惜的是,目前目前還很少見到人機共生體(man-computer symbioses)的出現(xiàn)。所以,最近中國機器人產業(yè)中出現(xiàn)的“發(fā)球機器人”,就引起了我們的注意。

原因無他,這或許是人機共生“星星之火”燎原的起點。

點燃人機共生的星火:發(fā)球機器人的初蹄

首先有必要解釋一下,為什么說發(fā)球機器人,體現(xiàn)出了“人機共生”的現(xiàn)實趨勢。

這款發(fā)球機器人,起源于新松機器人與乒乓球學院一次偶然的談話。

當前的乒乓球運動存在一些亟待解決的問題:

一是效率。助教為專業(yè)運動員喂球時,往往在速度、旋轉、落點控制、頻率等方面,難以達到高水平選手的訓練需求;

二是統(tǒng)一。一旦助教出現(xiàn)疲憊、狀態(tài)不佳等情況,就會直接影響速度、旋轉等參數(shù),影響訓練特定技戰(zhàn)術動作的一致性,運動員很難形成最佳的肌肉記憶;

三是反饋。乒乓球是一項實時性非常高的運動,往往一秒之間幾個來回,過快的球速與落點的不確定性,也導致教練往往只能憑借經驗來反饋,很難通過量化來優(yōu)化教學,一些特定動作也就無法有效分析和復現(xiàn)。

四是普及。乒乓球的另一個身份是“國球”,中國有眾多的愛好者和青少年參與到這項運動中來,但不同地域、不同水平的教練卻參差不齊,自然也就無法滿足更多人群享受乒乓球這項運動的愿望。

能不能通過智能技術的引入,來解決上述問題呢?

深耕深度學習算法的龐伯特,就以新松的機器人研發(fā)技術和中國乒乓球學院的海量專業(yè)數(shù)據和課程,研發(fā)出了可以自主決策的人工智能發(fā)球機器人。

而讓龐伯特機器人得以勝任發(fā)球工作的幾大核心:

首先是感知。通過高速雙目立體視覺系統(tǒng),機器人能夠捕捉高速運動下的乒乓球位置,并形成球的軌跡,通過軌跡分析,在毫秒內判斷球速以及球的旋轉方向,讓乒乓球技術轉化為可視的數(shù)據,實時調整,精準化訓練。

其次是決策:在軌跡分析的基礎上,龐伯特同時對人體動作進行捕捉,通過與預設的動作角度進行比對,分析運動員動作是否到位。結合軌跡和動作兩個因素,判斷運動員的水平,推薦課程。對于個人愛好者來說,相當于擁有了一個專業(yè)教練+陪練。

再次是運動。龐伯特機器人具有類人化結構,不同于市面上以擠壓方式進行發(fā)球的設備,龐伯特能夠高度模擬類人化的發(fā)球方式,模擬人類發(fā)球時對球方向和旋轉,實現(xiàn)兩跳發(fā)球。而利用不同的球拍膠面,還能打出不一樣的球,這些都能更好地輔助人類運動員進行訓練。

顯然,龐伯特機器人正在將技術思維(technical thinking)與人類智慧相結合,為人機共生打開了新的窗口。

逃離恐怖谷:發(fā)球機器人昭示三重改變

從龐伯特機器人的實踐中不難看出,如果在人和機器之間建立共生關系,那么二者的合作互動顯然會大大改善很多現(xiàn)有問題。

由此也可以總結出,共生型機器人與大眾常見的傳統(tǒng)機器人有何不同之處:

首先,盡管所有人造系統(tǒng)都是為了幫助人類,但傳統(tǒng)的自動化機器人更多的是為了實現(xiàn)“人類增強”,而共生型機器人則是為了“與人類更好地生活在一起”。

還是以發(fā)球機器人為例,傳統(tǒng)的發(fā)球設備只是機械地擴展某項技能,比如取代人的手臂來進行發(fā)球,往往需要人類助教來完成那些需要主動決策、調整、制定標準等工作,在效率和功能上并沒有帶來質的改變。

而龐伯特機器人的特殊之處,就在于通過深度學習算法的引入,在智能程度上賦予了機器人新的高度。比如實時高通量的數(shù)據收集與處理;高效精準專業(yè)的預判決策;個性定制化的訓練反饋與指導;乒乓球運動的隨機性又要求算法具備一定的泛化能力和高魯棒性……這些都是龐伯特機器人能夠成為乒乓球運動伙伴的關鍵。

第二,共生型機器人必須具備可“實時”(real time)進行的思考過程。

傳統(tǒng)的機器人可以根據預先設定的程序處理數(shù)據。比如餐廳服務機器人,輸入店內地圖、設定好傳送菜程序之后只能按部就班地工作,有的甚至連避讓行人都做不到,因為提前設定會導致一旦出現(xiàn)不可預見的情況,整個過程就會停止。

但球類運動可不一樣,乒乓球的高速運動需要發(fā)球者做出毫秒級的判斷,像人一樣快速思考、分析、決策、反應。對于人類來說都可能要靠直覺來完成的事情,對機器與人之間的耦合要求要緊密的多。

讓機器能夠做出決策和控制復雜的情況,而不依賴于預先確定的程序,就是龐伯特機器人向我們展示的現(xiàn)實圖景。

最后,共生型機器人有機會重構機器人行業(yè)的商業(yè)方法論。

長期以來,傳統(tǒng)機器人市場的商業(yè)邏輯,要么是“人工+智能”,用真人來操控機器人模型,以達到模擬強人工智能的效果;要么是長期砸錢在天頂技術上,比如波士頓動力的機器人雖然炫酷,卻因商業(yè)化困難而賣身給軟銀。

但龐伯特機器人所代表的共生型機器人卻開啟了另一種模式,通過“真AI算法”+聚焦實用場景來切入市場。

我們注意到,除了發(fā)球機器人之外,龐伯特還打造了對打機器人。

將深度學習神經網絡與強化學習相結合,讓對打機器人和發(fā)球機器人能夠通過大量復雜環(huán)境的交互,運用各自的人工智能算法平臺,不斷得到反饋,互相學習到新的技能與策略,機器人之間的對戰(zhàn)也能不斷提升算法模型的復雜度與智能度。

同時,一旦高性能算法模塊被拼圖一樣使用,就能夠以低成本、小型化、高效率的方式快速打開市場,未來不止于乒乓球這一項運動,更多場景都可以通過軌跡分析、動作分析、終端顯示等集成模塊帶來改變。

從這個角度看,龐伯特機器人正在重新確立人與機器、甚至是機器與機器的關系,即一種共生伙伴關系(symbiotic partnership)。在這一美好的畫面中,機器會為人類提供見解和決策,而人類則能更有效地進行智力活動與創(chuàng)造。

打開產業(yè)智能的價值圖景:挖掘人機共生的富礦

正如國際人工智能聯(lián)合大會前主席Francesca Rossi所說,人機共生是未來人類使用AI的最好方式。

那么,作為人類和機器的預期前景,其中是否也埋藏著商業(yè)價值的富礦呢?

答案是肯定的。

以龐伯特機器人為例,未來就有可能締造出不少新的產業(yè)機遇。

比如說,通過與海量運動員對戰(zhàn),發(fā)球機器人可以積累專業(yè)領域的數(shù)據,不斷優(yōu)化算法,快速提升自身的擊打能力和策略,衍生出個性化的對戰(zhàn)方式,來幫助運動員更好地進行訓練。并將其輸出為可量化、可視化的訓練標準,讓乒乓球的專業(yè)教育門檻下沉到普通人生活當中。

再比如,分析決策算法的持續(xù)迭代,有望推廣到新的運動和行業(yè)中去,以基礎化的能力支撐起千行萬業(yè)的智能化需求,成為“新基建”中不可或缺的一員。舉個例子,當機器人與城市智慧健康系統(tǒng)結合,是否能夠作為市民健康的關鍵終端,來提供行而有效、可連可控的運動網絡呢?

從這個角度延展開來,龐伯特機器人不僅能夠輸出算法模塊,還能夠向其他行業(yè)輸出軟硬件合一的整體智能解決方案。通過算法、硬件、人的交互,完成一次人機共謀的大變革。

站在萬物智能、人機共生的起點,不難預見人類和機器之間密切耦合的未來。與智能生命伙伴共舞,是人類必然的未來。而目睹了龐伯特機器人的我們,也正在經歷種植AI的進行時。

過去的數(shù)年間,讓深度學習擺脫需要大量輸入和人工的有監(jiān)督學習,一直是人類研究者努力的方向,為此推動了許多新的技術進展,比如:

借助meta learning元學習算法,機器獲得了“泛化”,能夠舉一反三,學習協(xié)同性地處理多種任務;

借助Reinforcement Learning強化學習,機器懂得了“決策”,通過不斷地自我學習與回饋來抵達高級智能。

而這些能“擬人”的機器學習方法,也讓AI獲得了前所未有的能力,打敗柯潔李世石的DeepMind阿爾法狗、在DOTA2中團滅人類電競選手的OpenAI Five、自動駕駛,乃至通用人工智能AGI,都是通過讓機器模仿人類對世界的認知方式,以不斷探索、試錯、改進的方式,與環(huán)境進行實時交互,進而提高自己的能力。

天地有正氣,雜然賦流形。今天,龐伯特也試圖讓機器人“自行進化”,啟動了一場發(fā)球機器人教對打機器人打乒乓的“先鋒實驗”。

通過兩臺機器人之間的相互“較量”,讓機器人身處在一個不可預期的環(huán)境中,依靠人工智能算法平臺主動生成一些標記和標簽來做決策判斷,獨立解決多個非線性的邏輯問題,通過“行動-評價”的強化學習機制來改進自身,適應新的環(huán)境,從而發(fā)展機器人間的校驗標準。這會為成為機器人社會意識的起點嗎?

4-6月,龐伯特會在B站(@龐伯特)定期發(fā)布機器人課堂的實時動態(tài),不妨和我們一起去圍觀吧。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2020-03-29
從人機共生體的視角,重新理解機器人產業(yè)方法論
深耕深度學習算法的龐伯特,就以新松的機器人研發(fā)技術和中國乒乓球學院的海量專業(yè)數(shù)據和課程,研發(fā)出了可以自主決策的人工智能發(fā)球機器人。

長按掃碼 閱讀全文