數(shù)據(jù)科學(xué)家,被譽是“21世紀(jì)最性感的職業(yè)”。
如今,一股數(shù)據(jù)科學(xué)的熱潮正席卷國內(nèi)各大高校。今年十月底,一系列數(shù)據(jù)科學(xué)的網(wǎng)絡(luò)直播課在多所大學(xué)火爆異常,吸引來自北大、清華、北師大、哈工大、浙大等多所高校學(xué)生廣泛參與。
該系列網(wǎng)絡(luò)課堂是數(shù)據(jù)科學(xué)產(chǎn)教融合計劃下的一項公益活動。在教育部產(chǎn)教融合號召的大背景下,數(shù)據(jù)科學(xué)產(chǎn)教融合計劃脫穎而出,該計劃由國內(nèi)數(shù)據(jù)科學(xué)領(lǐng)域明星企業(yè)、多所高校共同發(fā)起,旨在促進數(shù)據(jù)科學(xué)從業(yè)人員能力的整體提升,為數(shù)據(jù)科學(xué)產(chǎn)業(yè)發(fā)展提供人才保障。
數(shù)據(jù)科學(xué)火爆的背后,恰恰源自近年來數(shù)據(jù)科學(xué)市場的迅速崛起。隨著數(shù)字經(jīng)濟快速發(fā)展、數(shù)據(jù)成為最重要生產(chǎn)要素,數(shù)據(jù)科學(xué)的價值在產(chǎn)業(yè)數(shù)字化中加速得到彰顯,使得數(shù)據(jù)科學(xué)成為萬億數(shù)字化市場中當(dāng)之無愧的“價值擔(dān)當(dāng)”。
數(shù)據(jù)科學(xué):黃金時代下的“人才尷尬”
世界經(jīng)濟論壇(WEF)《新經(jīng)濟下的數(shù)據(jù)科學(xué)—第四次工業(yè)革命中的數(shù)據(jù)科學(xué)人才競爭》報告指出,數(shù)據(jù)科學(xué)在未來將是多個行業(yè)關(guān)鍵的基礎(chǔ)技能。
數(shù)據(jù)科學(xué)是什么?為何它能展現(xiàn)出如此強的魅力?
Master’s in Data Science網(wǎng)站介紹,數(shù)據(jù)科學(xué)是一個使用科學(xué)方法從數(shù)據(jù)中提取意義和洞察的研究領(lǐng)域,包括了制定數(shù)據(jù)分析策略、為分析準(zhǔn)備數(shù)據(jù)、開發(fā)數(shù)據(jù)可視化和構(gòu)建數(shù)據(jù)模型等方面。
“數(shù)據(jù)科學(xué)的核心是完成三個轉(zhuǎn)換:把數(shù)據(jù)轉(zhuǎn)換為信息,信息轉(zhuǎn)化為知識,以及用知識去支持決策。它具有綜合性的一系列方法,目標(biāo)是做數(shù)據(jù)在業(yè)務(wù)側(cè)的價值實現(xiàn)?!卑俜贮c科技集團數(shù)據(jù)科學(xué)研究院院長杜曉夢博士如是說,“數(shù)據(jù)科學(xué)天然與大數(shù)據(jù)緊密相關(guān),機器學(xué)習(xí)、運籌優(yōu)化等都屬于數(shù)據(jù)科學(xué)的分支,但它不包含人工智能仿真、機器人等研究。”
無疑,數(shù)據(jù)科學(xué)屬于一門綜合型學(xué)科,綜合了數(shù)學(xué)、統(tǒng)計學(xué)、計算機技術(shù)以及領(lǐng)域知識等。數(shù)據(jù)科學(xué)家們往往還需要在這些技術(shù)與知識的基礎(chǔ)上,具備溝通和解決問題的能力,能把具體的業(yè)務(wù)問題轉(zhuǎn)化為數(shù)學(xué)問題。
事實上,數(shù)據(jù)科學(xué)一詞最早誕生于上個世紀(jì)60年代,2000年之后開始出現(xiàn)數(shù)據(jù)科學(xué)家的職位。隨著2010年大數(shù)據(jù)概念興起,數(shù)據(jù)科學(xué)逐漸獲得了各行各業(yè)的重視。例如,大部分互聯(lián)網(wǎng)企業(yè)最近幾年均設(shè)立了獨立的數(shù)據(jù)科學(xué)團隊;而金融、電信、醫(yī)療等傳統(tǒng)行業(yè),對于數(shù)據(jù)科學(xué)人才的渴求度同樣在迅速提升。
數(shù)據(jù)科學(xué)之所以受到前所未有的關(guān)注,是因為隨著數(shù)字化進程的加深以及數(shù)據(jù)要素化,數(shù)據(jù)驅(qū)動型組織不再是虛幻的概念,而是一步步轉(zhuǎn)變?yōu)槠髽I(yè)的現(xiàn)實目標(biāo),數(shù)據(jù)科學(xué)在此過程的價值與作用逐漸彰顯,乃數(shù)字化進程中的必然趨勢。
但數(shù)據(jù)科學(xué)的綜合型學(xué)科性質(zhì),也注定成才難度指數(shù)屬于天花板級。當(dāng)下,數(shù)據(jù)科學(xué)雖然火爆,亦遇到略顯尷尬的局面:一方面,各個行業(yè)數(shù)字化轉(zhuǎn)型的深入,產(chǎn)生出旺盛的數(shù)據(jù)科學(xué)人才需求;另一方面,高校雖然重視數(shù)據(jù)科學(xué)人才,但面臨著培養(yǎng)難度大、所學(xué)難所用等難題,很難符合企業(yè)實際需求。
教育部一位工作人員透露,當(dāng)下數(shù)據(jù)科學(xué)相關(guān)人才缺口是百萬級的,雖然開設(shè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)相關(guān)專業(yè)的高校已達到近700所,不同層次的高校都在加大數(shù)據(jù)科學(xué)的人才的培養(yǎng)力度,但無論人才數(shù)量還是質(zhì)量都與實際需求尚有差距。
南方某985重點大學(xué)一位教師直言道:“老師們擅長基本功的培養(yǎng),但數(shù)據(jù)科學(xué)與實際業(yè)務(wù)問題的實踐息息相關(guān),學(xué)校很難提供這方面的培養(yǎng),需要高校與產(chǎn)業(yè)界共同突破?!?/p>
因此,攜手業(yè)界領(lǐng)先的數(shù)據(jù)科學(xué)企業(yè),改變傳統(tǒng)培養(yǎng)方式,加入實踐、實操等環(huán)節(jié)就成為人才培養(yǎng)的突破口。就如數(shù)據(jù)科學(xué)產(chǎn)教融合計劃,由產(chǎn)業(yè)界企業(yè)將多年的實踐經(jīng)驗、軟件、工具與案例整體給高校,為高校學(xué)生提供脫敏數(shù)據(jù)、完整工具、前沿經(jīng)驗等進行實操培訓(xùn)。
“這幾年,數(shù)據(jù)科學(xué)產(chǎn)業(yè)界變化很快,像數(shù)據(jù)編織、AI工程化等發(fā)展迅速?,F(xiàn)在產(chǎn)業(yè)界做項目的思路、邏輯和方法與三年前是完全不同的。”杜曉夢博士如是說,“數(shù)據(jù)科學(xué)產(chǎn)教融合計劃可以確保將產(chǎn)業(yè)界最新、最前沿的實踐和方法傳遞給高校學(xué)生。”
據(jù)悉,百分點科技集團是國內(nèi)數(shù)據(jù)科學(xué)領(lǐng)域的代表企業(yè),也是數(shù)據(jù)科學(xué)產(chǎn)教融合計劃的發(fā)起者之一,其提供集成全棧技術(shù)的數(shù)據(jù)科學(xué)基礎(chǔ)平臺,為廣大高校學(xué)生提供了實操的真實環(huán)境。“與教培軟件產(chǎn)品不同,數(shù)據(jù)科學(xué)基礎(chǔ)平臺脫胎于企業(yè)級軟件產(chǎn)品,成熟、穩(wěn)定且不會讓學(xué)生有脫節(jié)感,一切圍繞真實業(yè)務(wù)場景展開,并且會定期更新版本。”杜曉夢博士補充道。
如果說,數(shù)據(jù)科學(xué)產(chǎn)教融合是產(chǎn)業(yè)發(fā)展的必然結(jié)果;那么,數(shù)據(jù)科學(xué)在產(chǎn)品、服務(wù)等領(lǐng)域的突破,則標(biāo)志著數(shù)據(jù)科學(xué)經(jīng)歷過泡沫期之后,真正步入產(chǎn)業(yè)黃金期。那么,數(shù)據(jù)科學(xué)市場到底正在發(fā)生什么?呈現(xiàn)出哪些重要的新趨勢?中國數(shù)據(jù)科學(xué)市場又會朝著哪些方向發(fā)展?
扛起“價值擔(dān)當(dāng)”,數(shù)據(jù)科學(xué)有這些新趨勢
早在2014年,Gartner就在新技術(shù)成長曲線中將數(shù)據(jù)科學(xué)列入膨脹期的末端,并表示未來五年數(shù)據(jù)科學(xué)將逐步應(yīng)用于生產(chǎn)高地期(plateau of Productivity)。
事實情況的確如預(yù)測那樣。隨著數(shù)字化進程的加速,數(shù)據(jù)科學(xué)在各行各業(yè)數(shù)字化轉(zhuǎn)型中扮演著重要的角色,其市場也獲得了前所未有的成功。聯(lián)合市場研究報告顯示,2020年全球數(shù)據(jù)科學(xué)平臺市場規(guī)模為47億美元,預(yù)計到2030年將達到797億美元,復(fù)合年增長率高達33.6%。
事實上,市場的快速發(fā)展讓數(shù)據(jù)科學(xué)呈現(xiàn)出諸多明顯的新趨勢。首先,市場向上期和巨大的潛力,吸引了不同類型的市場參與者都涌向數(shù)據(jù)科學(xué)市場,這其中既有IBM、微軟等老派廠商,也有AWS、阿里云等云服務(wù)商,還有像Palantir、SAS、百分點這些堅守數(shù)據(jù)科學(xué)領(lǐng)域多年的專業(yè)廠商,甚至不斷涌現(xiàn)出一大批初創(chuàng)企業(yè)。
中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟一位專家認(rèn)為,與機器視覺遇到泡沫化境遇不同,數(shù)據(jù)科學(xué)市場的潛力遠(yuǎn)未爆發(fā)出來,國內(nèi)外相關(guān)企業(yè)可成長與發(fā)揮的空間明顯更大。例如,Aporia、Black Crow AI、Comet、dotData、杉樹科技等國內(nèi)外創(chuàng)業(yè)公司近年來普遍獲得了資本市場的青睞。
數(shù)據(jù)科學(xué)第二個重要的趨勢無疑就是端到端的數(shù)據(jù)科學(xué)應(yīng)用平臺,平臺與工具加速走向集成化、工程化、自動化。Gartner在《2021 數(shù)據(jù)科學(xué)與機器學(xué)習(xí)(DSML)平臺魔力象限》報告中認(rèn)為,數(shù)據(jù)科學(xué)與機器學(xué)習(xí)平臺必須實現(xiàn)全生命周期的數(shù)據(jù)科學(xué)活動,并且具備集成第三方組件、框架的能力。
Gartner認(rèn)為,數(shù)據(jù)科學(xué)與機器學(xué)習(xí)平臺未來重要的發(fā)展趨勢包括:自動化或增強數(shù)據(jù)處理、模型構(gòu)建、在線服務(wù)的各項工作;多人協(xié)作是用戶使用數(shù)據(jù)科學(xué)的剛需;開放性,如與開源工具的廣泛集成能力等。
事實上,數(shù)據(jù)科學(xué)在產(chǎn)品層面的新趨勢并不是無跡可循。一方面,企業(yè)數(shù)字化轉(zhuǎn)型所面臨的數(shù)據(jù)環(huán)境、業(yè)務(wù)聯(lián)系、數(shù)據(jù)處理鏈路加速走向復(fù)雜化,加速了數(shù)據(jù)科學(xué)平臺化的需求;另一方面,隨著各大企業(yè)的數(shù)據(jù)科學(xué)團隊配備走向規(guī)模化和正規(guī)化,數(shù)據(jù)科學(xué)團隊往往需要工程化程度高的平臺來屏蔽基礎(chǔ)工作的復(fù)雜度,提升數(shù)據(jù)應(yīng)用創(chuàng)新的效率。
當(dāng)下,有預(yù)見性的領(lǐng)先廠商均在瞄準(zhǔn)端到端的數(shù)據(jù)科學(xué)應(yīng)用平臺。例如,AWS在今年re:Invent大會上詳細(xì)介紹了其端到端數(shù)據(jù)戰(zhàn)略,推動數(shù)據(jù)處理、分析與應(yīng)用走向高效化和自動化;其他像Palantir Foundry和Apollo、SAS Viya等均為平臺化思路的產(chǎn)品。在國內(nèi),百分點科技等國內(nèi)廠商亦在端到端數(shù)據(jù)科學(xué)平臺的代表。
“過去,大家都是在各個行業(yè)中探索數(shù)據(jù)價值大多數(shù)屬于項目型,往往會研發(fā)出各種半工具化的產(chǎn)品。如今,數(shù)據(jù)科學(xué)公司自身多年行業(yè)實踐與打磨之后,工具產(chǎn)品走向成熟,具備了走向平臺化的基礎(chǔ);另外,從用戶數(shù)字化轉(zhuǎn)型的需求來看,端到端的數(shù)據(jù)應(yīng)用需求是大勢所趨,更加需要集成化、工程化、服務(wù)化的平臺來滿足用戶需求。例如,像高度集成、開箱即用的一體機形式,在各大云平臺的云版本等,都是數(shù)據(jù)科學(xué)平臺不斷發(fā)展的體現(xiàn)?!卑俜贮c科技集團首席技術(shù)官劉譯璟解釋道。
第三個重要趨勢,數(shù)據(jù)科學(xué)正加速在各大傳統(tǒng)行業(yè)的應(yīng)用與落地。除了互聯(lián)網(wǎng)企業(yè)在幾年前就陸續(xù)將數(shù)據(jù)科學(xué)團隊部署到業(yè)務(wù)之中外,像金融、航空、制造、醫(yī)療等行業(yè)龍頭的數(shù)據(jù)文化、組織架構(gòu)以及數(shù)據(jù)思維都在不斷成長,積極推動數(shù)據(jù)科學(xué)在業(yè)務(wù)場景中的應(yīng)用。
而數(shù)據(jù)科學(xué)平臺化的產(chǎn)品趨勢,有利于行業(yè)復(fù)雜業(yè)務(wù)能力的沉淀與賦能,進一步降低了數(shù)據(jù)科學(xué)在行業(yè)用戶中的門檻。例如,國內(nèi)像華為云、百分點科技等數(shù)據(jù)科學(xué)代表公司,都在強調(diào)其對于行業(yè)業(yè)務(wù)模型的沉淀與積累,行業(yè)用戶無需從頭投入,加速了端到端數(shù)據(jù)應(yīng)用的落地。
一位制造業(yè)的數(shù)字化負(fù)責(zé)人直言:“同行經(jīng)過業(yè)務(wù)驗證過的業(yè)務(wù)模型很有價值。通過借鑒,再結(jié)合自身情況,對于我們業(yè)務(wù)場景的數(shù)據(jù)應(yīng)用能夠少走彎路?!?/p>
中國數(shù)據(jù)科學(xué)市場或迎爆發(fā)
與國外市場相比,中國數(shù)據(jù)科學(xué)市場的增長速度和市場潛力更值得期待,未來幾年或迎來爆發(fā)期。
當(dāng)下,中國數(shù)字經(jīng)濟的快速發(fā)展給中國數(shù)據(jù)科學(xué)市場夯實了前景廣闊的外部市場環(huán)境。尤其是近年來數(shù)據(jù)要素化的步伐在提速,對于數(shù)據(jù)流動、共享、分析與應(yīng)用帶來更多便利。今年六月,中央深改委審議通過《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,再次強調(diào)促進數(shù)據(jù)高效流通使用、賦能實體經(jīng)濟以及加快構(gòu)建數(shù)據(jù)基礎(chǔ)制度體系。
另外,經(jīng)過多年的信息化與數(shù)字化建設(shè),中國各個行業(yè)的數(shù)字化轉(zhuǎn)型正在開啟新的階段,很多行業(yè)用戶在數(shù)據(jù)采集、治理等方面完成階段性工作,數(shù)據(jù)驅(qū)動型業(yè)務(wù)成為接下來的主旋律,數(shù)據(jù)科學(xué)在其中的作用與價值將會愈發(fā)突出。
以數(shù)據(jù)量最豐富領(lǐng)域之一政務(wù)領(lǐng)域為例,國務(wù)院十月發(fā)布的《全國一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》指出,隨著數(shù)據(jù)治理階段性工作結(jié)束,在2023年底前,全國一體化政務(wù)大數(shù)據(jù)體系有望初步形成,接下來重點是基于數(shù)據(jù)的應(yīng)用與創(chuàng)新。
更加重要的是,中國數(shù)據(jù)科學(xué)的產(chǎn)業(yè)生態(tài)正在穩(wěn)步形成和高速發(fā)展。生態(tài)中既有像阿里云、華為云、AWS云服務(wù)平臺商,也有聚焦數(shù)據(jù)科學(xué)領(lǐng)域多年的專業(yè)廠商,更有像運籌優(yōu)化求解器、機器學(xué)習(xí)平臺、BI等數(shù)據(jù)科學(xué)細(xì)分領(lǐng)域眾多初創(chuàng)企業(yè)。例如,百分點科技就是國內(nèi)聚焦數(shù)據(jù)科學(xué)領(lǐng)域多年的代表,其在政務(wù)、融媒、公安、應(yīng)急管理等多個行業(yè)扎根多年,一直推動數(shù)據(jù)科學(xué)在各個行業(yè)的應(yīng)用與實踐。
在數(shù)字化人才方面,教育部未來計劃投入4000億進行數(shù)字化人才培養(yǎng),很重要的方向之一就是聚焦大數(shù)據(jù)、人工智能、數(shù)據(jù)科學(xué)相關(guān)的人才培養(yǎng),未來有望解決數(shù)據(jù)科學(xué)領(lǐng)域人才匱乏的局面。
總體來看,數(shù)據(jù)科學(xué)在過去五十多年里一直都在坐“冷板凳”,外部條件和市場環(huán)境的限制,使得數(shù)據(jù)科學(xué)并未受到重視和充分發(fā)揮價值。隨著大數(shù)據(jù)的興起以及數(shù)據(jù)要素化的提速,數(shù)據(jù)驅(qū)動的需求走向井噴,數(shù)據(jù)科學(xué)也真正迎來了“春天”。面向未來,數(shù)據(jù)科學(xué)有望在更多行業(yè)與場景中發(fā)揮更大作用,在數(shù)字化轉(zhuǎn)型中扛起“價值擔(dān)當(dāng)”。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。