劉興亮|大數據與區(qū)塊鏈的碰撞

文/劉興亮(微信公眾號:劉興亮時間)

?

大數據與區(qū)塊鏈是當今最熱門的兩個話題,帶動了一系列的投資熱潮。不論是風投領域,還是傳統(tǒng)的金融領域,只要有這兩個關鍵詞出現,往往能讓企業(yè)獲得特別的關注。這也說明了這兩個詞在當今社會的火爆程度。

我們在前文中已經從各個維度對區(qū)塊鏈進行了詳細闡述,那么大數據又是什么呢?現在很多人都認為,大數據的本質是「大」。也就是說,它的數據量必須非常的廣泛和巨大,可能是海量級的。其實這并不準確。

大數據所指的「大」其實更偏向于全,也就是盡可能地接近某個統(tǒng)計范疇內最全面的數據,甚至達到全數據的統(tǒng)計結果。只有這樣才能真正實現大數據的基本目標。

大數據引起人們的關注,事實上是因為可以通過它對未來做出預測,獲取詳細分析,對未來進行有針對性的指導。想要實現這些,最重要的就是數據的提取和分析。

事實上,大數據目前最成功的領域是在歷史學。這可能是一個平時不太引人注目的范疇。但事實上,正是因為在歷史數據的分析方面發(fā)揮了巨大作用,人們才會對大數據有了更大的興趣。

最早進行這種分析的是一位英國的歷史學家。他把所有歷史數據進行了一次編碼——當然這里的歷史數據指的是關于重大事件與經濟、政治等方面的數據。之后,他把這些編碼以一個自有的邏輯對其進行了分析。

例如,在一個重大的政治事件發(fā)生之前多少年,會發(fā)生一次旱災,或者一次重大疾病的流行對宗教的傳播有什么影響。以這樣的模式,這位歷史學家對過去幾千年的人類歷史進行了一次梳理和分析。結果他發(fā)現了一個預測模式,通過這個模式,他甚至可以預測未來的某一年,在世界上的某個國家會發(fā)生什么樣的重大歷史事件,而這種預測的準確率達到了一個很高的水平。

雖然這些所謂的預測最終可以被改變,因為人們已經掌握了規(guī)律,可能采取一些措施,但是這樣的嘗試給了人們一種可能:也就是通過對過去的歷史數據進行分析,可以得到對未來發(fā)展變化的預測。這當然也符合我們現在所有的預測模式。比如在灰色預測過程中,事實上就是通過將過去的數據放入方程,去預測未來的發(fā)展模式,而這一切都與數據相關。

因此我們可以認為,假如有足夠多的數據量,就可能對世界上所有即將發(fā)生的事情進行預測。如果能夠做到這一點,那么無疑我們將控制整個世界的變遷。

這要怎么做到呢?要實現這一點需要不斷提取盡可能多的數據。

但是,現實和理想總是有區(qū)別的。在整個大數據分析過程中,有一種觀點是:世界上只有 5% 的數據是結構化數據,也就是人們常規(guī)認為的數字信息;剩下 95% 的數據都是不可量化的。這意味著,不可能有絕對正確、絕對全面的數據。

通過區(qū)塊鏈模式,可以盡可能地將那些非結構化的數據進行結構化處理。通過將現有各種數據拆解并存儲于各個存儲單元,我們能對整個世界的數據模式有更加清晰的認知。

既然說到區(qū)塊鏈,那么要解決的一個問題必然是信息的安全性問題。區(qū)塊鏈在這方面所能起到的作用是不可替代的。通過將區(qū)塊鏈應用到各種數據的提取過程中,就可以實現我們對各種研究所需的非結構化數據的集中使用,而不用擔心這些數據被肆意傳播和濫用。這也就預防了可能出現的數據風險。

從更深遠的意義來說,我們對數字的應用模式從根本上發(fā)生了變化。也就是說,我們過往的研究所需要使用的數據,往往都是某個機構積累的,或者某些企業(yè)出錢購買的數據。但是當我們通過區(qū)塊鏈模式鏈接各種各樣的數據之后,就會發(fā)現數據之間的壁壘被打通了,研究也會變得更加順暢,大數據分析也就變得更加有效。

當然,區(qū)塊鏈也可能帶來另外的問題。

在大數據研究中,有的時候我們需要對某一群體的特征進行精確的分析和描繪。但是大數據要求的這種數據模式,在區(qū)塊鏈中卻很難實現。比如說,我們要確認一組人群——80后或者90后——他們在職場中真正面臨的困境是些什么。通過對這個問題的進一步細致和深化,我們就可以把分布式存儲在各個領域里的、關于各種各樣情境的困惑集中起來,形成我們的結論。

但如果再進一步,想了解某一家企業(yè)、一個群體或者某一個具體區(qū)域的人群的特點,我們就無法得到有效的數據標簽來實現分析了。

換句話說,區(qū)塊鏈通過犧牲數據的個性化標簽來實現我們對某一類問題進行系統(tǒng)研究的可能性,但是同時也讓我們在進一步的分析過程中,遭遇數據提取的困難。

總體來說,區(qū)塊鏈還是為大數據研究提供了一種非常有效的支撐。它可以幫助我們更好地實現大數據的應用,也解決了各種數據之間橫向遷移時的壁壘。

而另一方面,大數據也為區(qū)塊鏈的應用提供了更好的支撐。

從目前的情況來看,區(qū)塊鏈的應用范圍依然比較狹窄。雖然它在很多領域中都有非常好的前景和解決具體問題的能力,但是具體到某個領域的時候,區(qū)塊鏈卻總是很難實現目標。

在這種情況下,如何能夠取得突破,快速找到一個能夠讓區(qū)塊鏈落地并且被大家使用的方式,就非常重要了。

與之相反,大數據的應用事實上已經被很多人所接受。尤其在商業(yè)領域,通過大數據分析實現商業(yè)競爭的目標,也成為很多企業(yè)的首選做法。在這種環(huán)境下,如果區(qū)塊鏈能夠給大數據的研究提供更好的支撐,可能就會帶來對區(qū)塊鏈應用需求的上升,這事實上可以為區(qū)塊鏈的應用和推廣帶來非常好的推動作用。

區(qū)塊鏈與大數據的整合,在未來將是一個必然的趨勢,大數據的研究將越來越深入地觸及人類社會的底線。我們的隱私、數據權利和思想權,都將成為討論的范疇。

而區(qū)塊鏈則可以讓大數據的研究跨越這些壁壘,形成無標簽化的數據結構,讓大數據研究者僅從數據看數據,而不考慮倫理的種種限制,這事實上也為未來的技術研發(fā)帶來更廣闊的可能性。同樣,借助大數據的東風,區(qū)塊鏈也有可能很快找到自己在現實中的落腳點,獲得更好的發(fā)展。

?注釋:

文中圖片來源于網絡,如有侵權請私信聯系后臺

免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。

免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-03-19
劉興亮|大數據與區(qū)塊鏈的碰撞
在整個大數據分析過程中,有一種觀點是:世界上只有 5% 的數據是結構化數據,也就是人們常規(guī)認為的數字信息;剩下 95% 的數據都是不可量化的。

長按掃碼 閱讀全文