經濟觀察報 關注
2019-05-18 13:09
(圖片來源:全景視覺)
經濟觀察報 陳季冰/文 兩年前的這個時候,2017年5月,英國《經濟學人》雜志發表文章,將數據比作“未來的石油”。自那以后,數據是“21世紀最寶貴的資源”這種觀點便在傳媒領域和學術界傳播開來。
而隨著2018年初Facebook多達5000萬用戶數據遭泄露丑聞的曝光和發酵,普通大眾對于數據的關切也達到了前所未有的程度,要求對數據的管理、流通、特別是商業化運用做出規范和監管的呼聲在全球各地此起彼伏。
一年前的這個時候,2018年5月,歐盟《一般數據保護條例》(GeneralData Protection Regulation, 簡 稱GDPR)生效。這是世界上第一個嘗試對數據這塊“新大陸”做出系統性闡釋和規范的法律文本,堪稱世界上第一部“數據憲法”。但GDPR從還在“懷胎”之時起就備受爭議,從某種程度上說,這正是它所肩負的歷史使命的折射。不管它的最終命運將會如何,它的誕生宣告了人類“數據時代”的正式開啟。
然而,如果想要對數據進行有效管理,以更好地適應這個業已降臨的“數據時代”,我們首先必須對這種伴隨人類社會之初就有、但被新技術賦予了全新價值的存在物的性質有一個比較清晰準確的認知。我的看法是,將數據比喻成“當代的石油”,只是一種令人印象深刻的文學方式。但這種比喻對于我們正確認識數據的本質、進而采取有的放矢的應對舉措是無益的,更可能還會產生嚴重的誤導。
一
將今天的數據比作100年前的石油,建立在一個看起來十分可靠的共性上:兩者都是各自時代中最重要的經濟資源。在經濟學視野中,凡是能夠直接產生經濟價值的東西,皆可稱為資源。數據在今天毫無疑問是越來越重要的資源,關于這一點,廣告業的概貌就能讓我們一目了然。
目前,全球市值最高的10家公司中有7家是互聯網科技公司。除了蘋果和微軟,其余5家都是直接“經營”數據的公司——谷歌和Facebook對用戶的個人特征和興趣了如指掌,亞馬遜對用戶過往的消費行為一清二楚,騰訊和阿里巴巴不僅掌握了數億中國人的所見所聞所想和消費情況,還充當著他們的數字錢包,甚至幫助逐漸建立起對未來經濟和社會發展至關重要的信用體系……這意味著,數據不僅重要,而且重要性正與日俱增??梢院敛豢鋸埖卣f,在當今世界,收集、分析和銷售數據,是增長最快的一個領域。
數據不僅本身能夠產生價值,更重要的是能夠幫助幾乎每一個行業優化業務,提升效率,進而創造出新的商業機遇。正因為看到了這種幾乎一望無邊的歷史性機遇,在科技公司開疆拓土的同時,各行各業緊隨其后,以前所未有的熱忱擁抱數據時代。眼下,別說是蘋果和微軟,就是GE和西門子這些典型的20世紀工業巨頭都紛紛把自己包裝成了“數據公司”。在中國,小米集團一直對外宣稱,自己賣的是“服務”,而不是手機,其主要收入來源不是硬件,而是建立在數據之上的網絡服務。
學術界和新聞界則不吝惜使用各種高級形容詞來表達對數據所蘊含的巨大潛力和驅動力的敬畏。有人指出,數據正在越來越大的程度上決定經濟價值,重塑權力的執行,并入侵到我們生活的最深層。因此,由誰以及怎樣收集、擁有和使用數據,事關一場根本性變革的方向。這場“數據革命”發生的速度、規模和深遠程度是驚人的,以至于我們正從“金融資本主義”時代邁向一個“數據資本主義”的時代,甚至是一種“數據新宗教”的時代。
這些說法或許并不算太夸張,因為數據確實正在深刻地改變著許多東西。我在這里僅舉一個簡單的經濟學學術例子——
在工業經濟時代,衡量一個經濟體經濟活動的最有效指標無疑是GDP,它以貨幣作為媒介單位。但正如一位澳大利亞經濟學家曾指出的,數字經濟時代的大量經濟活動將貨幣媒介排除在外了。例如,消費者可以“免費”獲得Facebook提供的許多服務,而Facebook反過來通過“免費”使用用戶的數據來獲得補償……在這一過程中,Facebook與消費者(用戶)跳開了貨幣這種媒介,直接使用數據展開交易。于是,這部分經濟活動便被GDP統計所遺漏了。盡管傳統工業經濟時代的GDP數據也遺漏了一些“免費”的經濟活動,例如家務勞動的產出,但那些不能與當今一日千里的“數據經濟”同日而語。
對于經濟學研究來說,真正革命性的變革或許還在襁褓中。長期以來,經濟學一直試圖通過對社會上的經濟活動進行更大規模、更細致的、更加動態的觀察、收集和分析,來得到更精確的研究結論。換句話說,使自己變得更像一門自然科學。然而,經濟學家們的這份雄心面臨著一道難以逾越的障礙:缺乏足夠“先進”的工具,可以去記錄、收集和分析如此海量和變動不居的數據。但如今,數據技術的進步使得長久以來的期盼成為了可能,于是實證經濟研究的最前沿正在醞釀著一場“革命”。對于經濟學家來說,這既是機遇,也是挑戰。
話說回來,既然數據對經濟和社會那么重要,對它進行監管以促進其規范性發展自然也就迫在眉睫了。
二
數據的確是重要的資源,甚至是21世紀最重要的資源,但它不是石油。這主要是因為,在數字經濟時代,傳統認知中“資源”這個概念本身的含義已經日益捉襟見肘,它迫切需要被改寫。
首先,對于傳統意義上的“資源”或者“資產”(這個詞可能更準確)而言,它的第一條、或許也是最重要的一條屬性便是,要對“所有者”進行清晰的界定。不解決所有者問題,任何資源就都無法正當地產生經濟價值——一個油田或一家石油企業,如果老板是誰都搞不清楚,它們能正常開采和經營嗎?這就是為什么產權的界定對市場經濟體制如此至關重要的原因。
然而,對數據這種21世紀的新型資產來說,“所有者”或“產權”是一個難以確定的概念。
2017年10月,職業社交公司領英(LinkedIn)起訴一家叫作HiQ的“數據檢索”公司,原因是后者抓取領英上公開的個人簡介數據,并基于此開發出兩個面向企業雇主的雇員市場信息產品。
這個案子的典型意義在于,它讓更多人聚焦于這樣一個問題:領英上的那些公開數據難道是屬于領英公司的私有資產嗎?類似的問題同樣適用于谷歌和Facebook等互聯網大公司。
顯然,這是站不住腳的。就像哈佛大學教授、美國杰出的憲法學者勞倫斯·特賴布(LaurenceTribe)所說的,如果你認可互聯網是新的城市廣場,同時“數據是中央型資本”,那么它就必須讓所有人都可以免費獲得。
再看中國,過去幾年里輿論洶洶的“頭騰大戰”、“新浪訴脈脈案”、“大眾點評訴百度案”……每一個都有各自的獨特關切,然而它們的直接聚焦同樣也都是這個問題:騰訊、新浪和大眾點評上那些公開的用戶信息和數據,能不能算作這三家公司的財產?中國法院在裁決這幾起訴訟案時都采取了模糊化的辦法,法院一方面承認數據平臺對于平臺內的信息具有一定的控制權,但又沒有明確這種控制權究竟屬于何種性質。在我看來,法院這么做是睿智和破壞性最小的。
在這方面最典型的例子莫過于“人人網易主”這件事了。2018年底,曾經被稱為“中國Facebook”的人人網被北京多牛傳媒公司收購。這起并購本身在業界并不是什么大事,但從尋找同窗的“校內網”到半夜偷菜的“開心農場”,人人網承載著許多人(特別是80后一代)的青春記憶。他們擔心,人人網換了老板以后,自己的那些“青春數據”會面臨什么樣的命運?它們會被妥善保管嗎?會被拿去用于商業挖掘嗎?自己的隱私會不會被侵犯……還有,這些數據本身在這次交易中是不是被賣了錢?當然不能認為它們是人人網或多牛傳媒的資產。
那么,假如數據不屬于那些互聯網平臺,是不是可以反過來認為,騰訊、新浪、大眾點評和人人網上的那些個人數據的所有權都屬于發布(上傳)這些數據的用戶自己呢?好像也不能這么說。因為如果是那樣的話,就意味著平臺只有在事事征得用戶同意的前提下才可以處理這些數據。但這是根本不可能的,除非用戶并不想要在平臺上獲得任何服務。
中國現有法律對于“數據權”的定義也是十分模糊的。2017年生效的《民法總則》征求意見稿的最初文本將“數據信息”一體納入“知識產權”進行保護,后遭多數專家反對,最終只留下“法律對數據、網絡虛擬財產的保護有規定的,依照其規定”以及“自然人的個人信息受法律保護”等模糊的宣示性內容。將數據視作一種“虛擬財產”或者更為籠統的“信息”,而非定義清晰的“知識產權”,這是我國立法在“數據權”設定方面的謹慎嘗試,也反應了數據的復雜性質。
作為世界上第一個專門為數據立法的嘗試,2018年5月25日生效的歐盟GDPR也沒有界定數據的“所有權”問題。但為了強調“個人數據權”是一項基本權利的宗旨,除了隱私保護等之外,它還創設了一個新的法律權利——“可攜帶權”。GDPR第20條第2款說,在技術可行條件下,用戶有權要求數據控制者向第三方直接傳輸數據。簡單地說,根據這項法律條款,我可以要求多牛網把我原來在人人網上的數據“轉移”到其他網站或平臺。然而,眾所周知,要轉移(傳輸)數據,就需要不同的數據系統在技術上兼容。但GDPR沒有要求數據控制者(平臺)有主動去兼容其他平臺的義務。換句話說,多牛網可以以“系統不兼容”為理由(事實上它說的也的確是實話),拒絕我對它提出的將我在人人網上的數據轉移到我的個人郵箱的要求。于是,這項與GDPR本身一樣受爭議的權利很可能因此形同虛設。
2019年3月中下旬,阿里巴巴發起的羅漢堂在杭州召開“隱私與數據治理”國際研討會,好幾位與會的頂級專家嘉賓在發言中都講到了數據的權益和賦權這一“世紀難題”。他們從理論和實踐的不同角度達成了基本共識——
數據是有價值的,因此是一種資源,但很難說它“屬于”誰。換一種表達或許更加清晰,不像過去時代里的“產權”概念,“數據的所有權”這個概念并不能對我們時代的經濟和社會起到什么作用,它是一個沒有意義而且還可能造成麻煩的東西。
阿里巴巴集團首席安全專家杜躍進的觀點最有典型性:在互聯網時代,用戶數據在整個一個異常復雜的鏈條里不斷產生并被不斷分享。用戶想要明確地獲知這些因為自己的消費活動而產生的數據究竟會被怎樣使用,幾乎是不可能的,也沒有一家公司能夠回答這個問題。杜躍進因此認為,如果用保護石油權益這樣的傳統思路去保護數據資源,數字經濟的未來就面臨被葬送的危險。
從經濟學理論的角度來看,為什么討論數據的“產權”是沒有意義的事?根源在于,產權的有效性建立在資源(或資產)是稀缺的,而它的使用是排他的這兩個基礎之上。但正如杜躍進所言——
首先,數據不是石油這樣的自然資源,它是由人生產的,并可以源源不斷地再生;數據取之不竭,傳輸又超級便宜,而且只會越用越多,而不是越用越少。谷歌前CEO埃里克·施密特(EricSchmidt)以前曾說過,我們每兩天就會創造1艾(quintillion,10的18次方)字節的海量數據,這個數據相當于從有文明以來一直到2003年人類創造的所有信息的綜合。不過,最新的研究更新了施密特提供的數據。過去數年里,全球的數據量以每年將近60%的速度增長。據稱,目前全球每天產生的數據已達大約2.5艾字節,這意味著世界上90%的數據是在過去兩年產生的。到2020年,全球數據總量將超過40ZB(相當于4萬億GB),為2011年數據總量的22倍。而隨著人工智能(AI)和物聯網的問世和應用,數據還將迎來一個指數級增長的新紀元。不僅數據的數量和形式在成倍的增加,更為重要的是,數據的成本在急劇降低。據稱,數據存儲、傳輸、計算的成本降低到了50年前的幾千萬分之一、甚至是上億分之一。在人類的歷史上,還沒有哪一種“資產”是以這樣的速度在急劇膨脹。
第二,同一堆數據,你我可以一起使用,并不是說你多占用一點,我就得少占用一點。正相反,數據必須共享和流動,才會產生價值。數據的非排他性的另一個表現是,同一個數據,并不是使用過了之后就“消耗”掉了(像石油那樣),而是可以不斷重復使用,用作各種不同的用途。況且,數據的管理也不可能做到中心化,因此誰(許多環節上)都有可能獲得數據,甚至濫用數據。
“非稀缺性”和“非排他性”決定了數據這種資源不是石油,進一步說,也意味著“資源”這個概念迫切需要被改寫。
三
在相對次要的程度上,還有一些明顯的特征也將數據與我們習慣上認為的“資源”區分開來。例如,數據雖然有價值,但卻幾乎不可能形成一種真正意義上(或傳統意義上)的“市場交易”。
原因首先在于,數據的價值會因時因地而截然不同。雖說傳統資源或資產的價值也會隨著時間的推移而升值或貶值,也會因為各地文化和市場情況不同而不同,但歷史上從未有過一種資源或資產的價值,像數據那樣易變。以至于相對它而言,石油簡直就是價值“恒久遠”和“永留傳”了。
在相當多的情景之下,數據甫一生成就已失效。即便是那些能夠用于商業挖掘的數據,也有極強的時效性和地域性。以前人們常說“新聞是易碎品”,其實新聞不就是數據大家庭中的一個種類嗎?有評論者指出,大數據與其說是“大”的數據,毋寧說是實時在線的“活”的數據。大數據之價值正在于它處在不斷變動之中,新的數據時刻在覆蓋舊的數據。這是傳統資源或資產概念所不能理解的——新油田的發現并不會使老油田里開采出來的石油不再有用。
數據難以形成市場交易的另一個更重要的原因在于,它雖然“有價”,但卻難以被準確地“定價”。數據不僅有上述提到的時效性和地域性,還有強烈的主觀性。它的價值在很大程度上取決于產生數據的主體的主觀個性,以及控制數據的機構(平臺)對數據進行商業化的能力和特長。
眼下,許多評論者都喜歡說,互聯網上的“免費”其實并不便宜。相反,消費者為此付出的代價可能極為昂貴。這話籠統地說當然是對的。Facebook憑什么賺這么多錢?還不就是因為幾億日活用戶平均每天花50分鐘時間在它上面“耕耘”嗎?然而,對于每一個不同的用戶而言,他們交出去這些數據所期望得到的回報卻是千差萬別的,而且還會隨著場景的改變而改變。同樣地,Facebook上的同一組數據,不同的廣告商在使用它們時,愿意向Facebook支付的價格也是截然不同的。更重要的是,數據如果不聚合在Facebook這樣的平臺上,并由它進行開掘,分散在世界各地的這幾億人的零碎數據可以說毫無價值可言。
由此可見,將數據看成石油,可能不是一個能夠很好地幫助我們理解它的經濟性質的類比。還有學者和立法者將它視作是一種“知識產權”、“專利”、“隱私”或“勞動付出”……然而,迄今為止每一種對數據的定義或類比都存在難以克服的重大缺陷,以至于還不如干脆沒有這些定義或類比。
舉例來說,無論是上述所列的“知識產權”、“專利”、“隱私”或“勞動付出”,都存在一個主體,也就是所有者。但我在前面已經分析過,數據的根本“困境”恰恰在于:我們幾乎不可能去界定它的所有者。
進一步以“隱私”為例,這已不僅僅是一個經濟概念,還是公民的一項憲法權利,類似于人生安全、言論、集會、結社、選舉之類。數據中當然一定包含著隱私問題,事實上,保護公民隱私也是備受爭議的歐盟GDPR的根本著眼點。但過分放大數據中的隱私因素,則可能會產生嚴重的現實后果,還不僅僅是束縛數字經濟發展的問題。
舉一個比較傳統的例子吧,一個病人去醫院看病,醫生肯定要詢問他(她)很多問題,諸如他(她)的年齡、性別、身高體重、生活習慣、某些過往經歷,甚至還經常會涉及他(她)的婚姻家庭生活……這些大多可以看成是隱私。醫生或醫院在對病人進行診斷治療的過程中,每一個環節都會分享病人的這些隱私。以往,醫院假定,病人只要一踏進醫院接受診斷和治療,就視作他(她)默認同意醫院內部分享自己的這些隱私,甚至出于診斷或科學研究的目的,還可以分享給其他醫療機構或科研機構??傊?,醫院唯一需要規避的就是將它們泄露到社會上去,比如販賣給商業機構。而今天,人們在使用互聯網平臺時,無時不刻不在向它們交出這些涉及隱私的數據。如果互聯網平臺不能獲得傳統上醫院被默認獲得的這種涉及客戶隱私的假定,那么它就不可能很好地提供服務。
此外,還有一個難點在于,對隱私這個概念本身,不同人、不同時代的定義以及重視的程度也有很大差別。
因此,在歐盟GDPR已經正式生效一周年之際,人們在究竟應該如何看待和認定數據的問題上依然眾說紛紜,難有共識。這也就是為什么美國和中國這兩個互聯網數字經濟遠比歐洲更發達的經濟體迄今對于如何監管數字經濟行動遲緩,不愿意輕率行事的根源。
正在漸漸形成的唯一共識或許是,數據是一種資產,需要得到適當的對待和監管,我們需要重新思考既有的經濟運行規范框架,不論是有形的法律制度還是無形的行為習慣?,F有的商業規范都形成于“石油時代”,如果數據這種資源與石油迥然不同,那么數字經濟時代就需要有新的思維模式。
京公網安備 11010802028547號