<tt id="ww04w"><rt id="ww04w"></rt></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <li id="ww04w"></li>
  • “棱鏡”下的大數據隱憂

    2013-06-21 11:25

    經濟觀察報 王曉夏/文  圍繞著不速之客愛德華·斯諾登,正上演了一出大戲,尖端級國家機密、黑客、潛逃、引渡、鋼管舞女友、謊言、戀人離別、個人權利和國家利益、公義和職業操守、大國間的博弈……種種矛盾和沖突一一展現,人們仿佛在觀看一部好萊塢大片。

    在這場全景式的真實電影之中,有太多的細節和橋段被媒介從多個維度去討論和爭議。在一系列爭議之中,隨著IT業巨頭們紛紛被斯諾登拉下水,“大數據”(big data)這一個先鋒技術概念再次被拉到聚光燈前。

    斯諾登披露,谷歌、Facebook、微軟、雅虎等互聯網巨頭都向美國政府提供的服務器后門,這一項目被命名為“棱鏡”(Prism)。

    “棱鏡”如同一條高速公路,讓美國國家安全局可以從IT巨頭的服務器中獲得包括電子郵件、搜索記錄、視頻和語音交談、視頻、照片、VoIP通話、文件傳輸、社交網站信息等海量數據。此后,這些海量數據進入“大數據”分析系統這座加工廠。分析師使用強大的運算能力,對信息進行檢索、比對和分析,再通過比對現實世界中信用卡或者電話錄音等方式,幾近真實地還原每一個人的真實狀況。

    事實上,這種效率已經被美國官方所證實。當斯諾登事件發生后,或許為了給“棱鏡”計劃開脫,美國官方公開宣稱,他們借助“棱鏡”計劃成功挫敗了多起恐怖襲擊。這一事實向世人再次展示了大數據技術擁有的巨大潛能,同時也折射出潛能背后的深深隱患。

    大數據和隱私

    十年前我在國外讀書時,身邊的一位學長總是神經兮兮地向我和其他同學建議:在給國內親友打電話時,電話中最好插一些涉及軍事等敏感詞,如同彈道導彈、核潛艇之類的詞匯。

    在他看來,外國人這個群體的通信始終會被“一些秘密機構”監聽。作為對個人隱私權遭受侵犯的抗議,如果所有普通人都在電話中夾雜一些容易被注意到的關鍵詞,會增加這些機構的工作量,增加其成本,最終獲得干擾對方監聽的效果。

    當時我并不清楚是否會存在類似的組織,也不知道這種組織到底是用人力還是用計算機系統來完成監聽工作,但我猜想,用成本相對低廉的計算機軟件系統來實現監聽和識別,以當時計算機的運算和存儲成本,學長的建議是可行的,能有效增加這一可能影子組織的監聽成本。所以很長一段時間內,在給國內打長途電話時,我都照此方法,總是夾七夾八地說一些不著四六的話。

    那個時候,谷歌兩篇關于描述大規模軟件平臺的論文剛剛發表,其中一篇講如何通過網絡來快速準確地訪問分布在世界各地服務器上的硬盤,集結存儲和讀取大量數據(GFS技術),另外一篇講如何使所有服務器的計算資源為你所用,共同完成一個龐大的運算(MapReduce技術,云計算的核心技術之一)。兩篇論文所涉及技術的核心,就是如何運用龐大網絡系統來應對龐大數據的運算。這種分布式系統,依托網絡的力量而擁有超級計算機的運算能力。 

    轉眼間,十年過去了,曾經停留在紙面的兩篇科技論文變成了成熟的技術應用,而伴隨著計算機運算和存儲能力的提升,以及相應成本的下降,網絡化計算能力得到指數倍的提升。時下,隨便哪個網站都可能需要處理數量巨大的在線數據,例如,當你使用谷歌在線翻譯,尋找英語單詞“light”是該翻譯成中文的“光”還是“輕”時,一瞬間谷歌就會檢索數十億頁的翻譯資料。

    事實上,盡管谷歌是最重要的大數據商,但過去幾年間許多網絡公司也都投入了很多精力,開發能夠在上萬臺服務器上分析處理線上數據的軟件平臺,而且在這些處理“大數據”的軟件完成之后,這些公司將成果公開了,任何感興趣的人都可以使用。

    在這種龐大的運算能力面前,此前似乎像散沙一樣不具備任何關聯性的海量數據得到了有效處理。如同處理人們千差萬別的電話錄音一樣,首先對不同語種和口音的錄音進行數字化轉換。盡管錄音和錄音之間的音調音色沒有任何規則可言,涉及到的內容也千差萬別,但這種不具備結構化和不規則的海量數據,被強大的網絡化運算能力分配到世界各地數百或數千臺電腦上,進行分析比對。例如,Facebook公司開發的運算系統可以處理超過100PB(即十億GB)的數據。

    在這種大數據處理能力面前,學長此前的招數被技術進步化解得毫無用處。

    事實上,沒有規律和結構可言的數據并不僅僅只有電話錄音,任何上網痕跡都可以通過強大的運算能力得到分析比對,人們的真實身份、性格、消費習慣、需求等等個人信息都可以被還原。海量分析出的這些結果,可以服務于各種各樣的決策,首先被廣泛應用到商業領域。

    諸如谷歌和百度這樣的搜索引擎,在你連續搜索若干關鍵詞后,它們就可以輕松知道你想要做什么。在相關搜索結果的頁面上,你總能看到谷歌和百度為你量身推介的廣告,而這些廣告中總有一個和你的需求相關。

    搜索引擎企業作為最具代表性的大數據企業,在為你免費提供各種信息服務的同時,也將你和其他眾多用戶的信息用來為第三方服務,特別是那些需要面對大眾的商家。比如洗發水生產商這樣的消費品企業,他們需要借助大數據商的數據分析,來幫助他們了解自己的客戶的真正需求。

    這一商業行為一開始,大數據商們就已面臨侵害個人隱私的指責和質疑,但大數據商們總是宣稱,所有用戶數據都只是被用于機器層面的應用,得到的也是整體性運算結果,不會危及個人隱私。但是,在斯諾登揭露了這個“暗黑世界”后,人們才驚奇地發現,大數據服務商都需要面對一個最大、而且要求更加具體的客戶——政府。

    在IT巨頭們海量數據庫的幫助下,美國政府不僅可以像洗發水生產商一樣來優化決策,提升應對恐怖襲擊的能力,更重要的是可以直接找到威脅國家安全的恐怖分子。

    面對一個個體生活不斷被互聯網信息化高度整合,甚至裹挾和綁架的時代,暫且不去討論大數據技術是否會淪為一個專制的惡政府的可怕工具。即便一個民主政體出于一個好的目的,但是,你永遠無法判斷結果的好壞,因為魔鬼永遠用一個好的理由將人們帶向地獄。

    棱鏡事件折射出的對個人隱私權的漠視,似乎正成為一個可怕結果的開始。

    正確的決策?

    自古以來,政府就是數據的最大使用者,從人口統計,到稅務征收,再到戰爭動員,國家涉及到的功能都和數據有關。數據如同感知外部世界的觸角,政府借此不斷調整自己的決策,使其符合外部環境的變化。

    和此前由人工統計的數據相比,網絡時代的數據更多來自機器,比如某條街道上記錄車流量的攝像頭,等等。隨著人類社會的數據規模呈指數級增長,對數據進行加工和分析的主角,也由原先統計和分析人員變成了程序員和算法師。

    后兩者借助大數據技術,建立了無數而且復雜的數學模型,模型之間也用復雜的算法進行嵌套,例如你用谷歌分辨幾個搜索關鍵詞和“流感”的關聯度,谷歌往往會通過全球范圍內的服務器去測試四億五千萬個數學模型的結果。

    相比網絡之前的時代,時下的數據分析能力得到了空前的提升,但誰能保障大數據分析的準確性呢?我們可以回過頭去,看看電腦是如何得出這個結果的,或許可以查閱一下硬盤上的數據,或許可以檢查一下一兩個程序代碼,來判斷其邏輯是否有誤。但在大數據時代,因為大數據算法和結構太過復雜,從外部沒有人能夠追溯錯誤的源頭。

    維克多·梅耶·松博格與肯尼迪·古奇爾在他們合著的《大數據:改變我們生活、工作、思考的革命》一書中,記錄了這一件事:在2004年美國國家安全局依賴大數據系統,自動分析生成了一張禁止飛行的危險人物名單,但這一名單錯誤百出,甚至美國參議員也赫然在列。幸虧國家安全局一名算法師從內部阻止了這張名單生效。

    在這個故事中,我們可以看到大數據出錯的風險。在沒有有效的保障下,大數據分析系統可能變成一個不可說明、不可追蹤、甚至不可信的黑匣子。在這種情況下,大數據和政府治理一旦密切聯姻,可能將產生無數的受害者。

    試想一下,誰能真正保證“棱鏡”計劃制止的恐怖分子不會有錯誤呢?受到政府迫害的人就一定會報復社會嗎?甚至一度有行兇念頭的人,不會在最后放棄呢?在民主國家,受害人還擁有法律武器,可以糾正大數據帶來的錯誤結果。在那些民主和法制不健全的國家,漏洞百出的大數據系統很可能會導致大規模的迫害。

    顯然,“棱鏡”折射出了這一潛在的危險。大數據政府治理時代的到來,要求我們必須建立一套新的監督制衡機制,來規范政府行為;建立一個更加開放的社會治理環境,來減少大數據錯誤的危害。

    版權聲明:以上內容為《經濟觀察報》社原創作品,版權歸《經濟觀察報》社所有。未經《經濟觀察報》社授權,嚴禁轉載或鏡像,否則將依法追究相關行為主體的法律責任。版權合作請致電:【010-60910566-1260】。
    日本人成18禁止久久影院