羅振宇:從個人的體驗上講我自己有一個體會,因為我找老婆是在世紀佳緣上找到的,我剛開始列的條件比如一米七的大高個兒,長波浪的頭發我都寫上了,但是最終我找的那個老婆恰恰都不符合這些,包括我老婆對我的條件,比如她剛開始的條件有什么不抽煙什么的,結果找了一個大煙鬼,有的時候要給生命留一些空間,比如說別人預測不到最好連自己都預測不到那才好呢。還有哪位。那位美女。
問:非常感謝給我提問的機會,剛才各位老師更多提到是大數據分析比較正面的一些功用什么的,我更關心的是大數據分析的安全性問題,比如說我在微博上看到一個媽媽曬的圖片,可以綁架她的兒子,有可能我通過分析拿到相關的數據殺死她,那在現在互聯網企業或者是說政府或者是各種方面擁有這些大數據的這些機構,他們是只能說是通過道德來進行約束還是說需要有一些法律,或者是別的力量可以做到這樣的事情。
羅振宇:這個女孩替陳冠希同志提了,為什么受傷害的總是我。其實有些回答已經在剛才的過程之中了。
郭樂:這個問題我在這兒補充一下,待會兒可以讓張昕,他是負責安全方面的,更權威一些。這個問題像剛才說的微博暴露孩子信息這些我也經??吹?,已經在發生,在企業里面這種問題是普遍存在的,以我們了解的情況這個機制一定是從不健全到健全,因為之前沒有太多這樣的問題,包括你的一些隱私信息泄露,在淘寶里可能很多收貨的信息、收貨的地址、電話,包括你買什么東西,有些東西比較敏感的,在空間里面很多的隱私照片等等,這些一定是一步一步健全,可能逐步的引進法律的約束,現在應該還是在一個過程之中,我覺得這個還是需要時間。
張昕:因為這個是涉及到一個數據安全的問題,其實從這本書的里面描述來講,假設發生數據泄露這種事情,數據泄露本身就是系統運行的一個異常值,它是打破了系統來正常的運轉的過程,而這個泄露之后一般來講被非法獲取的話肯定會被非法利用了,相當于是另外一種7%的解釋,別人預想不到的方式惡意利用這種數據,其實是打破了這個平衡,93%的平衡,這個會引起一個另外一個水潭一樣,另外一個漣漪,一旦被人惡意利用之后,其實群眾們被預測的這些人會起來反抗的,反抗之后其實就會又達到一種新的平衡,大概這個過程是不斷這么循環往復的,之前關于幾個重要的網站的數據泄露,這個其實是類似于他打破這個平衡之后,作為異常的把這個系統搞亂了,系統又去做了一次進化,這個大數據系統又做了一次進化或者是安全上,或者是用戶的隱私維權上都做了一些進化,這是本身的異常的出現就像一個羊群要突然沖出一頭狼來一樣,對整個是有益的也是正面的。
郭樂:從非技術角度講你這個是個問題但是可以不顯得那么嚴重,將來是這么幾條規則最終運行,第一條是建立原則,這是美國在以前保護的爭論中得出的結論,數據的控制權在誰手里,應該得出的結論是在消費領域里面,比如說在我們的AOBS里面TK來表示你不打開不泄露這是第一條游戲規則,而且是網頁上最核心的規則。
第二條技術建設是我們現在看不到的,是數據的分層管理,原數據不可見,就是我們看到比如說你一封情書實際上是不可見的,你現在的問題就是初級階段,他直接把你的情書從郵件里面調出來,從頭到尾看了,這個是不會發生的,這個地方是被嚴格保護,現在初始的狀態在阿里巴巴里面已經是提出了原數據,他是叫可以摸不可以提取,這些都是初始,你的數據能夠叫別人讀懂的,實際上是別人接觸不到的,接觸到的是對你的原文進行解讀,解讀比如說我給你解讀什么,IBM的技術是解讀你兩個詞之間的距離的算法,把這兩個詞作為一個封閉了,他雖然不知道你在說什么,但是可以區別出你在和別人討論同樣問題的時候的區別,這個是我認為第二個保護。
