主持人:各位好,歡迎收看本期橙色視點。隨著1988年互聯網的出現,你有沒有發現,如今的我們已經進入了一個萬物皆聯網,無處不計算的世界呢?而這樣的一個世界又可以將每一個地區的個別數據儲成一個龐大的數據庫供我們搜索,不過你有沒有意識到,掌握了這些龐大的數據,其實是一個大的機遇,對政府,企業是,對我們每個普通人也是。
(畫面)本周二晚,經濟觀察報·書評攜手廣西師范大學出版社·理想國,與嘉賓涂子沛、王煜全、姜奇平一起在北京師范大學就【“大數據”時代的公民生活】這個命題進行了一場有趣的討論。主講人涂子沛先生,《大數據》一書的作者提出:我們能從數據中發現以往不能發現的價值。因為摩爾定律和普適計算將生成一個機會更平等、信息更充分的時代,而一旦開放數據,那么創新將不再是精英們只有的特權,普通人也將能用數據來創新。那么將如波普爾所言,一個開放的社會,意味著人們把決定建立在他們自己的才智和掌控之上。
涂子沛:我們看到摩爾定律、普適計算、數據挖掘、社交媒體怎么會影響我們公民的生活。首先我認為摩爾定律跟普適計算它代表我國社會進入一個機會平等,信息更充分的社會,就是說你最后的成就,你能走多遠,恐怕跟你出生,跟你家庭的情況,跟你的種族,跟你的性別,跟你以前種種情況下的約束的能量會越來越小。因為知識無所不在,信息自由的流動,我們這個社會變的越來越開放,每一個人在面對很多社會禁忌的時候,他可以利用自己的信息和知識去作出自己的決定,他不會盲從,我們以前的社會有很多禁忌,一個禁忌的社會,告訴你這個不能做,那個不能做,一個主動你就能改變的時代,因為資源就在那里,你不能去等其他的人,我們說公民一點,公民最主要的精神是什么?是積極的介入,積極的改變。
主持人:大數據時代也是一個前所未有緊密相聯的時代。我們會發現,微博傳播消息的速度比地震波還快,但這隨之也帶來一些問題,其中隱私權的問題就顯得日益尖銳。在這個時代,我們應該如何來保護個人隱私呢?對這個問題,三位嘉賓各抒己見。
涂子沛:隱私問題是一個很大的問題,我的手機回國沒多久,現在也有人打來推銷東西,因為它背后是一個利益的驅動,剛才我們看到這里,有人發微博,能不能有一個反數據挖掘的手段,當然是有的,現在有很多平臺,像facebook,新浪,你進來的時候就問你愿不愿意公開自己的數據。進來的時候就是說信息是公開的,但是你能不能選這個地方說信息不公開,新浪微博是可以的是吧。你對部分人開放,并不是代表它在后臺不能搜索你的,其實它還是可以搜索你的,像海外的平臺他們已經做到這個程度,因為隱私權是一個最大的爭議,facebook怎么上新聞頭條?它每次上新聞頭條就是因為隱私權,它現在還設了一個首席隱私官,這個爭議最大。如果它給你一個事先的權利,說你愿不愿意開放自己的數據,你不愿意開放的話就是鎖上自己的數據,別人就搜索不了了,這是一個方法,還有其他的反挖掘。隱私這個東西,就是數據成為一個權利,隱私權是集中的體現為你管理自己數據的一個權利,你什么時候決定能夠開放,什么時候決定能夠編輯,什么時候決定這個信息可以刪除。
姜奇平:我從產業和政策方向我估計是這樣的,首先第一位是法律上要解決這個問題,首先第一位決定隱私開關權是交給消費者,這個是法律將來的共同趨勢,中國也不例外,這個也是根本性的保證,所以它在我們的隱私里面你不打開別人不能搜你,相反的這是一個,具體還有幾個趨勢使隱私的狀態得到根本性的改變,第一個是技術發展,我們現在的隱私討厭在什么地方,就是推技術,但是將來是挖技術,這個挖技術是什么呢?你不要它不來,這個技術一旦變化,所有非垃圾的就沒有了,這時候你可以發現,他挖的隱私沒有意義了,這是一種情況,由于技術類型的變化。另外一個是產業變化帶來形勢的變化。第二比如說將來會出現原數據和加工數據分離的趨勢,比如現在在阿里巴巴的原始數據,你能讀你出你情書這種類型的數據是絕對保護的,任何人都不能讀,但是經過打馬賽克以后或者被編碼化以后或者粉碎化以后,他有可能被提煉出來,那么這個提煉出來的信息也可能是某某人,或者某某號,比如說這里面買鞋類的信息的一個劇目。第三個方法是什么呢?商業模式會對隱私權造成巨大的影響,我們現在考慮的都是大批量的穿梭,如果是一對一就不一樣了,因為什么呢?你看大夫的時候,誰會說面對一個大夫隱瞞自己的隱私,所以可見當你一對一時候和一對多的時候是不一樣的,你把你的信息可以給滿大世界的人去看和這個人正好就可以幫助你,幫完了你他連你姓名都不知道是完全不一樣的,這第三個。第四是人們消費習慣不一樣,剛才我打的比喻,我說現在你相當于大家都穿著西服戈履,你土人透明化了,變成比基尼了,大家都會覺得非常不自在,但是將來如果說進入一個透明化的世界,大家都穿比基尼的時候,你突然西服戈履跑沙灘上,人家說你這人有毛病,所以這個時候實際上大家的隱私還有另外一中心態,就是看大家,如果大家都是這個水平那我也要這個水平,大家都不是這個水平我也不是這個水平,所以這些事情隨著時間發展我相信不會像我們今天看來的這么嚴重,但是不管怎么樣法律在這里起關鍵作用,就是說主動權在誰手里,如果你有開關權一切都OK了,現在的問題我們現在不是這種情況,以后會慢慢改變。
王煜全:因為涂老師也講了,社會網絡是真正特別巨大的潮流,這個潮流是不可推斷的,會使我們人進入到另一個時代,數字菠蘿化時代。就是你想有隱私也不太可能有那么多了,大家大學的時候,你一定住過宿舍,你們同宿舍想在大學期間維系這四年的隱私容易嗎?
這是第一,隱私必然降低。姜老師說未來的人必然會適應,因為隱私降低大家還要活,所以大家就一定會適應,而且會衍生出另外一套方法來。第二個就是隱私的保護是巨難的事,為什么呢?我們是研究數據的,你把A數據級和B數據集放到一起,尤其以前的數據擱數據沒有參照系這個很難做分析,現在一個參照系就是以人為參照,大數據最要命的是什么,我們說同一個用戶的身份,叫user ID,如果我拿手機做用戶身份,你在手機上干的任何事我都能匯總起來,這我分析你,我比你還了解你自己,所以這個就造成什么問題,就是說如果你掌握了這些數據,那你知道的事就多了,所以我認為未來其實對隱私這件事還不是今天我們談的這點問題,是個巨大的問題,但是第三點大家別擔心,那個問題很遙遠,就是運營商不知道他們家的數據那么值錢,他也不屑于采,這個問題在美國談還略有點意義,因為美國已經開始在整合了,涂老師數據講了很多,各部門一整合,因為我們做數據的知道,各部門數據一整合,尤其是以用戶為核心點把數據一整合,你對用戶的行為了解會驚人的準確,所以這個很恐怖,你知道他的社保數據,你知道他的銀行數據,就會出很多事,比如說詐騙社保的就出來了,銀行里都有錢他還去拿社保,現在美國發現這個事很嚴肅,我寧可不抓這個詐騙犯,我也不能讓數據整合,所以他對隱私考慮的很嚴重,中國這事想都別想,他們兩個部門的數據直接整合不起來,所以在中國這事還很遙遠,我們先朝著整合數據努力,即使那是未來的痛,那也是個美好的痛,因為等到我們能談那個痛的時候,說明我們離“大數據”不遠了。
主持人:涂子沛先生在《大數據》一書中提出:一個真正的信息社會,首先是一個公民社會,那么做為公民個人又應該如何來對待自己的數據及建立自己的數據庫呢?讓我們接著聽三位嘉賓在現場各自獨到的理解。
涂子沛:如果你對這個行為有個分析,這個行為的分析其實這里意味著很多的商機,這個跟王總再討論一下,什么商機呢?美國有一些應用,如果你把這部分數據全部提交給別人,他們會進行一些更深層的分析,比如說分析你的消費行為合不合理。是不是什么東西買多了,什么東西買少了,還有什么東西是不是買的特別貴,它們在量化你自己的時候,它發現其實你自己的行為根本不像你想象的那樣,就是你對自己的感覺實際上是有盲區的,它通過這種量化就可以糾正自己的行為,讓自己的行為更加健康,搜集個人的數據也是有價值的.
姜奇平:我就不講那么多理論了,我談談我個人的感受,我自己是怎么管理的,我寫日記跟別人不一樣,我白天的事全都不記,我專門記我的夢,我做了什么夢,白天的事過去就過去了,我做這個夢是什么是分析,對我進行心理分析,因為夢它是非常真實的,是在大數據這個層面才能挖掘出來的東西,我交給大家一招,你們大家都沒有孩子,如果有孩子就可以看出,比如問你小孩,說他晚上夢的是大灰狼還是老巫婆,他如果說大灰狼一定是丈夫對他批評太嚴厲了,如果是老巫婆一定是夫人太嚴厲了,因為什么呢?因為小孩受到心理壓力了,在臆意層面受到心理壓力了,他說不出來了,他也不敢對大人反抗,但是他晚上胡亂做夢的時候是毫無障礙了,這時候他就隨意匹配,因為他看到什么,他看到的不是公的就是母的,這時候就可以匹配。再有一個你們都有一個印象,你要是做夢發大水,肯定是你喝水喝多了沒上廁所,這時候你可以分析出什么,你可以分析出自己的快樂和不快樂的根源在什么地方,比如說你焦慮,焦慮狀態,焦慮到什么程度或者說這個時候可以達到一個狀態,就是所謂的自知之明,自己知道自己太困難了,你要能知道自己,剛才我非常贊成涂老師說的,你說別人的時候說的頭頭是道,等說到你自己的時候比較困難,為什么?就因為你自我隱藏的太深了,藏在了潛意識層面,大數據干嘛的?就是干這些用的,所以將來我建議大家除了記白天的事,晚上還可以記一下夢。
王煜全:一直有個說法,現在社會學那幫人對人研究的興趣還不如行為經濟學,因為行為經濟學是要看結果的,社會學太理論,我們總結“大數據”給我們的經驗教訓,你要太理論了沒有數據做支持就會脫離實際,比如說某個叫馬克思主義的東西,我們說數據支持有點弱,那么必須要數據支持,其實行為經濟學里面最愛做數據分析了,哪怕在學校里也是實證得來的。如果這個人身材更高,他談戀愛的時候會有優勢,所以矮的人他能夠量化計算,他要每年多掙多少錢才能談到差不多同樣的女朋友數量,才能彌補這數,所以個矮的各位趕緊學習,趕緊掙錢吧,要不然在找朋友上很有劣勢,那么這個東西可以看到量化,所以他的背后理論依據是什么,其實我們原來在做學校學生研究的時候,原來專門找過高校的學生,去跟蹤他們的行為也得到了驗證,什么意思呢?說簡單點就是社會地位高的人傾向于占有更多的社會資源,在學生里社會地位高,比如說這人吉他彈的特好被別人崇拜或者這個人是他們的戲劇社的社長,被一堆小女孩追著,他傾向于占有更好的社會資源什么意思呢?我們當時在學校里發現他的女朋友一定漂亮,所以回去看看你們班女朋友漂亮的孩子一定有出眾的地方,當然不一定成績好,別的地方好,受別人追捧。當然這事我們現在想辦法在干嘛?在微博里面做全樣本的量化分析,這個是據我所知國外也沒人干過,我們是干一些史無前例的事,所以我跟高校有合作,我們跟清華合作,我們的目標是把我們的文章登在頂尖論文期刊上,因為沒人干過,怎么測呢?我也告訴大家,看看你們能不能做,能做大家合作,某個人他擁有社會資源怎么測,就是他在微博里雙向好友,代表你認識的,互相互粉的好友,你的異性好友的年齡和你的平均年齡差,比如說我40歲,我是一個看校門的。另外一個人40歲,他是一個億萬富翁,你猜我們倆誰更有可能認識更多年輕漂亮的女孩呢?我想把它量化出來,通過你的異性好友跟你年齡差來推算你是不是掌握更好的社會資源。
主持人:數據時代是大眾創新的時代,越來越多的平民英雄將呼之欲出。“每一個人的心里,都有理想主義的火花,它可以被燃成火焰,進而迸發出非凡的能量和結果。”平民英雄的偉大之處在于他們以自己的行動喚起對人性本位的回歸,重構著時代的道德圖景。這是涂子沛先生在《大數據》一書中始終強調一個觀點,也希望對各位有所啟發,好感謝收看本期節目,再見。
