<tt id="ww04w"><rt id="ww04w"></rt></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <li id="ww04w"></li>
  • 涂子沛說“大數據”時代
    導語:“一個真正的信息社會,首先是一個公民社會”,這是全書的一個出發點,這個出發點就是說,“信息社會最大的特點就是,信息的自由流動?!比绻麤]有人的平等,沒有人的自由,信息能夠自由流動嗎?如果沒有人的平等,我們這個社會彼此另外壓抑另外一個人,我們的創造力怎么迸發出來?

    主持人:我為大家介紹一下今天的嘉賓,首先是《大數據》一書的作者涂子沛老師,有請涂老師!接下來為大家介紹今天和涂老師一起對談的兩位嘉賓是王煜全老師,資深的市場營銷戰略專家;姜奇平老師,中國社科院信息化研究中心的秘書長,也是互聯網周刊的主編,有請兩位老師!我們首先請涂老師先就他的《大數據》一書和“大數據”和我們每個人的關系做一個簡單的講述。
        涂子沛:大家好!很高興今天來到這里,非常高興!而且我看到這個片頭--鼓勵和思想,我們現在就要講這個東西?,F在講這個東西意義非常重要,十八大正在開,我們中國有30年的改革開放,我們說勞動力已經解放,市場經濟的規則已經基本上建立起來了,但是當我們看世界的時候發現,還有一個新的關鍵詞叫“創新”,怎么創新?沒有獨立的人格,沒有自由的思想,我們能創新嗎?所以我們現在需要的是一個創造力的解放,一個思想的解放和人格的解放。我這個書大家看了,一開頭扉頁就寫的是“一個真正的信息社會,首先是一個公民社會”,這是全書的一個出發點,這個出發點就是說,“信息社會最大的特點就是,信息的自由流動。”如果沒有人的平等,沒有人的自由,信息能夠自由流動嗎?如果沒有人的平等,我們這個社會彼此另外壓抑另外一個人,我們的創造力怎么迸發出來?首先做一個解釋和說明,這是看到了今天的片頭時我的一個感想。
        今天給我說出的題目是“大數據時代的公民生活”,題目我也很喜歡,我們來演繹公民生活的時候,它的背景是“大數據”時代。首先來講一講“什么是大數據時代”,在研究一個現象的時候,首先要研究它的定義,研究它的內涵,咱們就先把數據給它抽走,看看代表是什么。數據不是數字,數據是有跟列的數字,當我們談到數據的時候,我們想到的是它代表計算,代表精確,代表理性,代表科學,代表事實。大家說姚明很高,到底有多高,你最后說兩米多左右,這就是一個精確的事實。數據的出現也是人類認識這個世界,不斷地向前推進的需要,人類發現需要精確的數字,就好像回到剛才的例子,你說很高很高,到底有多高,我們看,人類歷史上很多重大的文明推進和演進都跟數據離不開,比如說度量衡的發明,貨幣的發明,再比如二進制的發明最后導致計算機的發明,最背后就是數據。
    我最近也在國內演講,特別在廣東講的時候,講“科學發展觀”時,我特別引申了一下,我說科學發展觀的落腳點就是數據,數據就是科學的基礎,沒有數據能有科學嗎?數據就是科學的度量,所以再繼續引申,因為這里面有一章叫“數據治國”,再繼續引申“數據治國”就應該是科學發展觀的題中應有之義。廣東省委的機關報,日報最后就是以這個為標題,說科學發展觀的落腳點就在數據,咱們就說數據的重要。經過信息時代之后,信息的內容實際上在不斷的變化,就因為計算機的發明,我們有一個新的詞叫Database--數據庫。這個詞完全是一個外來的詞,計算機最早是計算數字和處理數字,那時候就存在Database,后來隨著計算機能力的不斷增強,它可以處理文字、圖片、視頻、聲音等等,但所有這些都放在Database,所以我們把這所有的一切都稱為數據,這時候數據的內涵擴大了。大家要知道數據的內涵在擴大,還有一些其他的事情也在發生變化,就是說數據的容量在增大。
    八十年代的時候就有人提出Big data這個概念,那時候的“大數據”的還不是現在“大數據”的概念。“大數據”這個概念不斷的演變,最早有人就預見到說有一天數據會比程序更加重要,比軟件更加重要,它是指重要性。所以我們往大了說,可以說這是一個大的機器,一個大的房子,也可以說是一個大容物。到2000年的時候,賓夕法尼亞大學有一個教授出來定義,那時候企業的數據已經到泰了(?),他說200泰的數據就是大數據了,那泰到底是什么樣的單位呢?比如全世界最大的圖書館是美國國會圖書館,美國國會圖書印刷品的含量,不包括電子圖書加起來是15泰,北師大應該是2個泰或者更少,這個數據就叫泰?,F在國內也有很多人說“大”,到底多大才是“大數據”?我們說大數據的時候應該從大價值來理解,因為我們數據已經很多了,人類利用分析數據的能力很強了,我們能從數據當中發現以前不能發現的價值這個角度來理解。我們談把數據的現象抽離出來談,來理解什么是數據。接下來我們再把數據放回到物力事件當中,從它和其他現象的聯系當中來把握和考察它的因果關系,大數據究竟是怎么產生的?我們說“大數據”的產生有五個因素:第一個是摩爾定律,第二個是組織計算,第三個是普適計算,第四個是數據挖掘,第五個是社交媒體。
    我們現在一一對這五個因素進行解讀,這五個因素里面有四個因素是認為影響到了我們公民生活的,我們來看看它怎么來影響在“大數據”時代公民的生活。data在五年的時候,應該有一個創始人,他發現一個東西:同一個計算機芯片,同一個面積上晶體管的數量每一到兩年就要增加一倍,這意味著什么?意味著計算機處理的能力越來越強,存儲的能力也越來越強,同一個面積上東西越來越多,越來越密,一到兩年就增加一倍,物力存在器的性能不斷上升,價值不斷的下降。有一個考證說,從五十年代起最早的存儲器發明到現在,存儲器的價格下降了300萬倍,大家可以想想,歷史上還有什么商品它的價格能在半個世紀下降300萬倍?而摩爾定律也成為了一個代名詞,呈指數形發展的變化,急劇變化的狀態,劇變的變化。我們可以看看,這個圖代表摩爾定律,是條直線,為什么是直線呢?因為沒辦法畫,如果嚴格按刻度來畫的話應該是一條橫軸的曲線。
    我們說存儲器的價格在不斷下降,剛才說到泰,說北師大的圖書容量假設是1個泰,1個泰的存儲器要多少錢呢?現在的標價是95美元,意味著什么呢?意味著你有95美元你就可以把這個圖書館搬回家了。還有,科學家在繼續預測摩爾定律還會繼續有效,一直到2020年,2020年你把一個圖書館搬回家只要一杯咖啡的錢,3美元。1988年一個科學家提出了普適計算,普適計算提的不多,大家都提物聯網。物聯網是普適計算一個子概念,人家計算機的浪潮是分階段的:第一個階段是主機階段,到80年代由于微軟、蘋果一直到個人電腦的階段,88年互聯網之后,科學家說這不是結果。未來的計算機會越來越小,會無處不在,跟日常的環境聯系到一起,到今天實現了沒有?我們智能手機就是一臺計算機,無數的傳感器、攝像頭,很小很小,它可以收集數據,反饋數據。我可以舉兩個例子,美國氣象局他氣侯氣象檢測的傳感器,隨著汽車不停的往前走,從紐約到波士頓,它每10秒鐘收集一次數據,一天收集10幾萬次數據,實時的傳輸到數據上面去。1989年就出現了數據挖掘,大家都挺熟悉的,也都都津津樂道,我們回頭來看摩爾定律解決了什么問題?解決一個問題是說無論有多少信息,我可以以很低的成本保存下來。普適計算解決的一個問題是人類收集信息的能力越來越強,感應器、手機、無線網絡、望遠鏡、仿真計算都在產生數據,就是說保存數據的能力很強、收集數據的能力很強,到1989年數據挖掘出現之后,這時候人類使分析數據的能力也空前的增強,數據挖掘是叫“在數據庫當中發現知識”。
    最近馬云為了說服汪洋書記重視數據,他到汪洋書記那里說,他說汪洋書記你知不知道XX哪里賣的最好?根據他的數據他說新疆和西藏賣得很好,比全國絕大多數省份都賣的好,為什么呢?我們看數據挖掘沿著一條線,沿著一條什么線,首先我們有大量的數據,數據是信息的載體,然后有信息背景的數據就成為一條信息,有規律的信息就體現出一種知識。能夠產生價值的新的知識,這時候就成為一種智慧,數據挖掘就是沿著這條線。我們再回到剛剛的例子,為什么呢?他們后來經過檢測,發現西藏和新疆的男性總是給太太和愛人許下諾言,有一天我要帶你去看海,可是一下子去不了,怎么辦呢?先買一個筆記本表示一下心意,這是解釋的一種,但這是不是一個知識?最多的解釋,數據挖掘能發現一些新的知識,而我們知道的,數據挖掘不僅僅是挖掘數據,還會挖掘圖像,挖掘文本,挖掘視頻?,F在的數據挖掘是非常強大的,我們周圍有很多的攝像頭,你在這個鏡頭出現過,挖掘一下你有沒有在那個鏡頭出現過,如果它都監控過,就可以挖掘到今天同一個人在哪里哪里出現過,這就牽涉到我們公民生活一個很重要的方面--隱私,在這個時代還有沒有隱私。另外還有一個很有名的事,有一個百貨店,有一個父親生氣來質問這個銷售經理,“你為什么給我未成年的女兒寄這個東西”,經理一看是一個懷孕婦女的用品,過幾天父親發現他的女兒居然懷孕了,那么他現在對這些企業而言,已經是一個很基本的數據挖據?,F在對企業最大的挑戰是什么?挑戰是我要讓你不知道我知道你懷孕了,要是知道,我作為一個顧客,我要知道你知道我懷孕了,我會覺得被冒犯了,下次我恐怕不會來你這里買東西,這就是平衡。但是商家他不想冒犯你,他用很巧妙的形式來隱瞞自己的意圖,他把這個廣告放在其他的廣告里面,好像裝作自己不經意,數據挖掘已經到達一個很普遍而且大家都在用的東西。
        到2004年的時候又出現了一個新的現象,就是facebook。我們回到創新這個話題,facebook是不是創新?那肯定是創新。前一段時間我看國內有很多制度來鼓勵創新,我當時也跟幾個朋友討論了,說可不可行呢?馬克?扎克伯格為什么要建facebook?他建facebook的理由很簡單,就是想多認識一些漂亮的女孩子,后來他就是想幫助別人多認識一些漂亮的女孩子。facebook開始就是一個大學交流平臺,就這么簡單,后來他就去見硅谷的投資商,人家給了他1000萬,覺得這個東西有前途。創新不是一個制度化的東西可以鼓勵出來的,它是真正源于一種在自由的情況下的一種內在的能量的爆發。facebook給人類社會大數據的現象是一個“一錘定音”。為什么這么說呢?我們說以前是信息系統在收集數據,這時候是每個人都在貢獻數據,你也發微博,他也發微博,而且你發了一條微博可能有視頻,有圖像。原來的信息系統收集恐怕就是數據,記錄一個商業過程,這時候全世界的人開始貢獻數據,而且這種數據有一個不同的名字叫“非結構保持性”,跟以前的數據不一樣。大家想想什么叫非結構化?就是格式大小不一定一致。你發了一條微博大小肯定跟他發的不一致,你可能有三張圖片,他可能沒圖片,你可能140個字,他可能只有20個字,這種數據的挖掘也很難,這時候人類的數據一下子就開始爆炸了,大數據已經成為一個不可挽回的現象,為什么呢?因為80%的數據都是這種數據,原來信息系統收集的數據變成20%,變成少數了,這就是不折不扣的進入大數據時代。
    我們看到中國社會因為微博也發生了很多深刻的變化,很多事情都是由微博出發的,帶表局長的事,高鐵的事等等。我記得高鐵的事的時候,我正在美國,我一直跟蹤在微博上看,就是大家對這個事情的評論,事情不斷地推進。比如盲人的事件的時候我也在里頭,而且這些事件,你們能很快地從微博當中跟蹤到最新的消息。你看微博被另外一個交流協同的影響比地震波還快,首先在微博可以看到那個地方地震了,幾秒鐘之后感到地震波,有振動。所以我們可以多說兩句,因為這個東西太重要了,微博把這個平臺,把互聯網的交流溝通的功能推向了一個登峰造極的地步。我個人認為我們很難再超越在現有的互聯網架構上很難有再超越微博新的發明和應用產生,要超越的話只有把現有的互聯網架構重新推倒了再來。這就是Web3.0或者是Web2.0,王總和姜總他們兩個人都很博學,我今天下午和他們交流的時候已經學到了很多東西。王總是投資公司的老總,他剛才跟我說,他投資的項目100%全是基于微博的力量。
    我們再回到“大數據”上,2010年的時候“大數據”就成了一個很普遍的現象,2012年的時候“大數據”成了一個美國的國家戰略。奧巴馬把這個提得很高,他認為是跟互聯網的超級計算一樣重要。美國聯邦政府投互聯網的時候投了5億,現在他們宣布給了2億多。也是“大數據”很常見的一個解釋,我就不多說了。
        我們最后來分析一下,這種種的現象最后導致了數據的增加,特別是社交媒體,使數據量大到物聯網上,最后這個“大數據”的現象意味著什么呢?它代表的是什么呢?我個人認為,是一個新的時代來臨,什么時代呢?信息時代和知識時代,正在向智能時代邁進。最簡單的解釋就是,我們從數據當中能有能力去發現更多的智慧,這是以前發現不了的,我們說我們在信息時代最大的標志是什么?信息無所不在,你想找一個你不知道的信息,你一百度幾秒鐘就可以找到了答案。信息時代就像這個三角形,再上面是知識時代,信息要成為知識,什么是知識?知識是有規律的信息,經過系統化的信息才成為知識,我們說現在正在一個知識的時代。
    我們舉幾個例子,這幾年教育領域近一兩年在發生很深刻的變化,大家都是在大學教育,現在是在線教育。斯坦福大學的英文課現在已經有10萬人在上,10萬人同步在聽,有一個教授在上課,斯坦福大學的學生沒有100人,還有99900人都在全世界同步在聽。大家現在要問,這個技術是不是以前就成熟了?以前的技術跟現在的不一樣,他們除了上課之外還做作業,全世界10萬個人跟這100個人做的作業是一樣的,同一個平臺,在一個智能學習平臺。智能學習平臺后面也是“大數據”,它能記錄你所有的學習行為,然后分析你的學習行為,給后來的學習者提供建議。你進入它所有的鼠標,你在每一個PPT上面的停留,你什么地方做錯了,它是大量的數據之后是不是能積累到很多很多的知識,你一上來如果告訴它我是個大一的學生,他就知道大一的學生學習行為應該是什么樣子;她是一個女生,而且學的是物理學,它這里面有智能的系統會不斷的引導你。這是以前沒有的,大家可以想象這會發生什么變化呢?就是說每一門課都會有一個視頻出來,這個視頻是世界上最好的老師講的,你學這門課恐怕大家都會有興趣世界上最好的老師,哈佛的老師,斯坦福的老師講課的時候是怎么講的,更絕的事是什么,還有好多學者在進行編輯,他們把他們認為最好的視頻匯編到一起,不同學習者不停地打分,不停地呈現,大家可以想象最后出現什么結果?就是每一門課都會有一個最好的視頻,大家都要看這個視頻,而且是免費的。所以說知識在變為無所不在,這跟我們的公民生活也都是相關的,等會兒我們再具體的闡釋,這個跟公民生活到底怎么相關?所以說未來的老師也面臨一個革命,他上課的時候就會想,我們是不是大家都先看看哈佛的老師怎么講,他會成為一個課堂的組織者,而不是像以前一樣的是一個知識的傳授者。
    我們說從知識時代進入智能時代還有很多的標志,比如說IBM能獲勝,2011年時候戰勝人類回答問題的冠軍,我們記得,90年代的時候有一部計算機很有名叫“深藍”,它下象棋戰勝了人類的冠軍。這個沃森是怎么回事,美國有一個節目叫“危險邊緣”,主持人就是對參加比賽的人問問題,什么問題都問?天文、地理、語文、數學、明星、八卦、做菜、家務等等什么都問,終于有一個冠軍出來了,回答戰勝了所有的人,他的知識面是最廣的,結果沃森把他戰勝了。就是直接有人向他發問,然后沃森就回答,把人類冠軍戰勝了,這背后也是一個大數據,就是智能。它在快速的處理大量的信息時,一聽到有人問,最后就回答。大家都知道谷歌,谷歌的無人駕駛汽車已經快上市了,現已經在路面上跑了,它也是一個大數據,很快就能決定什么情況應該剎車,什么情況應該轉彎,什么時候應該減速,還有很多繼續學習等等,因為只有半個小時,我就不展開了。
    我們現在要來摩爾定律、普適計算、數據挖掘、社交媒體這些東西怎么會影響我們公民的生活。首先我認為,摩爾定律跟普適計算代表我國社會進入一個機會平等、信息更充分的社會,就是說,你最后的成就能走多遠,恐怕跟你的出生,跟你家庭的情況,跟你的種族,跟你的性別,跟你以前種種情況下的約束的能量會越來越小。它怎么來影響呢?我想跟大家分享書里面的幾句話,我特別喜歡這些話。
    我們調查一下多少人看書,很少人,連十分之一都不到,看來我做的鋪墊太少了,因為這么少才讀過這本書,我以為90%的人讀過。我很喜歡這段話----每個人的心里都有理想主義的火花,它可以被點燃,燃成火焰,進而迸發出非凡的能量,“大數據”的時代就是這樣子,知識無所不作,數據在開放,知識在自動地流動,只要你想,只要你要,你就能做到。還有一個“一萬小時定律”,就是說你騰出的時間只要夠一萬小時,你所有的資源都有,不像以前,家庭條件不好上不了最好的大學,現在哈佛大學的課都可以免費聽,斯坦福大學的課你也可以免費聽。因為知識無所不作,信息自由地流動,我們這個社會變得越來越開放,每一個人在面對很多社會禁忌的時候,可以利用自己的信息和知識去作出自己的決定,而不會盲從。我們以前的社會有很多禁忌,一個禁忌的社會,告訴你這個不能做,那個不能做。最典型的就是美國人坐月子,我在美國時他們也經常跟我討論這個話題,在美國留學的中國女學生到底要不要坐月子?為什么我們的同事,今天生了孩子,第二天孩子也抱來了,就來辦公室,跟大家打招呼?那中國女孩子要不要坐月子,這就是一個禁忌,是一個傳統。怎么對待這個傳統,國內也有爭論,最有名的是方舟子。方舟子主張說坐月子是不科學的,我不知道我說的對不對,方舟子是不是這個觀點。就是這個時代有足夠多的知識,只要你愿意去找,然后按照自己的知識不再盲從,把自己的決定建立在自己的知識上。
    然后說說“什么是一個開放的社會?”只有敢于突破禁忌的社會才是開放的社會,什么社會才會有真正的創新,才能不斷激發創新?也只有一個開放的社會才能不斷地激發創新,那是挑戰禁忌,挑戰傳媒。下面一條也是我很喜歡的話,怎么改變?這句話都在我書里,我把它摘出來----不能坐等他人,這個時代是一個你主動要去,一個主動你就能改變的時代,因為資源就在那里,你不能去等其他的人,我們說影響公民的第一點:公民最主要的精神是什么?是積極地介入,積極地改變。影響我們公民的第二點,我書里面有很多關于“大數據”時代的隱私文化,我越講越是有點對牛彈琴,這里有一個觀點,有的專家說87%都不能定位,只要通過“大數據”挖掘就會定位,這是影響我們公民生活的一個巨大的挑戰,就是隱私權的挑戰,而隱私權是一個非常重要的問題,是對個人自由的憑照。我為什么用這么大的篇幅來寫隱私權利呢?也是因為我覺得,我們中國社會特別需要隱私權利,不僅是政府在侵犯公民的隱私權利,我們公民彼此之間也在不停地侵犯隱私權,而且大家習以為常。但是隱私權是一個文明社會的標志,越文明的社會,越注重隱私權,個人才越有自由,隱私權是把自己跟公共生活劃分開的一條界線,保障個人的自由。
    社交媒體讓我們進入一個前所未有人文相連的時代,這影不影響我們的公民生活?這是最大的隱患,為什么?它把我們人跟人連接起來,我們知道人跟人一旦連接起來,1+1大于2的作用。一個專制政體是不讓人和人連接起來的,它要把人原始化地孤立起來,只有讓你孤立了才好打壓你,你的聲音也發不出去,所以我書里面寫“集體行動的邏輯”,100多年托克維爾寫《論美國的民主》,他到了美國,說他的巨大發現,美國的民主為什么這么發達,他只歸納到一個節點:他說美國人太適合結社了,他太自由了,因為一旦結社的話,你的聲音就能被放大,你就能形成一種力量,你就能發出這個聲音,就能跟其他的團體博弈,你能進行一個表達,對不對?所以我在廣東講,汪洋書記放開了關于社會團體的注冊,現在不用掛靠,原來要注冊一個團體是要掛靠的,要找一個單位,要證明“我屬于那個單位”,要大家“同意我”,現在不用了。哪個公民你要說愿意結社的話,當然還有一個過程,現在是一個巨大的過程,當然這是邁進了一小步就是時代的一大步。我們說微博之所以改變這個社會,就是因為它使人和人相連。今天王總給我講了一個事情,就是說,行動會引發行動,信息越來越信息。
    王煜全:其實也是剛才涂老師講到的葛拉威爾的一萬小時定律里講到的,就是信息的傳播
    信息只能引發信息的傳播,你聽到一個消息,你覺得這個事情很讓我生氣。剛才涂老師講了動車事件我們都很生氣,怎么辦?我也轉發一下,就是信息轉發信息,行動引發行動。如果你看到你的鄰居上街了,你會說我為了支持他或者你的兄弟上街了,你說我為了支持他,我也上街,所以行動才能引發行動。
        涂子沛:對,我覺得這個總結概括的非常好,就是說信息引發信息,而只有行動才會引發行動。我們現在問題在哪?現在公民的社會問題在哪?很多人圍觀但是沒有行動,很簡單一個道理,你在公共汽車上如果看見有人偷東西,如果大家都不做聲,如果有一個做聲,那個偷東西的人還要威脅你,如果10個人都做聲的話,他還敢威脅你嗎?他肯定不敢了。所以我覺得,公民社會的形成不是圍觀能改變的。前兩天說“圍觀可以改變”,現在圍觀不行了,那得要表態,表態發出聲音才能改變中國。怎么影響我們公民的生活?我們說這是一個更開放的時代,為什么?“大數據”的時代是一個開放數據的時代。我記得跟一個省政府的人談什么是開放數據,為什么要開放數據?首先說開放數據,要開放政府數據,就是說把政府的數據變成的格式放到互聯網上去,為什么?所以大數據的時代,剛才說1+1要大于2,一個數據只有通過跟其他數據的整合才能產生新的價值,跟什么數據整合?我們說首先要跟公共數據整合,政府數據整合,因為公共數據是整個社會數據的一個基礎。氣候數據、人口數據,如果你的銷售數據跟氣候數據進行整合的話,你會發現它們不會有關聯,你的銷售數據能跟人口數據整合的話,你會發現跟密度沒有關系。數據開放是有法理依據的。這要講到公民,我們都在納稅,它用的是我們納稅人的錢,收集了關于我們的數據,但是不給我們用,這行不行?肯定不行,所以應該開放。我們說美國社會,不只是美國社會了,全世界現在有幾十個國家都在開放數據,因為數據開放之后有很多創新都在產生,而且這種創新原來僅僅是知識分子才能做的事情,現在由于開放數據庫,普通人也能用這個數據進行創新。我身邊有很多這樣的例子,大家可以看一下,創新的力量在向大眾傳輸,每個人都可以傳輸,都可以擁有很多數據,數據也在成為一個權利,北京社會已經明確提出數據權這個概念。我再繼續多說一點,沃爾瑪在挖掘你的數據留下了記錄,那大家問我為什么不能看自己的記錄?沃爾瑪是不是應該開個窗口也讓我看一下我自己的消費記錄?這就是數據權。
        全世界有30多個國家都在開放數據,不是發達國家的專利,非洲的肯尼亞也在開放數據。我大概就講到這里,我還準備了10多頁紙,差一點刪掉了,就是關于我想通過這本書來表達什么,我講了一個什么樣的故事,我講了一個大數據的技術浪潮是怎么興起的,來龍去脈的,反正故事有一個背景,這個背景就是美國這個國家它的創新是怎么發生的,怎么一步一步的變得越來越開放的。通過這些故事我想傳達三個層面的信息:第一個層面就是我個人層面,這就是本書的一個主題,除了上級政府必須讓數據源時間,中國社會嚴重匱乏這種數據精神,我們的數據是一個任人打扮的小姑娘,數據的貢獻率極差,中國的落后就是因為沒有信息數據化的管理,缺乏這方面的東西;在國家的層面想傳達一個信息,我們要拋開粗放型的管理,走向精細化的競爭,因為這是世界的一個浪潮----越來越精細化、越來越數據化;最后在社會層面談這些,真正的信息社會,首先是一個公民社會,就是我開始說的,我認為我們不是一個信息社會,我們是一個信息時代,被科技力量拉近的信息時代,背后還是有一張手在操縱所有的信息。我前幾天電子郵件都不能上,跟世界大量的聯系都被切斷了,只有打電話到美國說把密碼告訴別人,再趕快把所有的郵件給我轉過來,轉到我中國的郵箱。所以說咱們今天晚上講“大數據”時代的公民生活,我覺得是一個非常好的主題。謝謝!
        主持人:非常感謝涂老師,下面我們將請三位老師就一些熱點的話題和大家進行討論。我們每個人都避免不了有自己的數據,那我們就是通過數據來證明自己的一切,可我們的信息也都被無數的公司進行數據采集,在這樣的情況下,我們會不會喪失掉自有的人性化和個性化?這個問題我想先請姜奇平老師回答,姜老師是《互聯網周刊》的主編,在這方面非常有研究,先請姜老師發言!
        姜奇平:我覺得《大數據》這本書是非常有意義的,可以說把握住時代的潮流,從里面我們可以觀察到時代的發展方向。我想結合剛才主持人的問題談談我的體會。我體會最深的一點就是剛才涂先生說要把“大數據”和“智慧”聯系在一起,因為不搞數據的人就會想這跟我有什么關系,這里面的關鍵是把“大數據”和人,包括和公民,和我們自己結合起來。“大數據”對人會產生什么影響呢?我認為這是主持人說的問題核心。我記得在10多年前,我當時在一個中宣部長家給他修電腦,修完電腦后跟他聊天,他說“知識經濟”這個提法不好,應該叫“智慧經濟”。這里面請注意正好是涂老師說的四個階段里面,“大數據”從知識到“智慧”這個道路,他當時說為什么叫“知識”不好呢,因為“知識”說的是特體,沒有說我怎么樣,對我意味著什么,因為數據多了好還是少了好,多了可能還成垃圾了。當說到數據跟我有什么關系的時候,那就得看跟人是什么關系。他認為“智慧“說的主體是“我怎么樣”。我進一步的體會,就是個人看法了,我認為就是說“知識”往往是有價值的,而“智慧”,是什么才有智慧,是有意義的。有價值不一定有意義,也就是說知識可能很有價值但未必有意義。最典型的現象,比如說GDP上升,有錢但不快樂,也就是說有錢是很有價值,但是快樂關系到意義。
     “大數據”是干什么用的呢?什么樣的知識可能是對人們有用,什么樣的知識沒有用呢?就看使我們的意義能不能得到提升,也就是說剛才主持人說的,個性化的東西。意義和價值是怎么換算呢?我的觀點是這樣的,個性化的價值就是意義,那么把意義合并同類項就是“價值”,價值是同質性的,意義是異質性的。當有“大數據”以后最終要變成智慧,就得看這個數據到底能不能解決人們的意義問題,我覺得這是一個核心的思想。這里面就要引申出兩個話題了,首先,我剛才看到底下有人提問題,說“有了數據以后我們有沒有可能對人的欲望進行解析?”我認為有可能,就是“大數據”最后對我們人的重大影響,它相當于讀心術一樣,可以讀出我們內心隱秘的意義,不是價值這個層面的東西,而是意義這個層面的東西。早期最簡單的大數據就是通過弗洛伊德解夢,就是一種數據挖掘,它不是把數據堆到那兒,而是通過數據解讀你真正都說不出來的意義。在商業里面,它可能表現為個性化的需求,你自己都說不出來,但是我給你解讀出來了,如果要在社會生活中,有可能就是把你滿意或不滿意,或者你出的那口氣,你到底是罵娘還是不罵娘,你說不出來的那種東西表達出來了。這我認為是從大數據對人的重大影響和對社會的影響,也就是說對于我們追求幸福的目標提供一種工具,那么從表達的方面來說,是我們讀數據,從利用數據方面來說,對于整個社會建設,包括公民建設是一個什么樣的想法,我個人有一個觀點,我認為它也是更大的表達意義,而不僅僅是表達價值。它可以表達價值就是大家共同的愿望,但是更主要的特點在于,它可以表達個人個性化的需求。個人的需求怎么說呢?比如四年一次,一大波人表達一個共同需求,這是一種有價值的思想,但是如果每天每日每時我有我自己的想法,這個東西我怎么來表達,現在美國的電子政務里面提出7×24小時,也就是我不需要四年表達一次,我每日每時都在表達,這個時候你注意它表達的東西,我在學理上把它稱為“網民在日常生活中主張自己的權利”,也就是說他想說“官僚主義”。“官僚主義”是一個大概念嗎?他說我這老虎,華南虎這個眼睫毛真好,這個眼睛真大,這是真的還是假的,他并沒有宏大敘事,而是用一種解構的方式。你說華南虎是真的,我說是假的,那我就研究華南虎怎么樣,好多人都圍到一起。其實這就是一種公民表達,但這個公民表達和以前的17、18世紀的區別在什么地方呢?就在于它是個性化的,它不是宏大敘事,他就說我日常生活里的事,你要是在這些事上講,那證明你就是官僚主義。我也不說你這個人貪污腐敗,我就說這個人表,你戴這個表多少錢,這是和我們過去20世紀揭起大的暴亂的表達方法是不一樣的。但是有一點是直指要害----你自己談“為人民服務,為人民謀幸福”,具體現在到今天的7×24小時,你到底是還是不是。所以我認為它對個性化的意義得到更好地體現,這個就是“大數據”時代和以往時代的不同之處。
        主持人:感謝姜老師,王老師您談一下對這個問題的看法?
        王煜全:我特別榮幸能和涂老師同臺,因為我看了他的書特別興奮,我估計大家可能都不太會意識到自己接觸到了這個時代最前沿的脈搏。我要是上學時能聽到這樣的講述我就興奮死了,因為我們是花了20年的時間慢慢爬到前沿的,涂老師現在是直接把這個前沿給大家帶過來了??赡艽蠹矣X得這事離我們很遠,可是你回頭想一個事情,誰手里還有沒有手機,手機才花了多少年,十幾年時間所有人都了,而且行為都改變了。這個時代的變化是非??斓?,關鍵問題是我們要判斷清楚潮流。在座很多都是學生,我自己的一點體會,對學生來說,一定要選準行業,如果是朝陽行業,你的未來無限。舉個例子,1955年生的人有一堆成了IT巨富,比如比爾?蓋茨、拉瑞?埃里森、邁克?戴奧這些人,但是問題是你如果是1955年生,沒沾電腦這事和你還是沒關系,但是就有一個要求,你的技術過硬。叫什么技術?我們叫“社會網絡分析”。如果你沒有這個技術我們免談,但如果你有這個技術我會千方百計哄著你創業,就因為你站在時代的前沿。所以剛才涂老師問大家誰看過書,舉手太少了,我覺得真的太遺憾了,回去一定要認真看,你掌握了這門科學的話,基本上,你出來薪水一定低不了。
        主持人:謝謝王老師,姜老師請您再談一下吧!
        姜奇平:關于隱私這個問題,我們現在都是用一種防避的心態來看的。我非常贊成涂先生說的,從這個意義上來說,首先要解決如何保證公民隱私權的問題,避免政府對公民隱私權過度的侵入,我是完全贊同這個的。同時我認為,假設我們是在一個很正常的社會里面,我們再來討論,把它當作一個全球化的問題來說,那“大數據”對個人隱私產生什么樣的影響的話,我認為是另一回事的。我記得上次跟凱文?凱利討論的時候,他提出一個觀點,說我們有了數據以后,最終可能使我們的生活個性化、透明化了,這就是說,我們原來的生活是不透明的,隱私保護的很好,但是以后可能變的透明化了。但透明化和什么有規律,和個性化是有規律的,也就是說越透明化,越個性化。未來我相信很可能是在正面面對大世紀浪潮的時候,如果我們把它當作一個好東西或者壞東西都行,它本身是轉型了,但是我們自己能調解它。也就是說,如果我不想個性化,我可能會把自己弄的不透明些;如果我想把自己更加個性化,那么我就不可能不讓別人為我服務,不讓別人了解我,因為別人更好地了解我,才能給我更好的提供科技化服務。他很有可能是這樣的觀點“我越個性化,我越主動的披露自己的信息”。我認為未來的社會,越來越開放,就會越透明,這個規律和社會發展有關系,一般到3000-5000美金之下收入的時候,大家看中的不是個性化的收益,更多的是消費,衣食住行大眾化的東西。如果收入越高,可能個性化需求也越高,這就意味著對一個全球化的問題?我們不考慮“在一個制度合理不合理的情況下”,在一般情況下會是什么?就是越個性化??赡軙鎸Υ髷祿淼母鞣N挑戰,如果這個人比較傳統,比較保守,可能是把高級需求抑制住,專門發展低級需求。我認為我的感覺是中性的,未來對這個問題我的主張叫“個人信息的開發與保護”。“隱私”這個詞有貶義,個人信息不一樣,我們有可能在未來個人直接面對的是什么問題,實際上有好多隱私,不是簡單的隱私問題,最關鍵的將來遇到的挑戰是那些涉及我意義的事情,這些信息我到底是跟別人分享還是不跟別人分享?讓不讓別人知道?我認為這個可能是我們面對的一個現實問題。這個問題在以前可能不突出,但是以后“大數據”越發展,這個問題就越突出。美國的facebook相當于一個時間軸把你生活中大大小小的事給記錄下來了,數據分析可以起碼分析出你這個人對事物看法的偏好和意義,在這個時候你愿不愿意和大家分享?這個問題可能對我們這一代人或者我們下一代人和上一代人可能不一樣,他會面對新的挑戰。
        主持人:涂老師在這本書中用了很多的章節在數據和人的關系,以及隱私的問題,這方面涂老師再說一下。我們每個人用微博,很可能就面對人肉搜索,包括我們的個人信息被盜賣。這種事情也越來越多,你的書里也有好多類似的觀點,現在給大家總結一下吧。
        涂子沛:隱私問題是一個很大的問題。我回國沒多久,現在有人打電話來給我推銷東西,因為這背后是一個利益的驅動。能不能有一個反數據挖掘的手段?當然是有的,現在有很多平臺,像facebook、新浪。你進來的時候就問你愿不愿意公開自己的數據。進來的時候就是說信息是公開的,但是你能不能選這個地方說信息不公開,新浪微博是可以的,是吧。你對部分人開放,并不是代表它在后臺不能搜索你的,其實它還是可以搜索你的。海外的平臺,他們已經做到這個程度,因為隱私權是一個最大的爭議。facebook怎么上新聞頭條?它每次上新聞頭條就是因為隱私權,現在它設了一個首席隱私官,但這個爭議最大。如果它給你一個事先的權利,說你愿不愿意開放自己的數據?你不愿意開放的話就是鎖上自己的數據,別人就搜索不了了,這是一個方法,還有其他的反挖掘。隱私這個東西,就是使數據成為一個權利,隱私權是集中的體現,為你管理自己數據的一個權利。你什么時候決定能夠開放,什么時候決定能夠編輯,什么時候決定這個信息可以刪除,就是這樣的,我覺得這就簡單的終結吧。
       姜奇平:從產業和政策方向我估計是這樣的,首先是法律上要解決這個問題,將決定隱私的開關權交給消費者,這個是法律將來的共同趨勢,中國也不例外,這個也是根本性的保證。在我們的隱私里面,你不打開,別人也不能搜你。具體還有幾個趨勢使隱私的狀態得到根本性的改變,第一個是技術發展,我們現在的隱私討厭在什么地方?就是“推技術”,但將來是“挖技術”,這個“挖技術”是什么呢?你不要它不來,這個技術一旦變化,所有非垃圾的就沒有了,這時候你可以發現,他挖的隱私沒有意義了,這是一種情況,是由于技術類型的變化。另外一個是產業變化帶來形勢的變化。將來會出現原數據和加工數據分離的趨勢,比如現在在阿里巴巴的原始數據,你能讀你出你自己的絕對受保護的數據,當然任何人都不能讀,可經過打馬賽克或被編碼化、粉碎化以后,它有可能被提煉出來。第三個方法是什么呢?商業模式會對隱私權造成巨大的影響,我們現在考慮的都是大批量的穿梭,如果是一對一就不一樣了。你看大夫的時候,誰會對一個大夫隱瞞自己的隱私,可見“一對一”和“一對多”的時候是不一樣的。你把你的信息可以給滿大世界的人去看,和這個人正好就可以幫助你,幫完了你他連你姓名都不知道是完全不一樣的,這第三個。第四是人們消費習慣不一樣,剛才我打的比喻,我說現在你相當于大家都西服革履的,你個人被透明化變成比基尼了,大家都會覺得非常不自在。但如果將來進入一個透明化的世界,當大家都穿比基尼的時候,你突然西裝革履跑到沙灘上時,人家會說你這人有毛病。這個時候,實際上大家的隱私還有另外一種心態,就是“看大家”,如果大家都是這個水平那我也要這個水平,大家都不是這個水平我也不是這個水平。這些事情會隨著時間發展而變化,我相信不會像我們今天看來的這么嚴重,但不管怎么樣,法律在這里起關鍵作用,就是說主動權在誰手里。如果你有開關權一切都OK了,現在的問題是我們目前不是這種情況,但以后會慢慢改變的。
        主持人:謝謝姜老師,王老師您對這個問題有什么看法?
        王煜全:我覺得姜老師說的特別好,第一隱私這個事的發展是個歷史趨勢,是不以人的意志為轉移的。這個歷史趨勢大家如果有時間可以讀一下facebook上市之前的時候,扎特伯格寫的一封告所有股民的公開信。那個公開信寫得非常有思想,(這個家伙是個非常了不起的人物,所以前一段國內有某著名的IT人士說中國出不了扎特伯格,因為咱們大學生沒有那么有思想,我是希望重要能出,一定要有思想,)那里面最核心講的,涂老師也講了,社會網絡是真正特別巨大的潮流,這個潮流是不可推斷的,會使我們人進入到另一個時代,數字菠蘿化時代,就是你想有隱私也不太可能有那么多了。大家大學的時候,一定住過宿舍,你們同宿舍的想在大學期間維系這四年的隱私容易嗎?未來就是那么不容易的。舉個例子,過去有個IT名人到處來演講,說自己多么多么牛,是加州理工畢業的,后來被人翻出來,說是西太平洋畢業的。這事被翻出來還要靠人肉,靠人工,我們就是做技術的,用什么辦法呢?我用技術辦法根本不需要人工就可以把問題找出來,為什么呢?你只要分析他所有的好友,一定發現他沒有加州理工畢業的好友,但有若干個西太平洋畢業的,你猜他是哪兒畢業的?這種東西用技術就把你的隱私打碎了,你想要有都不可能,這個趨勢你只能接受。過去還有破壞機器的那些人,可這東西是潮流,你可以逆潮流而動,但是潮流不會以你的意志為改變,這是第一,隱私必然降低。姜老師說未來的人必然會適應,因為隱私降低大家還要活,大家一定去會適應,而且會衍生出另外一套方法來。
    第二個,隱私的保護是巨難的事,為什么呢?我們是研究數據的,把A數據級和B數據集放到一起,尤其以前的數據和數據沒有參照系這個很難做分析,現在一個參照系就是以人為參照,大數據最要命的是什么?我們說同一個用戶的身份,叫userID,如果我拿手機做用戶身份,你在手機上干的任何事我都能匯總起來,分析你,比你還了解你自己。原來我給移動干了10年的顧問,我跟他們開玩笑,說假設我取一個值,當然運營商這個概念還不到,所以咱們涂老師需要再去給運營商忽悠忽悠,很多數據他認為是我后院的金礦,我不挖我也不讓你挖,但實際上他要挖的話,你會發現你很危險,因為他能知道你所有的情況。我當時就舉一個例子說,運營商只要分析一個書,叫《異地開關機數據》,你猜我能知道你什么?我能知道你所有的背景,因為我們中國人一般都習慣飛機都起飛了,滑好了我才關手機,那邊一降落就打開,我能準確的知道你什么飛,什么降。當然知道你所有的飛行行為,當然不止這些,就是通過運營商數據知道的事就多了。
    我和姜老師我們前一陣參加一個讀書會講,那本書叫《爆發》,《爆發》里有一個說法曾經把大家嚇壞了,說“通過數學分析能夠對一個人任何一個未來的行為產生預測準確率到93%”。大家就說我行為93%都可預測這是很恐怖,其實不是所有的事都是93%,就指特別的事。如果我能采集你在基站之間漫游的數據,因為每個基站之間,你要跨基站運動的話,手機是會和基站發生通訊的,就是運營商能夠連續記錄你的運營行為軌跡,就知道你從哪兒到哪兒。這些運營商能記下來,運營商只要連續采集你一個月,你的行為軌跡,再往后去預測,未來的任何一個時間點,他能預測你在那出現的可能性是93%,這是很特異的。就是說如果你掌握了這些數據,那你知道的事就多了。我認為未來其實對隱私這件事還不是今天我們談的這點問題,是個巨大的問題,但是第三點大家別擔心,那個問題很遙遠。運營商不知道他們家的數據那么值錢,他也不屑于采,這個問題在美國談還略有點意義,因為美國已經開始在整合了。涂老師數據講了很多,各部門的整合,我們做數據的知道,各部門數據一整合,尤其是以用戶為核心點把數據一整合,你對用戶的行為了解會驚人得準確,這個很恐怖。你知道他的社保數據,你知道他的銀行數據,就會出很多事,比如說詐騙社保的就出來了,銀行里都有錢他還去拿社?!,F在美國發現這個事很嚴肅,寧可不抓這個詐騙犯,也不能讓數據整合,美國對隱私考慮的很嚴重,兩個部門的數據直接整合不起來,所以在中國這事還很遙遠。我們先朝著整合數據努力,即使那是未來的痛,那也是個美好的痛,因為等到我們能談那個痛的時候,說明我們離“大數據”不遠了。
        主持人:謝謝王老師,今天的中國社會相比以前,我們掌握更多的財富,所以我們下一個問題想問一下涂老師,就是作為我們個人來說,在座的同學未來都將走進社會,掌握更多的財富,我們應該怎么來重視自己的數據,以及我們怎么來保護自己的數據和建立自己相關的數據信息,請你談一下你對這個問題的看法。
        涂子沛:第一點還是回到這個話題,首先保護自己的隱私。第二點我想談一下我書里面談到一個東西,就叫做“量化自己”。如果你掌握了你自己很多數據,我招商銀行給他們做了一個展示,是美國的個人銀行是怎么管理的,銀行記錄了我所有的消費,而且我在美國的消費基本上不用現金了,也在很少情況下用現金,可以說我的消費行為95%都是信用卡,全部是有紀錄的,這紀錄拿到銀行,把所有的消費分配,它就能知道你是在餐館的消費,它能知道這筆消費是水電費,它能知道這筆消費是購物,這筆消費是租車子,這筆消費是加汽油的。每個月它都會有一個消費報告做對比,比如說你加油的記錄,它就會有第一個月加油的數字,下個月加油的數字,有一個柱狀圖進行對比,如果你對這個行為有個分析,這個行為的分析其實這里意味著很多的商機。美國有一些應用,如果你把這部分數據全部提交給別人,他們會進行一些更深層的分析,比如分析你的消費行為合不合理,是不是什么東西買多了,什么東西買少了,還有什么東西是不是買的特別貴。它會告訴你,打個比方你上個月消費了這么多紙巾,你買的是什么牌子,是什么樣子的,它會告訴你那個更便宜,甚至分析你買的實物,它可以統計出它的卡路里,它說你這個健康行為不好。量化自己,像凱文?凱利來的時候帶一個監測器,現在很多種量化自己的方式,量化自己的健康,檢測自己的一切的行為是通過數據,各種傳感器來監控,它們在量化你自己的時候,會發現其實你自己的行為根本不像你想象的那樣,就是你對自己的感覺實際上是有盲區的,它通過這種量化就可以糾正自己的行為,讓自己的行為更加健康,搜集個人的數據也是有價值的,兩位有什么補充?
        主持人:謝謝涂老師。
        姜奇平:我補充一下,我覺得涂老師講的非常好。從未來的商業來看,個人數據庫的問題,數據留在本地這會成為一個趨勢?,F在我們的模式是什么呢?就是你的數據存在服務公司的服務器上,或者是把諸多人的數據集中在某一個大的庫量公司,然后它進行分門別類進行分析,將來不會是這樣的。將來會出現一個什么情況?就是你出現一個本地數據庫,這個本地數據庫就是一個手機,手機會同時把你在地球上運動的軌跡通過網絡BS服務的信息,你所有的交流記錄,以及你所有的信息記錄下來。這四大類信息一旦聚集相當于它解決了什么,相當于數據采礦業,也就是說大數據第一個形成的行業,相當于山西挖煤的,它是把數據當成采掘業采集了,現在四大行業大家可以注意,這都是上千億的,一個是LBS采集器,第二是支付采集器,第三是SNS采集器,第四是郵件的采集器,有這些東西之后,這些東西都像是隨身攜帶的,而且它現在向著那個方向發展,向著時間軸的方向發展。當時巴拉巴西提到這個,說它可以預測到你93%的概率行為,靠這個就可以基本搞定,這時候你會注意它和以前不一樣了。以前它是通過分類,分類是到不了1對1,但是你如果管理好你的手機的話,它將來會出現什么事呢?就是把有價值的信息在中央處理庫里面處理完之后,它會在最后的零點零一秒跟你比對一下,這時候分析出你的意義來了?剛才我說意義是什么,意義是個性化的價值,此時此刻的價值。這個時候你和別人不同的地方靠本地數據庫來比對,這個我認為是將來數據挖掘模式重大的變化,所以在這個過程中會引發出第二個行業,我估計等你們的后代發展起來時就在這個行業,數據加工業,相當于山西挖煤業,那個“煤”大家就覺得賣煤太可惜了,煤就這么一加工就搞出這么多錢來。我認為以后看起來沒什么好事了,以后深加工、加工,你可以發現,它有兩個加工:一個是對于數量的加工,大量的統計外面公司將煤收購,他們自己都不知道他們有這個秘密,再有分解數據出來以后,也就是音頻視頻出來以后它會帶來定性分析這種突飛猛進,下一步迫在眉睫的巨大變化就是咨詢業。咨詢業要變到那個方向去呢?它對數據分析要變成一對一數據分析,這時候就跟艾森的預測會出來了,這時候會出現幾千種行業叫做“生活方式設計師”,一對一進行個性化服務,這些靠什么?都是靠數據的加工,也就是這時候加工不是原來數據,而是靠原來數據的增值一步一步在發展下去。
    對我們個人生活來說會有什么影響,我剛才說的是對生產的影響。我就不講那么多理論了。我談談我個人的感受,我自己是怎么管理的。我寫日記跟別人不一樣,我白天的事全都不記,我專門記我的夢,我做了什么夢,白天的事過去就過去了,我記這個夢是干什么,是對我進行心理分析,因為夢它是非常真實的,是在大數據這個層面才能挖掘出來的東西。我交給大家一招,你們大家都沒有孩子,如果有孩子就可以看出,比如問你小孩,晚上夢的是大灰狼還是老巫婆,他如果說大灰狼一定是丈夫對他批評太嚴厲了,如果是老巫婆一定是夫人太嚴厲了,因為什么呢?小孩受到心理壓力了,在意義層面受到心理壓力了,他說不出來,也不敢對大人反抗,但是他晚上胡亂做夢的時候是毫無障礙的,這時候他就能隨意匹配。再有一個你們都有一個印象,你要是做夢發大水,肯定是你喝水喝多了沒上廁所,這時候你可以分析出什么,你可以分析出自己的快樂和不快樂的根源在什么地方,比如說你焦慮,焦慮狀態,焦慮到什么程度或者說這個時候可以達到一個狀態,就是所謂的“自知之明”。自己知道自己太困難了,你要能知道自己,我非常贊成剛才涂老師說的,別人的時候頭頭是道,等說到自己的時候比較困難,為什么?就因為你自我隱藏的太深了,藏在了潛意識層面,大數據干嘛的?就是干這些用的,所以將來我建議大家除了記白天的事,晚上還可以記一下夢。
        主持人:謝謝姜老師。王老師給我們支支招。
        王煜全:支招談不上,就是姜老師講的挖煤的,這個里面是非常精彩的,因為一切都剛開始,數據的收集剛剛能夠有機會,那數據的解讀也是史無前例的,斯坦福的一個教授(,東歐人,不知道為什么東歐人數學總是很好,那個哥們是我們學術領域的牛人,他)有一個說法,過去社會學有一個測本定理,就是三個東西不能全有:一個是全樣本,就是所有人都去檢測,第二個是實時數據,第三個是連續數據。我實時采一個點可以知道現在所有人的位置,一個點衛星一照沒問題,連續記錄衛星也留不住,以前是沒有辦法,現在有個攝像頭一切都有了,網絡把你的行為全部連續記錄下來,而且是所有人的。這就跨到一個新的時代,我們對人的分析不再是以前說的用取樣分析了,我們可以用全樣本做分析。這時候就回來了,我們就大量的需要驗證,以前只能取樣的理論,現在我們在全樣本上去驗證,這里面就很好玩。比如舉個例子,一直有個說法,現在社會學那幫人對人研究的興趣還不如行為經濟學,因為行為經濟學是要看結果的,社會學太理論,我們總結“大數據”給我們的經驗教訓,太理論了沒有數據做支持就會脫離實際。其實行為經濟學里面最愛做數據分析了,哪怕在學校里也是實證得來的。比如說行為經濟學里面有個領軍人物,我估計他的那本書大家應該能讀,叫“觀看行為學”,其實在國外的翻譯叫做“可以預測的非理性”就是說人都是非理性的,但是人的行為可以分析和預測,這個作者其實在另一個研究里面提到他很有趣的研究是什么,如果這個人身材更高,他談戀愛的時候會有優勢,所以矮的人他能夠量化計算,他要每年多掙多少錢才能談到差不多同樣的女朋友數量,才能彌補這數,所以個矮的各位趕緊學習,趕緊掙錢吧,要不然在找朋友上很有劣勢。這個東西可以做到量化,背后的理論依據是什么?其實我們原來在學校做學生研究的時候,專門找過高校的學生,跟蹤他們的行為也得到了驗證,什么意思呢?說簡單點就是社會地位高的人傾向于占有更多的社會資源,在學生里社會地位高,比如說這人吉他彈的特好被別人崇拜或者這個人是他們的戲劇社的社長,被一堆小女孩追著,他傾向于占有更好的社會資源,他的女朋友一定漂亮?;厝タ纯茨銈儼嗯笥哑恋暮⒆?,一定有出眾的地方,當然不一定成績好,別的地方好,受別人追捧。當然這事我們現在想辦法在干嘛?在微博里面做全樣本的量化分析,這個是據我所知國外也沒人干過,我們是干一些史無前例的事,我們跟高校有合作,目標是把我們的文章登在頂尖論文期刊上,因為沒人干過。怎么測呢?我也告訴大家,看看你們能不能做,能做大家合作:測某個人他擁有社會資源怎樣,就看他的微博里的雙向好友,代表你認識的,互相互粉的好友,你的異性好友的年齡和你的平均年齡差,比如說我40歲,我是一個看校門的。另外一個人40歲,他是一個億萬富翁,你猜我們倆誰更有可能認識更多年輕漂亮的女孩呢?我想把它量化出來,通過你的異性好友跟你年齡差來推算你是不是掌握更好的社會資源,在男性這個世界里說的比較現實,雖然我們都認為未來的共產主義很美好,但是現在我們還是活在真實世界里,對男性而言找年輕漂亮女孩,人說男性的追求永遠都沒有變,愛好永遠沒有變,不管是20歲、30歲、40歲永遠愛那18歲的,所以你是可測的。這些以前都是調侃,我們現在把它搞成嚴肅的,學術的東西。因為全部有數據支持,所以就能知道數據來了以后會怎么樣。我是師大畢業的,正好我們學校旁邊就北郵,我需要借這個機會在往那個學校的校長那兒扔只鞋過去,就是這些創新的東西其實在國外是潮流,是趨勢,就是國外講“大數據”的一堆,國外有一個網站所有的新思想在不斷的傳播,中國就需要涂老師從美國回來給我們帶,為什么呢?因為那個倒霉的破校長搞了一個東西,叫長城防火墻,我不知道這和長城是什么關系?長城是干這個的嗎?把我們的創新思維阻斷了,但是我用我自己的親身經歷告訴大家,未來是不可阻擋的,你今天想盡一切辦法去接觸最新的科學,未來你一定收益。因為你今天如果學過去的東西,我上大學的時候,我20年前在師大讀書,我們那教授說“為什么還要開這門課?”因為他還沒退休,當然了等他退休了,我們畢業了,我到哪兒去找飯碗去?我后來就改行了。所以我建議大家一定要面向未來,你如果學的是五年之后大行其道的東西,等你畢業出來你就是寶貝,所以你要突破那個倒霉的長城防火墻,去尋找知識,你多跟涂老師聯系,因為那是未來。
        姜奇平:補充一個數據挖掘的問題,我有一個婚店網站的老板告訴我,說有一個數據,第一點怎么談戀愛?這個數據特別常用,女孩子初戀成功率最高的是什么?長直發,成功率是65%,最低的概率是短卷發,這告訴我們,女孩子談戀愛的時候,千萬不要學別人是短卷發,因為短卷發給一個男孩子不單純、老謀深算的感覺,長直發讓他覺得這個女孩子青春可愛,沒什么心眼,可見“大數據”是多么有用。
        主持人:謝謝姜老師。替同學問一下王老師您是北師大中文系畢業的?
        王煜全:我是生物系的。
        主持人:現在網友有生物系的同學嗎?有請舉手?這是你的榜樣,給你的師兄一點掌聲,謝謝!
        王煜全:我們生物系離現實就比較遠,比較傻,沒面向未來,我那時候都是學過去。
        主持人:謝謝王老師!涂老師在這本書里一直給我們講說,數據開放不等同于信息公開,就這個問題我想請涂老師再詳細給我們解讀一下。
    涂子沛:這個東西確實不一樣,也是我在各地都一直強調的一個觀念,信息公開不等同于數據開放。信息公開是作知情權層面上的概念,為什么要公開,因為我們有權利要知道。比如說現在談到的領導干部的財產公開,是這個層面上的概念,但是數據開放不僅僅是知情權方面的概念,主要說的不是權的問題,是一個推動我們當前經濟發展,轉型升級的問題,是推動網絡經濟、知識經濟向前發展的動力,因為開放了數據之后,這些數據會產生新的價值。剛才已經舉了很多這樣的例子了。你的這個數據如何跟其他的數據進行整合,如果實現1+1>2,推動知識經濟、數據經濟的發展,而不僅僅是知情權的問題,而且形式也是會一樣的。開放是把這個完整的格式,記錄在數據庫里的數據格式,電子化的放在網上,你可以免費下載,而且對數據項也有原數據的說明,下來之后可以直接使用,信息公開是一條一條的,告訴你這個領導干部有多少財產,這是一條信息,數據開放是一片一片的。我們以后談到數據的時候,就不要想公開,就不要用公開,數據就是開放,信息才是公開。
     
    Q&A環節
    主持人:謝謝涂老師,王老師和姜老師還有補充嗎?那我們現在進入提問環節,前五名提問的同學有機會獲得涂老師親筆簽名的《大數據》一書,請那邊那位同學吧?
        提問:你好,非常謝謝三位老師非常精彩演講,給我們提供了一個非常真實,令人振奮的方向感,也是之前沒有接觸到的。我非常感興趣的是,這種大數據時代對于教育學的影響,我對這個方面比較感興趣,我的一個問題就是說,從現在的教育制度上,從一個宏觀的教育制度,讓學生變成什么樣,在這個大數據時代,每一個人積極的主動的去學習東西,比如說到一個微觀的角度,我們每一個人能有一個創新的精神,在老師顛簸他的頭腦的時候,他能綻放自己的思維之花,在這種大數據時代怎樣從學校學生學習還有老師的教學,如果更大程度上可以說學校制度上,這三種層面上,怎樣去把這種創新性發揮出來?
        主持人:你想提問哪位老師,這兒有三位老師。
        提問:我想三位老師,先問一下涂老師可以嗎?不知道我的問題是否闡述清楚了。
        主持人:涂老師聽明白了嗎?
        涂子沛:你用兩句話概括一下你的問題。
        提問:第一個是優質的教育需要一個公開,一個公平的教育資源,我想問的問題是,從學生的層面上,怎樣運用這種資源;從教師的角度上,怎樣幫助學生篩選這種資源,或者是怎樣的一種態度教學生,不是說老師對學生的一種改造,而是說怎樣幫助學生,激發自己內在的力量去學習,去選擇自己喜歡的東西。
        涂子沛:以后的學習資源非常豐富,學生應該怎么利用這些資源?首先第一點,終身學習成為可能,不再拘束于一定要來到大學校里面,隨時隨地都可以學習,在這之前這都是夢寐以求的,教育部想實現這些目標,但中國的教育資源很匱乏。對學生這一個立場來說,就是選擇,從時間上,從地點上選擇度就增加多了,不從老師這個角度講,也是資源多了,對老師你的技能恐怕不一樣,對你的技能的要求不一樣,原來是把知識講清楚,這時候你的技能是說怎么組織一個討論,怎么讓學生在討論當中激發新的思想。這個會比單純的講授一個知識更重要,因為恐怕有人比你講更好,大家坐下來看這個視頻就可以了,但是你要做一個課堂的組織者和引導者,技巧不一樣。
        姜奇平:我補充一下,我覺得從看得到的實際發展動向來看,首先有幾個趨勢,第一,我非常得贊同學生,我補充一下未來的學習會是什么樣的,會是一種現象學和體驗的方式,也就是孔夫子的方法,就事論事,見到白菜說白菜,見到蘿卜說蘿卜,我們不脫離現象,這種方式是一對一教學,而且是終生進行,這個和現在的拿教科書和實踐脫離的方式非常不一樣?,F在印度非常流行這種方式,用企業導師引導時代學習,這是一個,而且非常的速成。
        第二我認教育體系和教育理念會發生一個很大的變化,我看到美國用我們現在的方法和數據的結構不一樣,這個我們都是在訓練串型處理能力,就是先解決一個問題,再解決其他的。其實人生來就有并行處理的能力,比如說3歲、4歲小孩,只要你不教育他,不壓抑他,他都自然的有悟性?,F在有一本書叫《淺薄》,從表面上看來,它的處理有什么特點呢,他好象思路不專一了,同時想好幾件事,但是你注意到,這正好是未來網絡社會,大數據高度發達的狀態,一會兒網上這叫了那兒響了,它同時處理好幾件事,不亂,這是并行處理能力。這個時候我們的教育體制將從串型教育變成并行教育,現在在美國的三四歲小孩的教育里面,已經顯示出來了。你拿小孩隨便一試,在三四秒鐘之內,把圖紙上的零亂的數據,他可以輕而易舉的回憶起來,大人通過教育,徹底的消滅了這種教育素質,這個是并行處理和串行處理的能力,將來會帶來思維方式的改變,具體來說,小孩的方式是什么呢,他要求膚淺成為一種能力。為什么呢,他說我不懂的事,我問了我的朋友我知道了,我何必呢,人為什么這么聰明呢?就是因為沒有人肯幫助他,他才訓練自己聰明,如果誰都都肯幫助他,他干嗎自己非得像愛因斯坦一樣,我為什么自己非得針對我自己處理這個事,我才動腦子,這是一個。
        第三個我看到一個變化是什么呢?就是機械記憶不用了,將來完全集中創造性,實驗室是什么呢?液體計算實現以后,到2050年把大影百科全書一針打入大腦,以后你們上課就可以打一針,回家玩去吧,接著干嗎呢,你死記硬背不用背了,但是這個歷史到底是怎么回事,你們辯論去吧,這個時候完全進入一種創造性的狀態,叫你完全把死記硬背徹底交給機器。這是我談的第三個趨勢。
          另外還有一個眼前的趨勢,就是課件化。有優秀的老師,為什么不能對著所有的學生,但是現在這種做法不靈,給所有人看一模一樣的詩不是路子,應該是什么呢?上面有名師下面有各種品牌的解說師,就是說你看屋里給你講述大道理,但是具體你今天買蘿卜,這個道理我來給你換算一下,對于你的智慧的人來說,我應該像孔子那樣給你個性化解說。這叫大規模定制的方法,再一個我們可以看出APP的模式教育你,有教育平臺還有增值開發,干嗎非得一堂課講完呢,里面引起無數發財的機會等等,由于時間所限,注意觀察我們《互聯網周刊》做的廣告吧。
        主持人:謝謝兩位老師,王老師。
        王煜全:正好我們投資了一個未來教育的公司,有一點研究,說實話我對教育也是老不滿,因為我上學的時候成績可差了,老是倒數第一第二。后來得到一點寬慰,我們玩互聯網的,互聯網有一個叫西湖論劍活動,當初第一屆的時候,我們在臺下看臺上幾個互聯網的牛人,有一個丁磊,他們請的嘉賓是金庸,金庸上臺了,丁磊一上臺就沖金庸說,金老先生你可把我們害苦了,我高考的時候就看金庸小說了,所以考得一塌糊涂。然后我就想,我不是被金庸害的,我是被世界杯害的,我高考的時候世界杯,我們一直看到半決賽看完,半決賽基本上第二天就考試了,所以考得特糟糕,我們那個同學看到決賽,就沒考上大學。我當時在想,教育要是搞得比世界杯還精彩,比金庸小說還好看,我至于那樣嗎?所以一半的責任不在我們,在教育本身,教育怎么做的好玩。國外有很多的探索,其中有一個非常著名的叫可汗學院(音),你們可以去看,里面很多都是免費的。包括涂老師一直講到國外大量教學的課程免費上網。未來一定是兩者的結合,一個是教育變的更有趣,可以抓住人,另一個是什么呢,你是隨著自己的心,隨著自己的興趣選擇職業。我們當時比較慘,我們選擇的職業是反過來想的,這個是唯一的一個我覺得好玩一點的東西,其他的太無聊了,所以就選擇了這一個。但是實際上,今天你要想,這個是我最想要的,我希望一輩子就干這個事,你才能去選擇這個,我們今天選擇的領域寬了,如果你真心的熱愛它,方法得當,你就可以成為專家,你就可以成為牛人,那個時候整個世界都是你的,這是第一個我想強調的。學習方法確實有改進之處,你可以去看,比如說你去搜索一個詞,我不知道怎么翻譯,反正就是適應性平臺,就是它適應你,學習來適應你,而不是你去適應這個教材,教育方法有很多可改進之處。
        另外一半呢,姜老師說的特別好,我給姜老師的理論加一點注腳,未來我自己就在逐漸適應,大家講話我在底下玩手機,我也應該姜老師說的分心怎么回事,而且現在這個還有很多的訓練,大家如果有空的話上網站去玩,我給你很多玩的東西,叫lumosity.com,有一點點免費的注冊期,如果你很有錢的話,你可以去玩,反正最起碼免費的可以玩一周。它有好多各種各樣的益智的游戲,通過玩益智的游戲幫你測量大腦的水平如何,比如說其中姜老師提到一點,國外的多任務處理,多任務處理還分很多不同的。靜止的多任務和移動中的多任務,移動中的多任務,男性一般能力比較強,所以為什么說男性開車的時候要比女性好一點,因為我們移動中的任務擅長一點。但是這些都不要怕,因為你可以通過游戲訓練提升,所以以后你會發現游戲就跟教材一樣,你玩一個游戲下來,你考試就會很好。這個未來也多了,值得崇敬。
    而且其實未來考的東西,姜老師說的特別好,我聽說國外已經開始考慮,開始的時候可以上崗,反正搜索可以搜索到的東西都不考了,因為你上網可以查到沒意義了,。那么考的是什么呢,未來人類最稀缺的是什么能力,是創始,不是記憶力,因為記憶力芯片會比我們強,不是計算能力,中國人往往心算能力超級強,但是你心算能力再強,涂老師講了,要有電腦,你肯定玩不過人家。人和機器最大的區別是我們的創造力,這個就成了人最偉大的財富,我們所有的訓練都要以這個為基礎,因為未來有創造力的人會有巨大的前景,沒有創造力的人你再有本事,機器會干的比你好,所以這個未來的方向也會完全不一樣。
        第三個,說一點實際的東西,我們在投的項目,其實是另一個理念。除了說學習要娛樂化,要讓我們可以適應和學習要面向未來,指的不是面向別的東西,激發創造力以外還有一個很重要,師生關系會轉變。大家發現沒有,師生關系是一個不負責任的關系,他是老師我是學生,我補考了扣他的工資嗎?不扣的話,他怎么可以保證我盡心教我呢,但是國外有一種關系叫“師徒關系”,你帶不出徒弟來,就沒有飯吃。因為沒有人給你干活,所以我們在投的一個項目就是重新構建師徒關系,什么意思呢?就是老師的信用取決于學生的表現,你要說的是,我教出這些學生來,這一點上來說哪做的好呢,體育界,你是名師,不是說我在各個大校巡回演講,不是這樣的,是我教的誰是世界冠軍,所以你的信用取決于學生,這個時候你就會盡力教,而且就會做到姜老師說的,因材施教。根據不同的情況來解決問題,現在上大課誰來完了就走了,怎么因材施教,所以那個理念整個就是錯的。反過來講,學生也會跟老師互動,甚至說學生幫老師干活,因為只有幫老師干活,你才有實踐的機會,才能做的好,你沒練過,你怎么可能上的了手。我認為這個是一脈相承的,未來既然是個部落,這個部落里就是師徒關系,不是師生關系,我們也希望進行改進。涂老師剛才講到了,一對一,你自己學的那部分我不管你,但是你需要我點撥的那部分,我根據你的情況我稍做點撥,你可能水平就很強,為什么要盡心點撥你,研究你的情況去顛簸,因為和我的水平是掛鉤的,說白了就是大數據的另一個理念,一切都要是一個大數據的反饋系統,如果沒有反饋一定會跑偏。今天我們的高校反饋就相對弱。
        主持人:謝謝王老師,我們請后面那位同學。
        提問:姜老師和王老師我很認同你們的觀點,我認為真正的教育應該是價值觀念、思維方式和知識結構并進的,而我們目前的教育只注重知識結構,學到的都是比較僵硬,死的東西。其實不光在美國,在我們中國也有很多這方面的探索,比如說現在的家庭自助教育,還有我知道的今日學堂是很不錯的,三位老師可以關注一下。
        關于大數據我有一個問題,我們知道現在是海量數據,數據量是增長,而我們的人腦的容量又是有限的,這樣的話就形成一種矛盾,未來的話,人會向哪個方向發展,來適應無窮無邊界的海量數據,我們現在目前能做的又有哪些呢?
        主持人:你想提問哪位老師?
        提問:我想問涂老師。
        主持人:涂老師請做答。
        涂子沛:海量信息有計算機處理,我覺得對人不足以構成挑戰,挑戰就是說,人所做的一切決策都是一個有限的決策,基于有限信息的決策。人為什么發明計算機?就是想通過計算機來處理這些信息,來輔助自己的決策,擴大自己的信息范圍,我不知道這樣回答你的問題是不是回答了這個問題。
        提問:因為剛剛姜老師提到了,可以向大腦中植入芯片這樣的方法。
       聽眾:非常感謝三位嘉賓做的演講,我是幾個月讀的你們的《大數據》,我讀完以后覺得非常好,所以我至少買了二三十本送給我的學生和朋友,而且我在很多的場合推薦了這本書。本科生上課的時候,我給他們推薦了,我教MBA的時候給他們提供了,我覺得這本書最好的地方在于,你把這個科學和民主結合的非常好,我覺得這個是這個書最值得勸導的,講大數據很多人都可以講,把五四的精神結合的很好,你講的那些東西我們都很同意,而且我們都在做這個東西,比如說我是做創業研究的。我在兩個月以前,我給全世界的合作伙伴發了一個短信,我提醒他們。
        主持人:您做一下自我介紹。
        聽眾:我是經管學院的老師,我們也在微博上也互動了一次,因為我標題叫做“大數據時代的心理研究策略”。我認為每一個專業的學生,每一個專業的老師都應該考慮大數據的時代,研究面臨著什么樣的挑戰,而且還需要擁抱這種變化,比如說我們在研究的全世界各地的文化,我們以前是通過問卷調查的方法或者是實驗的方法,或者是行為觀察的方法,我現在提出一個觀點,用搜索引擎加上海量文本的深層次的分析,我們將來有一天可以建立掃描的工具,我在全世界各地,各個國家的門戶網站抓取信息,我去進行機器的處理,來透視它背后的文化價值觀的動態的變化,這以前是完全不可能的事情,而現在我們在理論上可以的,而且是我們現在在做的我要講的剛好是唱一些反調,因為我覺得你講的是數據,但是事實上在將來這個時代上你稀缺的不是數據,而是創造性和理論思維。
    我們說,你做研究有三種方法,一種是理論驅動,一種是工具驅動。我們以前都很貶斥數據驅動的,但是我覺得很多人的觀念必須要改變了,比如說我強烈的相信沒有什么東西比好的輿論更正確了,我們中國很多的學者或者是很多的人,事實上都在理論方法沒有任何的貢獻,西方在講什么東西,我們都是在傳承的。
        另外一個,我要告訴大家的,尤其是在座的學生,尤其是你不要被忽悠的地方在意,你現在加強的就是你理論的修養,比如說前幾天有一篇文章說是,研究用5500萬做的一個研究,在此之前,向我們做社會關系網絡研究的,我們是沒有可能測量社會影響,但是它通過一個非常巧妙的,比如說跟facebook的合作,測量了社會影響,這個是在上面發表這篇文章的原因而不是說用了5500萬測試,所以我最后一句,在大數據的時代最稀缺的是創造力和理論思維。謝謝。
        主持人:謝謝老師精彩的回答。
        涂子沛:我補充一點,老師談得非常好,其實說“大數據時代”首先是數據的定義,數據革命的根本是什么,實際上是統計學的革命,原來的統計學從抽樣這個角度分析,現在這個統計學不僅僅是抽樣,我有多元的數據就可以使??梢栽倥e一個例子補充這個,奧巴馬大選是剛剛發生的事情,每幾天發生的事情,我記得我跟薛勇(音)的微博,薛勇(音)是在美國的一個作家,寫了很多書,他當時在微博上說,這個我們要等很久,這個是一個焦灼的狀態,他說結果已經不重要了。奧巴馬的人氣已經領先5個百分點了,通過文本分析已經分析出來了,很多人上網說,我投了這個票,所以大選出來之前都有預測奧巴馬可以當選,這就是一個例子。事實上通過微博我們可以建立各種各樣的指標,原來你是抽樣,你抽樣了之后還要回來數據分析。有一個時間的滯后性。
          再補充一個故事,我里面寫了很多美國總統大選的預測,其實在歷史上就發生過一件事情,四幾年的時候,杜魯門和杜威競選,原來是杜威領先的。他們說肯定是杜威當選,那個時候的預測已經很準了。整個大的事件過來只失誤過兩次,這是其中一次,為什么呢,因為最后那幾天杜魯門翻盤,這個時候他已經來不及做民意調查了,因為他做民意調查,他預測的報紙已經印好了,準備去賣了,說杜威贏了,第二天報紙全部收回了,現在還會出現這種情況嗎?現在出現這種情況已經很少了,有很多渠道可以預測,首先是一個統計學的概念,但是統計學的概念你想吧,現在哪一個不用統計學,哪一個科學不用。所以我書里面提到過,美國說了,他們總統委員會說了一個總統提交的報告,現在科技領域有五大挑戰,第一大挑戰就是大數據的挑戰,大數據的挑戰是貫穿所有科學領域的。每個科學領域都存在這個挑戰,我就做這個補充。
          主持人:謝謝涂老師,這位同學。
          提問:大家好,三位嘉賓好,我的問題是關于教育和心理相關的兩個問題。首先我要說一下,關于你那個大數據的公民生活,我覺得這個是一個非常好的主題,現在我關心的是,我們現在的手機的充電器,我們電腦的充電器,這些東西的話,目前還沒有統一好,從數據統計的分析的角度,我想聽一下你的看法。
    第一個就是關于心理的,當前在我們心理學研究和計算機科學研究里面有一個叫情感計算,情感計算里面就涉及到我們現在比較敏感的,也就是面子的問題。我們現在很多中國的精神病人,現在抑郁啊,或者是神經癥啊,這些導致很多的社會公眾的診斷,從目前的角度來看,是沒有這種依據的,我想聽一下,從計算科學和數據的角度,談一下數據對我們醫學發展有什么積極意義。
        第二是關于我們教育統計與測量方面的東西,高考很敏感的。我們高考發展到今天,它的科學性是非常低的。我想知道一下,隨著我們數據和計算科學的發展,我們的高考將是一個什么樣的走向?謝謝。
        主持人:想提問哪位老師?
        提問:我覺得三位老師都可以回答這個問題,你們自由吧。
        主持人:請三位老師都談一下。
        涂子沛:我簡單地談一下,我把其他的問題留給另外兩個老師,我回答你第二個問題吧,第二個問題就是高考的走向。
        提問:從預測的角度,目前來說,教育發展是非常落后的。
        涂子沛:從數據的角度來說,我現在在廣東呼吁一個事情就是數據開放,我們設想一下,如果所有考生的報考數據可以開放的話會出現什么事情。
        提問:我關注的是對人才的測評問題,我們現在高考的話,應該是很簡單的數據的分量,不管是計算機還是心理學,還是教育科學的發展,完全是對高考進行測評,但是我們教育仍然不努力。
        涂子沛:我理解你的問題,是不是設計一個好的試卷。
        提問:能力的測量是一個很簡單的東西,我認為現在的高考在這一塊的思考真的不夠。
        涂子沛:你的問題就是說,怎么通過數據設計一個好的開始制度是嗎。
        提問:我們教育設計什么,或者是高考研究部門,他們的數據分析能力我認為是很差的。比如說他們可以完全去掉這些高考制度,這些現存的模型拿過來的,我們高考可以達到一個很高的水平,如果從數據分析的角度,你有什么好的建議嗎?
        涂子沛:我沒有什么好的建議。
        姜奇平:我想回答第一個問題,我覺得總的一個想法是什么呢?這個大數據最終是通向什么地方的,其實我覺得是通向人的,農業革命是解放了人的物質能力,工業革命是解放了人的社會能力,這個數據革命和信息革命是解放了人的大腦,但是并不是解放了人的物質的大腦,實際上解決了一個“會”的問題。我們想一想,在過去兩個文明時代,真正能夠成為“佛”的人或者是智慧的人是鳳毛麟角。通過這場革命之后,他會使每個人都具有慧根,這一點我認為才是大數據最終的重點,這個慧根具體來說,假如說我們從人工智能的角度講,我們在過去的時代都是在訓練人們的理性能力。但是你剛才說情感計算,這個確實是未來發展的方向,情感計算包括你說的心理分析,包括精神病治療,它的含義都是在我私之外,還有世界。是這樣的一個基本的概念在起作用,也就是說,這個東西在哪體現的最多呢?就是圖靈,圖靈關于人工智能,也就是人和機器最終走向哪,不會認為人只是一個邏輯的動物或者是計算的動物,或者是冷冰冰的動物。人既有冷的一面,又有熱的一面,既是既有干的一面也有濕的一面,所以我一直說,未來是這個主張,也就是說人在大的智慧的狀態之下,最終要達到什么目的,實際上是人工智能情感和理智的平衡,或者是我們過去說的,用弗洛伊德的話說是意識層面和其他層面的分離。但是比如說你剛才說的精神病,精神病的本質是什么呢?當然有生理型的,如果我們不從生理型的角度講,從精神分析者的角度去講,實際上是意識和淺意識層面的隔絕,就是把自己閉塞其中的一個世界和另外一個世界不能產生互動。對于這個,大數據深入分析以后,對人工智能研究的深入水平是什么呢?不僅要能夠進入到這種意識的層面,語言的層面,理性的層面,更主要的是可以進入人的情感的層面,進入到人的潛意識,并且使潛意識得到發展。這個我認為是揮,簡單地說,我們將來可以期待的是一個什么樣的未來前景呢?佛教里說的大乘佛教,大乘就是說,所有人都可以有慧根,所有人都可以成佛,這個知識用來干嗎的,如果不能給人們帶來智慧我認為一點用也沒有。這是我的第二個概念。
        王煜全:我覺得沒必要跟高考較勁。舉例來講,前兩天創業大賽,還有小孩子初中生,幾個孩子創業了,都有自己學的所有的途徑了,話又說回來,你要真是好學生,老師就愿意教你了,不需要進學校他就愿意教你,所以未來師徒關系就是這樣的,所以我覺得甭跟高考較勁,因為你在跟國家對抗,咱開十八大呢。
        主持人:謝謝王老師,還最后兩個問題。
        提問:感謝三位老師,感謝主持人,很榮幸涂老師親自給我們講座,我有個問題想問一下涂老師,這本書我看過。剛開始的時候,因為我是來自經管學院的,剛開始這本書我以為是對大數據技術的趨勢一種分析,一種走向。仔細翻的時候,我發現這本書大部分是寫人為的東西,尤其是寫美國的政治經濟,一些法律、人文,一些數據的發展,一些前景,我不知道涂老師為什么選擇了這個,剛才也講了,其實數據開放的國家不止是美國,我不知道為什么這本書都是美國的一些事實。對于目前國內的話,我們知道,美國開放大數據,但是我們有防火墻,我們草根有一些微博,但是我們一樣可以刪除微博,包括你剛才說的話,還有我們有微博大號的話,可能寫一些過激的言論的話,會被刪除。我想提的問題是,大數據這本書,對我們國家的政治、經濟、文化的一些改變沖擊,或者是一些改善。這個東西,我相信涂老師應該有一些自己的想法,只不過你不方便寫在這本書里面,所以我今天到場,想聆聽一下你的一些見解,以及對我們個人來說,在大趨勢之下我們有什么機遇和挑戰,非常感謝,但是我問的問題不是教育學的問題。
        主持人:他想聽聽在外面不讓說的。
        涂子沛:我講一下寫這本書的一個過程,很多學生已經開始走了。所以我想說這本書是給大學生看的,大家如果手頭有書的話,可以把書翻開,第一頁第一篇,有一個引言,引言我想跟大家分享一下,我認為中國現在是一個大時代,我們在座的各位都感覺到這個大時代,所謂的“大時代”就是改變即將到來的時代,對十八大開之前都有很多期望,感覺到大時代是不是離我們越來越近了。這段話是什么呢,為什么這是給大家寫的,這段話是奧巴馬在2007年在瑞士大學一個典禮上的演講,我之所以把這段話放在開篇,很多人當時批評我,你這是什么大數據啊,開篇就來了這么一段,你們每一個人都可以拿到畢業證。當時在畢業典禮上說的話,去追求錦衣玉食,這個金錢社會認為理所當然的東西,你可以選擇關心你自己的喜怒哀樂,把你的生活和國家的發展割裂開來,什么意思呢?這是奧巴馬自己的選擇,沒有任何問題,這是你個人的自由,他接著說,但是我不希望你們講述,這不僅僅是因為你對那些沒有你幸運的人負有責任,盡管確實負有責任,也不僅僅是因為對你幫助走到今天的人欠下的債,盡管你確實欠下了債。我講到這里的時候,我就想起了米歇爾的一個演講,米歇爾在幫助奧巴馬時候的一個演講,她有一句話,我當時在聽到的,她說當你跨過幸運之門的時候,請記住,不要把那扇門關上,要為后來人留門,要不同的人跨過來。
        為什么寫這本書呢?我經常關注奧巴馬,大家對比一下,我們國家的領導人和美國的領導人,他們在講什么,那邊的領導人又在講什么,我們說很多人批評他們選舉是虛偽的,是金錢政治。但是你想到這些話里面包含著一個價值觀,一個價值導向,我覺得這些話是原話,我們接著回到這里,他說,“這是因為,為什么你不要這么做呢,這是因為你對自己負有使命和責任,這是因為我們個人的命運依賴于群體的命運,這是因為如果你僅僅考慮自己,滿足眼先的需要,這是因為只有你把你自己和一些更偉大的東西捆綁到一起的時候,你才能發現你真正的能量,你才能發現,你為美國這個國家繼續書寫你在歷史當中,你能扮演的一個角色。“我很喜歡這句話,所以把這句話放在臺前。
        主持人:包涵,我要打斷你,我們還有最后五分鐘,所以我們還有最后一個問題。最后那位同學吧。
        提問:王總你好,我的問題是,我看到你投資了一些企業,我問一下現在這些企業的運營狀況怎么樣,你可以簡要的給我們說一下這些企業的營運模式嗎?
        主持人:關于投資的問題,王老師你時間有限,你得抓緊。
        王煜全:很簡單,就兩句話,經營狀況還早呢,我們不是想做一個手機應用的,所以現在說早的很。盈利模式也不用講,既然是未來的,我們將來講。
        主持人:今天的講座到這里結束。

        

    11月12日晚,由本刊主辦,廣西師范大學出版社理想國協辦的《“大數據”時代的公民社會》在北京師范大學如期舉行,《大數據》一書作者涂子沛攜同資深市場營銷戰略專家王煜全,《互聯網周刊》主編姜奇平一同對大數據時代,以及時代下的公民社會這個話題展開討論,以下是當天活動現場的速記整理:

    主持人:我為大家介紹一下今天的嘉賓,首先是《大數據》一書的作者涂子沛老師,有請涂老師!接下來為大家介紹今天和涂老師一起對談的兩位嘉賓是王煜全老師,資深的市場營銷戰略專家;姜奇平老師,中國社科院信息化研究中心的秘書長,也是互聯網周刊的主編,有請兩位老師!我們首先請涂老師先就他的《大數據》一書和“大數據”和我們每個人的關系做一個簡單的講述。   

    涂子沛:大家好!很高興今天來到這里,非常高興!而且我看到這個片頭--鼓勵和思想,我們現在就要講這個東西?,F在講這個東西意義非常重要,十八大正在開,我們中國有30年的改革開放,我們說勞動力已經解放,市場經濟的規則已經基本上建立起來了,但是當我們看世界的時候發現,還有一個新的關鍵詞叫“創新”,怎么創新?沒有獨立的人格,沒有自由的思想,我們能創新嗎?所以我們現在需要的是一個創造力的解放,一個思想的解放和人格的解放。我這個書大家看了,扉頁上寫的就是“一個真正的信息社會,首先是一個公民社會”,這是全書的一個出發點,這個出發點就是說,“信息社會最大的特點就是,信息的自由流動。”如果沒有人的平等,沒有人的自由,信息能夠自由流動嗎?如果沒有人的平等,我們這個社會彼此另外壓抑另外一個人,我們的創造力怎么迸發出來?首先做一個解釋和說明,這是看到了今天的片頭時我的一個感想。   

    今天給我說出的題目是“大數據時代的公民生活”,題目我也很喜歡,我們來演繹公民生活的時候,它的背景是“大數據”時代。首先來講一講“什么是大數據時代”,在研究一個現象的時候,首先要研究它的定義,研究它的內涵,咱們就先把數據給它抽走,看看代表是什么。數據不是數字,數據是有跟列的數字,當我們談到數據的時候,我們想到的是它代表計算,代表精確,代表理性,代表科學,代表事實。大家說姚明很高,到底有多高,你最后說兩米多左右,這就是一個精確的事實。

    數據的出現也是人類認識這個世界,不斷地向前推進的需要,人類發現需要精確的數字,就好像回到剛才的例子,你說很高很高,到底有多高,我們看,人類歷史上很多重大的文明推進和演進都跟數據離不開,比如說度量衡的發明,貨幣的發明,再比如二進制的發明最后導致計算機的發明,最背后就是數據。我最近也在國內演講,特別在廣東講的時候,講“科學發展觀”時,我特別引申了一下,我說科學發展觀的落腳點就是數據,數據就是科學的基礎,沒有數據能有科學嗎?數據就是科學的度量,所以再繼續引申,因為這里面有一章叫“數據治國”,再繼續引申“數據治國”就應該是科學發展觀的題中應有之義。

    廣東省委的機關報,日報最后就是以這個為標題,說科學發展觀的落腳點就在數據,咱們就說數據的重要。經過信息時代之后,信息的內容實際上在不斷的變化,就因為計算機的發明,我們有一個新的詞叫Database--數據庫。這個詞完全是一個外來的詞,計算機最早是計算數字和處理數字,那時候就存在Database,后來隨著計算機能力的不斷增強,它可以處理文字、圖片、視頻、聲音等等,但所有這些都放在Database,所以我們把這所有的一切都稱為數據,這時候數據的內涵擴大了。

    大家要知道數據的內涵在擴大,還有一些其他的事情也在發生變化,就是說數據的容量在增大。八十年代的時候就有人提出Big data這個概念,那時候的“大數據”的還不是現在“大數據”的概念。“大數據”這個概念不斷的演變,最早有人就預見到說有一天數據會比程序更加重要,比軟件更加重要,它是指重要性。所以我們往大了說,可以說這是一個大的機器,一個大的房子,也可以說是一個大容物。到2000年的時候,賓夕法尼亞大學有一個教授出來定義,那時候企業的數據已經到泰了,他說200泰的數據就是大數據了,那泰到底是什么樣的單位呢?比如全世界最大的圖書館是美國國會圖書館,美國國會圖書印刷品的含量,不包括電子圖書加起來是15泰,北師大應該是2個泰或者更少,這個數據就叫“泰”。

    現在國內也有很多人說“大”,到底多大才是“大數據”?我們說大數據的時候應該從大價值來理解,因為我們數據已經很多了,人類利用分析數據的能力很強了,我們能從數據當中發現以前不能發現的價值這個角度來理解。我們談把數據的現象抽離出來談,來理解什么是數據。接下來我們再把數據放回到物力事件當中,從它和其他現象的聯系當中來把握和考察它的因果關系,大數據究竟是怎么產生的?我們說“大數據”的產生有五個因素:第一個是摩爾定律,第二個是組織計算,第三個是普適計算,第四個是數據挖掘,第五個是社交媒體。我們現在一一對這五個因素進行解讀,這五個因素里面有四個因素是認為影響到了我們公民生活的,我們來看看它怎么來影響在“大數據”時代公民的生活。data在五年的時候,應該有一個創始人,他發現一個東西:同一個計算機芯片,同一個面積上晶體管的數量每一到兩年就要增加一倍,這意味著什么?意味著計算機處理的能力越來越強,存儲的能力也越來越強,同一個面積上東西越來越多,越來越密,一到兩年就增加一倍,物力存在器的性能不斷上升,價值不斷的下降。有一個考證說,從五十年代起最早的存儲器發明到現在,存儲器的價格下降了300萬倍,大家可以想想,歷史上還有什么商品它的價格能在半個世紀下降300萬倍?而摩爾定律也成為了一個代名詞,呈指數形發展的變化,急劇變化的狀態,劇變的變化。

    我們可以看看,這個圖代表摩爾定律,是條直線,為什么是直線呢?因為沒辦法畫,如果嚴格按刻度來畫的話應該是一條橫軸的曲線。我們說存儲器的價格在不斷下降,剛才說到泰,說北師大的圖書容量假設是1個泰,1個泰的存儲器要多少錢呢?現在的標價是95美元,意味著什么呢?意味著你有95美元你就可以把這個圖書館搬回家了。還有,科學家在繼續預測摩爾定律還會繼續有效,一直到2020年,2020年你把一個圖書館搬回家只要一杯咖啡的錢,3美元。1988年一個科學家提出了普適計算,普適計算提的不多,大家都提物聯網。物聯網是普適計算一個子概念,人家計算機的浪潮是分階段的:第一個階段是主機階段,到80年代由于微軟、蘋果一直到個人電腦的階段,88年互聯網之后,科學家說這不是結果。

    未來的計算機會越來越小,會無處不在,跟日常的環境聯系到一起,到今天實現了沒有?我們智能手機就是一臺計算機,無數的傳感器、攝像頭,很小很小,它可以收集數據,反饋數據。我可以舉兩個例子,美國氣象局他氣侯氣象檢測的傳感器,隨著汽車不停的往前走,從紐約到波士頓,它每10秒鐘收集一次數據,一天收集10幾萬次數據,實時的傳輸到數據上面去。1989年就出現了數據挖掘,大家都挺熟悉的,也都都津津樂道,我們回頭來看摩爾定律解決了什么問題?解決一個問題是說無論有多少信息,我可以以很低的成本保存下來。

    普適計算解決的一個問題是人類收集信息的能力越來越強,感應器、手機、無線網絡、望遠鏡、仿真計算都在產生數據,就是說保存數據的能力很強、收集數據的能力很強,到1989年數據挖掘出現之后,這時候人類使分析數據的能力也空前的增強,數據挖掘是叫“在數據庫當中發現知識”。最近馬云為了說服汪洋書記重視數據,他到汪洋書記那里說,他說汪洋書記你知不知道XX哪里賣的最好?根據他的數據他說新疆和西藏賣得很好,比全國絕大多數省份都賣的好,為什么呢?我們看數據挖掘沿著一條線,沿著一條什么線,首先我們有大量的數據,數據是信息的載體,然后有信息背景的數據就成為一條信息,有規律的信息就體現出一種知識。能夠產生價值的新的知識,這時候就成為一種智慧,數據挖掘就是沿著這條線。

     注:本文系當日活動現場速記,刊誤之處,敬請諒解

    相關視頻鏈接:http://www.tudou.com/programs/view/4KtO5uts2sg

    已有0人參與

    網友評論(所發表點評僅代表網友個人觀點,不代表經濟觀察網觀點)

    用戶名: 快速登錄

    經濟觀察網相關產品

    日本人成18禁止久久影院