我們人類之所以有今天在地球上能夠自由繁衍成為地球的主宰者,不是因為我們是強者,不是因為我們身強力壯,是因為我們的合作性是世界最強的,所以這個合作形就必然帶來一些我們人類相互之間的一個行為規則。海特認為說人類行為規則有五條,第一條有愛恨,互相之間愛恨情愁的關系,第二條是公平性,我要待在這個社會里要有公平性,第三條是我對一個群體要也認同感,第四條是我對權威會崇拜,我們都知道如果做過了就麻煩了。我崇拜權威是因為他做過權威的事,但是很多時候他做過事我崇拜以后他做的事不權威了,或者做錯了我還崇拜就麻煩了,連德國被號稱多么理性的國家也對某個叫希特勒的權威崇拜的一塌糊涂。
第五個叫做純潔性,我昨天還和一個朋友討論,海特講的事情也不全對,我們現在都希望所有讀書是批判性接受,因為海特有一個視頻他講了20分鐘講這個理論。他問臺下的人,因為稍微解釋一下,他認為社會現在進化了,社會這五條大家不是普遍都遵守了,是進化到兩極。一極是所謂的保守的人這五條同等重視,另外一極是更加文明的人,只尊重前兩條,只強調愛恨和公平,但是對后三條強調的不夠,基本不強調,參與者基本上都是美國的主流。這是我們講社會層面對大數據的理解,稍微說一點我們現在說的事是實踐層面,我原來特別痛恨資本主義的一切,現在也成了一個資本主義的小走狗,用資本的力量推動社交的發展,我們做了一個孵化器,孵化了將近20家做社交網絡各種應用的企業弄得我最近狼狽不堪,因為每個企業都有自己的應用,每個企業都很棒,都希望成為未來的谷歌。
稍微做點小的介紹,除了一些世俗的賺錢的業務以外,稍微有點純潔的就是跟陳教授合作那部分,做點基礎研究。我們認為由于有了大數據,尤其有了社會關系,社會關系使得我們的數據一下深入了一個層次,所以我為什么說是社會化計算。其實理論上講谷歌那個年代就已經用到了社會關系,他是把網頁按照社會關系給連接起來了。他計算哪個網頁對我們的搜索關鍵詞最匹配,哪個網頁在這個領域最重要,用的是社會關系這種做法來的。所有的其他也含有這個關鍵詞的網頁和這個網頁的連接是最多的,相當于我問北京誰最出名?這個關鍵詞就是北京,誰,每個人身份都有一個北京,北京人,他都指向某個人,比如都認識Keso,那他就是北京最出名的。這是用社會性辦法來算的,但是很不幸是計算網頁之間的關系,這下很麻煩了,因為我用網頁對應人是對不上的,所以百度最虧的就是沒有社會網絡,他沒有辦法把所有積累的知識和人做對應。
一旦有人這個對應物了,這個社會關系你在上面疊加信息。我們開玩笑說蒸汽機已經發明出來了,只不過推動社會進步的工業化還剛剛在開始,我們在做的是工業化的工作。這種工業化必須要和學術結合,因為蒸汽機剛發明有很多學術成分要解決,所以我們在做一系列很有趣的實驗,希望去揭示如何用算法能夠給大家提供更真實的服務。
時間關系就稍微解釋一點點比如說舉例來講過去我們知道有這么一個規律,如果這個人的社會地位比較高,他能夠擁有的社會資源就會比較多一些,他為什么出名?為什么有社會地位?它是有道理的,因為他能占便宜,比如羅老師社會地位高,理論上講社會地位高有什么特點?他更容易娶到年輕漂亮的老婆,確實是這樣的。但是這個很好玩我們也知道更出名的例子,比如楊振寧,如果是一個80來歲的看工廠門的退休老員工他娶不到一個20多歲的年輕碩士,因為他是楊振寧,所以他能娶到。
國外研究社會地位越高他就能和越年輕漂亮的女性結婚,因為擁有社會資源能力更強,但是這個事總來沒有證明過,我們和陳老師我們在合作希望在社交網絡里利用數據去證明這件事,當然也可能推翻我們正在拷數據。為什么呢?第一社會地位可計算了,通過分析你在社交網絡當中的位置我們可以分析出一個人的社會地位的,這個是很了不起的。
以前我不知道,現在我知道了,而且我們現在做一個事清華另外一個教授唐杰,也是社交網絡在中國頂尖的高手。他幫我們把社交網絡里,因為現在新浪的社交網絡差不多有三四億用戶,他把每一個用戶的社會地位做了一個高低,你在這三億多人里是排在哪個位置給你一個數,這個很厲害。另外一個是社會資源,也有數,我不知道這個人他老婆到底多少歲數,這個沒有體現,但是我可以用另外一個數據取代她,所以實際上做社會學研究的核心是你學會用各種各樣數據近似性得到你想要的結論。
我們的數據就是這個人假設他擁有更好的資源他就能擁有和更多的年輕漂亮女孩互動的機會,我們測他的雙向異性好友的平均年齡和他的年齡差,假設這個人40歲,我們把兩組人挑出來都是40歲的人我們全挑出來分成兩組,一種是社會地位高很多,一種是低很多,把每個人的雙向好友里邊的女性實出來,因為實際上新浪用戶里邊70%是標明自己的年齡和性別的,這點特別好,我們現在用戶數據特別充分,有些沒有標明就去掉,因為海量數據不看,挑出來之后可以證明雙向好友里邊的異性的平均年齡和這個人40歲到底差多少。
我們想看他的社會等級不同的時候他的年齡差是變得更大還是更小,如果說社會等級不同年齡差沒變那說明我們的社會非常公平,如果社會等級不同年齡差很大說明什么問題,我們的社會可能有資本主義因素存在,但是好玩的地方就在于說。舉一個例子,我們這樣好玩的例子有一大堆,大家如果有興趣做研發和創業的可以來找我們,我們最希望瘋狂的人跟我們一起改變世界。
最好玩的在于這是一個嶄新的世界,這是一個嶄新的理解世界的途徑,因為以前我們根本不可能從這個角度去理解人類,大數據時代最幸福的就是社會化網絡計算的時代,最幸福的以前這個世界是對個體行為的理解達到空前的深度。從弗洛伊德開始,對過去的幾年包括后來有了功能性投資共振對人的理解達到一個空前的深度。未來的一百年20世紀大家認為是人性解放,21世紀是群體解放,對人群體的行為了解可以達到一個空前的深度,這種時候就意味著一個新的工業革命的開始。
稍微說的更加瘋狂一點,我們一直有一個概念我忘了國外誰說的,那本書里講到一個理念,人類的進化一直是什么呢?不光是人所有的動物整個生物地球的進化,進化的原則是物競天擇適者生存,大家發現沒有,這個進化從來就搞不懂為什么是單向,越來越復雜,進化你沒有看到越來越簡單的理論,但是進化的理論達爾文并沒有得到一個結論進化必然越來越復雜,是最近這幾年才搞出來的。
什么意思?因為進化從來都是弱者更合作去戰勝了同等水平的強者,所以弱者一抱團,而且抱團的如此緊密以至于形成了一個新個體,弱者這一個群體結合成以后變成個體,變成超有機體戰勝了強者。最弱的分子是散著的,他們合起來變成了細胞,一個細胞就可以戰勝掉強大的分子,弱勢的細胞個體合起來變成了多細胞動物他們能夠戰勝掉最強大的單細胞動物,而那個最強大的單細胞動物到今天在地球上都存在著叫草履蟲,而我們是一代一代復雜化了以后更多層級從單細胞到多細胞逐漸演化。
我們是一層一層的進化從過去的包括說哺乳動物是有感情的,我們現在是理性的每一層的進化都帶來超有機體的誕生和涌現出來的新的智力水平,或者是新的管理控制系統,這個才造成人類的進化,很有可能我們若干年之后回來看說現在這個年代2012年很多人認為是世界毀滅,很可能是新生,人類會誕生出嶄新的超有機體可能就是革命,從現在開始,如果我們能夠有幸成為其中的探索者,我覺得是一個無比榮幸的事情,因為按照歷史局限性來說,這是我們能夠參與的最激動人心的事情了。謝謝。
