<tt id="ww04w"><rt id="ww04w"></rt></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <li id="ww04w"></li>
  • 斯科特?霍夫曼:你或許就是Google試驗的一部分
    導語:他們常常得意地對人說的一句話是:“我們對算法的實時更新和改進,就好比是在萬米高空為飛機更換引擎一樣”。

    經濟觀察網 張琪 北京報道

    有人曾問當時還是Google首席執行官的埃里克·施密特(Eric Schmidt)這樣一個問題:Google是否正使自己陷于“創新者的窘境”——過于關注對現有產品的小修小改而忽略了顛覆式創新,因為它的搜索技術實在是太強大了以至于到目前為止,競爭對手仍無機會威脅其絕對領先的地位?

    “我認為‘創新者的窘境’把問題過于簡單化了。你不能完全丟棄現有的系統,也沒有必要這么做,因為它很好用。” 施密特說,“而且,我們的文化偏愛創新,我們知道未來仍有很大改進空間,所以我們叫人去把它們找出來。 ”

    斯科特•霍夫曼(Scott Huffman)就是一個負責“找”出改進的人。他是Google高度神秘的“搜索質量團隊”(search quality group)的關鍵人物之一,負責領導搜索質量評估和移動搜索小組。在“搜索質量團隊”中,還有核心排名小組以及反垃圾小組。每個星期二,斯科特都要和其他小組的成員們聚在一起開會,用那個永遠不變的話題互相折磨:如何改進Google搜索引擎的搜索結果。

    1997年的Google搜索界面

    也許在很多人心目中,Google搜索多年來看上去并沒有太大變化。但是對于Google的工程師來說,Google搜索甚至每分每秒都在變化。他們常常得意地對人說的一句話是:“我們對算法的實時更新和改進,就好比是在萬米高空為飛機更換引擎一樣”。顯然,“搜索質量團隊”的天才工程師們就是為這架飛機換引擎的機械師。

    2012年的Goolge搜索界面

    “搜索質量團隊”的工作流程一般這樣開始:有用戶向技術支持部門抱怨使用體驗不好,或者系統自動收集到的信息表明用戶對某些搜索結果的點擊同以往相比發生異常,再或者是工程師們在頭腦風暴時產生了新的靈感,無論哪一種,據此提出的改進方案最終都會被反饋到核心排名小組的負責人Amit Singhal那里,他會讓手下的工程師們在內部網絡上進行模擬試驗,一旦他們認為問題得到解決,就會將方案發到斯科特的小組,即搜索質量評估小組。后者會對這些方案進行更加嚴格的測試,以確保不會損害其他的搜索結果。

    訪談:

    問:和十年前相比,Google搜索引擎主要變化有哪些?
          斯科特:首先在十年之前,我們搜索一個東西得到的結果看起來可能和今天的完全不一樣。以前,搜索結果只是一個網頁鏈接,但今天我們得到的結果內容非常豐富,包括網頁鏈接、相應的圖片、視頻、地圖等。這其實是整合搜索。第二個變化是快速回答的功能,在輸入搜索內容之后用戶直接能夠得到答案。比如搜索“北京天氣”或者是某一個航班號,Google可以直接給出答案,而不是鏈接到一系列無關的網頁上。第三是在用戶體驗方面的改進。比如在用戶輸入搜索請求時,搜索框中就會給出一些實時的建議,搜索結果也是實時變化?,F在還可以通過語音或圖片的方式來進行搜索,這也是過去所沒有的。此外,Google搜索引擎本身也在不斷改進,比如更好的排名搜索結果,我們每年年初和年末都會做一個比較,看一年中搜索結果發生的變化,有的時候變化能達到20%-30%,變化非常大。

    問:搜索結果如何才能做到與用戶最相關呢?
          斯科特:我們用幾百個指標來衡量結果并進行排名,最后的目的是給用戶呈現相關度最高和質量最高的搜索結果和文件。比如我們會考量這個關鍵詞在文件中出現的頻率;關鍵詞出現的地方,如果它出現在標題中就比它出現在文章的第十行或者更靠后的地方更重要;還會考慮用戶本身的情況,比如輸入“紐約”,而用戶位置又位于紐約,它就不會出現“紐”和“約”分開呈現的結果;另外,還要參考其他的網頁對這份文件的重視程度,比如引用程度、頻率,引用的量越高這個網頁的排名就越靠前,這個網頁的質量就越高或者越重要。

    問:您所在的部門叫做“搜索質量評估”小組,能否具體介紹一下你們是如何工作的?

    斯科特:Google每天要處理幾十億來自世界各地各種各樣的搜索請求,這種情況下我們不可能關閉搜索引擎做一些修改之后再打開,就好比飛機已經飛上天不可能讓它停下來更換引擎。我們使用精確的科學方法和流程對搜索進行改進。

    工程師們每天會思考還有什么地方可以改進,并產生一些新的構思,比如新的衡量標準或指標。我們首先會對這些構思做必要性評估,然而在部門內部和數據中心的某一部分做一些小規模的對比試驗。我們會針對一些搜索請求做兩組結果對比。一種使用現有方法,做基本組,另外一組是對比組,使用新構思出來的搜索方法。我們會請一些獨立的受過培訓的評估員幫助我們進行評估,他們來自不同國家,說100多種語言,他們會判斷基本組和對比組的搜索結果哪一個相關性和質量更高。然后通過統計學的模型對這些數據加以分析,并且做出統計學上的判斷:它如果真正的應用會不會改變用戶體驗,是否會給用戶帶來更好的搜索結果。

    之后將進入下一個階段,就是在線實時試驗。我們會隨機選取一些用戶進行試驗,如果你是Google的用戶,而且經常使用Google的搜索,可能在不知不覺中已經成為試驗的一部分,你所得到的搜索結果也許就是用這種新的構思方法所得到的。在Google上,每時每刻都在進行著兩百多項試驗,所以你參與其中的幾率其實很大。這些試驗就相當于我們在網上聆聽成千上百萬用戶的反饋,通過他們的行為來判斷我們的搜索結果或者新的構思是否切實有效。2011年,我們做了五萬多個這樣的試驗,最終做出五百多項改進。

    在過去幾個月中我們所做的一個重大調整就是在新鮮度算法上的調整,以給用戶提供更新最及時的信息,這也為用戶提供了更好的搜索體驗。比如在日本海嘯發生的前一天如果輸入“海嘯”這個字,可能得到的結果就是一般性的,比如什么是海嘯、海嘯發生的原因、全球海嘯歷史情況等。但在日本海嘯發生之后的第一天搜索“海嘯”,所得到的結果將全部都是日本海嘯最新的信息和新聞。

    問:當用戶更注重實時內容時,Google評價搜索結果時會更看重哪些因素?
         斯科特:社交網絡和個性化的搜索結果會越來越重要。像Google的Search Plus Your World(SPYW)這個功能現在實際上就在往那個方向走。個性化的信息可以呈現出和用戶個人相關的信息,因為這對用戶來說相關度最高。另外也更重視用戶作為一個人和其他人之間的關系。另外可能還有一些新的指標和判斷的因素。比如用戶在使用手機搜索的話,就可以基于位置呈現搜索結果,因為未來會有更多的移動設備,因此我們還可以通過語音搜索,比如“我最近的匹薩店在哪?”像這種非常自然的語音搜索和查詢也可以做到,這也是未來我們努力的一個方向。

    問:在所有新的改進中,被動解決用戶問題和員工主動提出創新的情況各占多大比例?
         斯科特:這兩種其實沒有辦法分得很清楚,因為很多新的想法實際上就是在問題中發現和產生的。比如發現某一個問題,就想怎么解決這個問題,那就產生了一些新的構思和想法。我們自己用搜索引擎搜一個軟件,結果出來的是這個軟件的舊版本;我搜一個新聞,發現這已經是24小時之前的新聞,而不是最近的新聞,這就說明搜索引擎是有問題的。怎樣解決這個問題,我們就會產生一些新的想法和構思,所以沒有辦法嚴格的說哪些是問題、哪些是創新。

    已有0人參與

    網友評論(所發表點評僅代表網友個人觀點,不代表經濟觀察網觀點)

    用戶名: 快速登錄

    經濟觀察網相關產品

    日本人成18禁止久久影院