<tt id="ww04w"><rt id="ww04w"></rt></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <tt id="ww04w"></tt>
  • <tt id="ww04w"><table id="ww04w"></table></tt>
  • <li id="ww04w"></li>
  • 讓機器開始思考
    導語:在人工智能的浩瀚海洋當中,機器學習儼然是最熱門的話題。

    thinking robot

    經濟觀察報 邦彥/文 與谷歌科學家杰夫·迪恩(Jeff Dean)的對話讓我開始覺得數學與統計學是相當有趣的東西。

    我們的對話主題是“機器學習”,這源于杰夫·迪恩和他的團隊著名的“貓臉”實驗。谷歌用1.6萬塊電腦處理器構建了全球最大的電子模擬神經網絡,并向這個人工神經網絡展示來自YouTube上隨機選取的1000萬段視頻。結果,在沒有外界指令的環境下,這個人工神經網絡竟然自主學會了識別貓的面孔。

    要知道,杰夫·迪恩從未告訴過這個人工神經網絡“貓”是什么概念,甚至未曾向它提供過一張標記為貓的圖像。“這好像是新生兒在成長中自然習得的過程,它擁有自我意識,它是自己從未標記的YouTube靜態圖片中發現了貓是什么樣子的,”杰夫·迪恩說,“例如把孩子放在車里,讓他從車窗觀察外面的世界,他會看到各種各樣的機動車和自行車,并沒有人去告訴他這些物體是什么,他是通過自己的觀察來去總結同類的事物。”

    這就是機器學習的與眾不同之處,它產生了“自我學習”。

    在人工智能的浩瀚海洋當中,機器學習儼然是最熱門的話題。如果你認可計算機科學之父艾倫·圖靈(Alan Turing)在1950年為人工智能下的定義:若一個人無法判別和他聊天的是另一個人還是一臺電腦,那么這臺電腦就實現了人工智能;那么機器學習的新意在于,讓機器像人類大腦一樣思考。

    “機器學習是關于計算機基于數據構建模型并運用模型來模擬人類智能活動的一門學科。”機器學習專家、華為公司諾亞方舟實驗室首席科學家李航博士曾為機器學習下過科普定義。這個對于外行人來講仍略顯晦澀的科技概念,實際上已經植入到我們日常生活的諸多細節,例如語音識別、垃圾郵件攔截、無人駕駛汽車、甚至淘寶網的商品流行推薦。

    拿去年iPhone推出的語音助理服務Siri舉例,那是一位多么溫柔體貼的個人助理。她為手機使用者提供天氣預報、餐飲建議、喚醒問詢等生活服務,像《生活大爆炸》(The Big Bang Theory)里那樣與她談情說愛也沒問題。在每天成百上千條問題的轟炸下,她正日漸嫻熟,不僅不會所答非所問,甚至還會判斷你是不是喝醉了酒,是否需要幫忙叫輛出租車。

    一些機器學習系統的表現甚至已經趕超人類。比如瑞士盧加諾大學Swiss AI實驗室設計出一套系統,在交通標志識別的比賽中戰勝了人類專家。

    更高調的展示是在2012年的10月底,在由微軟亞洲研究院和南開大學、天津大學舉辦的一次學術會議上,微軟首席科學家理查德·F·拉希德(Richard F. Rashid)在禮堂里發表演說,電腦程序對他的講話內容進行了識別,還用英語把這些內容實時顯示在了他上方的大屏幕上。

    之后,他在講完每句話之后稍作停頓,電腦就把這些話翻譯成了中文,同時還附上與他嗓音非常類似的中文配音。要知道拉希德從來都沒說過也并不會說中文,這個展示贏得全場雷動般的掌聲。

    國際媒體并沒有放棄這個熱點,《紐約時報》發表頭版文章,使用“真的很棒!”等字眼表達對機器學習前景的看好;緊接著,《紐約客》(New Yorker)也發表文章回應,“這讓我們向真正的智能時代邁進”。

    但杰夫·迪恩對我說,他的實驗是機器學習的另一個層面,與上述這些例子所使用的技術處于兩個維度。“把它叫做‘深度學習’更為恰當,這是機器學習的一個分支。”李航表示,這也是實現機器學習的一種途徑與方式。這個過程大致是電腦模擬人類大腦的神經元,再由很多電腦搭建起與人腦的神經連結相似的神經網絡,這就宛如一個小規模的新生大腦,這個“大腦”便可以像人腦一樣感知、識別、記憶甚至思考。

    盡管幾家大型學術組織都正在對機器學習展開研究,“但谷歌希望讓這項技術不限定于某一個具體的領域,而是能夠使之規模更大,建立一個比較大的模型,從而讓電腦系統能夠去從原始的數據上獲得更大限度的理解。”杰夫·迪恩說。這些人工大腦是否能夠通過圖靈的測試,尚未可知,但成果并非寥寥。杰夫·迪恩和谷歌語音識別團隊嘗試性地展開合作,用800個機器進行了為期5天的訓練,很快就把識別錯誤率削減了25%,這個成就相當于研究語音識別20年所取得的成果。目前,這項技術已應用到語音識別技術中,讓語音識別更加準確,這在Android 4.1版本的操作系統“Jelly Bean”中有所體現。

    這是一項非常昂貴的科研項目,這些人工神經元造價不菲,且需要大量的數據。因為數據量越大,能夠參與到機器學習網絡中電腦的數量就會越多,在訓練時,這個“人工大腦”的學習能力才會更強。“我們正在積極擴展系統,以訓練更大規模的模型。”杰夫·迪恩說,“雖然現在還沒有公認的方式將人工神經網絡和生物大腦進行對比,但為了讓你大概地感覺到所謂的‘更大規模’,還是可以與人腦做一個很粗略的比較——普通成人大腦大約有100萬億個連接。因此,在這一領域,還是有非常大的發展空間。”

    確實,動物的學習是感受化的,而機器的學習是純邏輯化的。與擁有800億個神經元細胞、100萬億個鏈接的人腦相比,“人工大腦”恐怕還是笨拙得多。因此,當我在對人工智能是否會發展壯大以至于入侵人類的個性生活展開聯想的時候,杰夫·迪恩僅僅是一笑了之,“要知道,目前我們所說的機器學習還只限于認知類,只能處理一些認知類的簡單工作,”這位相當嚴謹的科學家解釋道,而人們真正想要的,是獲取期望中的與輸入相匹配的、自動化的輸出,例如“今天中午到哪家餐館去吃飯”、“如何協調朋友和工作之間的關系”這些話題,是目前機器學習所不能達到的。

    (感謝北京大學計算機系博士生候選人姚俊杰對本文提供的協助)

    已有0人參與

    網友評論(所發表點評僅代表網友個人觀點,不代表經濟觀察網觀點)

    用戶名: 快速登錄

    經濟觀察網相關產品

    日本人成18禁止久久影院