巴西世界盃足球賽激戰正酣,有爆冷出局的,也有意外晉級的。本屆比賽雖然沒有了“預言帝”章魚保羅,但是預測比賽結果已經有了新工具——能夠分析數據、學習思考的人工智慧。目前,百度公司就有這樣一個叫做“百度大腦”的項目,用電腦加上深度學習等人工智慧技術去模擬人腦的思維,這個機器大腦到底是如何思考的?讓我們一起來看看。——編 者
能做什麼
提高語音識別、圖像搜索準確率,助力大數據應用推理預測
德國奪冠率17%,阿根廷奪冠率12.9%……打開百度的大數據引擎,點開世界盃預測一欄,可以看到每個參賽隊伍的奪冠概率分析——這都是根據大數據實時分析得出的結果。
這個大數據引擎是如何運轉的?與人類思考一樣,大數據引擎對數據的搜索分析及預測也通過一個機器大腦——百度大腦來實現。這個“大腦”用電腦模擬人腦神經網路,包括模擬人腦學習分析的能力,從而通過多層的學習模型和海量的訓練數據進行數據智慧分析,然後做出預測。
“從功能上來定義百度大腦,可以説它是以大規模機器學習和深度學習為基礎的人工智慧在搜索引擎中的應用,旨在優化搜索業務和提升用戶體驗。”百度高級副總裁王勁舉例説明,比如目前用戶已經不滿足於傳統搜索引擎只能提供網頁連結,他們希望能夠通過搜索引擎來直接找到答案。並且需要更加個性化的搜索體驗,希望使用更加自然的人機交互方式,比如通過語音圖像等形式讓機器理解,完成資訊與用戶需求的精準匹配。據悉,目前中國每天都有60億次的搜索需求。
目前,通過百度大腦的思考,語音識別的相對錯誤率降低了20%—30%,掃描文本圖像生成漢字文本的相對錯誤率降低了30%,相似圖像搜索效果顯著超過同類産品,通過大數據顯著提升廣告點擊率,提升網頁搜索排序品質等等。
同時百度大腦也能通過推理決策為大數據的應用提供助力,社會價值初步顯現。除了預測世界盃外,還能預測高考擇校、城市旅遊熱度、景點旅遊舒適度、疾病等。比如,通過“疾病預測”可以知道所處城市是否處於流感高發期,大家都去哪個醫院看病,從而了解當前流行病態勢及未來7天的變化趨勢。
百度大數據引擎這樣描述預測原理:“每天網民在百度搜索大量流行病相關資訊,匯聚起來就有了統計規律,經過一段時間的積累,可以形成一個個預測模型,預測未來疾病的活躍指數”。分析數據形成預測模型,其中就有百度大腦的“思考”。
怎樣工作
模倣人類大腦的神經網路,通過多層次的網路模型結構認知事物
今年4月,百度董事長兼首席執行官李彥宏首度披露百度大腦這一項目。在王勁看來,百度大腦的應運而生,受多方面因素的推動。
“首先是伺服器的能力和雲計算的能力有了很大突破,數萬台伺服器能夠集合起來像一台伺服器一樣工作。其次是大數據的積累達到了相當大的規模。”王勁分析。2013年全球每天産生25PB(拍字節,資訊計量單位)數據,相當於1500個國家圖書館資訊量總和。網際網路技術的突飛猛進及數據庫的積累為人工智慧提供了突破的環境與機遇。
“最重要的推動是深度學習的不斷演進迭代。”王勁介紹,人工智慧的核心是機器學習技術,即通過演算法使機器能從大量歷史數據中學習規律,從而對新的樣本做智慧識別或對未來做預測。從上世紀80年代末以來,機器學習的發展大致經歷了兩次浪潮:淺層學習和深度學習。
深度學習更接近於人類的學習方式,它通過模倣人類大腦行為的神經網路,利用更多層次的網路模型結構來收集事物的外形、聲音等資訊,進行感知理解並産生相應行為。比如,要讓機器“認識”物體,就需要若干層網路,首先要建立最基本的一層人工神經元,用來探知物體的邊緣形狀等基本資訊,第二層神經元需要將第一層感知到的物體邊緣形狀拼湊起來,認知物體形狀。然後第三層進一步拼湊資訊從而得出物體整體的形態。“這些過程都是機器自主完成的,並不需要工程師在任何環節輸入資訊。”王勁強調。
深度學習可以説是人工智慧技術取得新突破必須邁出的第一步。為此,百度請來了世界三大人工智慧專家之一的吳恩達。吳恩達的一個著名的深度學習實驗就是讓機器認識了“貓”這種動物:搭建一個1.6萬台電腦組成的網路,向這個網路展示1000萬段隨機選取的視頻。經過一段時間“學習”,該網路在沒有外界干涉的條件下,自己認識到“貓”是一種怎樣的動物,並成功找到了貓的照片,識別率為81.7%。吳恩達坦言,深度學習演算法目前還比不上人腦的精確性和靈活性,但相信那一天定會到來。
李彥宏也曾評價,目前百度大腦“大約相當於兩到三歲孩子的智力水準”,但是未來積累10到20年後,根據摩爾定律的發展速度,人工智慧的“大腦”可能會發生質變,趕上人腦。
前景幾何
人工智慧技術得到全世界網際網路巨頭青睞,成為衡量科技創新能力的重要標誌
目前,谷歌、IBM、微軟、蘋果、百度這些公司競相開發深度學習技術,投入明顯加大。比如谷歌收購了加拿大多倫多大學教授傑弗裏·辛頓創建的人工智慧機構,紐約大學數據科學中心的雅恩·立昆教授兼任臉書人工智慧實驗室的主管。
在美國,奧巴馬政府支援籌建一項跨學科的科研項目“基於神經科學技術創新的人腦研究”。歐盟2013年初也提出了“人類大腦計劃”,旨在用巨型電腦模擬整個人類大腦。
業內專家認為,人工智慧代表了網際網路的未來,是電腦科學發展的大勢所趨,是國家産業變革和升級的重大機遇。在全球格局的競爭中,如果人工智慧技術落後,不管是國家還是企業都處在非常不利的競爭地位。
王勁表示,世界範圍內的人工智慧競爭中,百度在人才方面與競爭者站在同一起跑線上,技術上各有短長,“我們要把人才和資源投入到最有希望的方向,大數據、深度學習是我們看到的最好的突破口。”將大數據、深度學習作為人工智慧的突破口,百度在該領域的投入已經開始有所收穫:不僅提高了搜索、地圖、團購等産品的用戶體驗,同時給百度帶來了收入上的提升,“在人工智慧技術的商業化方面,百度在全世界範圍內都是比較領先的。”
“未來百度會把技術提供給合作夥伴,合作夥伴把他們的數據提供給我們,幫助我們提升技術,這是一個共贏的機會,”王勁説,網際網路正在對中國的經濟帶來很大變化,未來推動網際網路發展和變革的仍將是技術。
對於這一點,百度的科學家們都深信不疑併為之興奮:儘管人類大腦將生物秘密隱藏得還很深,但是“得人工智慧者得天下”的時代已經到來了。
[責任編輯: 林天泉]