在日前舉行的國家資訊化專家論壇上,中國工程院院士、中國網際網路協會理事長鄔賀銓表示,當前大數據面臨的問題主要表現在技術和應用、人才、安全隱私、發展戰略等方面。
首先是技術和應用問題。中國人口居世界首位,但2010年中國新存儲的數據為250PB,僅為日本的60%和北美的7%。我國一些部門和機構擁有大量數據但以鄰為壑,寧願自己不用也不願提供給有關部門共用,導致資訊不完整或重復投資。2012年中國的數據存儲量達到364EB,其中55%(200EB)的數據需要一定程度的保護,然而目前只有不到一半(44%,即96EB)的數據得到保護。我國在自主可控的大數據分析技術與産品方面與發達國家相比有不少差距。國內企業在數據庫、數據倉庫、商業智慧分析軟體等領域基礎薄弱,尤其是大數據方面已經遠遠落後於國外先進企業。
其次是人才問題。500年前達·芬奇可以同時是畫家、音樂家、工程師、科學家,100年前的醫生可以了解醫學領域的所有分支,今天一名初級醫生必須同時了解大約一萬種疾病和綜合徵、3000種藥物和1100種檢驗方法。估計一個專業的醫生也需要每天學習21小時才能跟得上學科的發展。Gartner諮詢公司預測大數據將為全球帶來440萬個IT新崗位和上千萬個非IT崗位,麥肯錫公司預計美國到2018年深度數據分析人才缺口達14萬—19萬人,還需要數據需求和技術及應用的管理者150萬人。中國能理解與應用大數據的創新人才更是稀缺資源。
然後是安全與隱私問題。大數據的利用首先要求政府數據原則上該公開的必須公開。大數據的挖掘與利用需要有法可依。我國需要儘快制定“資訊保護法”和“資訊公開法”,既要鼓勵面向群體而且服務於社會的數據挖掘,又要防止針對個體侵犯隱私的行為,提倡數據共用又要防止數據被濫用。安全與隱私保護的隱患仍大量存在,重要的數據存儲和應用不能過分依賴大數據分析技術與平臺,需要重視資訊泄密的風險。
最後是發展戰略問題。資訊化要從重視硬體到重視軟體,再到重視數據的利用,不僅大數據,中小數據的挖掘也有意義。需要制定國家大數據發展戰略,大數據是一個應用驅動性很強的服務,其標準和産業格局尚未形成,這是我國跨越發展的機會,但切忌一哄而起在目的不明情況下到處建設大數據中心,到處搞“數據房地産”,而是需要從戰略上重視大數據的開發利用,將它作為轉變經濟增長方式的有效抓手。
[責任編輯: 林天泉]