您的位置：中國臺灣網 > 經貿 > IT > 正文

大數據：天使，還是魔鬼？

2014-03-12 13:24 來源：科技日報字號: 小中大轉發

　　提起大數據，很多人都感覺略知一二；但大數據到底是什麼，又很少有人能解釋清楚。今年兩會期間，包括小米科技創始人雷軍、聯想集團董事長楊元慶、科大訊飛董事長劉慶峰在內的多位代表、委員都提出了與大數據相關的建議和提案，他們一方面希望從國家層面推動大數據的發展，另一方面也對它在信息安全方面可能存在的隱患提出了警示。

　　大數據記錄了所有一切

　　一份調查顯示，2013年我國產生的數據總量超過0.8ZB，相當于2009年全球的數據總量；而到2020年，一個普通中國家庭每年產生的數據量，將相當于半個國家圖書館的信息儲量。

　　中國電子學會秘書長徐曉蘭委員指出，海量的信息儲存和挖掘，既是大數據的價值所在，也是它有別于傳統互聯網、可能對信息安全帶來的新隱患。

　　“大數據時代，記錄了很多以往根本不可能或者不需要記錄的數據，比如微博、朋友圈的內容，上網產生的cookie，家庭水電氣使用的情況、汽車和大型設備上安裝的傳感器拿到的數據等。”社交數據分析公司獨到科技的CEO張文浩說，“如果這些信息都是‘孤島’，影響可能不大。但一旦相互關聯，影響力會大得驚人。”

　　中科院信息工程所所長田靜委員也表示，以往碎片化的數據只是盲人摸象，但現在這些碎片全都被存貯起來，通過相關性分析拼湊，“就知道象到底長什麼樣了”。

　　技術上的差距，也造成了大數據暫時的“不安全”。

　　“沒有自己的分析能力，我們怎麼能搞清楚哪些數據是需要保護的？”

　　對于田靜的這個“問題”，國家信息化專家咨詢委員會副主任、中國工程院院士鄔賀銓提供的一組數據給出了答案——數據中，大約有一半是應該保護的，但我們現在真正保護的“只有一半的一半”，很多數據在有意或無意當中被獲取，“如果這些數據整合起來，被某些別有用心的人利用，會對安全造成很大的影響”。

　　徐曉蘭介紹，目前我國很多機構和企業使用大數據分析軟件都是國外廠商生產的，特別是近幾年視頻等多媒體數據爆炸性增長，“這些數據都是異構化的，這部分軟件是我們的短板”。

　　著名軍事專家尹卓委員則指出，現在互聯網所使用的服務器大都放在美國，“自己沒有服務器怎麼可能安全”？

　　另一方面，在田靜看來，缺乏大數據環境下的安全理念也是重要原因之一。“過去認為無害的信息，在數據爆炸的今天，已經完全不一樣了。觀念不改，是沒有秘密可保的。”

　　張文浩也認為，國人缺乏這方面的意識。“在美國，很多人都會要求不公開自己的隱私，或者主動把自己的數據提供給某些特定的機構使用；但在國內幾乎沒有聽到過，大家也不知道什麼類型的數據可能會有多大的風險。”

　　大數據或許也很“危險”

　　張文浩認為，很多人對于大數據的理解都只注意到數據的體量和統計，“其實，通過深度分析，從紛繁的數據中抽象出規則和原理，並實現對未來的前瞻性預測，才是大數據真正的價值和魅力所在”。

　　因為大數據，奧巴馬在2012年成為過去70年來，第一位在失業率高達7.4%的情況下成功連任的美國總統；因為大數據，Target超市“預測”了18歲少女的懷孕……

　　任何一項新技術的背後，都可能懸挂著一把達摩克利斯之劍。大數據也是如此，在人們驚嘆于它的“神力”之時，“威脅”也正悄悄逼近。

　　“前兩年，國外一家情報搜集機構利用國內某機構人員公開發表的數據和資訊，進行深度挖掘分析，生成了有價值的情報。”徐曉蘭告訴記者，後來經過詳細調查，確認情報確實不是該人員提供，而生成情報的那些數據本身也是可公開的。“這在以往幾乎是不可能的，也給我們敲響了警鐘。”

　　尹卓以戰時的交通流量信息舉例說，如果不注重數據的安全使用，將可能對國家安全帶來隱患。“科索沃戰爭中，南聯盟的油料庫雖然隱蔽得很好，但美國軍方通過對衛星圖中的交通流量進行分析，劃定了大量油罐車經常出沒的區域，在進行精確搜尋，從而一舉炸毀。”

　　如果您認為這些“危險因素”離自己很遠，那就大錯特錯。

　　“現在很多智能手機的應用都要求訪問通訊錄，”鄔賀銓說，很多人覺得自己沒有什麼秘密，就同意了。“但實際上，這不僅會透露自己的大量信息，也會把很多人置于隱私暴露的危險之下。”

　　張文浩也指出，現在很多年輕人都有用手機發微博或者“簽到”的習慣，“這樣其實會泄漏自己的很多信息。比如你白天經常簽到的位置就很有可能是你的單位，傍晚以後簽的多半是自己家”。

　　大數據正經歷成長的煩惱

　　“要想徵服數據，只有更好地利用它們。”張文浩說，數據是一種資源和財富，積累越多，產生的效力也會越大。

　　這個觀點得到了鄔賀銓的認同。他認為，越想規避大數據帶來的安全風險，越需要搜集儲存海量的數據，並進行深入的挖掘分析。“有統計顯示，國內數據搜集量不及日本的60%和北美的7%，大量數據留這樣白白流逝。”

　　“企業掌握的數據畢竟有限，而且是局部的。”百度公司董事長李彥宏委員提出了數據開放的概念，國家應該把那些不涉及安全的數據公開，讓有能力的機構進行更好的分析利用。

　　國家基礎地理信息中心原總工程師李莉委員指出，有的公共部門掌握了大量公共信息，這些數據是國家基礎信息的重要組成部分。鄔賀銓強調，這些數據“不願與其他部門共享，導致了信息不完整或重復投資”。

　　共享數據在技術上是否存在很大的難度？在徐曉蘭看來，現在需要大力發展的數據挖掘、分析方面的技術，但對于數據共享本身而言，技術不是最大的障礙，關鍵還是利益協調。她說幾年前，國土部和銀監會準備摸底國家土地信息，“一開始很多人提出各種各樣的困難，幾乎認為是不可能完成的任務。但後來引入問責等行政手段，得到地方配合，進行得就很順利”。

　　張文浩認為，建立一個公開、透明、規范的數據市場，將會大大增強數據的利用率。但在這個過程中，需要仔細考量什麼樣的數據可以進入市場。

　　這就涉及到立法的問題。“界定‘隱私’和為數據進行安全分級，是制定法律法規時要優先考慮的方面。”他指出，“個性化服務和隱私之間是一個博弈。名字、電話、住址……不能什麼都說是隱私，因此需要為數據安全分級。簡單地說，通過數據分析的經驗，我們會知道哪類信息具有更強的指向性和排他性。這類信息的安全級別就應該更高。”

　　(科技日報北京3月11日電)

[責任編輯：王偉]

大數據：天使，還是魔鬼？

相關閱讀: