首頁 專欄趙國棟正文

華住之后,數據泄露之殤如何遏制

今年3月,Facebook被爆出超過5000萬用戶信息被濫用,引發了全球對個人隱私數據安全的擔憂。

近日,華住旗下包括漢庭在內的多家酒店,開房記錄疑似泄漏,有暗網公開兜售相關數據。據稱:“此次泄漏數量巨大,在公開的酒店信息泄露歷史中前所未有,堪稱互聯網史上最大規模泄漏事件。”

隱私數據的泄漏近期頻繁發生,嚴重影響了行業的有序發展。中關村大數據產業聯盟秘書長趙國棟指出,數據泄露已經不僅是行業的難題,也是目前各個國家都在面臨的社會問題和國家安全問題。

如今,大數據行業正在逐漸走向成熟,而暴露出來的問題也不容忽視,數據治理迫在眉睫。

缺少防范數據泄露的有效機制

數據泄露的問題由來已久,2018年更是集中爆發的一年。根據身份盜竊資源中心(Identity Theft Resource Center,ITRC)的數據泄露總結報告顯示,2018年第一季度和第二季度遭泄露的數據數量已經超過了2017年全年數量的總和。在大數據時代的背景下,個人隱私數據被泄露、濫用似乎已經成為社會常態,難以避免。有網友調侃說:“在這個時代,誰不是‘裸奔’”。

這也許是人們享受網絡便利的同時所付出的“代價”。在互聯網時代,人們的生活基本上已經離不開網絡,從某種層面來看,越來越多人們的工作和生活都離不開各種各樣PC端和移動端的應用程序,而要使用任何一個應用平臺都需要先上傳姓名、電話號碼、身份證號等個人信息完成注冊,這使得人們的信息散落在各個平臺、存儲在各個公司。這些公司能否很好地保護用戶的數據成為會不會造成隱私泄露的關鍵所在。

趙國棟分析稱,被泄露的數據有兩個主要來源。一方面來源于技術實力欠缺的企業,尤其是大量小企業,他們大多缺乏對數據安全足夠的重視和充分的安全技術投入,更容易產生隱私數據泄漏的問題。另一方面,企業的破產倒閉也可能引發用戶數據的泄漏。例如,在共享單車大戰時,眾多單車品牌涌現,它們采用免費、補貼等方式吸引用戶注冊,留下了大量用戶信息,在共享單車的倒閉潮中,這些企業留存的用戶數據怎么保護呢?這也成了數據泄漏的來源之一。

“數據的地下交易則是數據泄露的主要流通渠道”,趙國棟認為,這些因保護不力被泄露的隱私數據就是在數據黑產的推波助瀾之下被肆意地竊取和販賣。

但是不能因為隱私泄露和流通的洞口難以堵住就任由其泛濫,必須采取相應的措施來遏制,這也是趙國棟及其所在的中關村大數據產業聯盟(以下簡稱“聯盟”)所關注的焦點。

如何在法律框架下保護隱私數據?

為保護、引導互聯網用戶,維護網絡安全,我國出臺了網絡實名制的管理規范,初衷是為了防止匿名在網上散布謠言、制造恐慌和惡意侵害他人名譽的一系列網絡犯罪。但是,網絡實名制以法律的形式強制要求互聯網用戶進行身份驗證,而在公司破產倒閉等極端情況下,又缺少了保護個人數據的機制。為此,聯盟推出“數聯網”,作為行業的基礎性平臺,力圖在法律框架下最大限度地保護個人隱私數據。

據介紹,“數聯網”也叫“數據標識互聯示范應用”,從字面意思來看,數聯網不是數據之間的互聯互通,而是將數據的標識進行連接、整合。趙國棟說:“數據和數據標識就像圖書館內書籍和目錄之間的關系,數聯網就是將每一個圖書館的數據目錄匯集起來,而不需要整合書籍。整合之后,書還是存放在各個圖書館,但是通過數聯網平臺,你將知道你所需要的書籍被存放在哪一個圖書館。”同樣的,數據被大量分散在不同的地方,通過“數聯網”將這些數據的標識存儲、聯接起來,這在某種形式上也是實現了數據的互聯互通。

那么,這個將數據標識進行聯接的數聯網是如何解決隱私數據泄露的難題呢?

“數聯網”提供的解決方案是:將個人的身份信息轉化成一個唯一的、外界無法識別的ID,這個ID就成為個人在網絡上的身份標識,標識背后關聯的是個人的身份信息;當個人在網絡平臺注冊認證時,真實的注冊流程就會發生變化,不再需要將個人的身份信息上傳、留存在平臺上,而只需要上傳身份標識,并由和數聯網系統關聯的應用平臺來對個人標識進行驗證。

在這個過程中,應用平臺只是保留了這個ID,不會存儲個人的任何隱私信息,因此,就算企業保護不力造成數據的泄漏,也只是標識的泄漏,而這些標識脫離“數聯網”將沒有任何意義,大大降低了個人隱私泄露的可能性。

健全治理機制 讓數據治理不再成為行業之痛

趙國棟表示,解決隱私數據泄露的社會問題是“數聯網”的首要目標,但這并不是它的全部價值,“數聯網跟社會的治理、個人隱私的保護、國家數據的安全、數字經濟的發展是息息相關的,這才是其價值和意義所在”。從更深層的角度來看,“數聯網”將會是數據治理的有效工具。

數據泄露只是數據治理面臨的一個方面的問題,除此之外,打破不同企業、部門、地方之間的數據壁壘、數據割據,促進三大產業融合以及維護國家數據安全、數字主權也是“數聯網”未來需要完成的使命。

在大數據行業迅速發展而問題也逐漸暴露的情形下,面對日益嚴峻的數據治理難題,“數聯網”的提出無疑為此提供了一個解決的思路和方向,但從當前的行業條件來看,實際運行起來并沒有那么容易。

首先,是技術實現上的難度。“數聯網”的前提是統一數據標識,而不同的數據存儲部門的標準是不一致的,例如男女的標識,有的用字母F、M表示,有的用0、1表示,沒有統一的標識程序就很難識別。如果要用“數聯網”建立大量的鏈接,還需要解決這些技術難題。

其次,“數聯網”發揮更大的價值需要社會廣泛的采用,這存在一個社會接受的過程。有能力保護用戶隱私數據的大型企業是否愿意采用這個平臺?社會能否接受這樣的數據治理機制?這些問題尚需進一步的探討,目前還只是邁出了實質解決問題的第一步。

另外,“數聯網”涉及的面很廣,如果能被國家正向應用,廣泛地投入使用會給整個大數據行業帶來巨大的變革;但如果被非法利用,則會給行業帶來更深的安全隱患。“數聯網”平臺還需要正確的引導。

對于進行全面的數據治理,“數聯網”具備實際應用的價值,但同時也要正視其還處在不斷完善的階段。要想充分發揮“數聯網”的作用,則需要有效的監管,并確保數聯網平臺合法、合理的使用。為此,聯盟發起籌備了“數據治理委員會”,旨在為“數聯網”建立一個廣泛參與的社會治理機制。

據介紹,“數據治理委員會”將會在9月11日由TalkingData舉辦的“T11”大會上正式成立,該委員會由聯盟發起,并聯合多家行業組織、大數據交易所以及地方政府等聯合設立,共同維護“數聯網”的有序推進。(數據觀 孫永慧)

責任編輯:方茶云

分享:
单双中特准高手版