江蘇捷勝錨機有限公司
(原泰興市捷勝船舶設備有限公司)
地址:江蘇省泰興市江平南路76號
全球服務熱線:13905266196
手機:13905266196 13905264589
電話:0523-87838058
傳真:0523-87838058
網址:www.ada1997.cn
E-mail:js139589@163.com jm139589@163.com
探索大數據的開發應用和保護
人氣:17048 發布時間:2018-08-08
為了克服大數據管理者面臨的問題,本文提出一種基于數據擴散控制的大數據保護方法。該方法的主要思想是:大數據的管理者基于安全虛擬化技術,為數據開發方提供集中的數據處理平臺,所有待處理的數據及其處理結果都被限制在指定的物理范圍內,數據開發方不再擁有大數據副本,因此不必擔心由于他們引發的數據泄露問題。這一基于數據擴散控制的大數據保護方法不影響數據開發方的數據處理流程和操作習慣,也不需要對相關應用進行修改。
1 大數據的安全保護現狀
數據脫敏方法是目前大數據安全保護中較為常見的方法。所謂數據脫敏是指對大數據中的個人敏感信息進行技術處理,使得其中的個人信息主體在不借助額外信息的情況下,無法被識別。數據脫敏應當盡量保證數據原始特征不被破壞,使得共享的數據具有相同或者相當的可利用價值。
常用的數據脫敏方法包括采用加密、哈希或者刪除相關個人敏感信息等,雖然這些脫敏方法還存在一些問題需要進一步解決,比如如何隱匿個人隱私標識數據并在其余數據公開的情況下,不能反向推定已隱匿的數據,相關算法也是研究熱點,包括k-匿名、L多樣性、差分隱私等。
對大數據采取分級分類的保護也是大數據安全保護的一個重要內容。數據分級分類保護是指根據數據的重要性和敏感性等指標,對數據進行類別和安全等級劃分,并按照數據分級分類結果,采取相應強度的數據安全保護措施,以實現在最大程度地開發和利用數據的同時,對數據進行充分和必要的安全保護。
數據的分級分類保護應該采用多維度指標體系,比如數據形態、數據內容、數據類型、數據完整性、數據準確性、數據新鮮度、數據加工層級、數據重要性、數據敏感度等,不同的保護需求和應用場景,其分級分類指標可能不盡相同。
美國國家標準和技術研究所(NIST)提出了數據分級分類的建議和方式。NIST按照信息和信息系統保密性、完整性和可用性等三個方面定義了數據分級分類的維度,同時對每個維度定義了三個影響級:低、中、高。NIST還根據信息系統中處理、傳輸和存儲的信息類型的重要性來確定該信息系統的安全類別,并配套制定了相關標準指南,以配合上述分級分類原則的實施和落地
?首先,它們對內部員工和第三方服務人員(如駐場開發、測試和維護人員)缺乏有效的安全管控手段。在利益的誘使驅動下,這部分人群可能會利用他們對內部網絡安防機制的了解以及他們能夠接觸到數據的便利,繞開安全機制或利用安防漏洞,截留、獲取敏感數據,并通過轉讓或出售等方式獲得非法利益。近幾年來,這類案件在銀行、衛生醫療、物流、教育等行業領域頻頻發生,給社會帶來極大的危害;
?其次,由于各種原因,大部分用戶的網絡安全防護措施在設計和建設時都或多或少地存在疏漏環節,加之在日常管理運維中也存在經驗不足或管理不到位情況,給數據的越權訪問提供了機會,這些違規行為很難被發現和追蹤;
?再次,在大數據開發和應用環境中,數據的所有權和使用權在技術層面很難分割,如果允許相關人員或合作方對數據進行開發和應用,就意味著他們在技術層面擁有數據的所有權,他們可能會未經允許對數據進行復制轉讓,由此帶來數據損失和安全責任問題;
?最后,網絡病毒和木馬依然是嚴重的數據安全威脅,比如勒索軟件利用病毒木馬的原理機制,對用戶數據進行加密,并通過金錢敲詐等方式獲取非法利益,而傳統的網絡病毒檢測和查殺機制還不能對勒索軟件等進行有效防范。
大數據面臨著這些安全風險,一個重要的根源在于數據擴散問題。如果大數據的管理者能夠有效控制大數據副本的復制范圍,將大數據限制在一個可控可信的物理環境中,那么上述風險就會得到極大地緩解。
2 基于數據擴散控制的數據安全保護方法
針對數據安全風險和傳統網絡安全機制的局限性,本文提出一種基于數據擴散控制的數據安全保護方法,即將數據副本的復制范圍限制在一個可控可信的物理環境中。其主要思想包括:
(1)通過集中化的數據安全操作平臺實現對數據的集中安全管控,對數據的復制范圍進行安全控制,防止數據泄露;
(2)通過密碼技術實現對集中數據安全操作平臺的可信運行保證,有效阻止數據勒索威脅,同時對用戶操作進行規范;
(3)通過細粒度的數據訪問控制機制,防范數據的越權訪問;
(4)通過可視化安全審計機制,對相關人員的違規操作和訪問行為進行快速和直觀的追溯。