php数据脱敏怎么处理 开源数据脱敏工具( 二 )


数据脱敏系统可以按照不同业务场景自行定义和编写脱敏规则,可以针对库表的某个敏感字段,进行数据的不落地脱敏
数据脱敏的方式有很多种 , 接下来一下数据为准
1、无效化
无效化方案在处理待脱敏的数据时,通过对字段数据值进行 截断 、 加密 、 隐藏 等方式让敏感数据脱敏,使其不在具有利用价值 。一般采用特殊字符( * 等)代替真值,这种隐藏敏感数据的方式简单,但缺点是用户无法得知原数据的格式,如果想要获取完整信息,要让用户授权查询
比如我们将身份证号用*替换真实数字就变成了"220724 ****** 3523",非常简单
2、随机值
随机值替换,字母变为随机字母,数字变为随机数字,文字随机替换文字的方式来改变敏感数据,这种方案的优点在于可以在一定程度上保留原有数据的格式,往往这种方法用户不易察觉
以 name 和 idnumber 字段进行随机化脱敏,而名字姓、氏随机化稍有特殊,需要有对应姓氏字典数据支持
3、数据替换
数据替换与1的无效化方式比较相似,不同的事这里不以特殊字符进行遮挡,而是用一个设定的虚拟值替换真值 。比如说我们将手机号统一设置成 “13651300000”
4、对称加密
【php数据脱敏怎么处理 开源数据脱敏工具】对称加密是一种特殊的可逆脱敏方法,通过加密密钥和算法对敏感数据进行加密,密文格式与原数据在逻辑规则上一致 , 通过密钥解密可以恢复原数据 , 要注意的就是密钥的安全性
5、平均值
平均值方案经常用在统计场景 , 针对数值型数据,我们先计算它们的均值,然后使脱敏后的值在均值附近随机分布,从而保持数据的总和不变
对价格字段 price 做平均值处理后,字段总金额不变,但脱敏后的字段值都在均值60附近
6、偏移和取整
这种方式通过随机移位改变数字数据,偏移取整在保证了数据的安全性的同时保证了范围的大致真实性 , 比之前几种方案更接近真实数据,在大数据分析场景中意义比较大
比如下边的日期字段 create_time 中2020-12-08 15:12:25变为2018-01-02 15:00:00
数据脱敏规则在实际应用中往往都是多种方案配合使用,以此来达到更高的安全级别
数据脱敏的原则有哪些数据脱敏系统是一款对敏感数据进行数据自动发现、数据脱敏的专业的数据安全脱敏产品 。可实现自动化发现源数据中的敏感数据,并对敏感数据按需进行漂白、变形、遮盖等处理 , 避免敏感信息泄露 。同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性 。
数据脱敏原则
1、实现数据脱敏需求,并保证脱敏过程安全
随着互联网的普及、大数据价值的飙升,敏感信息泄漏事件已经充斥在日常生活中,企业是敏感信息的聚集地,也是数据泄漏的源头 。数据共享、分析等才有价值,也就导致数据泄漏 。目前脱敏是国家法律法规要求,也是企业核心数据不被泄漏的基本保护措施 , 在脱敏过程中也需要保证数据安全 , 防止脱敏过程中核心数据泄漏,实现合规 。
2、脱敏数据不可逆向解析
数据脱敏后流出,应保证数据是安全的、不可逆向解析的 。如可被逆向破解 , 脱敏将不再有实际意义 。
3、可进行敏感数据自动发现,提升脱敏效率
互联网、数据共享等打破了数据孤岛问题,使数据更有价值,而海量的数据手动配置脱敏规则脱敏费时费力,效率低下,需实现敏感数据自动发现,建立敏感信息知识库,通过不断更新完善知识库和脱敏策略,整体提升脱敏效率 。

推荐阅读