中国信通院:数据清洗、去标识化、匿名化业务规程(试行) -11月.pdf

中国信通院:数据清洗、去标识化、匿名化业务规程(试行) -11月.pdf
这份文档是中国信息通信研究院产业与规划研究所、北京国际大数据交易所联合编制的《数据清洗、去标识化、匿名化业务规程(试行)》,旨在为规范数据处理行为,指导组织正确开展数据清洗、去标识化、匿名化处理等业务活动,并支撑数据共享、交易、开放等流通活动。 文档核心内容包括: 1. **处理目标及相互关系:** 强调数据清洗是数据可用的保障,去标识化是数据脱敏的关键,匿名化是去标识化的强化。区分三者在数据处理流程中的不同阶段和作用。 2. **数据处理原则:** 强调合法合规、安全优先、平衡效用、技管结合、有效溯源。 3. **数据清洗规程:** 详细描述数据清洗的处理目的、处理流程(抽取清洗对象、明确清洗规则、标识错误数据、数据修正处理、数据转换检验、评估清洗结果)和常见技术方法(处理残缺数据、偏差(异常)数据、重复数据、其他错误数据)。 4. **数据去标识化规程:** 详细描述去标识化的处理目的、处理流程(确定去标识化对象、制定去标识化目标、识别相关标识符、对标识符进行处理、验证数据处理结果、评估被识别风险)和常见技术方法(数据抽样技术、加解密技术、假名化技术、抑制遮盖技术)。 5. **数据匿名化规程:** 详细描述匿名化的处理目的、处理流程(明确匿名化处理对象、设定匿名化处理目标、先行去标识化处理、实施数据匿名化处理、评估匿名化效果、定期追踪复原风险)和常见技术方法(聚合统计技术、泛化、随机化、数据合成、隐私计算)。 6. **数据处理环境要求:** 强调管理制度要求、技术能力要求、人员能力要求、过程控制要求和事故管理要求。 文档还包含三个附件,分别是常见直接标识符和准标识符示例、常见标识符的去标识化或匿名化参考、以及部分数据处理技术方法应用建议,为相关组织提供更具体的指导和参考。 总而言之,该文档旨在为数据处理相关方提供一份操作性强的指南,帮助他们理解和实施合规的数据清洗、去标识化和匿名化流程,以提升数据安全性和可用性,并促进数据要素市场的健康发展。
下载完整报告 | 879.38 KB | 51页
阅读和下载会消耗积分;登录、注册、邀请好友、上传报告可获取积分。
成为VIP会员可免费阅读和下载报告