2020年4月9日,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,要求“加快培养数据要素”,将数据作为新型生产要素,正式与土地、劳动力、资本、技术等传统生产要素并列为国家基础战略性资源和社会生产创新要素之一。
目前部分消费者和金融机构数据保护意识相对不足,对数据泄露环节和危害认识不到位,而不法分子窃取数据的手段却不断翻新,从面对面诱骗到远程网络攻击,从木马病毒到短信嗅探,个人隐私泄露等安全事件频频发生,甚至危及人民群众生命财产安全,数据安全保护刻不容缓。
01、目标与价值
使用《金字塔原理》中的SCAQ方法来说明为什么要做这件事?S(Situation)情景:
这次数据泄露是因为这个接口没有鉴权并且过度暴露了敏感数据。
C(Complication)冲突:
公司涉敏资产安全可控吗?它们在哪里、有什么风险、是否有保护措施都不是很清楚。
Q(Question)疑问:
有什么办法能全局收敛这类风险呢?
A(Answer)回答:
我们的解决方案是通过建立资产平台、建设统一的涉敏资产识别能力,对涉敏资产进行风险评估,推动方案措施落地持续收敛风险。
02、治理思路
以数据为中心的数据安全治理理念,如下图:
数据安全方案总体结构
本文以开放API数据安全方案为例,讲述如何,通过涉敏资产识别、评估风险,及一系列治理措施达到风险收敛目的。
03、开放API数据安全治理方案
1)哪些数据需要重点治理?治理的整体策略是什么?
涉敏资产识别,从实践来看,从流量、数据存储两个端侧分别进行识别效果较好,“流量端”主要基于特征规则识别流量中包含敏感字段的接口,如在请求request、响应response中包含个人信息等敏感字段的;“数据存储端”利用数据库敏感字段扫描工具进行扫描识别敏感表,然后建立敏感表与上层应用的直接调用关系,识别出“根”服务,进而通过“根”服务继续梳理出调用“根”服务的下游服务,与“流量侧”打通无缝对接上,进而形成涉敏服务调用链,即:涉敏数据库表→“根”服务→服务(省略中间件、缓存服务等)→边界接口。
数据定义
通用型敏感数据:姓名、手机号、身份证号、地址、护照、邮箱、银行卡号、IMEI、IP等
业务型敏感数据:优惠券信息、话单信息等
数据开放策略
隐私政策:隐私数据共享的范围和用途
出境合规:数据出境策略
集团策略:制定的数据开放政策
2)这些数据在什么场景下开放使用?数据应用场景识别
利用机器学习算法对API的敏感数据流动事件进行标记,直接关联定位敏感数据应用场景,可覆盖数据中心到互联网的数据流动
数据接口标识
通用型敏感数据:内置数据识别算法和敏感接口识别策略,自动识别
业务型敏感数据:基于人工调研分析构建样本,利用小样本学习算法构建识别引擎,通过插件模式嵌入平台
3) 这些数据有没有安全风险?
从数据安全视角出发,以满足业务需求的最小够用原则(数据最小化、权限最小化)、可追溯原则对涉敏资产进行风险评估。
数据暴露面风险
利用算法识别文件下载接口、疑似后门接口、违规数据开放接口、失活接口
数据接口设计风险
利用算法识别脱敏策略不一致接口、过度数据透出接口、疑似越权风险接口等
数据流动风险
利用算法识别数据出境流动风险、数据滥用风险等
4)现有数据安全措施是否足够?数据安全加固手段
管理:
技术:
04、重点功能示例
01开放API接口梳理和敏感数据标记
全局概览
接口梳理
endpoint
|
数据类型
|
/user_info
|
姓名/手机号/余额
|
/merchant_info
|
公司名/工商id
|
参数梳理
方法
|
参数组合
|
VALUE TYPE
|
GET
|
uid
|
Type A
|
GET
|
token
|
Type C
|
GET
|
ts
|
Unix time
|
02数据暴露面和数据接口设计风险
03数据流动风险监测
安全审计人员
多维度数据流动风险检测