很多消费者习惯货比三家,比对完价格以后杀回第一家,结果第一家平台非常狡猾地告知消费者已售罄,但是价格更高的还可以购买,诸如此类的大数据杀熟事件见怪不怪。如果说平台利用消费者数据分析出了用户习惯从而精准盈利的方式令人反感又无力反抗,那么俄罗斯黑客在大数据基础上分析用户心理,在Facebook上精准投放信息,从而引导舆论,干扰选举,对国家安全的危害性非同小可。
随着商品市场的日益繁盛,在一堆商品里挑选一个自己满意的将花费越来越多的时间,大数据针对消费者的喜好推荐反而帮助消费者提高效率。当初创企业需要新开展某项业务,但是没有熟悉的服务商渠道,打开浏览器就会有平台推送相关信息,却能更高效实现买卖交易。因此,令消费者不满的不完全是这种“精准服务”,更多的是不满自己被剥夺了一定的选择权,屏蔽了接触其他信息的机会。消费者不完全信任大数据是否真的筛选了无用信息,还是有意筛掉了不想让消费者看到的信息。所以,大数据的精准服务并不能等同于侵犯隐私。
为避免大数据侵犯隐私,用限制数据采集的办法并不能保证数据安全。因噎废食的做法很大程度上会限制大数据技术的发展。数据采集前就向用户说明使用范围,从具体操作上有困难性。因为大数据时代不同于IT时代,并不是先设定好程序,再将信息填进去,而是先拥有大量数据才能产生应用。而不同平台交换数据,实现数据更新,更有利于人工智能深度学习。某些特定的场景下,数据的合理使用反而保护安全。例如AI大数据寻人,缺少数据支撑,寻人系统并不能发挥作用。
而多数人对于隐私和数据安全的概念认识不深。对于隐私的界定,不同的人有不同的概念。随着时间推移,同一个人对于自己的隐私衡量标准也会改变。即使是大型经营成熟的公司也不知道应该对谁的隐私负责。隐私是不愿意公开的信息,不愿意公开的对象更多是其他自然人或者机构。担心有别有用心的人通过机构的数据库提取到自己的数据加以利用。因此,大众更恐惧的是针对个人或个别机构的数据泄露和隐私攻击。
十年前黑客攻击更多的是原始数据,而现在黑客有可能污染机器学习模型的训练数据,篡改训练数据会影响模型输出正确预测的能力,破坏机器学习模型。从目前的技术层面,数据管理使用区块链技术相对安全。爱沙尼亚政府曾受到俄罗斯黑客的网络攻击几近瘫痪,如今政府网络几乎全部使用区块链,避免了当年重创重演。区块链具有“不可伪造”、“全程留痕”、“可以追溯”、“公开透明”、“集体维护”等特征。基于这些特征,区块链技术奠定了坚实的“信任”基础。从企业层面来看,选择有数据安全管理能力的企业,做好数据备案、建立好数据风险预警、数据泄露后即刻通知也能起到一定作用。当然,完全依赖企业自觉和数据管理平台并不可靠,涉及重大公共安全等数据,政府应该严格管理。从行政机构层面,采用数据管理采用分级制更为有效。
(部分观点引用赛迪智库网络安全研究所《数据安全治理白皮书》、阿里研究院《数据安全治理的基本原则》。)