几个月前,东北经历了限电,一夜醒来发现没电,突然生活被搞到一团糟。一听到通知维修电路,哪个片区会在哪个时段停电,大家就惊慌失措,这时候大家有个疑问,为什么电不够用?比起其他国家,我国水力发电、煤炭发电、风力发电、核电、太阳能发电等各种发电方式多样,怎么电量就不够了?究其原因之一还是用电分配比较难做。
对电量使用电网主要是预估值,预估高峰期用电量多少。电力缺口过大确实可以开启核电站发电,但是核电发出的电很难大量储存,而且核电每次发电成本都很大。所以,保证发电分配恰到好处、物尽其用就能很大程度减轻电荒。相同的困境美国早在2009年就已经遇到。当时美国怎样解决这个问题呢?2009年政府宣布已推行智能电网,在各家各户安装了智能电表,每隔15分钟电表向电厂发送一次用电数据,电厂根据数据判断送电量,用多少就送多少,绝不浪费。过了一段时间,突然有人发出质疑,电厂凭什么有权力知道我什么时候用电,哪些电器用电,凭什么可以偷窥我的私人生活活动。一石激起千层浪,这件事引起很多人的不满。当时的计算机专家发现,可以这样解决:电厂只是需要一个区域内某个时间段的用电量,平均用电量,高峰用电量,并不需要每个个体的用电量,只需要统计这部分数据就可以。这次电力分配的解决就是隐私计算的雏形。
如同当时大家不希望个人电表数被电厂记录一样,如今依然没有人希望自己大量真实个人数据暴露给一切路人。大数据暴露个人信息的例子不胜枚举。怎样尽可能保护信息安全?最初有人建议尽量不提交数据。但是AI模型需要大量数据训练才能保证有效精准运行,数据专家想到了“不给出原始数据,但是又让AI模型能用到有价值的数据”这一解决思路。隐私保护下的分布式机器学习方案就这样产生了。在这个方案下相应产生了多种途径进行隐私计算:将个体数据处理以后再使用就能让原始数据在不出域的情况下仍能发挥数据的使用价值;多方安全计算,即保证多方之间可以共同计算一个函数,最后任何一方只能知道最终的计算结果,除此之外不会泄露任何更多的信息, 尤其是不能泄露任何一方各自的输入。