2019年12月以来,突然爆发的新型冠状病毒肺炎疫情成为国际关注的突发公共卫生事件,以信息技术为支撑,以大数据分析模型辅助新冠肺炎诊治成为中国专家共识。疫情之下,激化了大数据与个人隐私之间的冲突。肺炎患者个人信息是否应该公开?我们应该担忧健康码是否会泄露个人隐私吗?个人隐私该不该让位于公共健康?健康和隐私似乎陷入了两难境地,我们该如何取舍?

2019年4月23日,马云在甘肃敦煌举办的中国绿公司年会上发表主旨演讲。互联网正在深入到社会的方方面面,互联网技术革命的影响力可能超过过去一切技术革命的总和。数字技术革命已经进入了后30年,未来数据将是重要的生产资料,计算是生产力,互联网是生产关系,未来不运用数据,可能要比不用电更加可怕。

1、公众健康与个人隐私的悖论

2018年3月26日,中国发展高层论坛,百度创始人李彦宏表示,“中国人更加开放,对于隐私问题没有那么敏感。如果说他们愿意用隐私交换便捷性或者效率,很多情况下他们是愿意那么做的。对我们来说,我们要遵循一定的原则,如果我们认为用这个数据会让所有者受益而且他们愿意我们使用数据,我们会使用,我想这是一个基本的做法,这是我们在数据方面该做什么和不该做什么的基本标准。”

2019年12月以来,新型冠状病毒肺炎疫情蔓延至全球,大数据在疫情防控狙击战中扮演了重要的角色。移动、联通、电信三大运营商推出个人轨迹查询服务,中国近16亿手机用户均可通过短信方式输入身份证后四位查询15至30天内到访的城市。阿里、腾讯等科技企业及时推出疫情防控“健康码”。阿里巴巴在杭州率先推出“红黄蓝”三色健康码,上线当天获得了1000万的访问量。截至2020年3月5日,腾讯防疫健康码上线25天,累计亮码突破10亿次,覆盖超过8亿人口,累计访问量43亿,是服务用户最多的健康码。健康码彰显了地方政府在重大突发公共事件治理中的创新思维。如果“数据”计划不断优化迭代,纳入更多社会治理和应急管理支撑功能,将持续助力国家治理能力和治理体系现代化提升。但隐私、个人信息保护、数据安全等问题也成为挥之不去的担忧。

在健康码大行其道的当下,不出所料有一些别样的声音,开始质疑健康码会泄露公民隐私信息。德国对使用大数据和科技手段抗击疫情的社会讨论,已经远远超过生命权和隐私权博弈的表面范畴。防疫公认的三法宝——追踪、检测和治疗,德国在后两项上已做得相当出色,但唯独追踪环节,在德国甚至整个欧洲独特的社会背景下步履维艰。特别是听到韩国政府通过查询手机GPS定位信息、信用卡消费记录、闭路电视监控录像等手段综合分析新冠患者及疑似患者的相关信息后,西欧人民会瞪大眼睛惊惶地本能拒绝。

2、数据主义与人文主义的平衡

人文主义倡导人权,隐私权是一项基本人权,尤其是数据隐私。数据主义则认为,任何现象或实体的价值就在于对数据处理的贡献,关键在于释放数据,信息自由。有些人可能觉得这是在是胡言乱语,但也有可能,你甚至没有意识到自己已经信奉了数据主义。我们每天通过电话、信息、邮件吸收无数数据,处理数据,又通过更多的电话、信息、邮件产生更多数据。我们并不知道在整个巨型数据库中,我们产出的数据如何与其他几十亿人的数据产生连接?我们也没有时间找出答案,因为光是处理数据就已经耗尽了我们的时间。随着效率的提高,我们能够处理更多数据,继续淹没在更多数据之中。有些人其实很愿意成为数据流的一部分,就算代表着放弃隐私,也无伤大雅。在前几代人中,写日记只给自己看是很常见的人文主义习惯,现在大多数年轻人会觉得完全无法理解。如果其他人没有看到,岂不是白写。掏出智能手机,记录上传,每隔两分钟看一下有多少好友点赞,是新的行为方式。现在的新座右铭是:“如果你体验到了什么,就记录下来。如果你记录下了什么,就上传。如果你上传了什么,就分享。”

李彦宏的“中国人愿意用隐私换取便利”的言论把隐私安全这个话题推到风口浪尖,大家纷纷把矛头指向网络巨头。每当互联网企业和机构有创新时,总是存在一些声音以隐私安全为借口,非善意的攻击和指责这些互联网服务。新生事物总是伴随着质疑,大多数时候,反应过度所造成的危险,其实是比问题本身更大的威胁。重点不在于它如何影响社会现实,而是如何影响人的情绪。这就像往大空瓶里丢一枚小硬币,即使再小的声音,也会被放大。这样就形成一种矛盾,正因为反应过度,反而特别容易受到影响。媒体必须保持客观,避免歇斯底里。对于李彦宏的发言,可能存在媒体为了流量过度解读的现象。李彦宏的发言重点在于我们今后要在为公众提供便利的基础上,完善法律法规,保护公众的隐私。算得上是“数据主义”与“个人隐私”的悖论中,采取的比较中庸的策略。事实上,我们通常在日常生活中刻意回避了隐私安全的话题。我们使用各种智能穿戴,比如智能手环,希望它能记录我们的身体信息并反馈给我们,我们使用搜索引擎,并希望它能依据浏览记录推送符合我们个性特点的内容。大部分人都默认并习惯于将自己生活交给数据处理,享受着“数据”带来的便利的时候,我们完全不考虑“数据”与“隐私”之间的博弈。在大数据时代,我们向算法提供越多数据,算法越能科学管理我们的生活。如果所有人都拒绝提供数据,我们进入智能化社会是否会遇到阻碍?

健康需求是人类最基本的需求。“健康码”基于人们追求健康的愿望,使得大多数人都愿意突破保护个人隐私的边界。不仅如此,我们甚至可以用包含隐私的数据,换取流行病暴发的警告。假设某人某天早晨醒来觉得身体不太舒服,他并不会直接选择去医院就诊,而是会选择等一两天,自行采取措施希望身体会舒服一些。如果病情没有好转,才会预约挂号,去医院就诊,医生把数据输入计算机,等到流行病真正爆发需要花费很长时间。如果我们允许个人信息被存取,在传统卫生机构浑然不觉的时候,发出警告,仅仅是几分钟的事情。通过阅读我们的邮件,追踪搜索引擎的记录,再与数据库交叉对比就可以做到。假设平时,“发烧”“咳嗽”等词语在数据库中会出现10万次,如果今天算法发现这些词语在邮件、搜索引擎中的使用次数忽然上涨到30万,就会立刻察觉出问题,流感正在肆虐。不需要等到人们去医院就诊,第一天早上觉得不舒服的时候,可能和同事发了短信,可能搜索了症状,如此就什么都知道了。如果想要实现这种功能,人们就要允许个人信息被存取被分析。我们已经看到,如果允许我们产出的信息能够被自由存取,就能够比传统卫生机构更快察觉流行病的爆发。为什么我们不能做一个类似的小小牺牲,以避免流行病爆发呢?

3、隐私还是健康

“隐私还是健康”的这道题看起来是零和博弈,只能选择一个,实际上隐私和健康可以兼得。在隐私和健康之间是一种假两难选择。这两者不应该是对立的,人们可以而且理应同时享受它们。中间地带不应该被这种非黑即白的选择所侵蚀。