【编者按】近些年来社交媒体和个性化信息流的火热,让很多人经常把信息茧房四字悬挂在嘴边。支持者指出算法引荐不会源源不断的把合乎用户兴趣的信息引荐给用户,最后导致用户理解道岔,缺少对世界的原始化解读。反对者指出,人天生就不会对所拒绝接受的信息展现出出有兴趣趋向,即使是报纸和书本时代,人们也不会自由选择自己感兴趣的内容来读者。而这种自由选择并会构成所谓“信息传播妨碍”“对外部世界的理解疏远”,信息茧房也就不正式成立了。
在智能引荐无处不在的今天,坚信我们每个人都某种程度患上了隐私焦虑症。平时和朋友说出聊天都疑神疑鬼实在手机在偷偷,很多人也因此更加不讨厌在社交媒体上公布信息了。
不说道、不并转、不点拜,看上去或许是十分合理的“隐私三连”——如果我不留给任何数据痕迹,机器学习大自然也没有办法对我的爱好展开分析了。可事实知道如此吗?精准预测你的社交媒体不道德,只必须9位互关好友最近在《大自然》杂志中,来自佛蒙特大学的数据科学家们发布了这样一项研究,在推特上需要查阅个人用户数据,而是通过对个人用户相互注目好友的推文数据分析,就能构建对个人用户社交媒体不道德的精准预测。
换句话说,就算你删号退网,机器学习依然可以通过你的好友列表来分析出有你的用户画像。在研究中,研究人员搜集了一万三千余个推特账号,这些用户分别都享有150-200个好友。在好友中寻找对话亲率最低的前9位并展开分组,将用户好友组中好友的不道德数据以时间为线索展开分析。数据科学家们通过研究得出结论,一般社交媒体用户,只要不是专心某一领域的KOL,一般来说在社交媒体上用于的词汇不多达5000个。
如果用中文来比喻,大约就是“哈哈哈哈”“不并转不是中国人”“我家哥哥太帅了吧”这些常规词汇。而通过对用户好友的常用词分析,基本可以圈定该用户的兴趣范围。研究者提及,很多专心于某一领域的用户(比如政治),只不过在社交媒体用词量上只有几百个单词。
在兴趣范围内的词汇量中引进代表个人行为变化的熵亲率,再行与创建在时间序列上的文本分解算法结合,就需要构建通过社交关系来预测个人社交媒体不道德。而当好友组中的好友数量越多时,这种预测也就越精确。但值得注意的是,一旦好友数量多达150人,预测的准确率反而不会上升——因为好友数量过多时往往双方的关联度减少,瓦解了一个本来的兴趣圈子,在不道德上也很难构成同构关系。也就是说,如果你微博好友都是战狼团,那么你也不会和大家一起“虽远必诛杀”,如果你的微博是追星阵地,那么你也不会深夜和姐妹们一起为idol打榜。
一个人的网友圈子,要求了他的理解范围,也进而使得其不道德可以被预测。显然,人类的本质是复读机正确性了。圈层矗立起高墙,隐私在内部坍塌这一研究虽然展出了自然语言处置能力的变革,却也证实了两个我们忧虑已幸的问题。
首先,通过推特好友的言行对于用户的言行展开精准推断,毫无疑问是为信息茧房理论转了一张正式成立票。自从桑斯坦的信息茧房假设被传播进以来,关于这一假设的接纳程度只不过长年正处于不稳定的状态之下。特别是在是近些年来社交媒体和个性化信息流的火热,更加让很多人经常把信息茧房四字悬挂在嘴边。
支持者指出算法引荐不会源源不断的把合乎用户兴趣的信息引荐给用户,最后导致用户理解道岔,缺少对世界的原始化解读。其反对者指出,人天生就不会对所拒绝接受的信息展现出出有兴趣趋向,即使是报纸和书本时代,人们也不会自由选择自己感兴趣的内容来读者。而这种自由选择并会构成所谓“信息传播妨碍”“对外部世界的理解疏远”,所谓的茧房假说也无法正式成立了。可佛蒙特大学在这次研究中明确提出了观点——人之于信息,很多时候不仅是兴趣自由选择,还存在社交自由选择。
社交媒体上朋友的兴趣、语言风格、活跃时间与个人用户社交媒体不道德不存在的强劲关联,意味著一个人信息茧房是通过社交圈层搭起一起的,而这种茧房早已必要起到在用户的表达能力上,例如在研究中经常出现的一个有意思现象,越是对政治话题感兴趣的用户,在社交媒体上讲话的词汇量就越短缺。或许上,这证明了信息茧房下的传播圈层障碍更加显著,长年浸淫在某一圈层的人,某种程度丧失了拒绝接受其他圈层信息的机会,也丧失了拒绝接受其他圈层信息的能力。更加可怕的是,通过互关好友摸清用户爱好这种技术,再一让我们丧失了个人隐私的最后一片领地。
奥地利法学家舍恩伯格曾多次出版发行过一本取名为《移除:记得是在数字时代的美德》的书,描写的是个人信息在互联网上的被消逝权,那些关于个人用户的信息,个人用户不应有权拒绝网站和平台从服务器端完全移除或者容许采访。一开始人们对被消逝权的拒绝还只逗留在强迫拍卖会、明知名单这一类个人负面信息上,但迅速涉及市场需求开始显得更加普遍。例如2013年左右曾多次很风行一种工具,可以根据用户主页链接寻找那些曾多次被用户移除微博、豆瓣等信息,当时被很多人用来展开人肉搜寻,以至于再度引发了人们对于被消逝权的反感市场需求。
到今天被消逝权早已被写到欧盟的GDPR,吊销账号、移除一切早已出了我们保卫网络隐私的最后一条防线。可“好友算法”的经常出现意味著,只要对方能寻找你的好友关系,即使你删掉了一切内容,仍然可以不会将自己赤裸的展出在算法面前。
这也让Facebook这样靠获知用户信息盈利的企业可以在伦理上钻空子——假如一位用户坚决不给社交媒体许可数据权限,但他的社交媒体好友都向社交媒体对外开放了权限,社交媒体平台很可能会“合理合法地”跨过用户本身提供用户信息。自我的副本世界上第一个找到天然放射性现象的物理学家,来自法国贝克勒尔在被放射性物质夺去生命时,难道也从为想起过这项让自己奉献给了一生的技术,未来会演变为夺去了无数人生命的核弹。世事总是如此,那个无意中关上潘多拉魔盒的人,往往看到被魔盒转变过的世界的模样。这种社交媒体预测算法也是一样,在某种程度的逻辑下我们完全可以想象到:否通过对一个主妇购物数据的分析,也能得知她丈夫刮胡子的频率?否工商管理场社交软件上非常简单分析,就能得知一个人的工作能力和薪资水平?在数字化存活和AI的联合起到下,“自我”的所有权早已构成副本并被无限拆分,布满在那些一切与我们产生关联的地方——我们的朋友的爱好、我们家人的不道德、我们爱人的一举一动……以至于从这些关联之中,也能挖掘出得碎片,还原成出有我们的自我。
面临这种有可能,我们很难现在就为其下一个“好或怕”的定论。但这一次,让法律法规回头在技术前面,也许是个不俗的自由选择。
本文来源:开云|kaiyun-www.zekeba.com