您的位置:402cc永利手机版 > 互联网动态 > www.402.com:也会透露你的网络个人特征,电脑比朋

www.402.com:也会透露你的网络个人特征,电脑比朋

2019-11-24 03:39

近日,英国剑桥大学心理测验学中心的米哈尔·科辛斯基(Michal Kosinski)和他的两位同事在《美国国家科学院院刊》上发布了一份新的研究论文。该论文证实,人们的许多个人特征——诸如政治倾向、宗教信仰、性别、种族和性倾向——都可以通过他在Facebook上的“赞”(Like)记录进行预测。

荣获2014年奥斯卡最佳原创剧本奖的电影《她》中,描述了这样一个科幻爱情故事:心思细腻而深邃的男主角爱上了他的操作系统。通过分析他的数字记录,他的计算机比其他人(包括他长期的女朋友和最亲密的朋友)能更好地理解他,并对他的想法做出回应。电影中的故事虽发生在2025年,但这是否可能会成为现实呢?

在研究中,研究人员开发了一个数学模型,可以根据5.8万位美国Facebook用户的“赞”记录来预测他们的各项特征和偏好。之后,他们将模型的预测结果与这些志愿者的Facebook档案信息以及通过在线测试得出的智力、人格和生活满意度等信息进行了比对,发现这个模型可以非常准确地预测参与者的性别、种族出身和性倾向。其性别预测正确率高达93%,在95%的情况下可以正确识别黑人和白人,并在88%的情况下正确识别出了同性恋和异性恋。同时,该模型还有80%以上的几率对民主党人和共和党人、基督教徒和穆斯林进行正确识别。但是,这个模型在预测恋爱状态、药物滥用以及父母离异状况等方面的准确度较低。

www.402.com 1在电影《她》中,主角爱上了他的操作系统OS1。图片来源:blastr.com

就此,果壳网对该论文第一作者——米哈尔·科辛斯基博士进行了采访。

最近一项研究显示,计算机模型作出的人格判断的确比熟人(包括朋友、家庭成员、配偶和同事等)的判断更准确。研究论文[1]于1月13日发表在《美国科学院院刊》(PNAS)上。果壳网科学人就此对论文作者,剑桥大学的吴又又以及斯坦福大学的米哈尔·科辛斯基(Michal Kosinski)进行了采访。

果壳网:用户会在Facebook上面点很多个“赞”,包括视频、链接、状态、图片等等,你们怎样分配不同类型的“赞”的权重?

电脑和朋友,谁更懂你?

在社会生活中,判断别人的个性是一项非常重要的技能,因为个性是隐藏在人们行为和情绪背后的一个关键驱动因素。人们常通过个性判断来做出决定和计划,比如和谁交朋友、结成伴侣、信任谁、聘用谁或者选谁作总统等等。一开始的判断越准确,后面做出的决定也越正确。

之前人们认为,准确的个性判断来自人类大脑的社会认知技能。但是近来研究表明,计算机模型可以通过人类行为的数字记录,对个性做出准确判断[2-3]。那么,计算机和人类的判断,到底哪个更准确呢?

研究中共收集了86,220名志愿者的信息。志愿者被要求填写有关大五人格模型的个性调查问卷,进而得出了他们在开放性、尽责性、外向性、宜人性和神经质这5个方面的个性特征。

计算机做出的人格判断则是以70,520名志愿者的脸书点赞数据为基础的,而点赞被认为可以有效地预测人的个性和其它心理特征[2]。比如,给某个品牌或者产品点赞可以代表消费者的偏好和购买行为;音乐相关的点赞可以透露音乐品味;点赞的网站则可以代表网页浏览行为。而来自他人的判断则由志愿者的好友完成,他们需要填写由10个项目组成的个性量表。

通过将参与者的自我评定与计算机及他人的判断进行比较,研究人员首先检测了这两种判断的自评-他评一致性(外部判断和自我评定的一致性)。因为自评-他评一致性受人际关系的持续时间和形式的影响很大,因此研究人员又进一步将“他人”分成了不同的小类别,分别为朋友、配偶、家人、同居者和同事。

www.402.com 2www.402.com 3以计算机为基础的人格判断的准确性(y轴)与点赞数目(x轴)之间的关系。红线显示的是计算机对大五人格判断的平均准确性,他人判断的准确性也在这条红线上标出。因为该样本中个体的平均点赞数为227,由此得到计算机在这个点赞数目下的平均准确性为0.56,这比来自他人判断的平均准确性(0.46)要更高,而与配偶判断的准确性(0.58,这也是最好的他人判断准确性)相近。在研究中,可以看到随着点赞数目的增加,计算机的判断准确性也在增加;当点赞数超过500时,可以看到该判断准确性可达0.66。而且,相比于其它个性特征,以点赞为基础的模型对于开放性的判断有着最高准确性。图片来源:研究论文

结果显示,计算机模型仅需要100个点赞数据,其准确性就可以超过他人的平均值(蓝点);和同事、朋友/同居者、家人和配偶的判断相比,计算机模型分别需要10、70、150和300个点赞,就可以在准确性方面超过他们。

米哈尔·科辛斯基 :我们使用的是一个非常简单的机器学习方法,让机器来自动判断哪种“赞”更加重要。在这次研究中,“赞”所扮演的角色与其它的数字记录信息很相似,比如你的浏览日志、搜索记录、购买记录、微博和播放列表。

为什么点赞可用来判断个性?

研究人员表示,点赞可以代表行为、态度和偏好。比如,有着高开放性的志愿者倾向于给萨尔瓦多·达利(Salvador Dali)、冥想或者TED演讲点赞;而具有高外向性的志愿者则倾向于给派对、史努基(Snookie,真人秀明星)或者舞蹈点赞。

谈到计算机判断比人类判断更准确的原因,吴又又解释说:“原因之一是计算机掌握有大量和人格有关的数据信息;另一个原因则在于计算机能通过模型和算法,非常理性地处理这些信息。相反,人类可能会受到认知偏见的影响,而无法以最好的方式处理这些信息。打个比方,我们的结果显示,喜欢英剧《神秘博士》的人是高度内向的;而对普通人来说,即使你知道你的朋友在看《神秘博士》,你可能也无法得出这个结论。“

www.402.com 4通过建立模型分析Facebook上的点赞信息,我们能得到关于一个人人格的很有预测。合理的使用这项技术,将会使更多人受益。图片来源:wordpress.com

吴又又告诉科学人:“这次研究中,我们仅仅检测了大五人格特征。我们认为计算机模型完全有可能在判断其他人格特征方面,也有更好的表现。但是,我并不会说计算机模型就一定会更好,因为对某些特征做出正确判断需要更微妙的线索,而这在数字环境中是没有体现的。我们可以拿情商(EQ) 作为例子说明这一点:对人来说,利用面部表情或者肢体语言等信息来判断他人是否在社交中感到尴尬,或者是否对别人产生了共情是相对容易的;但至少从目前来看,这种信息在数字环境中是很难体现的。”

吴又又表示,该研究最实际的应用包括将该算法应用到有着脸书使用者身上——当然是在他们同意的情况下。这样,就可以绘制出使用者的个性特征图谱,而这个图谱可以进一步在其他方面使用,例如

  1. 市场营销,广告商可以因此提高产品的推荐并对他们的市场信息进行量身定制(比如说,蹦极公司可能要针对那些更愿意尝试新体验的人);
  2. 工作推荐,HR专员能根据人格特征选择合适的求职者(如为会计工作选择有条理的人);
  3. 网上约会,一般来说,性格相似的人更容易成对。

针对计算机个性判断是否存在风险,论文作者之一的科辛斯基告诉我们:“个性判断和其他任何技术一样,在道德上是中立的。就像一把刀,我们可以用它来改善生活,也可以用它来伤害我们自己。当然,我们需要小心行事,因为这项技术涉及的范围很大,很多人能从中受益,或受害。因此,我们应该采取一些政策或者技术,来将风险降到最低。在此,有两个原则可以指导我们:透明和受控。首先,我们需要帮助使用者知道,他们有哪些个人数据正被如何使用及可能被如何使用;其次,我们需要让使用者能够控制他们的数据,并决定这些数据可以被用来做什么。做到这两个方面在技术上并不困难,但是落实它们则需要使用者意识到问题本身的存在——也许还需要加上政策制定者的推动。”(编辑:球藻怪)

PS:这个结论对点赞狂魔可能不适用……

果壳网:为什么这个模型在预测恋爱状态、药物滥用、幸福感和父母离异状况时的准确度会下降呢?

参考文献:

  1. Wu Youyou, Michal Kosinski, and David Stillwell. Computer-based personality judgments are more accurate than those made by humans.PNAS..
  2. Kosinski M, Stillwell D, Graepel T. Private traits and attributes are predictable from digital records of human behavior.PNAS. 110(15):5802–5805.
  3. Kosinski M, Bachrach Y, Kohli P, Stillwell D, Graepel T. Manifestations of user personality in website choice and behaviour on online social networks. Mach Learn. 95(3):357–380.

米哈尔·科辛斯基:事实上,我们一开始非常震惊:我们的模型居然还能预测父母离异和药物滥用这种信息!在恋爱关系和幸福指数预测上准确度较低的原因,可能是因为我们取样的用户“赞”记录覆盖了较长的一段时间,而他们在这段时间内的心情和恋爱状态会有多次变化。

文章题图:martinvarsavsky.net

果壳网:这些准确度稍低的预测结果能告诉我们什么呢?有办法提高其准确度吗?

米哈尔·科辛斯基:在父母离异状态的预测方面,尽管准确度不太高(都在60%左右),但这其实是一个有着非常深刻意义的结果,因为我们看到了类似父母离异这样的事情会对人们造成的深远影响。对于社会科学家来说,这意味着网络行为是一个大金矿,它能帮助我们更加了解人类。比方说,与“父母离异”关系最大的几个“赞”关键词是:“对不起,我爱你”、“如果我和你在一起,那么我就只想和你在一起,我不要其他任何人”,这表明这种生活事件会给人们留下永久性的行为痕迹,而且这种痕迹是可以在网络环境中被检测到并进行深入研究的。

如果我们在预测恋爱状态或是幸福感时缩短用户行为的取样时间范围,比如一小段给定时间内的用户网页访问记录或是“赞”记录,而不是用几个月甚至几年的数据,就能将准确度提高。

果壳网:这样的预测模型有怎样的实际应用价值呢?

本文由402cc永利手机版发布于互联网动态,转载请注明出处:www.402.com:也会透露你的网络个人特征,电脑比朋

关键词: www.402.com 402cc永利手机版