正在阅读:

网络色情搜索的数据研究 揭示了什么?

扫一扫下载界面新闻APP

网络色情搜索的数据研究 揭示了什么?

这些“福柯和弗洛伊德会梦寐以求的”网络色情搜索数据,真的能反应出人类最真实的自我吗?

赛斯·斯蒂芬斯-大卫德维茨(Seth Stephens-Davidowitz)想将自己的书名定为《我的生殖器有多大》,但是他的出版社表示反对。最终书名变为《每个人都会说谎》(Everybody Lies),副标题则是“网络能告诉我们自己到底是谁吗?”(What the Internet Can Tell Us About Who We Really Are)。这本书精心打造了“大数据”科学的早期成果,而其主要的缺陷或许是:书中并没有说到底有多少成果已经过时了。

大卫德维茨是一位数据科学家,他使用的数据来源是谷歌趋势。谷歌趋势中记录了不同时刻、不同地点中每个搜索关键词的相对频率。之后,他又使用了谷歌广告词(Google Adword),这里面记录了搜索的实际数字。之后,他又使用了其他的来源:维基百科、Facebook 以及世界上最大的色情网站之一 PornHub。PornHub 为他提供了全部的匿名数据库:全部搜索记录与视频观看次数。他还从其他许多网站中获得了数据——甚至包括堪称是网络毒瘤的 Stormfront 等等新纳粹网站。

《每个人都会说谎》
[美] 赛斯·斯蒂芬斯-大卫德维茨 著

在得到这些记录了人类内心最羞耻秘密的元数据后,他发现,在美国的马丁·路德·金纪念日,关于种族主义笑话的搜索上升了 30%。在共和党的党内初选中,支持特朗普的人数最多的地区也,是搜索“黑鬼(nigger,对黑人的蔑称)”最多的地区。Prosper 是一个 P2P 贷款网站,来自该网站的数据显示:当审核贷款申请的时候,一个人应该特别注意以下五种表达:“上帝”、“保证”、“将付”、“医院”以及“谢谢”。做保证“就是一个人不会去做某件事情的一个肯定信号”。“上帝”则对贷款成功率有负面影响。

仍然有许多诸如此类的事实等待人们去发掘。对大卫德维茨这样的社会科学家来说,大数据有四种重要好处。首先,这是一种“数据的真相精华”:有些人会在诸如种族主义、以及关于性的调查中说谎,而数据则反映得是真实的态度;第二,它能够为人们提供大规模、随机性的控制变量。而这在以往是一项工程量浩大、成本高昂的事情——如今,人们几乎不用任何成本,便能够通过这种方法,揭示出不同事物之间的相关关系,甚至是因果关系;第三,庞大的数据体量能够使我们更准确地聚焦于某一类型的人身上。这在以往是完全不可能实现的。第四,它为人们提供了新形式的数据。

大卫德维茨认为,网络色情习惯方面的搜索可能是“最重要的发展”,“这能够让我们去了解人类的性”。这方面的数据可能是 “叔本华、尼采、弗洛伊德以及福柯等人所梦寐以求的”。

有一些性事实比较负面,有一些则比较有趣,能够让人产生共鸣。一些数据非常吸引人,因为我们发现这些数据不同寻常,或者是因为我们发现这些数据适用于所有人。搜索数据表明,成千上万的年轻男性特别偏爱年长的女性。威廉·华兹华斯希望自己妻子玛丽能够胖一点,许多异性恋男性也对自己的伴侣有这样的想法。在这个十年即将结束的当下,色情片中的肛交正在快速赶超阴道性交。“大量女性非常偏爱那些带点暴力的色情片。”在“我想和我的……做爱”这种句式的搜索中,有超过 75%的都是乱伦片。大量男性都经常搜索自己为自己口交的办法,也在经常搜索如何为女性带来高潮。

还有许多坚定的小众分类,一些女性只会去搜索矮胖的、生殖器短小的男性;一些男性则只搜索“大乳头”。30%的搜索者只看那些最丑的色情片。我们的网上习惯暗示我们都是怪人,但是实际上我们许多人并没有那么怪异。一些搜索“逐渐走向被禁的道路”,因此相关数据反映出的并非完全是真实情况。数据中有无数的暗含意义以及陷阱,但尽管数据体量十分庞大,而且仍在不断添加,大卫德维茨也已经将其中很多数据解释得很清楚了。

“下一个福柯将会是一位数据科学家。下一位弗洛伊德将会是一位数据科学家,下一位马克思将会是一位数据科学家”。我(指本文作者 Galen Strawson,分析哲学家兼专栏作家——译注)认为这不太可能,但是这些未来的伟大人物们,将会和数据科学家们紧密合作。在《每个人都会说谎》的结尾,大卫德维茨变得兴奋(“人们都在重新构想数据是由什么组成的……一切皆是数据!”)但是,他并没有对数据带来的危险进行足够说明。凯西·奥尼尔(Cathy O'Neil)在作品《数学杀伤性武器》(Weapons of Math Destruction)中说明:基于大数据的程序如何为掠夺性广告引入了一种全新的,更高的效率,“扭曲高等教育、提高债务、在每个路口殴打穷人、削弱民主”。设计用意非常好的程序,都会陷入自我证实的反馈回路当中。

《数学杀伤性武器》

网络带来的最大的危险之一,是丹尼尔·卡内曼(Daniel Kahneman)在他的作品《思考,快与慢》(Thinking, Fast and Slow)中所提到的:“在观点相似的人们所组成的社群中,人们对于任何无论多么荒诞的看法,都拥有坚定不移的信念”。这并非危言耸听(例如,一些人否定意识的存在),问题是,任何看法——无论是偏见还是仇恨——都能够在网络上找到一大群拥护的人们。

大卫德维茨回应了这些担忧。他是一位社会科学家,在他对数据科学的定义中,恶意程序并不是数据科学的一部分。他们的创造者并没有试图去描述和解释人类的行为,反而是去操纵人类行为。大数据在本质上并不危险,也不邪恶,而是具有极大价值,非常吸引人。新事物在各个地方出现。其中一些结果——例如飓风和和草莓饼干之间的相关关系——非常离奇。对于他来说,“重点是,社会科学正在变为一门真正的科学,而且这种新兴的,真正的科学将会提高我们的生活质量”。

大卫德维茨在最近的采访中曾说道:“有时候我想,如果把每个人的色情片偏好都一下子全部公布出来的话,或许是个好事。人们会有 30 秒钟感到尴尬,然后我们便会克服这种尴尬,对性更为开放。”我非常喜欢他的这个建议。但我觉得他有些过于乐观了。我认为,更容易地接触到色情片将是人类历史上最大的悲剧之一,这将对良好的性关系产生毁灭性影响。如果我们拥有一台绝对可靠的仪器,能够去衡量网络给人类生存所带来的得失,我认为我们会发现我们所失去的远远大于我们所得到的。

(翻译:尉艳华)

……………………………………

欢迎你来微博找我们,请点这里

也可以关注我们的微信公众号“界面文化”【ID:BooksAndFun】

 

来源:卫报

原标题:Everybody Lies by Seth Stephens-Davidowitz review – what internet searches reveal

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

网络色情搜索的数据研究 揭示了什么?

这些“福柯和弗洛伊德会梦寐以求的”网络色情搜索数据,真的能反应出人类最真实的自我吗?

赛斯·斯蒂芬斯-大卫德维茨(Seth Stephens-Davidowitz)想将自己的书名定为《我的生殖器有多大》,但是他的出版社表示反对。最终书名变为《每个人都会说谎》(Everybody Lies),副标题则是“网络能告诉我们自己到底是谁吗?”(What the Internet Can Tell Us About Who We Really Are)。这本书精心打造了“大数据”科学的早期成果,而其主要的缺陷或许是:书中并没有说到底有多少成果已经过时了。

大卫德维茨是一位数据科学家,他使用的数据来源是谷歌趋势。谷歌趋势中记录了不同时刻、不同地点中每个搜索关键词的相对频率。之后,他又使用了谷歌广告词(Google Adword),这里面记录了搜索的实际数字。之后,他又使用了其他的来源:维基百科、Facebook 以及世界上最大的色情网站之一 PornHub。PornHub 为他提供了全部的匿名数据库:全部搜索记录与视频观看次数。他还从其他许多网站中获得了数据——甚至包括堪称是网络毒瘤的 Stormfront 等等新纳粹网站。

《每个人都会说谎》
[美] 赛斯·斯蒂芬斯-大卫德维茨 著

在得到这些记录了人类内心最羞耻秘密的元数据后,他发现,在美国的马丁·路德·金纪念日,关于种族主义笑话的搜索上升了 30%。在共和党的党内初选中,支持特朗普的人数最多的地区也,是搜索“黑鬼(nigger,对黑人的蔑称)”最多的地区。Prosper 是一个 P2P 贷款网站,来自该网站的数据显示:当审核贷款申请的时候,一个人应该特别注意以下五种表达:“上帝”、“保证”、“将付”、“医院”以及“谢谢”。做保证“就是一个人不会去做某件事情的一个肯定信号”。“上帝”则对贷款成功率有负面影响。

仍然有许多诸如此类的事实等待人们去发掘。对大卫德维茨这样的社会科学家来说,大数据有四种重要好处。首先,这是一种“数据的真相精华”:有些人会在诸如种族主义、以及关于性的调查中说谎,而数据则反映得是真实的态度;第二,它能够为人们提供大规模、随机性的控制变量。而这在以往是一项工程量浩大、成本高昂的事情——如今,人们几乎不用任何成本,便能够通过这种方法,揭示出不同事物之间的相关关系,甚至是因果关系;第三,庞大的数据体量能够使我们更准确地聚焦于某一类型的人身上。这在以往是完全不可能实现的。第四,它为人们提供了新形式的数据。

大卫德维茨认为,网络色情习惯方面的搜索可能是“最重要的发展”,“这能够让我们去了解人类的性”。这方面的数据可能是 “叔本华、尼采、弗洛伊德以及福柯等人所梦寐以求的”。

有一些性事实比较负面,有一些则比较有趣,能够让人产生共鸣。一些数据非常吸引人,因为我们发现这些数据不同寻常,或者是因为我们发现这些数据适用于所有人。搜索数据表明,成千上万的年轻男性特别偏爱年长的女性。威廉·华兹华斯希望自己妻子玛丽能够胖一点,许多异性恋男性也对自己的伴侣有这样的想法。在这个十年即将结束的当下,色情片中的肛交正在快速赶超阴道性交。“大量女性非常偏爱那些带点暴力的色情片。”在“我想和我的……做爱”这种句式的搜索中,有超过 75%的都是乱伦片。大量男性都经常搜索自己为自己口交的办法,也在经常搜索如何为女性带来高潮。

还有许多坚定的小众分类,一些女性只会去搜索矮胖的、生殖器短小的男性;一些男性则只搜索“大乳头”。30%的搜索者只看那些最丑的色情片。我们的网上习惯暗示我们都是怪人,但是实际上我们许多人并没有那么怪异。一些搜索“逐渐走向被禁的道路”,因此相关数据反映出的并非完全是真实情况。数据中有无数的暗含意义以及陷阱,但尽管数据体量十分庞大,而且仍在不断添加,大卫德维茨也已经将其中很多数据解释得很清楚了。

“下一个福柯将会是一位数据科学家。下一位弗洛伊德将会是一位数据科学家,下一位马克思将会是一位数据科学家”。我(指本文作者 Galen Strawson,分析哲学家兼专栏作家——译注)认为这不太可能,但是这些未来的伟大人物们,将会和数据科学家们紧密合作。在《每个人都会说谎》的结尾,大卫德维茨变得兴奋(“人们都在重新构想数据是由什么组成的……一切皆是数据!”)但是,他并没有对数据带来的危险进行足够说明。凯西·奥尼尔(Cathy O'Neil)在作品《数学杀伤性武器》(Weapons of Math Destruction)中说明:基于大数据的程序如何为掠夺性广告引入了一种全新的,更高的效率,“扭曲高等教育、提高债务、在每个路口殴打穷人、削弱民主”。设计用意非常好的程序,都会陷入自我证实的反馈回路当中。

《数学杀伤性武器》

网络带来的最大的危险之一,是丹尼尔·卡内曼(Daniel Kahneman)在他的作品《思考,快与慢》(Thinking, Fast and Slow)中所提到的:“在观点相似的人们所组成的社群中,人们对于任何无论多么荒诞的看法,都拥有坚定不移的信念”。这并非危言耸听(例如,一些人否定意识的存在),问题是,任何看法——无论是偏见还是仇恨——都能够在网络上找到一大群拥护的人们。

大卫德维茨回应了这些担忧。他是一位社会科学家,在他对数据科学的定义中,恶意程序并不是数据科学的一部分。他们的创造者并没有试图去描述和解释人类的行为,反而是去操纵人类行为。大数据在本质上并不危险,也不邪恶,而是具有极大价值,非常吸引人。新事物在各个地方出现。其中一些结果——例如飓风和和草莓饼干之间的相关关系——非常离奇。对于他来说,“重点是,社会科学正在变为一门真正的科学,而且这种新兴的,真正的科学将会提高我们的生活质量”。

大卫德维茨在最近的采访中曾说道:“有时候我想,如果把每个人的色情片偏好都一下子全部公布出来的话,或许是个好事。人们会有 30 秒钟感到尴尬,然后我们便会克服这种尴尬,对性更为开放。”我非常喜欢他的这个建议。但我觉得他有些过于乐观了。我认为,更容易地接触到色情片将是人类历史上最大的悲剧之一,这将对良好的性关系产生毁灭性影响。如果我们拥有一台绝对可靠的仪器,能够去衡量网络给人类生存所带来的得失,我认为我们会发现我们所失去的远远大于我们所得到的。

(翻译:尉艳华)

……………………………………

欢迎你来微博找我们,请点这里

也可以关注我们的微信公众号“界面文化”【ID:BooksAndFun】

 

来源:卫报

原标题:Everybody Lies by Seth Stephens-Davidowitz review – what internet searches reveal

本文为转载内容,授权事宜请联系原著作权人。