正在阅读:

2100万数据有1800万造假,马蜂窝还值175亿吗?

扫一扫下载界面新闻APP

2100万数据有1800万造假,马蜂窝还值175亿吗?

坚持不做数据造假,往小了说,这是对你企业未来负责,往大了说,这是对整个行业和市场负责。

最近,估值高达175亿人民币的旅游业独角兽马蜂窝被人“捅”了,捅了什么呢?说它数据大量造假、评论内容抄袭的丑闻。

根据乎睿数据团队披露的数据,在马蜂窝总共2100万条点评中,有1800万条是通过机器人,从大众点评、携程等竞争对手那抄来的,单单抄袭账号至少就有7454个。

更糟糕的是,马蜂窝上85%的点评都是由这7454个抄袭账号所贡献。

尽管马蜂窝在随后的声明中,声称点评内容只占马蜂窝整体数据量的2.91%,涉嫌虚假点评账号数量在整体占比中微乎其微。

但在大众看来,这好像在说:我确实造假了,但只是一点点评数据造假,没什么大不了。

事到如今,事情已经进入白热化阶段,依旧难平众怒,因为这已然不仅仅是造不造假的问题,更是对待造假的态度问题。

▲马蜂窝被爆抄袭的部分账号及来源

估计听完这事,有人会替马蜂窝“叫屈”,因为这些年来,数据造假早已是公开的潜规则。

确实,今天是信息化时代,我们所有的行为都可以被数据化,我们也习惯看数据说话,也乐于看数据进行消费。更关键的是,这些数据正在影响着我们的消费取向以及思维动向。

2016年美国总统选举,想必大家还记忆犹新,当时一家叫剑桥分析的数据公司,窃取了5000万Facebook用户资料。

根据这些用户的日常喜好、性格特点和教育水平,预测他们的政治倾向,精准投放信息,以达到洗脑的效果,从而帮助特朗普当选。

你看,稍稍动下数据的手脚,操纵者便能得到总统之位,但是,这波数据的操控,在当时美国政商界引起一片哗然,引发民怨,直接质疑选举的公正与合法性。

民众为何如此愤怒,因为数据造假严重伤害了他们的利益,伤害了那些真正有资格当选总统人的权益。

回过头看看当下各个行业频频爆发的数据造假事件,民众面对一次又一次的伤害,忍耐度是有限的。而长久以往,更会伤害到商业秩序。

那么如何阻止数据造假?

问题在于,给这段短暂的秩序“真空”寻找“裁判员”。

我认为,在现实中,裁判员至少有两种。

第一种,数据“打假人”。

这些数据打假人在网上往往像是“刁民”,可以在各大平台上看到他们投诉的身影。

最典型的就是崔永元,前不久因为对明星假合同的质疑,就以一己之力利用数据造假的漏洞“打垮”了著名影星范冰冰。

再比如,这次揭露马蜂窝数据造假的三人团体,他们不过是看了评论点了外卖,一不小心吃坏了肚子,于是写了差评,没想到反被店家污蔑诋毁。

愤恨之下,这几位同学利用在美国常春藤学校所学的数据挖掘以及语义分析技术,弄了一个查评论数据抓取模型,盲狙到马蜂窝。

马蜂窝认为他们是“有组织”的,但其实不过是众多投诉者中那个最难搞的“刁民”。

或许也是因为有了这些“刁民”的坚持与不畏惧,才能震慑到那些不良的企业,去挑战权威,让他们收敛造假的行为。

▲数据真假的检验方法

我要讲的第二种裁判员,是企业自己。

企业数据造假,无疑是利于短期竞争的,但是长久以往,对外对内都是一种伤害。

首先,对外,一旦被资本判定为你造假,那必定将你抛弃;而一旦被大众识破你造假的伎俩,你的企业诚信将会大大降低,继而影响你的产品销量。

“马蜂窝”们很清楚一旦挂上造假之名的危害,所以不会承认“自己是造假公司”,因为有节操的公司,才能活下去。

其次,对内,当所有内部员工知道这家公司的老板没有诚信,没有底线,那还留得住人才吗?公司还有未来吗?

所以,无论是对外还是对内,我们都应该自律。

那么要想学会自律,该向谁学呢?国内有爱奇艺!国外有Netflix。

上个月,爱奇艺就宣布关闭全站节目内容前台播放数据,以综合用户讨论度、互动量、多维度播放等指标的“内容热度”取而代之,并呼吁全行业告别唯数据论造成的浮躁风气。

用更高标准来衡量自己的收视量,而不是用造假门槛极低的“播放量”来进行对比,这就是一种进步。

再来说,去年Netflix把早期的“五星评分”系统改为“顶、踩”单一评分系统,3个月前又决定陆续移除所有用户发布的剧评。这些都是为了保证评分客观性。

▲Netflix把五分评分系统(上)改为“踩、顶”单一评分系统

要知道,流量固然重要,但刷出来的流量只能短暂“欺骗”用户,取悦自己,营销的终点还得靠用户用脚投票。

坚持不做数据造假,往小了说,这是对你企业未来负责,往大了说,这是对整个行业和市场负责。

这个商业世界的秩序并不完善,铁丝网上多是漏洞,多的人想方设法钻进漏洞找机会发横财,也有的人甘愿“约束”自己,努力维护心中无形的商业秩序,推动商业世界的有序发展。

本文为转载内容,授权事宜请联系原著作权人。

马蜂窝

3.2k
  • 机构:2024春节假期香港、沈阳、长春等城市热度大涨
  • 免签、小众、物美价廉,这些出境游目的地热度飙升!

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

2100万数据有1800万造假,马蜂窝还值175亿吗?

坚持不做数据造假,往小了说,这是对你企业未来负责,往大了说,这是对整个行业和市场负责。

最近,估值高达175亿人民币的旅游业独角兽马蜂窝被人“捅”了,捅了什么呢?说它数据大量造假、评论内容抄袭的丑闻。

根据乎睿数据团队披露的数据,在马蜂窝总共2100万条点评中,有1800万条是通过机器人,从大众点评、携程等竞争对手那抄来的,单单抄袭账号至少就有7454个。

更糟糕的是,马蜂窝上85%的点评都是由这7454个抄袭账号所贡献。

尽管马蜂窝在随后的声明中,声称点评内容只占马蜂窝整体数据量的2.91%,涉嫌虚假点评账号数量在整体占比中微乎其微。

但在大众看来,这好像在说:我确实造假了,但只是一点点评数据造假,没什么大不了。

事到如今,事情已经进入白热化阶段,依旧难平众怒,因为这已然不仅仅是造不造假的问题,更是对待造假的态度问题。

▲马蜂窝被爆抄袭的部分账号及来源

估计听完这事,有人会替马蜂窝“叫屈”,因为这些年来,数据造假早已是公开的潜规则。

确实,今天是信息化时代,我们所有的行为都可以被数据化,我们也习惯看数据说话,也乐于看数据进行消费。更关键的是,这些数据正在影响着我们的消费取向以及思维动向。

2016年美国总统选举,想必大家还记忆犹新,当时一家叫剑桥分析的数据公司,窃取了5000万Facebook用户资料。

根据这些用户的日常喜好、性格特点和教育水平,预测他们的政治倾向,精准投放信息,以达到洗脑的效果,从而帮助特朗普当选。

你看,稍稍动下数据的手脚,操纵者便能得到总统之位,但是,这波数据的操控,在当时美国政商界引起一片哗然,引发民怨,直接质疑选举的公正与合法性。

民众为何如此愤怒,因为数据造假严重伤害了他们的利益,伤害了那些真正有资格当选总统人的权益。

回过头看看当下各个行业频频爆发的数据造假事件,民众面对一次又一次的伤害,忍耐度是有限的。而长久以往,更会伤害到商业秩序。

那么如何阻止数据造假?

问题在于,给这段短暂的秩序“真空”寻找“裁判员”。

我认为,在现实中,裁判员至少有两种。

第一种,数据“打假人”。

这些数据打假人在网上往往像是“刁民”,可以在各大平台上看到他们投诉的身影。

最典型的就是崔永元,前不久因为对明星假合同的质疑,就以一己之力利用数据造假的漏洞“打垮”了著名影星范冰冰。

再比如,这次揭露马蜂窝数据造假的三人团体,他们不过是看了评论点了外卖,一不小心吃坏了肚子,于是写了差评,没想到反被店家污蔑诋毁。

愤恨之下,这几位同学利用在美国常春藤学校所学的数据挖掘以及语义分析技术,弄了一个查评论数据抓取模型,盲狙到马蜂窝。

马蜂窝认为他们是“有组织”的,但其实不过是众多投诉者中那个最难搞的“刁民”。

或许也是因为有了这些“刁民”的坚持与不畏惧,才能震慑到那些不良的企业,去挑战权威,让他们收敛造假的行为。

▲数据真假的检验方法

我要讲的第二种裁判员,是企业自己。

企业数据造假,无疑是利于短期竞争的,但是长久以往,对外对内都是一种伤害。

首先,对外,一旦被资本判定为你造假,那必定将你抛弃;而一旦被大众识破你造假的伎俩,你的企业诚信将会大大降低,继而影响你的产品销量。

“马蜂窝”们很清楚一旦挂上造假之名的危害,所以不会承认“自己是造假公司”,因为有节操的公司,才能活下去。

其次,对内,当所有内部员工知道这家公司的老板没有诚信,没有底线,那还留得住人才吗?公司还有未来吗?

所以,无论是对外还是对内,我们都应该自律。

那么要想学会自律,该向谁学呢?国内有爱奇艺!国外有Netflix。

上个月,爱奇艺就宣布关闭全站节目内容前台播放数据,以综合用户讨论度、互动量、多维度播放等指标的“内容热度”取而代之,并呼吁全行业告别唯数据论造成的浮躁风气。

用更高标准来衡量自己的收视量,而不是用造假门槛极低的“播放量”来进行对比,这就是一种进步。

再来说,去年Netflix把早期的“五星评分”系统改为“顶、踩”单一评分系统,3个月前又决定陆续移除所有用户发布的剧评。这些都是为了保证评分客观性。

▲Netflix把五分评分系统(上)改为“踩、顶”单一评分系统

要知道,流量固然重要,但刷出来的流量只能短暂“欺骗”用户,取悦自己,营销的终点还得靠用户用脚投票。

坚持不做数据造假,往小了说,这是对你企业未来负责,往大了说,这是对整个行业和市场负责。

这个商业世界的秩序并不完善,铁丝网上多是漏洞,多的人想方设法钻进漏洞找机会发横财,也有的人甘愿“约束”自己,努力维护心中无形的商业秩序,推动商业世界的有序发展。

本文为转载内容,授权事宜请联系原著作权人。