动态观点|News Views
【大百科】如何利用数据攻破渠道作假伎俩
Date | Sep 23,2016

随着O2O兴起的第三方地推大军尚处在莽荒时代团队良莠不齐。作弊泛滥,手段千奇百怪数据真假难辨。而对于上游cp来说最重要的莫过于地推数据的真实性。

那么如何判断用户是否真实、是否来自墙、是否机刷or肉刷而来?接下来地推派给大家分享下关于如何从数据辨别渠道作弊的几种简单实用的方法。

终极判断法——就是看用户对内容贡献。首先要看自己应用的类型,举3个例子。

比如你是电商类的应用,最直接的就看这个渠道用户的下单消费情况–激活到订单创建转化率,如果这个造假能给你产生营收贡献那也不错呀,哈哈,所以这个不会假。

比如你的应用是生活类可以产生信息的应用,如:问医生系列,那就看这个渠道用户的提问量,这个造假成本高,造假这个他们也不划算。

比如你的产品是游戏类,那就和电商差不多了,看用户购买增值道具的比例,看用户玩到个关卡的比例,他们不会雇人玩游戏造假吧!!

通过以上3个例子可见,还是先看自己产品,从产品内容细节上去判断,这样就容易了。

相对容易常路出马脚的作弊数据:

留存率

渠道刷量会选择在次日、7日、30日这些重要时间点上导入用户数据。然后发现APP在次日、7日、30日这些关键时间点上的数据明显高于其他时间点。而真实的用户的留存曲线是一条平滑的指数衰减曲线,如果他们发现留存曲线存在陡升陡降的异常波动,基本上就是渠道干预了数据。

用户终端信息

1.低价设备排名:根据经验分析渠道的新增用户或者启动用户的设备排名。如果发现某款低价设备排名异常靠前,他们就视其为异常,开始报警。


2.新版本操作系统的占比:经过渠道多年蹂躏,运营人员终于发现,很多渠道刷量工作室在操作系统版本的适配上会有延时。查看渠道用户的操作系统时,可以和全体手机网民的操作系统的分布做比较。

3.wifi网络的使用情况:比如说2G、3G、4G的使用比例分布是否正常等等。

延伸信息

1.注册昵称的分布和规律很多低端的刷假量的注册昵称有很强的规律性,各位运营看官肯定遇到这样的情况;

2.注册手机号码的归属地分布,这点相比各位看官也遇到过,某个渠道上来的用户手机号码不但来自某运营商的某个地市,甚至都是连号手机号码。

单个指标

1.IP:是否为黑名单IP、是否为代理IP,跟一个巨大的黑名单库进行比对;

2.IMEI:是否为黑名单IP;

3.手机号码:号码是否非法,是否在黑名单。

群体指标

1.IP:用户IP的地域分布是否符合先验数据的分布,地域包括国内的省份分布和海外市场的分布;

2.IMEI:用户IMEI号的地域分布是否符合先验数据的分布,IMEI所代表的制造商的分布是否随机;

3.OS:该渠道操作系统版本的分布情况是否符合一定的随机性和统计性,并与之前的先验数据进行对比判;

4.机型:机型分布是否符合先验数据,以及最新智能手机出货量的比例;

5.位置信息:位置信息打开的比例,以及获取到位置信息的地域分布比例是否符合先验数据的分布,是否符合渠道承诺的地域情况,是否符合应用的实际分布情况;

6.运营商:运营商的数据分布是否随机,是否符合国内运营商的正常分布,以及海外运营商的随机分;

7.网络接入方式:wifi、2G、3G、4G的分布比例是否与先验数据保持同样的趋势和数据特征。

信息一致性 

设备一致性的验证,包括:CPU、制造商、Mac地址、IMEI、机型、操作系统的一致性验证。

大百科说

目前从跟踪统计到的用户属性上很难分别了,看用户留存、机型、地域、联网等正常也不能说一定没作弊。因此cp在将推广业务外包给第三方团队时,要应运好各项数据指标,以确保地推的高效性。