这篇是基于成本考量的分享内容——关于效果与成本兼顾的APP反作弊策略分享。
APP反作弊是一个实践性很强的业务。在现实的环境中,没有绝对有效的反作弊方法,这里有一个核心底线,就是成本。
你要投入的成本跟收获的价值相比,合算吗?毕竟这是一个生意,而不是一个学识研究,或探究真理。
说到底,反作弊最后算的还是经济账,是一个效率问题。
量江湖在实践中摸索出一套经济高效的反作弊策略。关于高效,大家已经比较清楚了,我们现在回答另外一个问题——如何做到经济的。
针对行业现状,量江湖的反作弊处理策略是:
1) 锚定原点:数字DNA指纹技术,标识硬件设备,是构成量江湖整套作弊防护体系中的参照系、坐标系;
2) 分层过滤:多层独立防护技术,能在初层解决的问题,就在初层解决,不用增加处理后续的处理成本,同时,针对疑难杂症,加深作弊的防护深度和精细度,确保万无一失;
3) 软硬兼施:硬件信息和软件环境综合考虑,全面考虑各种因素、各项指标;
4) 模式识别:建立如同杀毒软件一样的病毒库——异常行为特征库技术是量江湖的独门秘籍,不仅覆盖全部的作弊手段,还提供实时的更新机制,把作弊歼灭在信息源头,降低机器计算的开销和处理成本;
(一)多层独立识别技术
先说分成过滤。作弊识别是一个极其复杂的工程,有的作弊特征非常明显,有的则隐藏很深,还有少量情况是特征不够明显,甚至是个概率事件。为此,量江湖在识别作弊行为上采用了多层防护、多维判定、独立识别、综合评定的全套作弊识别解决方案。目的在于提高防范强度和精度的同时,兼顾方案的时效性和实用性:对于70%以上的作弊行为,可以在10分钟内给出判断;剩余下的大约20%高度仿真作弊行为,可以在3小时内给出判定;但其余大概5%左右的疑似作弊但特征不明显的行为,则需要2天的时间给出判定(跟版本有关),并对最终所有结果给出最终的判定:
1.1:初滤识别层
硬件设备异常嗅探技术:
第一步是判断设备本身、app、以及工作环境,是否处于被调试状态,当处于调试状态,系统会启动更加严格的设备验证算法,可识别目前所有通过调试方式刷量的行为;
第二步是判断设备的OS是否被劫持。一旦操作系统被劫持,就可以通过软件方式篡改设备信息。而量江湖的嗅探技术,不依赖操作系统接口的方式,而是独立获取设备信息,不受任何劫持木马或程序的干扰,通过对比得到准确的判断。
第三步是判断模拟器作假。量江湖对模拟器的作假判断有丰富的经验与独特技术,可以100%识别基于模拟器技术的作弊。
软硬件信息一致性校验技术
量江湖还对所取得关键设备信息、软件信息,如制造商ID、CPU、Mac地址、IMEI、操作系统版本、机型版本等各种进行一致性的校验,并与数据库中的用户数据进行比对校验,进行双保险的一致性校验比对。加深了对作假的审查深度。
1.2再滤识别层
IP甄别:对其IP地址的来源、性质、分布进行全面的审查判断;
大数据比对:量江湖拥有5亿以上的用户画像,对所取得硬件关键设备ID进行合规校验以及数据库行为校验,分析其异常概率;
群体行为分析:包括接入网络类型、运营商分布、操作系统分布、机型分布、地理位置分布等特征,逐个与先验数据所构建的行为分布模型进行模式校验比对;
1.3终滤识别层
对上两层还不能确定的疑似情况作最后的审查,一方面综合评定所有的指标,另一方面与异常行为特征库所有的特征进行一一Match,并计算其匹配度。从而对这些疑难案例给出最终的结论。
(二)模式识别——异常行为特征库技术
再说模式识别。原理介绍每一种作假手段制造出来的,实际上是用户行为,通过机器学习对海量用户行为的洞察,抽象出这些异常用户或者异常来源的行为特征,这种行为特征称之为异常行为特征。这些各种各样的异常行为特征就构成了量江湖反作弊异常行为特征库,类似于杀毒软件中的“病毒库”。
量江湖目前已经收集、识别和记录存储了当前所有流量作弊方式的行为特征。
实时更新:量江湖密切关注任何一种新的作弊手段,发现,收集,学习,并输出更新异常行为特征库。确保客户在第一时间发现作假行为。
(三)锚定原点——数字DNA指纹技术
量江湖采用独特的数字DNA指纹技术,而不是使用IMEI、MAC、设备SN、蓝牙地址、ICCID等设备标识,以防止篡改。对于通过动态修改设备参数如MAC、IMEI、IMSI、ICCID、蓝牙地址等核心硬件的作弊行为,量江湖通过以数字DNA指纹技术为中心,参考硬件多维度参数检测,综合网络侧技术的风险评估以及异常行为特征库的匹配度评估,给出最终的判定。
(四)底层技术——机器学习及大数据技术
4.1机器学习技术
机器学习的优势就是能从海量数据中抽象出更加系统、更加深刻、更加完整的智慧、模式、特征;
机器学习不仅学习的更加深入透彻,还学习的非常快,在数据充分的情况下,对一种新作弊方法的学习可以在1小时内完成;
机器学习可以在人类的监督下自动学习,也就是说他不仅24小时在干活,而且还24小时在学习和进步,换句话说,其学习的速度不仅远超人类,而其学习的加速度更加令人生畏,实在是防作弊制胜之法宝。
4.2大数据
大数据:5亿以上的用户数据是量江湖做用户识别准确率的基础:
基本参考:5亿以上的用户量已经涵盖了半数以上的移动互联网用户,活生生的数据就是硬邦邦的证据;
机器学习的基础,机器学习的一个关键是有多少数据和多少种数据可以给机器喂,这个量级的数据,已经基本上涵盖了所有的用户行为类型
后续见二篇...