网络信息技术的逐步发展,推动了数字广告的快速地增长。与此同时,广告黑灰产也已形成上下游分工、配合密切的产业链,不仅经济上令广告主遭受损失,心理上也令广告主们倍感煎熬,同时更摧残市场之间的竞争秩序。广告作弊(特别是归因欺诈)便是广告黑灰产中的核心问题。
根据腾讯灯塔《2018年广告反欺诈白皮书》显示,2018年黑产流量占比在 15% 左右[1];根据主要服务出海业务的商汇量科技Mobvista《移动广告反作弊白皮书2.0》显示,黑产流量占比在 11% 左右[2];根据占全球份额65%的三方平台AppsFlyer资料推算,接入的黑产流量为13% 左右[3];根据腾讯安全联合腾讯防水墙发布《2021年移动广告反欺诈白皮书》,2021年广告主因欺诈致损高达220亿人民币,这一数字比2020年预估的180亿增加了22%。这些数字背后所体现的是广告作弊的频发以及有效风控、维权的困难。
检索案例发现,无论是国内还是国际,与广告作弊相关的案例少之又少,有一定影响力的便是Uber诉Fetch Media广告欺诈案(但并未走到审判这一步)和猎豹移动涉嫌归因欺诈案(最后也不了了之)。可以说,目前针对广告作弊问题从识别、风控到启动法律程序维权都存在巨大困难,众多问题有待深入研究与妥善解决。本文以CPI(cost per install)广告为例,从广告作弊的逻辑、方式与路径讲起,结合目前我国司法判例,解析有关问题的救济痛点。
广告作弊手段基本都是围绕广告归因的逻辑来进行的。常见的归因逻辑包括以下3种。
基础场景:张三正在刷A网站,看到了一个有意思的广告,这个广告宣称能够线利率借款,放款额度高。张三正好需要钱买一辆酷炫的摩托车,于是他点击了广告(Ad Click),转到了Google Play Store(或者是App Store,大同小异,存在略微不同)。张三浏览了产品介绍和评价,觉得不错,点了下载按钮(download)。下载完成后,张三打开APP(First Open/Install)开始借钱买摩托。
这个场景中的逻辑最为简单:(1)客户点击广告;(2)广告调起应用市场,客户在应用市场中点击下载以及(3)下载完成后,打开App。简言之,在此场景中,广告带来了一个安装。
现在将场景复杂化。张三正在刷A网站,看到了一个有意思的广告,这个广告宣称能够线利率借款,放款额度高。张三正好需要钱买一辆酷炫的摩托车,于是他点击了广告(Ad Click),转到了Google Play Store(或者是App Store,大同小异,存在略微不同)。张三浏览了产品介绍和评价,觉得不错,点了下载按钮(download)。开始下载后,张三收到短信,父母给了转了钱,赞助他买摩托车。此时张三已经忘了下载APP的事,N天以后,猛地发现手机里还有这么一个APP,便打开了它。
在此场景下,能否认为这个安装(First Open / Install)是这个广告带来的,取决于广告平台,也取决于N(这个N即Lookback Window,归因时间窗或称归因窗口期)。一般来说,点击Google Ads广告后30天以内,产生的安装认为是Google Ads带来的(即Google Ads的归因窗口期是30天);而其他广告平台是(点击后)7天内。
因此在上述场景中,如果是广告点击8天后才打开App,则认为这个安装是Organic(即自然流量,这个安装不是由任何广告带来的)。但如果在7天内(窗口期内),则这个安装是Non-Organic(非自然流量),即是广告带来的。
现在考虑另一种情形,即客户没有主动点击(click)广告。张三正在刷A网站,看到了一个有意思的广告,这个广告宣称能够线利率借款,放款额度高。张三正好需要钱买一辆酷炫的摩托车。但是张三并没有点击广告,而是打开Google Play Store(或者是App Store,大同小异,存在略微不同)。张三浏览了产品介绍和评价,觉得不错,点了下载按钮(download)。下载完成后,张三打开APP(First Open/Install)开始借钱买摩托。
另一个核心问题是,什么能够定义为一个“View”?对于Facebook,广告的任意一个部分出现在你的屏幕上就算一个“View”。对于Google,如果是展示广告,广告的50%展示超过1秒钟会被认为是一个View(如果广告超过一定尺寸,那么30%的部分超过1秒钟就算一个View)[4]。
继续将场景复杂化。张三正在刷A网站,看到了一个有意思的广告,这个广告宣称能够线利率借款,放款额度高。张三正好需要钱买一辆酷炫的摩托车,于是他点击了广告(Ad Click),转到了Google Play Store(或者是App Store,大同小异,存在略微不同)。张三浏览了产品介绍和评价,觉得产品不怎么样,于是并没有下载。一两天后张三刷到了同一个产品的另外一条广告,他考虑了一下,点进去下载了App,并且打开了该APP。这时应该算哪个广告带来的安装呢?这就涉及归因模型的选择。
最后点击归因是最简单和最常见的归因模型。它将用户在完成目标行为之前最后点击的广告接触点作为唯一的贡献者。这种方法的优点是其易于理解和实施,适用于短期活动或单一广告渠道的效果评估。然而,它也存在局限性,尤其是在多渠道营销中,它可能会忽略早期接触点的贡献。
与最后点击归因相反,首次点击归因将功劳归于第一个接触点。它有助于识别引导用户首次接触品牌的渠道或广告。这种办法能够帮助广告主了解初始广告的吸引力,但同样忽视了后续接触点的影响。
线性归因模型将“功劳”在用户旅程中的所有接触点之间平均分配。它提供了一种更均衡的方法,认为每个接触点都对最终的转化有一定的贡献。这种模型适用于多渠道的复杂营销活动,帮助广告主更全面地了解用户旅程。
时间衰减归因模型认为越接近转化行为的接触点,其影响越大。它通过赋予最近接触点更高的权重来反映这一点。这种方法适合于分析用户在购买决策过程中受到的近期广告影响,尤其是在用户行为迅速变化的情况下。
U 型归因模型将大部分“功劳”分配给首次和最后一次接触点,其余的接触点获得较少的权重。这种模型反映了初次接触和最后推动转化的关键时刻,同时也考虑了中间接触点的辅助作用。
数据驱动归因模型使用机器学习和算法,根据历史数据分析每个接触点对转化的实际贡献。这种方法最为精确,但也最为复杂,常常要大量数据和高级分析工具。数据驱动归因可以识别最有效的营销组合和渠道优化策略。
目前市场中,最后归因模型是最常见的、最核心的归因模型。下文的分析也是基于最后归因模型。
在全部广告作弊类型中,作弊者能够伪造在归因中使用的任一或两类“信号”(Signal)。这两类信号分别为广告交互(例如查看或点击)和应用活动(例如安装)。在此基础上,我们将广告作弊分为伪造广告交互(即归因欺诈,Spoofed Attribution)和伪造用户应用内活动(即伪造用户,Spoofed Users)[6]。
归因欺诈,也称Attribution Fraud、Spoofed Attribution、归因作弊、抢归因,是利用归因逻辑上的一些漏洞进行作弊的手段,通过发布虚假的曝光(View)/点击(Click),劫持线. 点击欺诈(Click Spamming)
点击劫持也叫安装劫持(Install Hijacking),即广告作弊者在手机上安装监听程序,只要有App安装就给归因平台发消息,声称用户点击了自己的广告。如果平台采用Last-Click归因方式,则收益被恶意作弊者获得[11]。
点击劫持给相关主体造成的损失高,危害程度也大。流量一般是广告主从正规渠道买来的,而这些渠道一般是按照CPC(Cost per Click,按照点击收费)或者CPM(Cost per Mille,按照展示收费)计费。因此这些流量实际上,广告主已经付过费了,但是因为又归因给了这些欺诈流量,广告主还要再付一次钱给欺诈流量主。或者流量本是免费的自然流量,但是被劫持后却得付钱给欺诈流量主[13]。
伪造用户发生虚假应用内活动,常见的种类包括模拟器、设备农场(Device Farms)和SDK伪造。
模拟器指的是作弊者通过自动化脚本或计算机程序模拟真实用户的点击、下载、安装甚至是应用内行为,伪装成为真实用户,从而骗取广告主的CPI等预算。其特征是IP离散度密集、新设备率过高、用户行为异常、机型/系统/时间等分布异常等。
设备农场指的是广告作弊者购买大量真实设备做广告点击、下载、安装和应用内行为,并经过仔细修改设备广告跟踪符等方式隐藏设备信息[14]。其特征是是IP离散度密集、新设备率过高、用户行为异常、机型/系统分布异常等。就损害程度而言,其具有一定的杀伤力(虽没有点击劫持程度高),根源在于流量主花钱买了一堆没有后续行为的“僵尸”流量,并且不单要向流量主付费,还要给MMP付费。
SDK伪造是指广告作弊者通过执行“中间人攻击”破解第三方SDK的通信协议后,在没有一点实际安装的情况下,使用真实设备的数据来发送虚假的点击和安装,以此消耗广告主的预算的作弊行为[15]。SDK sproofing是最近几年新出现的欺诈方式。核心逻辑类似于网络安全里的重放攻击。对于MMP来说,无论是Install也好还是Event也好,所有的监测数据都基于SDK向Server发送的SSL加密链接。破解了这个就等于可以凭空地向服务器发送不存在的数据[16]。SDK伪造的特征是广告主后台数据和第三方数据不符。
SDK伪造造成的损害程度颇高。SDK伪造具有更高的隐蔽性,例如有些新型SDK恶意刷量子包,使黑产分子可以在用户完全无感的情况下,进行广告点击量和曝光量的刷量操作。恶意SDK主要承担着搜索关键词、亿量广告自动点击以及网页访问等刷量任务。其一旦入侵,用户应用设备将沦为流量黑产的刷量“肉鸡”。曝光量和点击量的异常,将导致广告主的大量广告费用流入黑产“口袋”。因此,造成营销资金损失的同时,可能还将导致广告主对广告效果的误判,,将对品牌和企业的营销决策带来负面影响[17]。
本文所讨论的广告作弊并不等同于“刷量”(采用人工手段或技术方法为己方增加粉丝量、点赞量、好评、人气等),也不等同于“流量劫持”(即行为人通过技术方法诱导或强制用户访问特定网站或网页,从而造成他人流量损失的行为[18]),广告作弊实际是利用广告归因的逻辑与模型实施的欺诈行为,根本目的是通过(1)虚构的点击(Click)、展示(View);(2)从其他投放平台盗取的或点击(Click)、展示(View);或者(3)将自然流量错误归因等方式骗取广告主的广告费用,而这一行为本身亦可能损害市场内的同业竞争者(特别是当广告主在多个平台投放广告,作弊者从其他投放平台盗取的或点击、展示或安装),进而损害市场之间的竞争秩序。
甲、乙公司(甲公司为甲方,乙公司为乙方)签订《线上广告投放框架协议》,约定2022年4月26日至2023年4月25日期间乙公司对甲公司产品做线上推广,按照有效授信用户计算广告费用,有效授信用户的结算数据以甲方后台系统统计数额为准,结算周期为一个自然月,当月6日双方对上一结算周期内所有数据来进行对账并出具数据清单。随后乙公司以甲公司未支付2022年12月至2023年2月广告服务费及利息约120万元为由将其诉至深圳市南山区人民法院。甲公司在案件中提起反诉,主张乙公司在推广过程中存在数据作弊行为,严重违反协议约定,主张乙公司应当退还服务费约320万元,并赔偿违约金约620万元。为证明乙公司存在数据作弊行为,甲公司提交了司法鉴别判定所出具的司法鉴定报告,报告内容显示甲、乙公司合作期间产生的广告数据存在不正常的情况并分析可能原因。而乙公司则主张甲公司未在案涉合同约定的异议期提出异议,并对甲公司在司法鉴定中提供数据的真实性、完整性提出质疑,从而否认其存在数据作弊行为[19]。
其二是江苏三步科技股份有限公司(以下简称“三步公司”)与网易传媒科技(北京)有限公司(以下简称“网易公司”)合同纠纷案(以下简称“三步公司与网易公司合同纠纷案”)。2014年12月,网易公司(甲方)与三步公司(乙方)签订《推广合作协议》,约定甲方在乙方推广平台推广甲方享有权益的手机应用软件“网易新闻Android 客户端”,因网易公司未支付2015年11、12月推广费,三步公司将其诉至法院,网易公司以三步公司存在刷量作弊行为提起反诉。根据双方《推广合作协议》约定,数据统计以网易公司服务器数据为准,允许三步公司以指定方式进入该系统核实数据。为调取合格检材,一审法院主持主持双方到网易公司服务器上提取了2015年10月1日至12月31日三步公司履行涉案合同约定的推广义务产生的数据(包括设备类型、用户ID、IMEI、MAC、开始时间、结束时间、网络类型、IP、运营商、渠道、日期),并将数据交由电信终端产业协会协助调查其中的TAC码与对应的手机型号是否真实。该协会回函称,其将该院提供的825747条数据记录与全球移动通信系统协会IMEI数据库进行了对照分析,结果为:TAC存在且与型号相符的记录为14365条,TAC不存在的记录为741071条。
该案值得借鉴的核心内容是:是不是能够使用分析手机IMEI码中TAC的真实性及与手机型号相不相符的方式来判断推广数据的线)三步公司为网易公司推广的是手机应用软件,并以在一个手机上安装好并启动作为一个有效激活用户,因此每个有效激活用户数据中必然包含其使用电子设备的有关数据,故以手机有关数据作为核查的基础,有事实依据。
(2)据电信终端产业协会网站上介绍,电信终端产业协会系我国移动终端设备IMEI码的核发与管理机构。IMEI码即国际移动电子设备识别码,用以标识TD-SCDMA、WCDMA和GSM制式的移动终端设备,使每一个移动终端都具备全球唯一的设备识别号。同时,根据2001年11月15日开始实施的《移动电话机商品修理更换退货责任规定》,移动电话机销售者在销售时,应当开箱检验,正确调试,当面向消费者交验移动电话机商品;核对移动电话机主机机身号(IMEI串号)和进网标志、附件的出厂序号(批号)、产品商标和型号;提供有效发货票,有效发货票应当注明主机机身号(IMEI串号)、附件的出厂序号(批号)、产品商标及型号 、销售日期、销售者印章 、金额等内容。因此,每个有效激活用户的手机数据中应当含有IMEI码,并且该码应当具有唯一性。
(3)根据IMEI的编号格式,其包含有移动终端型号分配码TAC。真实的推广行为所产生的数据中,手机的TAC应当与电信终端产业协会核发的一致,且与其手机型号相符。由此,通过对推广过程中产生的IMEI数据中TAC是否真实存在还有是不是符合其手机型号进行分析,可以对IMEI数据的真实性作出判断。而电信终端产业协会作为我国移动终端设备IMEI码的核发与管理机构,对IMEI数据的判断具有权威性和客观性。
如上文所述,广告作弊造成的最大损失在广告主一侧(包括金钱上的损失和商业策略上的长远负面影响),损失相对较大的是竞争广告平台/流量主(当另一平台/流量主采取作弊手段,将应归因于一方的数据“抢夺”,必然导致该方的经济损失)。但无论是广告主一侧,还是广告平台/流量主一侧,其蒙受损失后的经济均存在致命痛点。
上文所谈及的两个案件中,广告平台/推广平台均以“数据异议期”作为抗辩理由,即广告主并未在约定的异议期内提出异议、已支付相应推广费用。在某金融借贷类APP案中,审理法院认为,虽然双方就推广费用结算周期及方式做出约定,但并未限定甲公司核查存在恶意刷量行为的期限,基于数据核对具有一定的滞后性,甲公司在结算后提出异议具有合理性。在三步公司与网易公司合同纠纷案中,一审法院参照买卖合同检验期间规定确定买量交易合同的数据异议期,认为双方未限定对刷量数据的核查时间,网易公司主张其于2015 年11 月发现数据有问题,随即开始启动对合同履行期间所有数据的核查,并于2016 年3 月通知了三步公司,属于在合理期限履行了通知义务。同时,基于合同履行需遵循诚信原则,网易公司在结算后依然有权核对相关数据。
然而,也有部分法院基于数据异议期超期而未认定存在作弊行为的。例如北京派瑞威行互联技术有限公司(以下简称“派瑞公司”)等与爱普互动(北京)科技有限公司(以下简称“爱普公司”)合同纠纷案(以下简称“派瑞公司与爱普公司合同纠纷案”)中,双方争议焦点就是数据异议期。派瑞公司(甲方)与爱普公司(乙方)签署《合作协议》,约定由爱普公司推广唯品会软件产品,爱普公司因派瑞公司未支付2016年3、4月推广费而将其诉至法院,派瑞公司辩称爱普公司刷量作弊,未履行推广义务。一审法院指出,唯品会公司有充足时间以及可利用的技术方法进行反作弊筛查,但直至爱普公司起诉前亦未告知其存在作弊、刷单的情况[22]。该案中,唯品会公司虽然出具了结算说明提出经反作弊系统筛查后爱普公司实际应获得的结算金额以及提供了数据筛查的公证书,但均因超过协议结算节点而未被法院认可[23]。
很大一部分广告主并没有健全的反欺诈/反作弊体系(无论是技术层面,还是法律风控层面),导致其数据核对的滞后与发现异常数据的滞后。如果协议中未妥善预留和约定数据异议期,如未进行妥善数据核对,如在发现数据异常的蛛丝马迹后进行及时反馈,则极可能给予广告平台/推广平台/流量主机会以数据异议期已过且已进行结算为由,摆脱责任。
数据的异常,往往要鉴别判定。在三步公司与网易公司合同纠纷案中,为调取合格检材,一审法院主持主持原被告双方到网易公司服务器上进行提取。但更常见的现象是,双方对数据鉴定的客观性与真实性存在巨大争议。新浪财经移动网络科技(北京)有限公司(以下简称“新浪财经公司”)与新普互联(北京)科技有限公司(以下简称“新普互联公司”)服务合同纠纷(以下简称“新浪财经公司与新普互联公司合同纠纷案”)中,喀什百思公司(乙方,再审时已注销,其相应诉讼权利义务由唯一股东新普互联公司承担)与新浪网公司(甲方)签订《新浪新闻-互联网推广合作协议》(以下简称《协议》),约定甲方在乙方推广平台推广甲方软件“新浪新闻”。2017年,新浪网公司针对该《协议》的权利义务转让给微海公司,微海公司更名为星潮闪耀公司。喀什百思公司以星潮闪耀公司未支付2017年8月至10月服务费为由将其诉至法院,星潮闪耀公司在诉讼中提出喀什百思公司存在数量作弊行为[24]。该案的核心争议点就是数据鉴定的客观性与真实性。一审中,法院委托鉴定中心对存储在星潮闪耀公司系统中的相关广告数据来进行鉴定。但鉴定中心因无法确定相应的鉴定检材及双方技术约定或单方技术要求而终止鉴定,星潮闪耀公司亦未能提供其他有效证据证明数据造假,一审败诉。二审中,星潮闪耀公司自行委托评估机构并提交相关数据鉴定报告,同时积极采取申请恢复司法鉴定,申请通知专业知识人员、一审鉴定人员出庭等措施。但二审法院以星潮闪耀公司提交鉴定报告为单方委托,检材未经法庭质证,未经对方当事人认可等原因未采信该份报告[25]。在该案中,星潮闪耀公司与喀什百思公司已约定数据结算方式,但鉴别判定中心基于双方未就流量真实性的技术标准进行约定,亦未能在诉讼中就该标准达成一致意见而拒绝鉴定,导致星潮闪耀公司无法就其主张提供最为关键的证据。可见,如未妥善约定流量真实性的技术标准,也将导致广告主的救济困难。
有时,公司部门发现流量有问题、数据异常,但是背负着KPI压力(例如缩减CPI、CPS),可能会“睁一只眼,闭一只眼”继续划拨预算。更有甚者,鉴于广告作弊黑灰产的高利,不能排除个别人即使发现数据异常,仍然放任,以换取“汇报”。这一些状况无疑严重增加广告主的维权难度,也都是广告作弊的救济痛点。
广告作弊系基于技术的隐蔽行为(虽然根据作弊方法的不同,隐蔽性存在差别),在此情况下,凭借民事主体一己之力,几乎不可能掌握上述三方面证据以有效形成证据链。
通过上文的分析,能够准确的看出广告作弊的治理需要深层次、多维度考量,包括制度、技术、法律相结合,也包括内部风控与外部治理机构相结合。目前多家互联网头部机构均推出了“广告反欺诈”、“广告反作弊”方案,在具有预算的情况,可优先考虑将其作为技术层面的后盾之一,以弥补内部监测的滞后。同时在内部制度层面,也应建立、健全广告反作弊的内部风控体系。特别是对于尚不采购第三方反作弊技术服务方案的企业,自身风控体系的合理性与能力至关重要。此外,在法律层面,对涉及广告推广的合同把关,发现数据异常时取证的指导与建议,日常法律宣贯,乃至发生纠纷后的诉讼策略把握,都可以有明显效果地缓解企业维权的困难、消除一定的阻碍。目前司法实践中对于广告作弊问题的判例与研究尚少,对有关问题的深入理解更极为困难,笔者也将持续关注,并结合新的立法、司法趋势做再研究,以期寻找到广告作弊的更优救济方式,缓解相关痛点。
【3】参见《广告反作弊:媒体作弊产业链篇》,,最后访问日期:2024年11月17日。