百度统计访客标识码详解

相信很多SEM推广人员都知道,百度凤巢系统的工具中心里有一个商盾系统。该系统每天会自动过滤无效点击,被过滤的无效点击不收费。那么百度判定无效点击的规则到底是什么呢?其实这里就用到了,百度统计里大家经常会关注到的一个东东“访客标识码”。最近在学习PHP的过程中,对这个访客标识码有了进一步的了解。思考了很久,今天就跟大家分享一下我的经验心得吧。

百度统计的访客标识码官方概念

在百度统计后台并没有对“访客标识码”概念的说明,但是百度统计的帮助中心里,倒是有一个简单的介绍。访客标识码是标记访客唯一身份的一串符号,类似于访客身份证。

这个概念说明非常的模糊,说了等于白说。根据进一步的实验,慢慢揭开了这个访客标识码的真面目。

访客标识码是基于浏览器的

这个实验做起来很简单:同一台电脑,用两个不同类型的浏览器访问同一个网页,就会发现自己的访客标识码已经发生了变化。客户通过浏览器访问网页后,百度统计的JS脚本会通过GET请求获得浏览器的版本信息。稍微有点web开发知识的人,会发现这个访客标识码实际上跟cookie很像,或者说他就是一个cookie。

更精准一点的设置是,将操作系统版本、浏览器版本、屏幕分辨率、屏幕颜色等都作为参数。如果访客仅仅是用VPN改变了自己的IP地址,但是本地的操作系统等参数并未改变的话,依然可以确立他的身份。

仅仅根据浏览器的信息来生成访客标识码的话,服务器需要生成更多的访客标识码,会带来额外的服务器开销。好处则是,对访客的标识会更加的灵敏。

根据百度推广搜索词分配访客识别码

同IP同操作系统同分辨率同浏览器访客识别码不同

如图所示,该访客一天内六次通过搜索高价词进入本站的竞价网站。百度统计显示该访客的信息:

1,IP地址为同一个IP;

2,浏览器均为遨游浏览器;

3,屏幕分辨率均为1366*768;

4,屏幕颜色均为32-bit色;

5,操作系统均为win8;

6,恶意点击时间为同一天;

7,nginx的网站日志里也没有显示其使用了代理,IP地址为真实IP;

但是访客识别码并不相同,显然访客识别码还有其他未知参数。唯一不同的就是客户的搜索词,连续三次搜索了同一个搜索词,百度统计给与的访客识别码是相同的。但是隔了一段时间搜索了其他词以后,再搜索之前的搜索词,给出了并不一样的访客识别码。由此可见,百度给予相同IP多次访问,给予访客识别码的几率非常的高。

大概为了配合百度凤巢系统的商盾更加精准的识别恶意点击。访客识别码增加了一个条件判断语句,如果客户是通过百度搜索过来的,则根据搜索词分配不同的访客识别码。不同时间段搜索相同的搜索词,分配不同的访客识别码。

这个cookie信息只在百度统计后台显示

找了好多天,在各个版本浏览器的header信息里都没有找到这个cookie。可能是出于安全的考虑,访客标识码只在百度统计的后台显示。

参数不变访客标识码不变

上文提到访客标识码是基于浏览器版本等参数的,如果这些电脑信息不发生变化的话,访客标识码是长期有效不会发生变化的。这对于确定用户的身份,是非常有用的。同一局域网内,相同IP不同电脑的身份也可以由此确立。

如果积累大量历史访问数据,长周期内发现某访客经常更换IP地址点击百度推广广告,则是恶意点击无疑。苦逼的是,百度统计只有十天的记录。

访客标识码是百度商盾防恶意点击的核心参数

百度统计的官方帮助中心明确提示,如果在同一时段,出现了访客标识码相同,但是IP地址不同,通常是恶意点击。这类恶意点击,统计只是将所有到访的情况作了记录,但是风潮系统的后台并未计费。由此可见,访客标识码是百度商盾防恶意点击的最为重要的参数。

猜测百度商盾防恶意点击的策略

根据对百度统计和百度商盾防恶意点击的实时监控,我个人猜测百度商盾防恶意点击的策略有如下几种:

策略一,在特定时间段(比如说1个小时内或者半个小时内),访客标识码相同,IP地址不同的点击全部视为恶意点击;

策略二,在特定时间段,访客标识码相同,IP地址相同的部分点击视为恶意点击;

百度商盾的后台,有一级过滤点击量和二级过滤点击量两个过滤级别。目前来看,策略二过滤的恶意点击,都是归类到一级过滤中的。

百度商盾防恶意点击系统的缺陷

第一,该系统是基于浏览器也就是访客标识码的,如果更换浏览器并且使用VPN恶意点击的话,商盾系统无效;

第二,远程连接到服务器,利用服务器的VPN进行恶意点击的行为,商盾系统无效;

第三,对于分布式的人为恶意点击,由于IP地址和浏览器都不同,商盾系统无效;

第四,对于周期较长的恶意点击,商盾系统很无力;

第五,百度统计的访客标识码只保留十天,通过历史数据挖掘恶意点击很无力;

由此可见,做百度推广的企业,引进更为先进的防恶意点击系统是非常有必要的。企业可以通过开发自己的防恶意点击系统,来增加对在线广告系统的保护。仅仅依靠百度自身的防恶意点击系统,是绝对不够的。(来源:文武双全)

THE END