从百度取消referer关键词说起

2015/06 29 15:06

。其实在百度站长平台的消息放出之前,已经有敏感的站长从日志中发现了端倪,并对百度此举进行了准确预测。现在消息正式颁布后,很多站长都对此表现 了看法,学院选择了其中一篇进行分享,但由于内容比较敏感,作者不愿透露自己的姓名,遗憾之余我们希望这位朋友今后可以在学院进行更多分享,和大家一起成 长。

在2015年5月15日星期五这个七千年一遇的日子,百度站长平台挂出公告《百度将逐步取消referer关键词显示 站点数据更安全》,一个简短的公告,关注和讨论的人似乎不多。不过这可能会是一件影响深远的事情。

 一、百度做了什么

  a)从百度https化说起

实际上这件事情的开始要从几个月前的羊年春节说起:百度选择在流量比较小的春节期间,悄然把搜索全站切换到https。到现在百度已经是全站 https化。大家都知道https比http更加安全,不带“S”的http在传输过程中是明文的,也不对传输双方进行验证,在传输过程中的任何一方都 可以对数据进行修改。

说个段子:一个黑客黑下了一个妹纸的路由器,看到妹子正在刷微博,于是找到了妹子的微薄账号。还给妹子的浏览器弹窗说:早点休息。

  HTTP传输过程中不仅内容是明文的,传输层还可以把修改的内容返回给用户。在百度启用HTTPS之前,DNS劫持这件事情在中国广泛存在。在这一方面有许多灰色利益链,比如说:

● 直接劫持跳转(例如上淘宝A商品页面会先跳到某个B商品页面)

● 上网的时候给你在URL后面加个小尾巴(比如在百度url后面加个tn=,百度是要为这个流量来源付费的)

● 嵌入一段js或者一个iframe给你弹广告

● 修改网页中的广告联盟ID,窃取其他站长的联盟收入

● 修改cookies中的一些信息,创造成不存在的广告(例如用户是直接进入淘宝的,但是经过修改referer和cookies被当成淘客来源进入的)

● 修改百度搜索结果中的竞价排名甚至自然排名

● 分析你的上网行为,把你的数据出售给第三方:有人搜个“人流”以后收到医院打来的电话

以上只是列举一些常见的行为,实际还有更多花样,都触目惊心。事实上百度每天要处理很多这类投诉:

 

 
  百度在收到无数用户投诉之后,决心解决这个问题。于是就有了后来的百度全站HTTPS的出现。

 b) 什么是REFERER?

REFERER全称是:HTTP(s) REFERER。这个东西在HTTP的header中,浏览器Referer用来告诉服务器我是从哪个页面链接过来的,服务器籍此可以获得一些信息用于处理。

 c) 为什么要取消REFERER中的关键字

在百度HTTPS化之后,百度决心在隐私保护上更进一步。但是为什么是取消REFERER中的关键字?

虽然百度对全站做了HTTPS加密,但是从百度跳转到目标页面的时候,是带着REFERER的,DNS劫持者通过分析跳转到页面的REFERER,还是可以轻松的推算出在这之前,你搜了什么。基于这一点,DNS劫持者还是可以针对用户做很多事情,比如:

● 根据搜索行为展示广告

● 把你的行为做成接口提供给一些网盟用于精准展示广告

● 分析搜索行为形成报告出售

这一次百度取消了REFERER中的关键字,而不是取消REFERER。这样做以后:站长只知道这个用户来自百度,但是不知道从百度搜哪个词过来的。虽然我是站长,不过我相信任何一个用户都会赞成百度这样做。

 二、 各方利益影响

  a) DNS劫持者和一些公共WIFI

首当其冲的应该是DNS劫持者和一些公共WIFI。虽然他们可以继续通过百度以外的其他渠道继续劫持用户,但是百度这块的利益已经彻底被掐断,具体情况大家可以通过我前面的分析自行脑补。

b) 一些实力差的网盟将退出历史舞台

许多号称有大数据背景的网盟本质上来说,都是从百度的搜索行为拿数据。从百度启用HTTPS,取消REFERER中的关键字以后,大量依靠这款 数据的网盟公司在短期内广告展现质量会迅速下降。还有有一些广告联盟的大块广告分销商就是做DNS劫持的,这些网盟恐怕以后日子更不好过了。

 c) 统计工具

无法获取REFERER中的关键字以后,除了知道一个流量来自百度以外其他无从知晓。所以百度的搜索份额还是保留在统计中的,但是无法基于此做进一步分析了。两方面来说:

● 统计流量任何一个工具都做得到,统计关键词就只剩下百度统计工具和百度站长平台的搜索关键词工具了。失去关键字统计功能,会越来越多站长会转向百度自家工具,这是无疑的。

● 缺失搜索数据的统计工具,是挖掘不出多少价值的。而挖掘价值恰恰是第三方统计工具的生命。

所以说,第三方统计工具恐怕要成为一大输家,陷入统计质量下降和流失用户的恶性循环中。

 d) 对中小站长影响不大

作为一个站长,我当然关心自己的利益。百度关上一扇门,却打开两扇窗。站长还可以通过百度统计和站长平台分析来自百度的流量。所以这件事情处理的好,其实没什么影响。

● 可以通过跟百度统计交换数据,了解自身从百度来的流量情况。而且更大的好处是:让百度知道你是一个优质、守规矩的站长,让百度知道你的运营情况,百度可能给你更好的权重(也许百度排名有参考百度统计的数据,谁知道呢)

● 如果不想用百度统计,还可以通过百度站长工具。从我个人的经验看:站长平台不仅提供了展示关键字,还告诉站长每个词的点击率和平均排名。这份关键词报告虽然没有明细,但是指出了优化的方向。

取消referer以后,第三方统计工具依旧可以统计到来自百度的总量,但是缺失了关键词细节。而百度统计和百度站长平台刚好补上这块数据。

 三、 总结

从百度全面启用HTTPS到逐步取消REFERER中的关键词,这个过程中牵涉到的群体是巨大的。各方利益都牵涉其中,而百度必须做出抉择。迈出这一步还要背负一些压力:

● HTTPS比平时耗费6-7倍性能,打开速度慢30%-50%。这个需要优化才能达到好的用户体验。

● 全站HTTPS需要投入更多的服务器和硬件设备。牵涉部门很多。

● 如果受到DDOS,HTTPS更难解决,而利益受损方可能对百度做DDOS

● 一些看不懂的站长会指责。除了解释,还需要做更多。可以说百度的考虑还是比较周到的,即保护了用户隐私,又给站长提供了便利,保护了站长生态圈。

我们可以看到百度为了用户体验付出的代价,这一切到最后都会转变为百度的竞争力。互联网时代,你为用户做了什么用户就会给你什么。这恐怕也是作为SEOer真正要学习和领悟的吧。

发表回复