网站建设

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

Jager · 11月1日 · 2015年 · · · 6402次已读

关注张戈博客以及喜欢转载张戈博客原创博文的朋友,应该都发现张戈博客现在的百度收录异常惨淡!而且,我还叮嘱哪些喜欢转载我博客博文的朋友,不要转载半个月内发布的文章,因为我以为几个月来百度不收录、排名下降严重的是因为我先后更换主题-->换用 360 网站卫士-->文章被人快速转载所致。

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

我发现最蛋疼、最诡异的是,我发布的文章几个月都没被收录!!!然后我也默默的在心里把度娘骂了几个月,尼玛就算被人采集、被人第一时间转载也不至于不收录啊?

可实际有图为证:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

基本从 5 月份开始,发布的文章就不再收录,索引从 4800 掉到现在 1000 左右!

期间,我各种怀疑,是不是 robots 设置有误?是不是外链 go 跳转对搜索引擎封闭等措施带来惩罚?

直到。。。直到我今天心血来潮,想试下百度的 API 搜索接口,提供 sitemap 数据才发现抓取失败。

其实,在之前我就发现所有和 sitemap 数据提交有关的功能都提示抓取失败!但是尼玛,在百度抓取诊断检测相同的链接又是成功的!!

我以为是百度站长工具出现了暂时性的问题,还反馈过:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

 

直到今天,我还又反馈了一把:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

反馈完之后,我反复去看了下这个抓取失败结果:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

结果发现都是连接超时错误,DNS 解析是没问题的,确实是真实 IP,看来不是使用 CDN 的问题:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

 

继续看了几遍之后,我偶然点开了抓取异常这个工具,一看吓一跳,每天的连接超时居然将近一半!

突然灵光一闪,连接超时,好熟悉的字眼,不是 40X,也不是 50X。。。没错,就是防火墙拦截!

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

赶紧登陆阿里云 ECS 看了下 iptables:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

看到了有 2 个网段被禁用,先尝试解封,然后回到百度更新了下 sitemap 试了下,居然成功了?!

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

我次奥!真是这个网段被禁封造成的!成功后,我特意再次更新 sitemap。并看了下 nginx 日志,发现还真是 220.181.108 这个 IP 段的 IP,尼玛,巧就巧在百度抓取诊断工具不在这个网段,可以正常抓取,迷惑了我几个月!!!

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

事后,我努力的回忆了一把当时为什么禁用了这 2 个网段。。。

记得,当时是 Begin 交流群里有个人采集我的整个博客。我当时用了各种办法禁止他采集内容中的盗图,最终他用了搜狗的图片接口来采集我博客的图片。我就不好怎么禁止了,因为搜索引擎来的 IP,CDN 是自动回源的!

于是,我图省事直接把搜狗的图片接口 IP 的整个网段都给禁封了!尼玛,当时也没想过百度和搜狗的蜘蛛节点可能在同一个机房了??另外恶狠狠的诅咒下,采集个人博客者木有小 JJ!!

几个月的时间,对 SEO 带了非常严重的影响!要不是运气好,突然想到了这么一桩,这博客的百度 SEO 就基本废了!

废了也没什么,关键不明不白,谁也不爽吧!此次解除禁封之后,相信不出一个月,应该就会有效果了,至少最新发布的文章是会被收录的,不看别的,就见证下本文一个星期会不会被收录吧!不过之前未收录却被转载走的文章算是废了,发出去虽然推送到了百度,但是百度却没抓取到内容,被人转了之后估计被识别成首次发布的原创了吧!

好了,本文算是一个吐槽贴,也是给一些网站降权、收录异常的朋友一个参考,某些时候,收录异常、网站被 K 站不一定是你 SEO 方面的问题,一定记得看看是不是服务器把蜘蛛挡在门外了哟!


后续跟进篇

2015-11-02:再去百度站长平台查看抓取异常和抓取时间,可以发现已复到正常水平:

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

太狗血了!分享一下张戈博客百度收录排名异常的检查记录

45 条回应
  1. 陌小雨博客 2015-11-1 · 1:04

    我的站点近几个月好像也一直都没有收录,不知道是啥原因呢,陌小雨谈个人博客如何应对采集和抄袭有兴趣可以来看下。

  2. 创意应用 2015-11-1 · 15:30

    哈哈,不过这么晚才发现也是有点后知后觉~

  3. sven 2015-11-1 · 21:20

    收录量一直从60到600的在变化,百度最近一直都在是心跳,投诉坐等反馈。

  4. boke112导航 2015-11-2 · 12:39

    还有这种事情啊,我的站点自从关站备案后,到现在偶尔有一篇被收录,其他的都不收录,正在苦恼中。不过好像抓取SITEMAP是正常的,继续等待看看。

  5. 星岩博客 2015-11-2 · 14:56

    博客被人采集,真的是让人头疼的事,博客不被搜索引擎收录,让人忧心。

  6. 日光博客 2015-11-3 · 13:27

    博主好,交换友情链接,可否?

  7. harries 2015-11-3 · 13:56

    哈哈,终于找到原因了

  8. 且听风吟 2015-11-3 · 14:50

    每次来你这里都能涨姿势!

  9. 小众博客 2015-11-3 · 14:57

    后知后觉 :mrgreen:

  10. 微部落博客 2015-11-3 · 16:40

    度娘就是坑货,最近发现站长工具有重新更新百度快照了,这个是什么情况

  11. 三月福利吧 2015-11-4 · 14:14

    还好博主聪明机智!!!

  12. 王英学 2015-11-4 · 16:02

    前段时间百度在收录这一块管的比较严,观察发现这星期恢复正常。应该不会有影响了。

  13. aladd 2015-11-4 · 17:11

    :sad: :sad: 采集什么的……真是醉了。 不怕被采集,就怕采集的排名还比原来好 = =

    • 爱锚记 2016-1-14 · 15:52

      孙猴子真假难辨了。 :mrgreen:

  14. 明月登楼 2015-11-4 · 21:36

    百度自身的技术不过关所以收录不对很正常的!我几乎就没有管过!

    • avatar
      Jager 2015-11-4 · 22:56

      我是把蜘蛛堵在门外了,百度技术再牛也抓不到。。。

      • 爱锚记 2016-1-14 · 15:54

        是用的轻服务器。不是虚拟主机?可以远程操作。 :cool:

  15. 外居移民网 2015-11-4 · 21:48

    厉害

  16. 牧羊人 2015-11-5 · 9:14

    噗。。。。。

  17. 黎叔 2015-11-5 · 22:00

    优秀,已经比在下优秀好多,准备采集您的文章了

  18. 张子豪 2015-11-6 · 15:24

    博主厉害。学习了。

  19. ivmm 2015-11-6 · 15:35

    百度sitemap不兼容通用,我也是醉了

  20. 摄影论坛 2015-11-6 · 15:43

    这需要有足够的知识,换成我,我就死都不会想出啥原因

  21. 交通事故律师 2015-11-6 · 20:46

    可惜了博主这几个月的流失,博主的IT技术文章写得好,图文并茂,有人采集也是正常,像我这种专业法律网站没人会采集吧,搞法律的人总不会特地请一个高手来采集吧,而且法律文章受众小,文章也带不来几个流量,所以我做的交通保险律师网也是自己的一小地耕田了。

    • avatar
      Jager 2015-11-7 · 18:55

      采集个人博客是愚蠢的行为,并没有任何意义。

      • 外文网站 2015-12-22 · 11:01

        请问博主,怎么不去在外文网站上深耕一把,感觉还是不错的?能否加下你q和你交流下,感谢!

  22. 来赚网 2015-11-8 · 9:25

    好多的人气

  23. JACK的机器人 2015-11-8 · 20:55

    这个没有丰富的经验也不容易发现问题的吧,还好博主经验丰富 :shock:

    不过对于采集,目前JACK的机器人是没有太多话说的(因为确实太无耻了......),而且会被采集主要还是因为文章质量都是比较高的原因吧......

    • avatar
      Jager 2015-11-9 · 13:21

      做采集站并不是不行,但是采集个人博客就真的太不尊重他人劳动了。

  24. 微部落博客 2015-11-8 · 23:55

    我在卢松松博客看到这篇文章了,哈哈,大神就是大神

    • avatar
      Jager 2015-11-9 · 13:23

      我这是搬石头砸自己的脚。。。

  25. 季节网 2015-11-11 · 10:50

    最近百度索引量下降 不知道什么原因

  26. 中国历史 2015-11-14 · 11:19

    我的最近收录也少了,但貌似都正常。

  27. 微童年 2015-11-16 · 14:55

    全站采集确实是不道德的,转载不留链接也是不好的

  28. 技术拉近你我 2015-11-17 · 20:48

    博主技术很牛!

  29. 影乐 2015-11-21 · 18:50

    我的博客sitemap也无法获取

  30. 夏日博客 2016-1-3 · 15:42

    只能怪采集的哪个人了,太鄙视哪种人了。。

  31. 包子 2016-1-9 · 20:41

    博主,知更鸟文章归档这个要怎么弄?是在新建页面里面吗?

  32. 爱锚记 2016-1-14 · 15:50

    博客被人人采集是好事情啊。说明网站质量比较高。我的网站不知怎么样,大家可以过来瞧瞧,提提意见。

  33. 微商货源网 2016-3-26 · 16:27

    很炫的网站,不错

  34. 江太公 2016-7-16 · 20:48

    这种追根到底,不搞清楚不罢休的态度,佩服。。。。卢松松日评100的核心在于广覆盖,利用人工,但别小看了这个简单重复的工作,重复一万次,十万次,你会了解中国大部分甚至全部博客,认识他们,至少让他们知道你,然后在很多地方碰面,于是你的知名度慢慢就有了,积累到一个零界点一爆发,O了。这就是我正在做的事儿!!花名江太公,微信:jiangtian-net-studio,微信公众号:Jiangtaigong66,那里已经雷打不动的写了114篇文章了,几乎没有中断过,这样的节奏会延续30年,10000个小时,信或者不信,我都在这里!!!!

  35. 诗梦 2017-2-12 · 15:47

    我看完了?,你怕不怕七牛镜像?

    • avatar
      Jager 2017-2-13 · 19:13

      :shock:

  36. 安静的风 2017-2-13 · 12:43

    一看就是不熟悉百度站长工具的。
    不过百度现在排名算法真的挺垃圾的。

    • avatar
      Jager 2017-2-13 · 19:03

      貌似你很熟悉似的。