新博客开张三天,google收录了。可是看了一下收录的页面,Betty又汗了。Betty明明已经在robots.txt里面写了Disallow: /*.php$
Disallow: /category/*/*

也提交了xml格式的sitemap,避免它收录重复内容和后台页面,可是google的收录结果里面还是有blog.myfairland.net/tech/wp-login.phpblog.myfairland.net/tech/category/blog/这样的页面。

Betty的上一个blog也是这样,在有robotx.txt和sitemap.xml的情况下,google开始收录时仍然收录了这些被禁止的页面,过了一阵子时间才消失。好像google在收录的最初是不看robots.txt和sitemap.xml的,过一阵子之后才会处理。正如那句常见的话,“您的提交我们已经收到,处理可能需要数小时乃至数天的时间”。google收录页面和处理robotx.txt、sitemap.xml等文件可能不是同步的。

本文作者:Betty | 本文地址: http://myfairland.net/google-disobeys/
本站文章除特殊标明者外均为原创,版权所有,如需转载,请以超链接形式注明作者和原始出处及本声明

同标签的文章

  • 豆瓣友邻广播分类的Chrome扩展
    写了一个简单的豆瓣友邻广播分类的Chrome扩展。效果如图: 说明: “写了”包括写了日记、写了博客、写了影评等等 “讨论”是在书影音的论...
  • 绝对必需的Chrome扩展
    这里介绍的都是绝对必需、少了就几乎没法用的Chrome扩展。那些炫酷的、有固然好、没有也无妨的扩展,以前我也装了很多尝鲜,但是渐渐就很少用了。Chrome的多进...
  • Google Wave的失败
    Google宣布不再开发Wave是前几天的新闻了,我本来不想写它,但一直觉得心绪难平,终于决定还是为它写点东西吧,毕竟我之前对Wave期望值很高的。下面是我觉得...
  • PageRank升到4了
    听说Google PageRank更新了,我就顺手查了一下这个博客的PR,发现居然涨到4了。还是挺出乎我意料的,本来以为撑死了也就到3呢。PR为4的网站有我这么...
  • 支持谷歌,献上一副对联
    为了近日Google被逐之事,我胡诌了一副对联: 驱贤逐能,失虚谷之海量; 耳塞目闭,惟长歌以当哭。 联中嵌了“谷歌”二字。上联说统治...

One Response to “Google为什么不听话呢?”

  • [...] google官方blog的沙发暂时是抢不到了……原来Google虽然收录了Betty的这个博客,但goole的博客搜索还没收录这个blog呢,而根据这篇文章的说法,google blog上列出的”links to this post”(链接到这篇日志的日志)并不是根据pingback或trackback,而是根据google blog search里收录的反向链接……Betty的博客还没被google博客搜索所收录,博客本身都搜索不到,反向链接就更搜索不到了,当然也就不会显示在”links to this post”里了 [...]

发表评论