使用Google网站管理员工具删除错误页面
前面几篇关于本博流量的文章已经将本文的写作前提交代得很清楚了,这里就不再赘述为什么要这么做。前面在慎用Global Translator中我曾提及,可能会写一篇图文教程,讲解如何在 Google 网站管理员工具执行删除错误网页的步骤,今天我就把它写出来。删除之前需要做的工作请参考慎用一文。
1、使用 Google 账号登陆网站管理员工具,进入要管理的网站,在左侧的控制台展开"故障诊断(Diagnostics)",选择"抓取错误(Crawl errors)",在右侧的标签页中,打开"找不到(Not found)"。

抓取错误(大图)
在这里你可以下载网站的所有错误页面表和错误源(CSV格式),其中后者能够判断错误来源。另外可以查看错误页面最近出现的时间,可以作为删除排序的依据。复制好错误页面列表,下一步使用。
2、在控制台展开"网站配置(Site Configuration)",打开"抓取工具访问(Crawler access)"

在这里选择删除整个网站、错误网址、目录等等。我采取的措施是首先将 Global Translator 生成的缓存目录删除,例如http://louishan.com/ar/;然后将最近出现过的错误页面进行删除,例如http://louishan.com/el/articles/tag/evernote-3-5。

3、添加之后,状态会变成"待定(Pending)",如果 Google 检测到你添加了仍然存在的页面,会立即拒绝你的请求,否则一般第二天就会处理。

删除以后状态变成"已删除(Removed)",如果出现了错误删除(一般不会出现这种情况,如果页面存在 Google 会拒绝你的请求),或者你重新添加了某些页面,可以"重新添加(Reinclude)"。

虽然这是一个非常简单的工作,但是因为我一着不慎,结果目前 Google 统计到的错误网页数已经达到了223页,很庞大的数字了,所以这其实不是技术活,而是体力活。其实现在的中文到西文翻译工具,根本就无法翻译出有价值的东西,而且它们既然都是调用 Google 的翻译工具,为什么不直接放个 Google 的翻译插件呢,不占资源,绿色免费。




2009/10/10 19:50:54
你用的东西都是英文的?
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:45 下午
@小强, 大部分都是吧
[回复]
mimzyx 回复:
十月 10th, 2009 at 11:44 下午
@Louis Han, 自卑ing。。。
[回复]
2009/10/10 19:54:53
添加网址是个体力活啊,那些通配符又不知道支持不,我以前就是,最后我也懒的删了,等Google自己清处。
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:47 下午
@SErHo, 不知道通配符,只能一个个来
本来想删除整个文件夹呢,结果不好使
[回复]
2009/10/10 19:57:32
最近有许多错误,没有心思去排除啊。
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:47 下午
@我想想, 如果不是很影响流量也无所谓的
[回复]
2009/10/10 20:05:23
我就三、四个,不管了
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:48 下午
@zrqx008, 那道用不着吧 呵呵
[回复]
2009/10/10 20:31:41
google管理员工具要好好用,我的站没那么多404,再加上自己弄个404页面,很不错的说。
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:50 下午
@程哥哥, 嗯,我也是在慢慢学啊
[回复]
2009/10/10 20:34:58
这个工具还真没发现过,自己好像并不怎么在意这些东西!要改正观点呀!
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:50 下午
@kevin, 我也是刚刚发现的呢
[回复]
2009/10/10 21:22:42
赞一个,向你看齐!!!
[回复]
2009/10/10 21:57:51
这功能还没用过~~
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:51 下午
@Lc., 一般人不需要吧 如果不像我那么多的404
[回复]
2009/10/10 22:26:03
恩,这个功能不错,我也用过,如果百度也有这功能就好了
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:56 下午
@万戈, 百度有也得花钱才能用
[回复]
2009/10/10 22:45:36
呵呵
我也是难得删除直接写个robot
[回复]
Louis Han 回复:
十月 10th, 2009 at 11:00 下午
@浩子, 写完robots之后再删除
[回复]
2009/10/10 22:46:06
不错,非常有用的功能啊!
[回复]
Louis Han 回复:
十月 10th, 2009 at 11:01 下午
@TTT BLOG, 嗯,对我现在的情况来说,非常有用
[回复]
2009/10/11 00:22:10
很不解,这种错误的页面是怎么产生的呢??
[回复]
Louis Han 回复:
十月 11th, 2009 at 12:36 上午
@MuMu'S, 以前用过Global Translator插件,后来删除了
[回复]
2009/10/11 01:04:16
原来可以直接删啊,我原以为只能通过robots.txt呢
[回复]
Louis Han 回复:
十月 11th, 2009 at 4:33 下午
@kangzj, robots只能禁止以后收录,之前已经收录的可以删除
[回复]
2009/10/11 01:18:41
我懒得删除
[回复]
Louis Han 回复:
十月 11th, 2009 at 4:33 下午
@蓝冰, 你还真懒。。404也是耗流量的啊
[回复]
2009/10/11 11:19:34
挺实用的。不过在具体操作之前,一定要理清操作思路。
[回复]
Louis Han 回复:
十月 11th, 2009 at 4:35 下午
@对啊博客, 是啊,得明确要删除的东西,不过出了错google还是会给你机会改正的
[回复]
2009/10/11 16:26:42
我也应该去试试看~
但是估计不多~
[回复]
Louis Han 回复:
十月 11th, 2009 at 4:40 下午
@exia, 像我这样有这么多的,都是不小心引起的
[回复]
2009/10/11 21:14:45
貌似不错,以后用得着,先留个记号!
[回复]
Louis Han 回复:
十月 11th, 2009 at 9:32 下午
@Lxhome, 偶尔会用的到
[回复]
2009/10/11 23:27:39
我一直没怎么理,看来得去看看了。
[回复]
2009/10/12 22:27:28
Google最近对我很不屑~~收录一直减少~~唉
[回复]
Louis Han 回复:
十月 12th, 2009 at 10:56 下午
@老饕, 你肯定是得罪google了
[回复]
countmeon 回复:
十月 13th, 2009 at 8:53 上午
@老饕, 我也是,无奈啊
[回复]
2009/10/12 22:56:43
原来没注意这些东西,还是要关注一下了。
[回复]
Louis Han 回复:
十月 12th, 2009 at 11:14 下午
@酷口, 如果流量异常,可以关注一下
[回复]