使用Google网站管理员工具删除错误页面
前面几篇关于本博流量的文章已经将本文的写作前提交代得很清楚了,这里就不再赘述为什么要这么做。前面在慎用Global Translator中我曾提及,可能会写一篇图文教程,讲解如何在 Google 网站管理员工具执行删除错误网页的步骤,今天我就把它写出来。删除之前需要做的工作请参考慎用一文。
1、使用 Google 账号登陆网站管理员工具,进入要管理的网站,在左侧的控制台展开"故障诊断(Diagnostics)",选择"抓取错误(Crawl errors)",在右侧的标签页中,打开"找不到(Not found)"。

抓取错误(大图)
在这里你可以下载网站的所有错误页面表和错误源(CSV格式),其中后者能够判断错误来源。另外可以查看错误页面最近出现的时间,可以作为删除排序的依据。复制好错误页面列表,下一步使用。
2、在控制台展开"网站配置(Site Configuration)",打开"抓取工具访问(Crawler access)"

在这里选择删除整个网站、错误网址、目录等等。我采取的措施是首先将 Global Translator 生成的缓存目录删除,例如http://louishan.com/ar/;然后将最近出现过的错误页面进行删除,例如http://louishan.com/el/articles/tag/evernote-3-5。

3、添加之后,状态会变成"待定(Pending)",如果 Google 检测到你添加了仍然存在的页面,会立即拒绝你的请求,否则一般第二天就会处理。

删除以后状态变成"已删除(Removed)",如果出现了错误删除(一般不会出现这种情况,如果页面存在 Google 会拒绝你的请求),或者你重新添加了某些页面,可以"重新添加(Reinclude)"。

虽然这是一个非常简单的工作,但是因为我一着不慎,结果目前 Google 统计到的错误网页数已经达到了223页,很庞大的数字了,所以这其实不是技术活,而是体力活。其实现在的中文到西文翻译工具,根本就无法翻译出有价值的东西,而且它们既然都是调用 Google 的翻译工具,为什么不直接放个 Google 的翻译插件呢,不占资源,绿色免费。































































2009/10/10 于 19:01:10
不错的,我博客里也有很多错误找不到的页面,一直以来都没有敢删除就怕删到别的东西
[回复]
Louis Han 回复:
十月 10th, 2009 at 10:43 下午
@90后的贼, 嗯,这个可惜只能对Google 其他搜索引擎没有这些功能
[回复]
2009/10/10 于 19:05:24
沙发啊啊啊
[回复]