因为那时尚未接触到站长网这样的专业型网站,所以根本不了解SEO,只知道一味地用稿件的数量换取访问量。于是在建站之初,每天除了真正有自己原创的稿件之外,还从其他网站上面直接未加修改复制采集了许多稿件。很快,谷歌收录量达到三四千以上,而腾讯SOSO新闻业把我的站点纳入新闻来源。而为了满足腾讯soso新闻,我们不得不进行更多新闻稿件的采集,于是网站上面复制的稿件越来越多。
起初我并没有觉得这样做有什么不好,还觉得自己每天忙得不亦乐乎。直到有天晚上,网站上面一个友情链接的网站站长突然以我们网站被百度K掉为由说要删掉链接。我这才发现一个奇怪的现象,谷歌收录近5000,百度收录却是0。我开始寻找各种原因和解决的办法,在站长网这类网站上面学到了许多网站建设方面的知识。原来大量的复制采集是导致网站不被百度收录的祸根之源。
此外,由于之前网站域名是被服务商禁用了,没有进行301重定向,所以长期以来百度还是“信任”原来的旧域名,对我们更换的新域名迟迟不肯接受。
后来我不断地寻找自己的原因,可是百度就是不收录我的站点。也给百度投诉过关于快照的问题,百度的答复依旧是这样:
尊敬的用户,您好!
百度使用自动的spider程序抓取互联网上的网页,大多数情况下,网站都能被百度自动收录。虽然百度希望尽可能多的抓取互联网上的网页,但为了确保用户的搜索体验以及某些不确定的原因,仍会有少数网站无法被百度收录,如果您的网站未被收录,通常是由以下原因引起的:
1. 您的网站所在服务器不稳定,被百度暂时性去除,稳定之后,问题会得到解决。
2. 您的网站有设计缺陷,导致spider无法正常抓取。
3. 您的网页不符合用户的搜索体验。
4. 网页是复制自互联网上的高度重复性的内容。
5. 网页做了很多针对搜索引擎而非用户的处理,使得用户从搜索结果中看到的内容与页面实际内容完全不同,或者使得网页在搜索结果中获得了不恰当的排名,从而导致用户产生受欺骗感觉。
6. 您的网页内容有不符合国家法律和法规规定的地方。
7. 您网站的robots协议禁止百度抓取。
8. 其他技术性问题。