网站时光机archive.org及Google的域名评级策略

archive.org网站的其中一个很炫的功能就是记录你的网站历史,像时光穿梭机一样可以带你回到过去。

该时光穿梭机的地址是:http://www.archive.org/web/web.php

如果你的网站有记录可以看到你以前网站的内容,就拿我的沉思小屋(leedd.com)来说吧,在我启用该域名之前的2004年(或许更早)就已经有人注册建站了,  点击查看:http://web.archive.org/web/*/http://leedd.com

如下图所示(先记录下,万一某一天全部丢失了):

archive-log

该URl中的*号代表所有日期,点开具体会进入到一个形如: http://web.archive.org/web/20050205130839/http://leedd.com/  的子链接 ,这个链接就是对应于当天(20050205)保存的你网站的首页信息。

不过我在使用中发现这个时光机并不是万能的:

一是不一定能收录你的网站,毕竟世界上的网站很多。

二是记录的网站可能很久后自动删除,比如在网站更换内容等情况下,根据我的观察,对于信息比较模糊的或是即将丢失信息的保存记录,在时光机首页对应于该日期的后面会多出一个“*”号 , 只要存在“*”号 在不久的将来该星号对应的记录就会模糊或丢失,甚至完全丢失该日期(至少我的其中一个网站是这样)。

三是该网站好像有付费收录?暂时没有研究

因为很久以前听到一个消息说Google也要涉足于域名注册领域(目前已经开始经营了),不仅仅是为了赚取域名注册的钱,更重要的是要根据域名的注册信息(最早注册年度、DNS信息、续费时长等等)来加入对一个网站的评级, 如果有的网站注册年度较早,而且续费年度较长,注册年度早至少说明该域名相对有价值,续费年度长至少能说明域名持有人打算长期持有或是有持续做站的想法。对于DNS来说,如果一个网站的DNS启用的是像DNS1.sina.com.cn(不一定存在,仅举例说明) 这样的DNS,那么这个站肯定不是个垃圾站,即使它使用的是机器认为非常垃圾的域名,而且google会经常光顾它, 所以Google需要获得网站的“历史信息”来更好的进行搜索算法的优化。(关于google算法的问题因为没有深入研究,只是我个人的猜测,仅作为参考)

6 thoughts on “网站时光机archive.org及Google的域名评级策略

Comments are closed.