搜索引擎蜘蛛是如何找到页面的?下面福州seo博主Cxh就给大家介绍5点搜索引擎蜘蛛找到页面的方法,希望对您研究搜索引擎蜘蛛有一定的帮助。
1、外部链接:在其他蜘蛛可以爬取的网站,发布你网站或者新页面的链接,这样搜索引擎就可以通过你所发布的外部链接找到你的网站或者页面。关于外部链接的话,我这边想强调一点的是,就是直接发布网址,也就是说无法点击的URL,也就是我们通常说的域名曝光度,搜索引擎同样可以通过域名曝光度找到该页面。
2、提交URL:网站的所有者通过提交他们的URL向搜索引擎注册自己的网站。这样可以将这些URL添加到搜索引擎爬取初始列表中。
3、存储:搜索引擎可以记录之前沿着链接所爬取到的URL,即使这些链接的页面之后被删除或者被改变了。搜索引擎也会重新爬取存储在它数据库上的URL地址。
4、猜测:搜索引擎可以用有限的集中方式猜测其他的URL。其中的一种方式就是截去所有URL每一个斜杠后的部分,以便找到每个目录的主页。换句话说,如果找到这样一个URL:http://www.seofz.com/seofz/346.html,那么搜索引擎蜘蛛可以自动尝试原始URL获得以下几个URL:http://www.seofz.com/seofz/,http://www.seofz.com/。不过不是所有的URL,搜索引擎都会进行猜测。
5、非链接信息:当一个Web页面被删除后,对原始URL的请求可能不会返回一个Web页面,但是浏览器会收到一条来自Web服务器的信息,以显示新的地址。这是超文本传输协议重定向请求的常用方式。就是我们平时说的301重定向。