广度优先搜索策略
原创:http://www.qicheng.org/
搜索引擎蜘蛛在抓取网页的时候,一般有两种搜索策略:广度优先搜索策略和深度优先搜索策略。
广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中 的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。

根据以上表格 我们可以得出以下结论路径图:
路径1 ==> A
路径2 ==> B --> C --> D
路径3 ==> E --> F --> G
路径4 ==> H --> i --> K
路径5 ==> L
广度相对深度,对数据抓取更容易控制些,对服务器的负栽相应也明显减轻了许多, 爬虫的分布式处理,使的速度明显提高。
启程官方(www.qicheng.org)可能谈了那么久,大家对于搜索引擎蜘蛛的概念还比较模糊,如果是的话,建议大家先阅览文章“搜索引擎蜘蛛”,在了解了深度优先搜索策略之后,您是不是对于搜索引擎有了新的认识,对于SEO有了新的看法?不会对于SEO的概念还是模糊吧?什么是SEO?还需要再看看吗?再看看吧……
文章来源:http://www.qicheng.org/seo/breadth-first-search-traversal.html
转载请注明版权:SEO 浏览更多SEO文档,请关注青岛网站优化、青岛网站推广服务团队。
版权所有。转载时必须以链接形式注明文章原始出处!