seo经验杂谈

搜索引擎收录原理

发布日期:2014-04-02 浏览次数:1201
搜索引擎的荃本工作原理包括如下三个过程川:首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输人的查询关键词.在索引库中快速检出文档,进行文档与查询的相关度评价,对将要轴出的结果进行排序,并将查询结果返回给用户。
  (1)抓取网页。睡个独立的搜索引攀都有自己的网页抓取程序蜘蛛(spider).蜘蛛Spider顺着网页中的超链接,从这个网站爬到另一个网站.通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。
  (2)处理网页。搜索引笨抓到网页后,还要做大皿的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类m、分析超链接、计算网页的重要度和丰富度等。
  (3)提供检索服务。用户输人关键词进行检索.搜索引攀从索引数据库中找到匹配该关键词的网页。

相关文章

·关于seo技术应用的目的
·如何定位互联网上的竞争对手
·百度站长VIP大讲堂(上海站)精彩问答
·网站不被收录是什么情况
·给网站做SEO的目的
·网站优化中关键字的选择
·关键词选择的好坏一战定成败
·一个基于Web挖掘的网站优化系统
·网站SEO怎么才能喂好蜘蛛
·企业网站建设基于百度的优化排名手段