当前位置:文档之家› 搜索引擎概述 PPT课件

搜索引擎概述 PPT课件


页面相关性
关键字匹配度:是指网页中的内容与用户所查询关键字之间的 匹配程度,主要是2个因素:
• 页面中是否包含关键字 • 关键字在页面中出现的次数
关键字密度:
• 关键字出现的次数与该网页总词汇量的比例
页面相关性
关键字分布: • 关键字在网页中出现的位置 • 关键字在网页中出现的位置会影响到关键字的分布 值
网页分析
网页分析主要包括:
正文信息提取:主要是对标签和注释等信息的过滤 切词/分词:对页面内容进行切分,形成与用户查询条件相匹配的关键字为单位的 信息列表
• 匹配分词:和预设的海量词汇的“辞典”中的词比较,如果有匹配的 词,则为命中
• 统计分词:根据相邻的2个或者多个字(词)出现的概率判断这2个字 (词)是否会形成一个词。
为保证采集的资料最新,它还会回访已抓 取过的网页。
这个工作是搜索引擎所有工作的基础
页面收录原理
URL列表 抓取页面 提取URL 存储原始页面
进入搜索引擎URL列表的方法
搜索引擎还允许用户自己提交网站(一般只需要提交首页或者网站域 名即可) 通过与别的网站建立链接关系即“外链”
页面存储
搜索引擎在存储原始页面时,不单只存储原始页面,还会存储其他的 附加信息,例如:文件类型、文件大小、最后修改时间、URL、IP地 址、抓取时间等
关键字的权重标签 • 关键字是否使用了HTML标签实现了不同的视觉效 果(如加粗、颜色变换等)
页面相关性计算公式: • R(relevance)=M(match)+D(density)+P(position)+T( html Tag) • R(相关性)= M(相同性)+ D(密度)+ P(位置 )+ T(HTML标签)
搜索引擎-页面分析
对页面内容进行分析,提取相关网页信息(包括网页所在URL、编码 类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、 与其它网页的链接关系等) 对页面正文内容进行“切词”,为这些词建立索引,得到页面和关键 字之间的对应关系
页面分析
网页索引
正文信息
关键字列表 关键词重组
网页
搜索引擎-建立索引
关键字索引:在切词处理后,形成了关键字列表。关键字列表的每条 记录包含:关键字、关键字编号、出现次数、在网页中的位置信息等。 根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面 文字中及超链中每一个关键词的相关度(或重要性),然后用这些相 关信息建立网页索引数据库 对抓取回来的网页建立索引,以实现对页面的快速定位;
1
SEO不等于作弊
2
SEO内容为王
3
SEO与SEM的关系
4
SEO与付费排名的关系
目录
• 互联网调查报告显示:78%的网民通过搜 索引擎这一方式查找自己所需的信息
所以个人站长、企业网站管理者、
大型网站的运营者,对搜索引擎的 关注将成为日常工作的重点。
搜索引擎中,用户的对搜索结果的关注度:
• 搜索结果第1名------100% • 搜索结果第2名------100% • 搜索结果第3名------100% • 搜索结果第4名------85% • 搜索结果第5名------60% • 搜索结果第6名------50% • 搜索结果第7名------50% • 搜索结果第8名------30% • 搜索结果第9名------30% • 搜索结果第10名------20%
页面排序
用户在搜索引擎中输入查询条件后,搜索引擎就在数据库中检索相关 的信息,并将检索结果返回给用户 搜索引擎在往用户端返回数据的时候,并不是随机的,而是按照一定 的计算方法进行排序的 涉及到排序的因素主要有:
页面相关性 链接权重 用户行为
页面排序-页面相关性
• 页面相关性
通过对检索结果进行相关性排序,搜索引擎的最终目的是将最相关的网 络信息尽可能地优先显示在搜索结果的前面部分,以改进搜索结果的输 出。 虽然各个搜索引擎中相关度排序的具体实现各不相同,但基本上都采用 了基于网站内容的分析方法,即考虑用户所查询的关键词在文档网页中 的出现情况,包括关键字匹配度、关键字频率、关键字密度、关键字位 置、链接等因素。
• 为避免马太效应,对排在后面的链接的点击的权重补偿
• 思考? • 1、搜索引擎遵循了什么样的排序标准? • 2、排在前面的网站是不是不会被挤下来? • 3、利用这些排名可以给网站运营带来什么好处? • 4、网站排名靠前是否就意味着运营成功? • 、、、
一、SEO简介
• SEO,是站进行 整体修改,以符合搜 索引擎的搜索原则, 使网站在搜索引擎中 的排名靠前。
• 很明显,同样的结果
• 1、页面收录 • 2、页面分析 • 3、建立索引 • 4、页面排序
搜索引擎的工作原理
搜索引擎-页面收录
这个工作主要由叫做“机器人 (描存在于互联网上的网站,并沿着网页 上的链接从一个网页到另一个网页,从一 个网站到另一个网站。
链接Βιβλιοθήκη 页面之间的超链接反映了页面之间的引用关系,页面被其他站点或其 他网页引用的次数基本上也反映了该网页的受欢迎程度或重要性。
内部链接 外部链接
网页1
网页2 网页3
用户行为
用户行为主要包括:
搜索:用户获得信息的过程,通过这个用户行为,学习新词汇, 丰富辞典 点击:用户对搜索结果的反应,被点击的次数越多,说明越重 要,权重越高• 在国内,、搜狗也是SEO人主要研究的对象。
• SEO进入中国 • 2002年,SEO引入中国,已经发展了近10年,而且势头越来越强劲。 • 特别是中国企业对SEO的认可促进了SEO在国内的迅速发展。
• SEO涉及网站结构、页面设计、内 容添加以及个各种外部条件等内容。
SEO主要工作
外部链接
• 内部优化 • 外部优化
网站结构调整
网页结构调整
内容页面优化
效果评估


完成
SEO何许人也?
• SEO的“家乡” • SEO起源与国外,最初被谷歌成为研究搜索引擎优化的人。
• 谷歌是全世界SEO人的研究对象
相关主题