SEO优化入门课件
页面收录方法
页面存储
搜索引擎在存储原始页面时,不单只存储原始页 面,还会存储其他的附加信息,例如:文件类型、 文件大小、最后修改时间、URL、IP地址、抓取 时间等
搜索引擎-页面分析
对页面内容进行分析,提取相关网页信息(包括 网页所在URL、编码类型、页面内容包含的所有 关键词、关键词位置、生成时间、大小、与其它 网页的链接关系等) 对页面正文内容进行“切词”,为这些词建立索 引,得到页面和关键字之间的对应关系
搜索引擎发展简史
1997年7月,微软与Inktomi签订协议,由后者为微软的 MSN搜索引 擎提供技术支持
2005年1月,Google成为搜索市场的领头羊,微软也完成了自己搜索 引擎的开发,并推出了全新的MSN搜索,网址为“”
2006年3月,微软推出了 “Windows Live搜索”,地址为 “”。微软随后在搜索引擎中抛弃了Windows的品牌, 将搜索引擎直接称为“Live搜索” 2009年,微软发布新的搜索引擎品牌:Bing(必应)
1993年,内华达州高教系统能检索文件和网页的搜索工具 1993年,Excite(2002年被InfoSpace收购),对字词关系进行分析 1994年,Lycos,除了相关性排序外,Lycos还提供了前缀匹配等功 能,Lycos第一个在搜索结果中使用了网页自动摘要 1994年,Infoseek,以友善的界面和附加服务著称。95年和netscape 达成合作,在netscape浏览器中嵌入其搜索() 1994年,Yahoo诞生
思考问题:
1、博客的主题(鲜花、服饰、李宁、篮球、seo学习、 朋友、大学生活、情感、飞机模型、汽车爱好俱乐部等等) 2、域名的选择 3、界面的风格 4、栏目的设置
搜索引擎优化概论
一、SEO的产生
Ranking
PPC
搜索引擎优化概论
网站/网页
优化
数据分析
搜索引擎优化
维护
数据分析
Search Engine
对抓取回来的网页建立索引,以实现对页面的快速定位;
搜索引擎-建立索引
页面排序
用户在搜索引擎中输入查询条件后,搜索引擎就在数据库 中检索相关的信息,并将检索结果返回给用户 搜索引擎在往用户端返回数据的时候,并不是随机的,而 是按照一定的计算方法进行排序的 涉及到排序的因素主要有:
页面相关性 链接权重
页面中是否包含关键字 关键字在页面中出现的次数
关键字密度:
关键字出现的次数与该网页总词汇量的比例
页面相关性
关键字分布:
关键字在网页中出现的位置
关键字在网页中出现的位置会影响到关键字的分布值
关键字的权重标签
关键字是否使用了HTML标签实现了不同的视觉效果(如加粗、 颜色变换等)
网页分析
网页分析主要包括:
正文信息提取:主要是对标签和注释等信息的过滤 切词/分词:对页面内容进行切分,形成与用户查询条
件相匹配的关键字为单位的信息列表
匹配分词:和预设的海量词汇的“辞典”中的词比较,如果有 匹配的词,则为命中
统计分词:根据相邻的2个或者多个字(词)出现的概率判断 这2个字(词)是否会形成一个词。
搜索引擎发展简史
1995年,Larry Page开始学习搜索引擎技术 1997年,注册域名 1997年底,Larry Page、Sergey Brin等开始提供google的前身—— BackRub的Demo 1999年2月,Google完成了从Alpha到Beta版本的转换 Google在PageRank、动态摘要、网页快照、DailyRefresh、多文档 格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等 功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
这个工作是搜索引擎所有工作的基础
页面收录原理
URL列表
抓取页面
提取URL
存储原始页面
用户提交
搜索引擎还允许用户自己提交网站(一般只需要提交首页 或者网站域名即可)
Google:/ahtml
搜索引擎分类
元搜索引擎
代表:Dogpile、Xisoso、Vivisimo等 在接受用户查询的时候,会同时在多个搜索引擎上进行搜索,并
将结果返回给用户
搜索引擎工作原理
搜索引擎工作主要分为: 页面抓取 页面分析 建立索引 页面排序
搜索引擎-抓取页面
这个工作主要由叫做“机器人(robot)”、“爬虫 (crawler)”或者“蜘蛛(spider)”的程序,根据一定 规则扫描存在于互联网上的网站,并沿着网页上的链接从 一个网页到另一个网页,从一个网站到另一个网站。 为保证采集的资料最新,它还会回访已抓取过的网页。
搜索引擎发展简史
1995年,元搜索引擎(Meta Search Engine)出现。这种搜索引擎本 身并没有相关的搜索能力,只是将搜索需求提交给其他的搜索引擎并 返回集合的结果 华盛顿大学学生发明的Metacrawler 1995年,DEC公司AltaVista诞生。它是第一个支持自然语言搜索的搜 索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如 AND,OR,NOT等) 1995年,HotBot诞生。1996年Inktomi公司成立,负责Hotbot的商业 化运作。它声称每天能抓取索引1千万页以上,所以有远超过其它搜 索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好 设置
搜索者点击链接
搜索者点击网页,是因为他们认为这个网页能解决他们的 问题或者更接近解决问题的方法 搜索者是没有耐心的。一般只看前3个链接,最有可能的 点击是第一个链接。一般不点击付费搜索结果 搜索者一般只点击标题和摘要中包含关键字的链接
实践
如果你没有网站,从来没有接触过网站建设。我们可 以通过以下方案来接触和了解网站。 1、直接注册一个很好用的博客,请了解这里: 这个博客相对其他的博客系统(如新浪等)相对复杂一些, 复杂才有可理解和操作的东西。
Visitor
SEO是一种工具,一种归属营销范畴的工具,它可以帮助搜索引擎更好 更多的索引和收录网站;也可以帮助访问者更友好快捷的访问网站; 在做到以上两点的同时,最终帮助网站拥有者获取更符合营销要求的 高质量的浏览人群。
搜索引擎优化概论
三、搜索引擎优化的地位 A.搜索引擎优化不是营销的全部
搜索引擎优化概论
2000年中Google数据库进行了升级,并被Yahoo选作搜索引擎
搜索引擎发展简史
2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与 好友徐勇发布搜索引擎Beta版 2001年10月22日正式发布搜索引擎搜索引擎-建立索引
关键字索引:在切词处理后,形成了关键字列表。关键字 列表的每条记录包含:关键字、关键字编号、出现次数、 在网页中的位置信息等。
根据一定的相关度算法进行大量复杂计算,得到每一个网 页针对页面文字中及超链中每一个关键词的相关度(或重 要性),然后用这些相关信息建立网页索引数据库
虽然各个搜索引擎中相关度排序的具体实现各不相同,
但基本上都采用了基于网站内容的分析方法,即考虑 用户所查询的关键词在文档网页中的出现情况,包括 关键字匹配度、关键词密度、关键词位置、关键字的 权重标签等因素。
页面相关性
关键字匹配度:是指网页中的内容与用户所查询的关
键字之间的匹配程度,主要是2个因素:
搜索引擎优化
Search Engine Optimization
—— 主讲:王海霞
章节内容
1 3 2
搜索引擎优化概论 优化项目的分析
3
页面优化
章节内容
4 3 5
结构优化和内链建设 外部优化和外链建设
6 3
搜索引擎优化的窍门
第一章 搜索引擎优化概论
搜索引擎发展简史
1990年,加拿大麦吉尔大学的Alan Emtage等开发出Archie,这是所 有搜索引擎的鼻祖
搜索引擎分类
全文搜索引擎 代据库,再从这个数据库中检索 与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果 返回给用户,因此他们是真正的搜索引擎。
目录搜索引擎 代表:DMOZ,早期的Yahoo 其实质是按目录分类的网站链接列表,并非真正的搜索引擎
• 多数的用户通过SE选择网页,这是巨大的进步。SEO刚好可以帮助用户作出精准选择。
4)SEO可以帮助改进业务流程,提高客户转化率
• SEO对于流量的分析过程,可以帮助产品和业务部门改进流程,提高客户转化率。
搜索引擎优化概论
四、搜索引擎优化基本术语
搜索引擎优化(SEO) 搜索引擎营销(SEM) 权重(Weightiness) 垃圾技术(Spamming) 反作弊(Anti-Spam ) 桥页(Cloaking) 黑帽 SEO(Black hat SEO) 白帽 SEO(White hat SEO) 搜索蜘蛛(Spider) 网站地图(Sitemaps) 链接工厂(Link farm ) MFA (Made for Adsense ) 目录(Directory) ROI (Return On Investment ) 搜索引擎结果页面(Search Engine Results Page) W3C(The World Wide Web Consortium )
B. 搜索引擎优化是不可或缺的
1)SEO 创建可访问和有用的 Web 站点
• SEO对于用户的优化,可以让网站的信息更具阅读特性。让用户更容易找到他想要的内容。
2)SEO 对于商业站点至关重要
• 有价值的流量是商业站点盈利的保证,seo恰好可以很好的解决这个问题。
3)SEO 是 Web 使用方式演进的一部分
用户行为
搜索引擎-页面排序