产品经理必须懂得的SEO优化—搜索引擎的工作原理

“上知天文,下知地理”的合格产品经理们应该知道的SEO知识。

古话说得好,产品经理就应该上知天文,下知地理,中晓人和,明阴阳,懂八卦,晓奇门,知遁甲,运筹帷幄之中,决胜千里之外!今天露爷我就在这里和大家分享一下关于SEO方面的姿势。

什么是SEO?

SEO,全称是Search Engine Optimization,就是搜索引擎优化的意思,说人话就是:用户在搜索引擎(例如百度搜索)搜索某个与你网站内容相关的关键词时,让你的网站排名更加靠前的技术,随着线上流量越来越贵,百度竞价愈演愈烈,SEO可以让你的网站源源不断的带来精准流量,而且几乎完全免费。

正所谓知己知彼,百战不殆,要做好SEO,先要了解搜索引擎的工作原理。

搜索引擎的工作原理

搜索引擎的工作原理主要分成3个部分。

爬行和抓取:是搜索引擎工具获得内容的方法和原理,毕竟,搜索引擎不生产内容,它只是内容的搬运工。

预处理:搜索引擎抓取了那么多内容,当然“脏乱差”,所以我们需要预先对内容进行处理一下。

排名:那么多内容,谁先谁后?当然要制定一套规则。

由于搜索引擎可以说是互联网几代人智慧的结晶,一时半会是无法讲完的,所以今天我们来讲第一部分:

搜索引擎对互联网内容的爬行和抓取

首先,我要给大家介绍一位有意思的小伙伴

蜘蛛(spider)

蜘蛛是搜索引擎用来爬行和访问页面的程序,他就像真实世界中的蜘蛛一样,在互联网这个大网上面不断爬行,当爬到你的网站时,就会将你的网站内容记录下来,这样搜索引擎就会收录(具体原理会更加复杂一些),用户通过搜索引擎就可以搜索到你的网站了(蜘蛛爬行网站的时候会优先访问根目录下的robots.txt,如果该文件禁止搜索引擎抓取某些文件或目录,则蜘蛛将不进行抓取被禁止的网址)。

当然,互联网是一张非常大的网,蜘蛛只是爬取了非常小的一部分,这里我简单介绍一下蜘蛛的两种爬行策略:广度优先遍历策略&深度优先遍历策略


广度优先遍历策略

顾名思义,就是优先遍历种子页面的所有二级页面,遍历完所有二级页面后,再遍历所有的三级页面,如下图


深度优先遍历策略

就是优先遍历种子页面某一个二级页面之后的所有分支,当蜘蛛爬到该分支的最低端,没有新链接供蜘蛛继续爬行后,则蜘蛛返回种子页面,爬取另外一个二级页面下面的分支

在实际的蜘蛛爬行过程中,会根据页面结构不同,这两种策略都是混合使用的。

如何吸引蜘蛛?

整个互联网的内容如同星辰大海,以目前的技术,蜘蛛无法也没有必要对整个互联网的所有内容进行爬取,而没有被蜘蛛爬取过的网页内容,则无法通过搜索引擎搜索到,这时候,不过,我们只要知道蜘蛛的习性,就可以吸引蜘蛛过来爬取我们的网站的内容,从而被搜索引擎收录。那么,如何吸引蜘蛛呢?


提高网站和页面权重高

俗话说的好,有人的地方,就有江湖。互联网也是如此,一些老牌网站,例如腾讯新闻、马蜂窝、网易等,由于网站建设时间长,在江湖上有一定地位,所以蜘蛛总是会优先对这些网站内容进行爬取。


提高页面内容质量

人都喜欢新鲜的事物,蜘蛛也不例外,蜘蛛对新的内容爬取优先级非常高,如果你的网站持续有原创的新鲜内容,蜘蛛将会非常喜欢光顾你的网站,但如果蜘蛛每次来到你的网站,发现都是一些转载或者抄袭的内容,它就会认为你的网站没有创造新内容的能力,甚至会再也不造访你的网站。


持续对网站进行更新

蜘蛛喜欢勤劳的站长,如果你的网站持续更新,那蜘蛛将有可能定时对你的网站进行爬取。


找知名网站引入友链

前面提到,老牌知名网站蜘蛛总会优先进行爬取,而蜘蛛的爬取逻辑是顺着链接不断爬行,所以我们可以找一些已经成熟的网站,让他们帮忙引入一条我们自己网站的链接,蜘蛛就可以顺着这条连接爬行到我们的网站。

SEO的内容非常多,蜘蛛是其中一个较为重要的模块,下一期我们将重点讲搜索引擎的“地址库”以及“文件储存”。

公众号:露爷聊产品

1条评论 添加新讨论

05月08日评论

公众号关注了一篇文章也没有 ,打扰了

回复
登录后参与讨论
Ctrl+Enter 发表