郑州SEO教程之百度搜索索结果关键字排序算法大解密
本文摘要: > 百度算法 > 正文百度算法郑州SEO教程之百度搜索索结果关键字排序算法大解密王小强【百度算法】阅读次数:?次郑州SEO教程之百度搜索索结果关键字排序算法大解密,王青召SEO为你全面解读。 一、特征词库的类别的建立与更新大家都知道,百度有特征词库
> 百度算法 > 正文百度算法 郑州SEO教程之百度搜索索结果关键字排序算法大解密

王小强【百度算法】阅读次数:?次

郑州SEO教程之百度搜索索结果关键字排序算法大解密,王青召SEO为你全面解读。
       一、特征词库的类别的建立与更新
大家都知道,百度有特征词库,通过特征词库,可以对用户查询序列,进行判断。例 如:当用户搜索 天龙八部在线播放〃、 射雕英雄传在线播放〃、 鹿鼎记在线观 看〃、 电视连续剧在线播放〃时,由于这些待挖掘序列中的 天龙八部〃、 射雕英 雄传〃、 鹿鼎记〃、 电视连续剧〃在需求特征词库中属于视频类需求的特征词,并 且 在线播放〃这一关键字与上述视频类需求的特征词的共现频次达到一定阈值 (共现阈值)时,根据关键字 在线播放〃,提取关键字 在线播放〃与视频需求 类别的映射关系,并根据映射关系来建立或更新需求特征词库。

二、对词条的分类

1、对查询序列进行切词处理获得切分后的词条,再通过诸如对词条进行文本挖掘 或根据词条在需求特征词库中进行匹配查询等方式,来获得所述候选需求类别。

例 如:用户的查询序列为 土豆上的热门影视作品〃时,通过对其进行切词处理,得 到 土豆/热门/影视作品〃,由于影视作品一词具有明显的需求类别,诸如视频、下 载、图片、演员介绍,再通过诸如对词条进行文本挖掘或根据所述词条在需求特 征词库中进行匹配查询等方式,来获得候选需求类别。

2、当挖掘序列相对应的分类结果的用户累计点击次数超过预设点击阈值时,基于所述 分类结果所对应的需求类别,提取待挖掘序列与需求类别的映射关系,并根据映 射关系来建立或更新需求特征词库。

例如:当待挖掘序列为 日本地震〃时,根据 该待挖掘序列对应的分类结果,如视频类百度搜索、新闻类百度搜索、图片类搜 索结果,若视频类百度搜索对应的用户累计点击次数为300,新闻类百度搜索对 应的用户累计点击次数为25000,图片类百度搜索对应的用户累计点击次数为 700,预设点击阈值为10000时,将待挖掘序列对应的分类结果的用户累计点击 次数与预设点击阈值进行比较,并根据高于所述预设点击阈值的分类结果所对应的 需求类别,即新闻需求类别,提取该待挖掘序列与新闻需求类别间的所述映射关系,并根据映射关系来建立或更新需求特征词库。

郑州SEO教程,关键词排序算法

三、获取需求度

1、获取与用户的查询序列相对应的原始百度搜索

2、获取与查询序列相对应的候选需求类别

对原始百度搜索进行处理,根据查询序列,通过诸如对查询序列进行文本挖掘或根 据查询序列在需求特征词库中进行匹配查询等方式,来获得候选需求类别。例如, 当用户的查询序列为 土豆上的热门影视作品〃时,通过对其进行切词处理,得到 土豆/热门/影视作品〃,由于影视作品一词具有明显的需求类别,诸如视频、下 载、图片、演员介绍,对该查询序列进行文本挖掘或在需求特征词库中进行匹配。

查询,来获得候选需求类别,例如根据 影视作品〃可知该查询序列对应的候选需 求类别包括视频、下载、图片、演员介绍。

3、根据查询序列与候选需求类别,确定与查询序列相对应的类别需求度。

根据查询序列和候选需求类别,通过诸如对该查询序列所对应的百度搜索按类别进 行数据分析或者对关于百度搜索的历史点击记录按类别进行数据分析,确定所述查 询序列对于每一候选需求类别的类别需求度。

例如: XX电影明星〃时,根据查 询序列,得到候选需求类别包括视频、新闻、背景介绍、音乐、图片,然后根 据查询序列和候选需求类别,通过诸如对该查询序列所对应的百度搜索按类别进行 数据分析或者对关于百度搜索的历史点击记录按类别进行数据分析,确定与所述查 询序列相对应的类别需求度,如, XX电影明星〃查询序列在视频类的类别需求 度为0.3 ;查询序列在新闻类的类别需求度为0.3 ;查询序列在背景介绍类的 类别需求度为0.1 ;查询序列在音乐类的类别需求度为0.2 ;以及查询序列在 图片类的类别需求度为0.1。

需求度确定:

用户的查询序列为 XX电影明星〃,将查询序列在需求特征词库中进行匹配查询, 当在需求特征词库中匹配查询到XX电影明星属于明星列表并且该明星列表对应 的需求类别包括视频、新闻、背景介绍、音乐和图片时,得到与查询序列相对应 的候选需求类别包括视频、新闻、背景介绍、音乐和图片。结合该查询序列相应 的大量用户的点击数据分析。

例如:数据分析结果中表明视频类百度搜索、新闻类 百度搜索、背景介绍类百度搜索、音乐类百度搜索与图片类百度搜索的用户点击 频次分别为60000次、10000次、10000次、10000次和10000次,则查 询序列对于视频类百度搜索的类别需求度为0.6,而对于图片类百度搜索的类别需 求度为0.1。

4、根据类别需求度,将百度搜索提供给用户。

根据所述类别需求度,将百度搜索提供给所述用户。还是以 XX电影明星〃为例: 当用户的查询序列为 XX电影明星〃时,查询序列在视频类的类别需求度为0.3, 在新闻类的类别需求度为0.3,在背景介绍类的类别需求度为0.1,在音乐类的类 别需求度为0.2,在图片类的类别需求度为0.1时,若查询序列的百度搜索列表中 的第一页显示10条百度搜索,根据类别需求度,将3条视频类的百度搜索、3 条新闻类的百度搜索、1条背景介绍类的百度搜索、2条音乐类的百度搜索提供 给用户,并且将剩余的所有百度搜索中与查询序列相关性最高的1条百度搜索在 第一页提供给用户。

根据类别需求度,将类别需求度与百度搜索提供给用户。具体地,根据查询序列与 候选需求类别,通过诸如对该查询序列所对应的百度搜索按类别进行数据分析或者 对关于百度搜索的历史点击记录按类别进行数据分析,确定了与查询序列相对应的 类别需求度后,以诸如特别字体、浮动窗口等方式,将百度搜索相对应的类别需求度与百度搜索提供给所述用户。百度己使用此类 技术,可在百度搜索索结果页面中找找。

百度对结果的优选 1、查询相关属性包括以下至少任一项;

2、百度搜索与所述查询序列的相关性;

3、百度搜索的权威度;

4、百度搜索的及时性。

相关性: 优选结果不仅根据百度搜索所对应的类别需求度,而且还结合百度搜索与 查询序列之间的相关性,将百度搜索提供给对应的用户。当百度搜索所对应的新闻 类百度搜索的类别需求度和音乐类百度搜索的类别需求度相同时,将所述百度搜索 对应的类别需求度与百度搜索和查询序列之间的相关性结合,将所述百度搜索提供 给用户。

权威度: 确定查询序列的类别需求度后,百度搜索对应的类别需求度与百度搜索的 权威度结合提供给用户,例如:查询序列对应的新闻类百度搜索的权威度较高而查 询序列对应的音乐类百度搜索的权威度较低时,将查询序列对应的新闻类百度搜索 和音乐类百度搜索依次提供给所述用户对应的用户。

及时性: 不仅根据百度搜索所对应的类别需求度,而且还结合百度搜索的及时性, 将百度搜索提供给用户。例如:查询序列对应的新闻类百度搜索的及时性较强而查 询序列对应的音乐类百度搜索的及时性较弱时,将查询序列对应的新闻类百度搜索 和音乐类百度搜索依次提供给用户对应的用户。

一、   相关性

1、网站内容是否和网站主题相关。

可以方便百度搜索引擎把你网站进行定位,方便对你网站进行类目分类。准确的类目分 类对提升网站在某一个行业中的权威度有很大的好处。

2、网站中的内容是否能够满足客户需求需求。

这个讨论的太多了。就不一一详解。网站中的内容关联性是影响seo排名的主要因素之一。

二、权威度

权威并不等于知名,知名反作用力于权威。权威度的计算方法非常复杂,有很多的基数作为参考,以下列出 可能 决策权威度 的一部分基数。

1、网站品牌词的搜索指数。

2、与网站相关的长尾关键词的流量。

3、直接访问流量。

4、url中的体现的权威度(在索引库中存在的时间,在搜索中的表现,政府门户网站等)。

5、口碑与社交网络的转载。百度搜索引擎一直在监控网络上用户的一举一动。不过因为 一些 原因〃有些是直接效果,有些是间接效果,或者没效果。不过所有可以点击的link都是有用的。

6、网站发布频率。嘿?!这个网站还有人维护呢。不是死站。短时间不维护(春节 放假7天)影响不大。当长期不维护。真的可能会降权。

7、页面代码的规范性。虽然现在己经过了扣细节的时代,但是百度搜索引擎还是通过源 代码来获取页面信息。适当的减噪,可让百度搜索引擎更方便的判断主体内容,主题, 页面结构等。

8、所有元标签内容的质量与相关性。tkd的必要性别说了。

9、外部投票:百度的外链算法,最近看了个百度的文章,貌似是:把网站所有 的有外链的页面建成一个合集,把其他一些结构相似的页面建立一个合集,通过合 集之间的互换外部投票的权重,得到结构相似的页面外部投票的权重,在加上内部 投票权重,等于未处理的原始页面权重。

三、及时性

多见于及时性很强的内容。如:mh370飞机失事前,排名在mh370百度搜索页面 的主要为mh370飞机的订票,介绍等信息。当飞机失事后,随着新闻类目需求的增 加,百度搜索页面也随之进行了变化。

排序并非以先来后到为准,在文章及时性很强的时候,彳艮 短 的一一段时间内出现 大量类似文章,点击量达到一定厥值,百度搜索引擎结合相关性,权威度等一系列的算 法,向搜索用户推荐相关索引序列。

大家都知道只有title中包含关键字组才有可能在百度搜索引擎中有这个词的排序,但随 着百度对自身的客户体验的发展,从关键词排名算法发展上看,关键字位置决定排名- 关键字完全匹配优势-关键字分词结果进入排名-根据关键字客户体验进行排名排序 等一些列算法的改变,百度对于百度搜索序列是否能够满足客户需求需求,一直都在尝 试。随着百度的尝试,Seo也从体力活慢慢的向智慧型转变。

那么我们分析下百度排序是如何提高自己的客户体验的。

百度有搜索日志,监控每个用户的搜索习惯,通过搜索日志,可以把很多关键字联系起来。 1、通过搜索日志,可以产生泛需求词,涵盖几乎所有的有需求的词。

⑴通过模式词表对词语进行选取或者大数据挖掘的方式得到,模式词表中的词
包括起修饰作用的修饰词,例如 好玩的〃、 好看的〃、 聪明的〃等等。搜索日志记录 了一个以上用户的搜索行为,包括用户搜索时使用的关键字,因此,通过模式词表, 可以从搜索日志中提取出一个以上前缀匹配的关键字,例如 好玩的地方〃、 好 看的电影〃等等,这些前缀与模式词表中的词匹配的关键字均可作为泛需求词。

⑵从搜索日志中提取以预设的模式词表中的词为前缀的关键字,并将提取的关键字去除前缀后的剩余部分作为泛需求词。例如以模式词表中的词为前缀的关键 词有 好看的电影〃、 好玩的地方〃,其中 好看的〃、 好玩的〃,是前缀则 电 影 、 地方〃就是泛需求词。

⑶确定搜索日志中各关键字的后继词,并将属于同一实体类别的后继词所占 比例超过第一设定阈值的关键字作为泛需求词,其中一个关键字的后继词是与该关 键词共同出现在一个会话中且在该关键字之后出现的词语。

通过泛需求词,可以提取到相对应的精确需求词与后续词。例如:泛需求词(电影),通过 搜索日志,我们得到精确需求词(电影天堂,电影下载,电影排名榜,电影网)同时也得到 了电影的后续词(激情与速度,战狼,奔跑吧兄弟等)在这儿先不讨论后续词,虽然广泛应 用在右侧相关展示、大家都在搜、阿拉丁。我们单单说说精确需求词。

郑州seo:无论百度怎么变换算法,站长们还是要追寻着他,做好关键字词性分析,排名稳增不降。

- END -


郑州SEO教程_HTTP状态码中301与302的区别篇

郑州SEO教程_HTTP状态码中301与302的区别篇,做好对SEO非常的重要,下面王小强为你全面解读。...

郑州SEO初级教程之单页面SEO优化的优点全

郑州 SEO初级教程 之单页面SEO优化的优点全面说明,单页优化有很多的方法,主要是:集中权重,增加网站关联性,还要让网站容易被收录,下面郑州SEO为你全面解读。 对于这种页面最...

郑州SEO初级教程之影响SEO排名的九大因素

郑州SEO初级教程之影响SEO排名的九大因素说明,下面我们来学习一下,在以后的工作上提高工作效能。...

【郑州SEO】SEO基础必看-SEO基础概念解读

【郑州SEO】SEO基础必看-SEO基础概念解读,我们建立网站优化工作,首先就是学习SEO的初级教程,下面郑州SEO小编为你解读。...