TrustRank算法之百度搜索引擎原理研究

发布日期:2018-04-20 21:01:59 作者:冬镜SEO

  • 正文内容
  • 相关推荐
原创

TrustRank算法是近年来比较受关注的基于链接关系的排名算法

TrustRank可以翻译为“信任指数”

TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾说明站并且于2006年申请专利

TrustRank算法发明人还发表了一份专门的PDF文件说明TrustRank算法的应用

感兴趣的站长朋友们可以在下面这个网址下载PDF文件 http://www.vldb.org/conf/2004/RS15P3.PDF

TrustRank算法

TrustRank算法并不是Google提出来的

不过由于Google所占市场份额最大而且TrustRank在Google排名中也是一个非常重要的因素

所以有些人误以为TrustRank是Google提出的

更让人糊涂的是Google曾经把TrustRank申请为商标但TrustRank商标中的TrustRank指的是Google用于检测含有恶意代码网站的方法,而不是指排名算法中的信任指数

TrustRank算法基于一个基本假设:好的网站很少会链接到坏的网站,反之则不成立

也就是说坏的网站很少链接到好网站这句话并不成立

正相反很多垃圾网站会链接到高权威高信任指数的网站,试图提高自己的信任指数

基于这个假设如果能挑选出可以百分之百信任的网站,这些网站的TrustRank评为最高,这些TrustRank最高的网站所链接到的网站信任指数稍微降低但也会很高(重庆SEO搜索热点:央视评中兴遭封杀)

与此类似第二层被信任的网站链接出去的第三层网站信任度继续下降

由于种种原因好的网站也不可避免地会链接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数越高,离第一级网站点击距离越远,信任指数将依次下降

这样通过TrustRank算法就能给所有网站计算出相应的信任指数,离第一层网站越远成为垃圾网站的可能性就越大

计算TrustRank值首先要选择一批种子网站,然后人工查看网站设定一个初始TrustRank 值

挑选种子网站有两种方式:

1、选择导出链接最多的网站

因为TrustRank 算法就是计算指数随着导出链接的衰减,导出链接多的网站在某种意义上可以理解为“逆向PR值”比较高

2、挑选种子网站的方法是选PR值高的网站

因为PR值越高在搜索结果页面出现的概率就越大

这些网站才正是TrustRank算法最关注的需要调整排名的网站

那些PR值很低的页面,在没有TrustRank算法时排名也很靠后,再计算TrustRank意义就不大了

根据测算挑选出两百个左右网站作为种子,就可以比较精确地计算出所有网站的TrustRank值

计算TrustRank随链接关系减少的公式有两种方式

一种是随链接次数衰减

如果第一层页面TrustRank指数是100,第二层页面衰减为90,第三层衰减为80

第二种计算方法是按导出链接数目分配TrustRank 值

如果一个页面的TrustRank 值是100,页面上有5 个导出链接,每个链接将传递20%的TrustRank值,衰减和分配这两种计算方法通常综合使用,整体效果都是随着链接层次的增加则TnustRank值逐步降低

得出网站和页面的TrustRank值后可以通过两种方式影响排名

一种是把传统排名算法挑选出的相关页面,根据TnustRank值比较重新做排名调整

另一种是设定一个最低的TnustRank值门槛,只有超过这个门槛的页面才被认为有足够的质量进入排名,低于门槛的页面将被认为是垃圾页面从搜索结果中过滤出去

虽然TrustRank算法最初是作为检测垃圾的方法,但在现在的搜索引擎排名算法TnusRank概念使用更加广泛,经常影响大部分网站的整体护名

TrustRank算法最初针对的是页面级别,现在在搜索引擎算法中TrusRank值也通常表现在城名级别

TrustRank算法信任指数

整个城名的信任指数越高整体排名能力就越强

标签:

标题:TrustRank算法之百度搜索引擎原理研究

链接:http://uqseo.com/seosf/48.html

版权:若无特殊标注皆为 冬镜SEO 原创版权,转载请以链接形式注明作者及原始出处

发表评论

电子邮件地址不会被公开。 必填项已用*标注