爱看小说网

首页 足迹
字:
关灯 护眼
首页> 重写科技格局女主是谁> 第0040章 搜索引擎算法

第0040章 搜索引擎算法(2/3)

利确实在谷歌之前,我们现在不去猜测真假,但这种说法体现了一个很重要的信号,其实不管是哪一家的算法,算法基础其实都是一样的。

     抓取网页信息,然后用某种机制对这些网页进行排序,当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。

     那么白度输在哪呢?关键就在于白度现在过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。

     相比之下,谷歌的Pagerank就多了两件很重要的事情,第一件事情是,把A页面到B页面的链接解释为A给B的投票行为,谷歌在这里会同时考评A和B的等级从而形成新的等级。

     也就是每一个页面都有PR值,同时你的PR值会成为其他页面PR值的参考。

     然后不断的重复计算每个页面的PR。

    假设给每个页面一个随机PR值,那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。

     至于HITS,其理论基础依然没变,它最大的特点或者说改变就在它意识到Pagerank算法平均的分布权值不符合链接的实际情况。

     所以HITS算法中引入了另外一种网页,称为Hub网页,Hub网页是提供指向权威网页链接集合的WEB网页。

     所以使用HITS的搜索结果会比其他两者都更权威,但这个算法会大大增加计算负担,对吧?” 孟谦看了一眼IBM出来的哥们,对方愣了一下有点好像不确定的点了点头。

     所以现在简单总结一下,搜索引擎的算法基础就是超链分析,算法的优劣势就在于如何让搜索结果更具有参考价值,让用户获得更有效的信息。

     当然如果能直接理解用户的需求然后帮他搜索他最想要的内容,这是最理想的搜索引擎状态,但谁都知道这是不可能的。

     因此搜索引擎的好坏决定的就是同样的关键词下,你是否能让相对更多的人获得他们想要的内容。

     10个用户用谷歌,5个人找到了自己想要的东西,如果用我们的搜索引擎,6个人找到了自己想要的东西,在这里领域目前的技术环境下,我们就是更优秀的。

     那么在这个理解基础上,我接下来要给大家介绍的,就是我的搜索引擎算法,动态规则超链分析算法。

     动态规则超链分析算法有以下几个变化。

     第一,刚才我们提到了,好的搜索引擎是要看在同一关键词下谁的反馈结果更能满足用户需求,那么当用户在搜索某个东西的时候,从大概率来说,他想要看到的结果应该是与这个东西具有更垂直型相关的内容。

     举个例子,客户在搜索汽车的时候,不管他是想买车,还是
热门推荐

书友正在读: 敛骨 [综武侠]骑着扫帚穿越啦! 《霸总的共用女儿》作者:腐女幻受 星临诸天 平平无奇小师叔 从求生之路开始的综漫旅途 《老公意外出轨(男出轨)》 作者:一百个小C莓(完结np) 作者:未知作者 社牛小男配的植物人亲娘[六零] 64.《诡计多端的alpha》作者:林啸也 《风月魔城》by墨麒麟 一受多攻 《穿七零去父留子,军婚也得离》苏璃 萧衍珩 恶毒小美人翻车以后 《女知青带夫回城》作者:织笈 荆棘王冠 [np 完结]《室友各个猛如虎(双性 万人迷受)》作者:三弄 骑士之歌 《现实游戏逃生指南》作者:墨兔儿 《燃尽春夜》作者:陈舟渡我 男朋友是机器人 【Y.B热文】法老的宠妃II(下部)作者:悠世 婚入心扉 如果我变成回忆 四合院之快意人生 问仙剑道 (1V1)《在恋爱综艺里搞对象》作者:吃甜少女--【完结by80番外】 炼丹房打杂,从废丹合成开始修仙 我在仙界当渣男 仙武:无限推演金钟罩,横推万古 逆命相师 无限兑换之旅 金属牙套【骨科gl】 洪荒:我的系统不惧天道 女配也要被强制爱吗(末世 nph) 攻略精灵(西幻万人迷NP) 我,天道亲儿子,呼吸都能变强 我欲修仙神魔不渡 唯我道 最终守护者 穿越以后,我在黑暗世界在造乾坤 被休后我成了侯府真千金 兵痞帝皇 这是正经修仙吗? 旧日盗墓笔记 玄幻:我能随机刷新境界 谁说他修仙天赋差的? 星武纪元 全宗入魔:请师尊赴死! 冷血医师 收手吧!哥布林都快灭绝了 万古最强霸体