爱看小说网

首页 足迹
字:
关灯 护眼
首页> 重写科技格局无错版> 第0040章 搜索引擎算法

第0040章 搜索引擎算法(2/3)

利确实在谷歌之前,我们现在不去猜测真假,但这种说法体现了一个很重要的信号,其实不管是哪一家的算法,算法基础其实都是一样的。

     抓取网页信息,然后用某种机制对这些网页进行排序,当用户输入关键词进行搜索时,根据关键词匹配出按照机制进行排列的网页。

     那么白度输在哪呢?关键就在于白度现在过于简单的基于在某次搜索的所有结果中被其他网页用超链接指向的越多的网页就价值越高这种基础排序方式。

     相比之下,谷歌的Pagerank就多了两件很重要的事情,第一件事情是,把A页面到B页面的链接解释为A给B的投票行为,谷歌在这里会同时考评A和B的等级从而形成新的等级。

     也就是每一个页面都有PR值,同时你的PR值会成为其他页面PR值的参考。

     然后不断的重复计算每个页面的PR。

    假设给每个页面一个随机PR值,那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。

     至于HITS,其理论基础依然没变,它最大的特点或者说改变就在它意识到Pagerank算法平均的分布权值不符合链接的实际情况。

     所以HITS算法中引入了另外一种网页,称为Hub网页,Hub网页是提供指向权威网页链接集合的WEB网页。

     所以使用HITS的搜索结果会比其他两者都更权威,但这个算法会大大增加计算负担,对吧?” 孟谦看了一眼IBM出来的哥们,对方愣了一下有点好像不确定的点了点头。

     所以现在简单总结一下,搜索引擎的算法基础就是超链分析,算法的优劣势就在于如何让搜索结果更具有参考价值,让用户获得更有效的信息。

     当然如果能直接理解用户的需求然后帮他搜索他最想要的内容,这是最理想的搜索引擎状态,但谁都知道这是不可能的。

     因此搜索引擎的好坏决定的就是同样的关键词下,你是否能让相对更多的人获得他们想要的内容。

     10个用户用谷歌,5个人找到了自己想要的东西,如果用我们的搜索引擎,6个人找到了自己想要的东西,在这里领域目前的技术环境下,我们就是更优秀的。

     那么在这个理解基础上,我接下来要给大家介绍的,就是我的搜索引擎算法,动态规则超链分析算法。

     动态规则超链分析算法有以下几个变化。

     第一,刚才我们提到了,好的搜索引擎是要看在同一关键词下谁的反馈结果更能满足用户需求,那么当用户在搜索某个东西的时候,从大概率来说,他想要看到的结果应该是与这个东西具有更垂直型相关的内容。

     举个例子,客户在搜索汽车的时候,不管他是想买车,还是
热门推荐

书友正在读: 《病娇怀里惊坐起,疯批竟是我自己》 城市大脑穿越古代(基建) 敛骨 【独家】《昨夜星辰昨夜风》沈琰 温沁 穿越当县令 气御千年 平平无奇小师叔 【首发】《陆启年,如你所愿我很幸福》陆静姝 陆启年 社牛小男配的植物人亲娘[六零] 千千阙歌再无你 装A影后被我捡回家后 64.《诡计多端的alpha》作者:林啸也 九州·缬罗(《斛珠夫人》前传) 《女知青带夫回城》作者:织笈 [np 完结]《室友各个猛如虎(双性 万人迷受)》作者:三弄 春光错位[娱乐圈]by空山迟 长生送葬:敲木鱼能继承亡者遗物 灵气祥腾云雾 一觉醒来几把被偷了(单性_1V1) by 余火烬燃(日更中) 至尊箭神 规则怪谈:从动物园怪谈开始 白眼狼,我不爱你了 妖道至尊 镇守仙秦:地牢吞妖六十年 如果我变成回忆 港综开局:我把自己炼成僵尸 源天法地之永夜之殇 我欲封地 武极昊天 女巫猎杀(西幻 高h) 谁说机器人不能修仙 命運之核 :宿命交錯 女配也要被强制爱吗(末世 nph) 昼烬(1v1) 自蹈覆辙 (1v2 重生) 【西幻】罌粟之戀 我欲修仙神魔不渡 寿衣店的营业员 穿越以后,我在黑暗世界在造乾坤 不死战神:不败传说 代码修仙:我在洪荒写天道补丁 底层逻辑 这是正经修仙吗? 朕刚登基,开局召唤十境天人! 噬神鼎 狂想版三国 西游:收徒孙悟空,圣人被玩坏了 都市空间王 韩娱之脸盲 为了祸害正道,我只好制作游戏了