谁才是真正的搜索引擎之父?


动不动就用“搜索引擎之父”这样的名头实在是太过 。如果用这个名头去找 。中国没有这样的人 。国外也难以找到这样一个人 。有人说李彦宏是 。那就更不靠谱 。因为无论是在学术研究上和技术实践上他都名不副实 。1999年的时候 。互联网搜索基本上处在分类搜索阶段 。类似于现在的网站导航 。那个时候代表是雅虎、搜狐 。2000年之后 。商业网站才开始出现关键词搜索 。2001年的时候我去过一次北大资源楼(百度在那儿办公 。规模很小) 。当时还和徐勇(李彦宏的合伙人)一起聊过 。那个时候百度才刚起步 。而在此之前 。北大有个“天网搜索”就是搞的关键词搜索 。很多早期玩互联网的可能都用过 。我也用过 。可能是学术研究性质的 。技术应用推广不够 。后来随着百度和国外一些搜索引擎的崛起销声匿迹了 。实在是可惜 。百度号称其技术是李彦宏从国外带过来的 。但据我所知 。百度早期的起步很大程度上是借鉴(或者说是使用)了“天网搜索”的东西 。不过 。百度在技术推广普及上做的比较好 。很快就在互联网搜索市场上站住了脚 。那个时候新浪是三大门户的“大哥大” 。其搜索页面下方就是“powered by baidu”,想必很多人对这个还有印象 。百度就是从很多网站下方的这个“powered by baidu”逐步被人们认知的 。都是很早之前的事情了 。只能凭记忆聊聊 。主要是不想有人动不动就用“xx之父”这样的名头去欺世盗名!搜素引擎是一项技术应用 。是逐步发展起来的 。早期的技术理论并不高深 。所以很难找到一个所谓“之父”的人 。
其他观点:
李彦宏于1997年获得了搜索引擎的关键专利 。我们通过某个关键词搜索一个文档 。如何对文档进行排序 。李彦宏的办法是通过统计对这篇文章的链接数量来排名 。形象一点就是按照引用数量排名 。这个思路在现在已经司空见惯 。但在互联网的初期 。那是革命性的突破 。谷歌1998年10月推出搜索引擎时 。引入pagerank算法 。专利到2001年9月才拿下 。李彦宏比谷歌早了四年 。科学技术第一性很重要 。说谷歌抄袭李彦宏的专利可能难听了点 。但要说没一点借鉴 。那就很不要脸了 。时间线事实摆在那里 。而且pagerank专利为什么拖了那么长时间 。这个恐怕跟专利相似性不无关系 。pagerank本质上是对李彦宏的超链分析专利的改进 。在链接排名的基础上 。给每个链接加了权重 。李彦宏的专利是一个链接一票 。谷歌的是网站越重要 。链接投票越重要 。谷歌的pagerank更合理 。但最基础的基于链接排名的思路却是李彦宏提出的 。
很多人因对百度的怨恨就极力贬低李彦宏对搜索引擎的贡献 。请诸位理性的尊重事实 。专利时间在那里 。这个谁也否认不了 。科学技术里第一性非常重要 。第一个发现人或发明人贡献才是最大的 。
个人认为李彦宏也不能称为搜索引擎之父 。称作超链分析之父比较合适 。
【谁才是真正的搜索引擎之父?】

谁才是真正的搜索引擎之父?

文章插图
其他观点:
乔纳森·弗莱彻(Jonathan Fletcher)是现代搜索引擎之父 。说来有意思 。乔发现搜索引擎技术是在其下岗的时候 。
我们先科普一下搜索引擎技术 。当我们在搜索引擎搜索框输入某个词的时候 。比如“五一假期” 。然后会出现一大堆搜索结果 。这是信息是有网络爬虫抓取的 。
在乔下岗的时候 。他无事可干 。于是回到自己母校谋了一个临时差事 。而这个活让乔接触了互联网 。当时是1993年 。网络对与地球人来说 。还很陌生 。虽然也有网站和网页 。但是用户想要访问某个页面或者网站内容 。“如果你想知道发生了什么变化 。你必须亲自回到网站上去查看 。”乔说:“我拥有计算机科学学位 。认为应该有更好的解决方式 。我决定编写一个程序来帮助我进行查看 。
正因为乔有这个想法 。为了方便自己使用 。很快 。乔利用自己的专业特长做出来第一个搜索引擎 。这个搜索引擎的命名实在有点糟糕 。叫做Jonathan Fletcher 。和谷歌 。百度 。360这些朗朗上口的搜索引擎比较 。作为技术出身的乔 。商业头脑差了一头 。
现在一个普通的搜索引擎能检索出上亿条信息 。而乔的Jonathan Fletcher最初能检索出2万条信息 。随着网虫不断抓取更多的内容 。Jonathan Fletcher不堪重负 。出现了卡顿 。乔采取的措施是精简搜索结果 。只出现标题 。但是 。很快服务器又要陷入瘫痪 。Jonathon 也开始觉得力不从心 。“那不是我的本职工作 。”他说:“我的工作是维持学生实验室运行 。做些系统管理和技术方面的零工 。”

推荐阅读