20070606

Google搜索排名算法背后的人

最近一段时间Google简直是上帝,推出了街景浏览,拷贝了几本梵语书,和好莱坞打
打嘴仗,随手收购了几家公司,顺便又摇摇微软这棵大树。

但是搜索引擎依旧是Google的核心,令它强大的根基。Google想要满足用户的需求,
但并不总是很成功。这就是Amit Singhal和其他数百位Google工程师每天的工作,完
善搜索引擎,改善搜索算法。2000年加入Google的印度人Singhal先生目前是最神秘的
"搜索质量(search—quality)"部门的主管,正是它决定如何向用户提供最好的搜索
答案。就像可口可乐的配方,Google很少让外人接触这个部门,《纽约时报》显然面
子很大,Singhal向他们介绍了搜索查询背后神奇的数学算法。


搜索已经从几年前的"列出相关结果"转变成"提供用户最想要的结果"。面对互联网浩
瀚的网页,决定它们重要性的算法是由数以千计的方程式组成的,牵一发而动全身,
改变一个方程式就可能影响无数网页的排名,而search—quality团队每周都会作出5到
6个大大小小的改变,以提高搜索精度。

Google的1万多名雇员可以使用一套叫"Buganizer" 的系统来通告搜索问题,每天约有
100次左右。但对于这些的问题Singhal先生并不会立刻就去修正,因为调整一个方程
式牵涉太多,必须等到时机成熟。算法也有很多问题,它假定旧的页面更好,因此在
去年Google Finance发布时,算法竟然没有找到,因为它太新了。

文章还提到,为了快速的搜索,Google并不是简单的建立一个巨大的web数字目录,而
是把整个互联网拷贝下来——每一个字节每一个网页——都被储存到专门的数据中
心。Google开发了一套系统可以迅速的搜索这些信息。"

http://www.nytimes.com/2007/06/03/business/yourmoney/03google.html?_r=2&oref=slogin&oref=slogin