Google 爬虫又学了一招:理解 JavaScript 代码

Google数以亿计的爬虫们每天都在以光速索引着互联网上的信息,以便我们能通过Google搜索到最新的内容。最近Google的发言人告诉福布斯说他们的爬虫现在可以跟JavaScript做深入互动了,它们甚至可以理解JavaScript 代码,这将使Google可以索引到更丰富的内容。

让一个程序理解JavaScript并不是一件简单的事,没有哪种算法可以应用到任何程序上,在任何点,告诉你这个程序是否可以继续无限循环下去, 然而如果Google的爬虫可以处理JavaScript,他们就必须解决这种困难。

Google爬虫变得越来越快越来越聪明还要感谢新的Caffeine系 统,正是这个新系统使得Google爬虫具备了理解甚至处理代码的能力,以更好的解析富媒体。

Via Mashable