谷歌在博客中表示,当1998年刚刚开始进行编目时,仅仅只发现2600万个页面,这一数据到2000年时上升至10亿。而过去8年中,互联网页面数量的增长速度越来越快。
谷歌通常利用一些充满大量链接的初始页面去发现新页面。实际上,谷歌发现的页面数不止1万亿,但是并非所有链接都指向不同网页,因为许多网页拥有多个不同的链接地址。1万亿只是去除这些重复页面之后的数字。
谷歌表示,严格来讲,互联网链接的数量是无限的。例如在互联网日程表应用程序中,永远都存在指向“下一天”的链接。不过,谷歌不会去编目这些链接,因为这些链接对于用户来说没有意义。
实际上,谷歌也没有编目所有这1万亿个页面,主要因为许多页面之间很相似,而另一些页面则采取与日程表类似的原理自动生成内容。





