World wide web telt zeker 14,3 miljard webpagina's

Het world wide web telt zeker 14,3 miljard webpagina's.

Dat heeft de Tilburgse student Maurice de Kunder becijferd. Het Nederlandse web telt minstens 291 miljoen webpagina's.

De Kunder, student bedrijfscommunicatie en digitale media in Tilburg, heeft zijn afstudeerscriptie aan het onderwerp gewijd. De Kunder gebruikte voor het tellen een methode die uitgaat van woord- en documentfrequenties in verschillende tekstverzamelingen.

Als een woord in dertig artikelen voorkomt in een verzameling van 30.000 krantenartikelen, dan is de verwachte documentfrequentie van dat woord 1 op 1000. Wanneer een zoekmachine meldt dat er 9 miljoen webpagina's zijn waarop dat woord voorkomt, dan is het aannemelijk er 9 miljard webpagina's te vinden zijn.

De Kunder herhaalde de rekensom voor een groot aantal woorden en kon op die manier de omvang van de database van de zoekmachines Google, Yahoo Search, MSN Search en Ask schatten. Maar omdat de machines voor een deel dezelfde sites vinden, moest de student via een steekproef de overlap er uit halen. Die correctie bracht De Kunder op 14,3 miljard.