Den usynlige geoweb

Michael Jones fra Google fortalte i slutningen af juli måned, at Google estimerede at antal af KML filer (inkl. KMZ som er en zippet udg. af KML) nu var

  • 500 millioner
  • Disse har tilsammen 2 milliarder placemarks (rummer punkter, linier, polygoner, 3D modeller)
  • 250000 webservere er værter for KML filer

Da Google siden 2006 også har indekseret KML/KMZ filer i deres søgemaskine, har man også kunne søge specifikt efter den type af filer. Vi kan se ,hvor mange KML/KMZ filer Google har i deres indeks d.d. ved følgende søgeterm “filetype:kmz OR filetype:kml” – Det giver p.t. 8.160.000 hits. Nu spørger du sikkert og helt berettiget, hvor er så de sidste 491,84 millioner henne?

Den primære forklaring på disse manglende mange millioner er, at Google Crawler der høster rundt på webben, kan ikke høste KML/KMZ filer, der bliver dannet on-the-fly fra databaser. Det er helt den samme problematik vedr. den usynlige web, hvor det kun er brøkdele søgemaskiner kan se.

Hvordan kan Google så hævde at der er 500 millioner KML filer ude på geowebben? Nu røber Michael Jones fra Google intet om research- og beregningsmetoder, men med den forskning/beregninger der er lagt i den usynlige webs størrelse, så lyder Googles estimat på 500 millioner ikke helt ude i skoven. Det er den første gang jeg hører om en beregning på antal KML filer, så vi tage det for gode varer Googles beregning p.t.

Nu er geoweb ikke lig med kun KML formattet, andre formatter er også en del af geowebben med fx GeoRSS, CSV (som bare har geokoordinater tilknyttet), Shape, MapInfo, GeoJSON osv. Hvis du vil læse mere om GeoWeb standarder, så kan Andrew Turners “GeoWeb Standards – Current Problems” anbefales.

Nu skal geoweb ikke betragtes som et selvstændigt net adskilt fra den normale web, det er en del af den normale web, men geoweb er alt det indhold, der har på en eller anden vis er beskrevet geografisk. Dette kan være som i ovennævnte formatter, eller du fx geotagger dine billeder hos Flickr, videoer hos YouTube osv.