Nyt fra den store nordiske Wikipedia geotaggingkrig

(Artikelserie Dit og mit kort, 253). Som en tommelfingerregel går man ud fra at ca. 20 % af alle Wikipedia artikler har et geografisk islæt. Det kan være artikler om byer, museer, kirker, statuer, broer osv. Objekter som ikke findes mere kan også have et geografisk islæt fx Saltlageret, Valby Gasbeholder osv. Kun Wikipedia artikler med geografiske objekter som findes her og nu, kan vi kæde sammen med OpenStreetMap (læs mine artikler 1,2) med et tag.

Wikipedia tags i OSM

Vi kan kigge på hvilket nordisk OpenStreetMap community som er nået længst med at koble geografiske Wikipedia artikler sammen med OpenStreetMaps geodatabase. Sammenkoblingen sker i form af tags i stil med “wikipedia=da:Vikingeskibsmuseet”, “wikipedia=no:Bislett stadion”, “wikipedia=sv:Skånes Djurpark”, “wikipedia=fi:Uspenskin katedraali” osv. Stillingen 3. november 2013 er følgende med hensyn til antal unikke Wikipedia artikler i OpenStreetMap.

  1. 1901 – Danmark
  2. 1868 – Sverige
  3. 545 – Finland
  4. 301 – Norge

OpenStreet Danmark har lagt sig i spidsen. Nu er antallet af Wikipedia artikler i de forskellige lande ikke lige store. 3. november 2013 er stillingen følgende

  1. 1596478 – Sverige
  2. 399218 – Norge
  3. 334832 – Finland
  4. 182942 – Danmark

Her indtager Danmark en sidsteplads og Sverige har en solid førsteplads. Da vi antager at i hvert land har ca. 20 % af alle Wikipedia artikler et geografisk islæt, så justerer vi for dette forhold. Vi lader Danmark være indeks 100 i den nordiske OpenStreetMap Wikipedia taggingkrig og får så følgende stilling.

  1. 100 – Danmark
  2. 15,66 – Finland
  3. 11,26 – Sverige
  4. 7,25 – Norge

Med denne opgørelsesmetode så er OpenStreetMap Danmark rykket fra de andre lande godt og solidt.

Opdatering kl. 11.55. Wikipedias danske formand Ole Palnatoke gør mig opmærksom på at grunden til at Wikipedia Sverige har så markant flere artikler end de andre nordiske lande skyldes robotskabte artikler . Disse svenske robotskabte artikler handler især om fugle, svampe og insekter og skulle ifølge Ole Palnatoke udgør 2/3 af alle svenske artikler. Da disse emner ikke kan geotagges til et bestemt og præcist område, så vil Sverige vedr. indekstal for OpenStreetMap ovenfor ikke rigtigt bruges. En stor tak til Ole for at gøre opmærksom på denne væsentlige forskel mellem de nordiske lande i Wikipedia regi.

Nu kan tingene ændre sig hurtigt i OpenStreetMap regi, og den nordiske Wikipedia stilling kan hurtigt ændre sig, såfremt at de andre landes OpenStreetMap communities beslutter sig for, at nu skal Danmark fravristes førerstillingen. Her skal også nævnes at Wikipedia (alle lande) stadigvæk mangler en del artikler om geografiske objekter, især om mindre byer, kirker i udkantsområderne.

Et forsigtigt skøn fra min side vil være, at der er mindst 8000 (på nuværende tidspunkt) danske Wikipedia artikler, som kan kædes sammen med OpenStreetMap Danmark. I denne ca. 20 % geografiske antagelse tæller også danske Wikipedia artikler om udenlandske geografiske objekter fx Eiffeltårnet, Notre Dame, Empire State Building osv. Disse danske Wikipedia artikler om udenlandske objekter har ingen relevans for OpenStreetMap Danmark. Men der er uanset hvad, en lang vej og meget arbejde endnu mod så godt som fuldstændighed (sammenkædning) af alle relevante danske geografiske artikler fra Wikipedia til OpenStreetMap Danmarks delen.

Sådan undersøgte jeg – OpenStreetMap geodata fra Sverige, Norge, Finland og Danmark blev hentet fra Geofabriks download arkiv 3. november 2013 . Open source værktøjerne Osmconvert og Osmfilter blev brugt til at hente statistiske oplysninger ud om Wikipedia tags for de respektive lande. Da Finland har officielt to sprog så er tags for både wikipedia=fi:ARTIKEL og wikipedia=sv:ARTIKEL talt sammen.

Osmfilter
(Billede – Osmfilter viser statistiske oplysninger)

Skriv et svar

Din e-mail-adresse vil ikke blive offentliggjort. Krævede felter er markeret med *

Disse HTML koder og attributter er tilladte: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>