Nyt fra den store nordiske Wikipedia geotaggingkrig

(Artikelserie Dit og mit kort, 253). Som en tommelfingerregel går man ud fra at ca. 20 % af alle Wikipedia artikler har et geografisk islæt. Det kan være artikler om byer, museer, kirker, statuer, broer osv. Objekter som ikke findes mere kan også have et geografisk islæt fx Saltlageret, Valby Gasbeholder osv. Kun Wikipedia artikler med geografiske objekter som findes her og nu, kan vi kæde sammen med OpenStreetMap (læs mine artikler 1,2) med et tag.

Wikipedia tags i OSM

Vi kan kigge på hvilket nordisk OpenStreetMap community som er nået længst med at koble geografiske Wikipedia artikler sammen med OpenStreetMaps geodatabase. Sammenkoblingen sker i form af tags i stil med “wikipedia=da:Vikingeskibsmuseet”, “wikipedia=no:Bislett stadion”, “wikipedia=sv:Skånes Djurpark”, “wikipedia=fi:Uspenskin katedraali” osv. Stillingen 3. november 2013 er følgende med hensyn til antal unikke Wikipedia artikler i OpenStreetMap.

  1. 1901 – Danmark
  2. 1868 – Sverige
  3. 545 – Finland
  4. 301 – Norge

OpenStreet Danmark har lagt sig i spidsen. Nu er antallet af Wikipedia artikler i de forskellige lande ikke lige store. 3. november 2013 er stillingen følgende

  1. 1596478 – Sverige
  2. 399218 – Norge
  3. 334832 – Finland
  4. 182942 – Danmark

Her indtager Danmark en sidsteplads og Sverige har en solid førsteplads. Da vi antager at i hvert land har ca. 20 % af alle Wikipedia artikler et geografisk islæt, så justerer vi for dette forhold. Vi lader Danmark være indeks 100 i den nordiske OpenStreetMap Wikipedia taggingkrig og får så følgende stilling.

  1. 100 – Danmark
  2. 15,66 – Finland
  3. 11,26 – Sverige
  4. 7,25 – Norge

Med denne opgørelsesmetode så er OpenStreetMap Danmark rykket fra de andre lande godt og solidt.

Opdatering kl. 11.55. Wikipedias danske formand Ole Palnatoke gør mig opmærksom på at grunden til at Wikipedia Sverige har så markant flere artikler end de andre nordiske lande skyldes robotskabte artikler . Disse svenske robotskabte artikler handler især om fugle, svampe og insekter og skulle ifølge Ole Palnatoke udgør 2/3 af alle svenske artikler. Da disse emner ikke kan geotagges til et bestemt og præcist område, så vil Sverige vedr. indekstal for OpenStreetMap ovenfor ikke rigtigt bruges. En stor tak til Ole for at gøre opmærksom på denne væsentlige forskel mellem de nordiske lande i Wikipedia regi.

Nu kan tingene ændre sig hurtigt i OpenStreetMap regi, og den nordiske Wikipedia stilling kan hurtigt ændre sig, såfremt at de andre landes OpenStreetMap communities beslutter sig for, at nu skal Danmark fravristes førerstillingen. Her skal også nævnes at Wikipedia (alle lande) stadigvæk mangler en del artikler om geografiske objekter, især om mindre byer, kirker i udkantsområderne.

Et forsigtigt skøn fra min side vil være, at der er mindst 8000 (på nuværende tidspunkt) danske Wikipedia artikler, som kan kædes sammen med OpenStreetMap Danmark. I denne ca. 20 % geografiske antagelse tæller også danske Wikipedia artikler om udenlandske geografiske objekter fx Eiffeltårnet, Notre Dame, Empire State Building osv. Disse danske Wikipedia artikler om udenlandske objekter har ingen relevans for OpenStreetMap Danmark. Men der er uanset hvad, en lang vej og meget arbejde endnu mod så godt som fuldstændighed (sammenkædning) af alle relevante danske geografiske artikler fra Wikipedia til OpenStreetMap Danmarks delen.

Sådan undersøgte jeg – OpenStreetMap geodata fra Sverige, Norge, Finland og Danmark blev hentet fra Geofabriks download arkiv 3. november 2013 . Open source værktøjerne Osmconvert og Osmfilter blev brugt til at hente statistiske oplysninger ud om Wikipedia tags for de respektive lande. Da Finland har officielt to sprog så er tags for både wikipedia=fi:ARTIKEL og wikipedia=sv:ARTIKEL talt sammen.

Osmfilter
(Billede – Osmfilter viser statistiske oplysninger)

Le Monde har fået fransk verdenskort

(Artikelserie Dit og mit kort, 211). MapBox har for den franske avis Le Monde lavet et fransk verdenskort. Det vil sige at du ser de fleste stednavne på fransk. Le Monde skal bruge dette verdenskort som grundkort og henover skal avisens geotagget artikler angives.


(Le Mondes verdenskort med franske stednavne for Norden)

MapBox har brugt OpenStreetMaps geodata til at lave dette nye franske verdenskort for Le Monde. Vedr. de franske stednavne for områder udenfor selve Frankrig, så stammer nogle fra OpenStreetMap frivillige som har tilføjet fransk sprogkode for geografiske objekter i følgende tag “name:fr=FRANSK“.

Wikipedia har også bidraget i stor stil med stednavne på fransk samt på mange andre sprog. I november 2012 blev der lavet et udtræk på alle geotagget Wikipedia artiklerne for lande og hovedstæder (alle sprog fra Wikipedia) og så sammenlignet med OpenStreetMap sprogkoder for det samme. Hvis sprog XX manglede i OpenStreetMap, så blev disse indsat maskinelt ved en sammenkørsel.

Det kan bedst vises ved et eksempel med “Juleøen” (link til OpenStreetMap her). For at vide hvilket geografisk objekt der hører til hvad – Så er det tagget “wikipedia =en:Christmas Island” i OpenStreetMap, der styrer sammenknytningen. Der er fx flere byer der hedder Paris, så det er vigtigt at vide hvilken Paris der er knyttet sammen med en bestemt og rigtige Wikipedia artikel.

Du vil kunne se over 100 forskellige sprog og hvad “Juleøen” hedder på disse. En OpenStreetMap frivillig kunne have brugt flere timer på at oversætte og indsætte disse. Dette er smart genbrug af Wikipedias sprogkorpus. Jo flere sprog, jo bedre genfinding.

Er det ikke misbrug af Wikipedias data? – Projektet blev finansieret af Wikimedia Tyskland og samtidigt betragter Wikipedia ikke et stednavns stavemåde på forskellige sprog som værende noget, der kan gøres copyright på. Næste sammenkørsel med sprog har jeg hørt skulle være større floder og søer verden over.

Hvad skal vi med alle disse her stednavne på forskellige sprog? – Versionen for OpenStreetMap er ude i fremtiden at uanset hvilket sprogområde du kommer fra vil du kunne se stednavne på dit eget sprog på et OpenStreetMap kort. Det er selvfølgelig et godt stykke vej før det er en realitet.

Gør uventet fund i OpenStreetMaps database

(Artikelserie Dit og mit kort, 185). OpenStreetMap ville være et meget lettere tilgængeligt projekt, hvis nogen havde besluttet at kun 100 forskellige geografiske objekter skulle kortlægges. Det kunne være ting som købmand, veje, stier, hoteller, fodboldbaner, søer, skove o.s.v. Men da missionen for OpenStreetMap er, at kortlægge hver eneste tænkelige geografiske objekt i verden, så render man hurtigt ind i mange tusinde forskellige objekter.

Der er faktisk ifølge TagInfo lavet 36509 forskellige tags, og det er fuldstændigt umuligt for en OpenStreetMap frivilligt at kunne huske disse. Derfor er værktøjer som TagInfo nyttige, hvis man står med et geografisk objekt, man ikke lige er klar over, hvordan skal beskrives (tagges).

Man studser også ofte over, hvad det så egentlig er de frivillige vil beskrive. Under kortlægning af en dansk kaserne, ville jeg lige tjekke alt inden for “military” katgorien. Jeg studsede over følgende tag “military=nuclear_explosion_site“, som var brugt 2405 gange.

Hvilket så vakte min nysgerrighed, og via OverPass API (webservice til OpenStreetMaps data) og Wget programmet blev alle geodata hentet med følgende argument.

wget -O nuclear.osm http://overpass-api.de/api/xapi?*[military=nuclear_explosion_site][@meta]

Softwaren QQIS blev dernæst brugt til at skabe en KML fil (fil kan hentes her 159KB), så disse 2405 objekter kunne ses nærmere som et lag henover et kort.


(Google Earth over Bikini-atollen og atomprøvesprægninger som lag vist henover)

Det viser sig, at det er samtlige atomprøvesprængninger siden 2. verdenskrig, som er blevet angivet i OpenStreetMap. Det er så USA og Rusland (Sovjetunionen da dette fandtes) som de førende på det område. Metadata tags for hvert enkelt sted er meget beskrivende fx militærkodenavn, bombetype, hvor stort et krater (ved jordoverfladen) det gav, tidspunktet. Men du kan selv gå på opdagelse i ovenstående KML fil omkring i verden.

Der er sikkert mange andre historier, der kan skrives med uventet fund og sære “tags” fra OpenStreetMap universet, og du skal være mere end velkommen til at gå på gratis datajagt og opdagelse. Hvad med en analyse af ca. 111.000 fodboldbaner og hvor de placerer sig i byområder verden over?

På en ø med høje tweets-bjerge

Nogle forskere ved CASA (Centre for Advanced Spatial Analysis) ved UCL har visualiseret geotagget tweets for hele London by. Og så er London lavet om til en ø med landskaber fyldt med bjerge, højden baseret på antal geotagget tweets i det område. Det er der kommet to flotte spændende visualiseringer ud af som du kan se nedenfor.

Først video viser hele London området. Tip – klik på knappen i videoen for at se stort format.

Anden video går tæt ind på området omkring Soho. Soho er det område i London, der sendes flest geotagget tweets fra folks Twitter konti. Dermed vises Soho som et kæmpe bjerg. Det er en slags DEM (digital elevation model) baseret på virtuelle klynger af geodata og ikke baseret på den virkelig verdens fysik.

Nogen, der er friske på at lave en Københavner version? Det er virkelig blærerøvs visualiseringer CASA tit disker op med, men på den gode fede måde.

Via Digital Urban.

6 måneders tilbageblik på OpenStreetMap Danmark

(Artikelserie Dit og mit kort, 54). Jeg har lavet et historisk tilbageblik for OpenStreetMap Danmark de sidste 6 måneder. Jeg har nedenfor opremset højdepunkterne for, hvad der er sket af væsentlige ting. Listen er selvfølgelig helt subjektiv og set fra min vinkel. Hvis du mener, at jeg har glemt et eller andet vigtigt, så skriv gerne en kommentar.

  • Primo november 2010 – Wikipedia Danmark og flere andre lande tilføjer OpenStreetMap funktion som standardkort til deres geotagget artikler
  • 23. november 2010 – Ekstra Bladet benytter OpenStreetMap til visualisering af en vejrudsigtartikel. Det er første gang et større medie i Danmark benyttter OpenStreetMap
  • Ultimo november 2011 – Dansk Cyklist Forbund efterlyser i deres tidsskrift Cyklister (2010, nr. 6) blandt deres medlemmer nogle frivillige til OpenStreetMap. Over 100 personer henvendte sig
  • 1. december 2010 – Microsoft Bing Maps giver tilladelse til at OpenStreetMap frivillige indtegner efter deres kort. I Danmark dækker Bing Maps i god opløsning ca. 15 % af hele landet
  • 6. januar 2011 – Det landsdækkende ortofotos lag fra Fugro går live. 662 luftfoto af 10X10km i 40 cm opløsning. Jonas Häggqvist og Peter Brodersen står for den tekniske implementering
  • 11. januar 2011 – OpenStreetMap frivillige fra Kolding omegn melder, at nu er alle veje og mindre stier i kommunen med. Den første danske kommune hvor dette er sket
  • Ultimo januar – Jonas Häggqvist videreudvikler nogle statistiske værktøjer til brug for manglende danske navngivne veje i OpenStreetMap (Værktøj 1,2)
  • Medio Februar – 3 medarbejdere i Dansk Cyklist Forbund sendes på intensiv OpenStreetMap kursus. Disclaimer underviser er undertegnende
  • 10. marts 2011 – Melding om at det første danske speciale om OpenStreetMap er på vej. Det er studerende ved Kort- og landmålertekniker studiet i Horsens. Ekstern vejleder på opgaven er Jens Winbladh
  • 14-15 marts 2011 – Det første 2. dages kursus i OpenStreetMap i Danmark, udenfor det sædvanlige Open Source miljø. Det bliver afviklet i Vejen for turistfolk og enkelte folk fra nogle kommuners GIS afdelinger. Disclaimer underviser er undertegnende
  • 18. marts 2011 – Dansk Cyklist Forbund begynder at afholde de første OpenStreetMap kurser for deres medlemmer. Disclaimer underviser er undertegnende
  • 22. marts 2011 – Masseimport af 19.024 bygninger fra Stevns Kommune. Geodata stillet frit til rådighed for enhver der måtte ønske at benytte disse.
  • 26-27. marts 2011 – Masseimport fra Kolding Kommune af 75.859 bygninger, 61 mindesmærker og 80 statuer
  • 30. marts 2011 – Stevns Kommune og sagen om de gratis geodata. Debat i Version2 hvor OpenStreetMap indgår
  • 31. marts 2011 – Et OpenStreetMap community for de frivillige fra Dansk Cyklist Forbunds medlemmer går i luften
  • 13. april 2011 – Turist- og cykelrute planlægger Cyclistic går online i tidlig beta version. Dansk Cyklist Forbund står bag
  • 5. maj 2011 – Status over væksten i OpenStreetMap Danmark fra 28. december 2010 til 5. maj 2011 – Antal vejstrækninger (tæller både veje/stier) fra 184358 til 268560 stk. (vækst 45,67 %) – Geodata for Danmark fylder nu ca. 1,3 GB

Men de største højdepunkter sker hver eneste dag, døgnet rundt, når de danske frivillige i deres fritid tilføjer, redigerer og retter indhold i OpenStreetMaps database. Uden deres store indsats vil et projekt som OpenStreetMap ingen værdi have.

Topografiske Twitterkort for New York, London, Paris og München

Jeg har før nævnt CASAs (Centre for Advanced Spatial Analysis ved University College London) projekt med indsamling af geotagget tweets (baseret på brugerens lokalitet) fra forskellige storbyer rundt om i verden. Nu har CASA lavet nogle topografiske kort over disse geotagget tweets.

Du ser hermed et højdekort baseret på antal tweets i byerne (data fra de indsamlede byer). Nedenstående interaktive topografisk kort viser New York med en radius af 30 km fra centrum. Prøv at zoome rundt og se hvilke områder af New York, der især sendes tweets fra (stor udgave her)

De andre interaktive topografiske twitterkort i fuld størrelse kan ses ved klik på et af nedenstående links

Sådanne geografiske visualiseringer kan fortælle en del om first movers (hvilket jeg mener, at brugerne af Twitter stadigvæk er) bevægelser gennem byerne. Hvor de holder til, bor og bevæger sig rundt i det urbane rum med deres mobile gadgets og computere. Gad vide hvordan et Københavnerkort ville se ud?

Hattip til Google Maps Mania