Sådan hjælper Wikipedia Le Monde og andre med stednavne til digitale kort

(Artikelserie Dit og mit kort, 251). Forrige indlæg handlede om hvordan Wikipedia bruger OpenStreetMaps geodata. Dette indlæg handler så hvordan OpenStreetMap får data fra Wikipedia. Wikipedia har et kæmpe sprogkorpus af geografiske objekter på mange forskellig sprog, som OpenStreetMap er meget interesseret i. Jeg har skrevet om hvordan der sidste år blev importeret alle stednavne fra Wikipedia artikler om lande og hovedstæder til OpenStreetMap.

Nu er Wikipedias stednavne mere end lande og hovedstæder – det kan fx være kendte turiststeder som Eiffeltårnet, som Wikipedia har skrevet om på forskellige sprog og har forskellige stavemåder fra sprog til sporg (Eiffelturm, La Tour Eiffel, Eiffel Tower osv).

Så for at gøre arbejdet lidt lettere med at få disse sprog og koblet Wikipedia sammen med OpenStreetMap er der oprettet et samarbejde i form af WIWOSM (Wikipedia where in OSM). Der er i den forbindelse lavet et semi-automatisk import værktøj (der kommer et selvstændigt blogindlæg om hvordan dette værktøj virker). Jeg kalder det et semi-automatisk værktøj, fordi du skal tage stilling fra objekt til objekt, når du vil koble Wikipedia og stednavne på forskellige sprog sammen med OpenStreetMap.

Hvor kommer Le Monde ind i billedet som overskiften lægger op til? Firmaet Mapbox har for Le Monde lavet et fransk verdenskort (OpenStreetMap geodata baseret). Det vil sige du vil såvidt se franske stednavne rundt omkring i verden på Le Mondes kort, hvis stednavnene altså findes på fransk. Ellers vil det være lokale stavemåder angivet på det franske verdenskort. Det er ikke helt simpelt og ligetil at skaffe åbne datasæt med stednavne for at lave et globalt verdenskort på et sprog. Her spiller Wikipedia en meget vigtigt rolle for at skaffe stednavnene. Selvfølgelig har Wikipedia ikke alle stednavne på alle sprog.

Vi tager en case med Ribe Domkirke – Her blev der først vist på på Le Mondes franske verdenskort stednavnet “Ribe Domkirke”.

Ribe Domkirke

Med det semi-automatiske importværktøj lavede jeg en forespørgsel efter Wikipedia og OpenStreetMap for objektet “Ribe Domkirke”. Jeg fik retur alle sprogvarianter af Ribe Domkirke , som der skrevet artikler om på Wikipedia (indtil videre) fx fransk sprogtag “name:fr:=Cathédrale de Ribe“. Via OpenStreetMap redigeringsværktøjet JOSM hentes alle sprogvarianterne fra Wikipedia over i OpenStreetMap. Og endelig bliver OpenStreetMap tagget “wikipedia=da:Ribe Domkirke” koblet på, dette tag binder Wikipedia og OpenStreetMap sammen. Domkirkens bygningspolygon laves ved samme lejlighed endnu bedre og dernæst gemmes arbejdet.

Sprogimport

Mapbox henter hvert 5. minut alle nye geodata der er produceret i OpenStreetMap og indsætter det i deres egen geodatabase. Dernæst går Mapbox tile-servere i gang med lave rendering for deres kunder. Da der er tilføjet “name:fr:=Cathédrale de Ribe” tag så vil Le Monde verdenskort vise (kig på interaktivt kort her) dette franske navn. Hele processen tager ca. 20 minutter fra “Gem” geodata hos OpenStreetMap geodatabase til Mapboxs Le Monde verdenskort viser det franske stednavn for Ribe Domkirke.

Fransk

Det tyske OpenStreetMap community har også deres eget kortdesign, og her bliver danske stednavne som der findes en tysk variant i OpenStreetMaps geodatabase brugt – Godt eksempel er Hadersleben (dansk Haderslev) som kan ses her.

Hadersleben

Især i Sønderjylland vil du se en del tyske stednavne på OpenStreetMap tyske communitys kort. OpenStreetMap Danmark har indtil videre koblet ca. 1850 Wikipedia artikler med danske geografiske emner sammen. Der er stadigvæk masser at koble sammen. Ideen på den lange bane er at hvis fx nogen skriver en artikel om Ribe Domkirke på russisk eller måske latin ude i fremtiden, så vil disse nye sprogvarianter automatisk blive hentet over i OpenStreetMap. Det kræver selvfølgelig at så mange geografiske objekter fra Wikipedia kobles sammen med OpenStreetMap via tagget “wikipedia=da:ARTIKEL” for at dette kan blive meget brugbart.

Endelig til sidst så betyder flere sprogvarianter, at der bliver bedre genfinding/informationssøgning muligheder. OpenStreetMaps søgemaskine Nominatim indekserer disse sporgvarianter og samtidigt indgår Wikipedia tagget i vægtningen. Se Ribe Domkirke på Nominatim som et eksempel.

Ribe Domkirke i Nominatim

Løs den gordiske by/land knude for OpenStreetMap med offentlige adresser

(Artikelserie Dit og mit kort, 250). Med et vejnet (almindelige veje og stier) på nu over 160.000 km for OpenStreetMap Danmark begynder det at blive lidt svært at finde områder at tilføje endnu mere til vejnettet. Der er dog stadigvæk et misforhold mellem land og by med hensyn til vejnettet, da de fleste frivillige bor i byområder og samtidigt også kortlægger mest der. Selvfølgelig er der landområder i Danmark som er godt dækket ind, det kan skyldes nogle få personers indsats og lokalkendskab til et landområde. Mens andre landområder kun er dækket ind med de store veje.

Så for at finde landområder og hvor der er mulighed for at kortlægge mere, så kan vi tage Overpass Turbo værktøjet tilrådighed. Vi vil bruge de offentlige adresser, som OpenStreetMap har i et 100 % landsdækkende datasæt. Vi laver Overpass søgning som tager udgangspunkt i en 150 meter søgning fra et adressepunkt mod om der findes en vej eller sti i nærheden. Hvis der ingen vej eller sti er i nærheden (150 meters afstand) , så vis os disse adressepunkter.

Vi tager Horslunde på Lolland som case. Overpass søgningen kan prøves her. Nu vil der blive angivet steder, som måske kan være en mulighed for mere kortlægning.

Horslunde vist i Overpass søgning

Vi zoomer ned ved “Søndertoftevej 11” adressepunktet. Vi kliker på kortets markør og dernæst på “hyperlinket” (talværdi).

Nu bliver vi ført over til OpenStreetMap og kan åbne området med adressepunktet i redigeringsværktøjer som fx iD, Potlatch 2 eller JOSM. Vi ser om det er muligt at tilføje nye veje ved “Søndertoftevej 11“.

Det ses at der mangler en vej ned til gården ved adressepunktet. Vi indtegner denne manglende vej ned til gården og gemmer arbejdet.

Nu er der blevet tilføjet 230 meter mere vej i OpenStreetMap ved hjælp af offentlige adresser og en Overpass søgning. Tidsforbrug ca. 1 min plus gårdens område er tillige blevet indtegnet. Vi kan sammenligne området omkring gården mellem OpenStreetMap, Google Maps og Bing Maps i Geofabrik Map Compare. (interaktivt kort her)

Det ses, at kun OpenStreetMap har vejen ned til gården indtegnet. Overpass søgningen kan du flytte hen til et andet område af Danmark – Træk kortet hen det ønskede område og klik så på “Søg” knappen. Start så evt. mere kortlægning selv. OpenStreetMap laver jo ikke sig selv. Du kan evt. ændre i radiusafstand til 100 meter i Overpass og så søge.

Der vil dukke adressepunkter op, som der overhovedet ikke fører nogle veje eller stier op til. Dette er ikke nødvendigvis fejl i de offentlige adressepunkter. Du MÅ IKKE SLETTE disse fundne adresspunkter. Et eksempel er fra Hedagervej 60C ved Odense, som her kan ses på Bing luftfotoet, at der ingen veje eller stier fører op til adressepunktet

Okay, vi har ikke 100 % løst landområde problematikken for hele Danmark. Stier i skove kan ikke kortlægges og det samme gælder for geografiske objekter som fx tapper med mindre lokale eller aktive OpenStreetMap frivillige tager ud på selve stederne. Men mere indhold dag for dag gør hele OpenStreetMap mere værdifuldt.

Wikipedia og OpenStreetMap : et fornuft partnerskab i åbne data udveksling

(Artikelserie Dit og mit kort, 249). Jeg fortalte i sidste måned på den danske Wikidag om, hvordan Wikipedia og OpenStreetMap samarbejder samt udveksler data. Jeg vil her fortælle lidt mere om dette.
Først lidt baggrund – Wikipedia startede ca. år 2005 med at give muligheden for at geotagge en artikel. Denne form for geotagging har været/er endimensionel – Det skal forståes på den måde at artikel omhandlende et geografisk objekt kun kan få et koordinatsæt (ala. lat/long 55.698611, 12.551667).

Nu består verden jo også af geografiske objekter, der er områder og linjer. Dette er Wikipedia selvfølgelig godt klar over. Derfor har de kastet blikket på OpenStreetMap. Wikipedia har en database kopi af OpenStreetMap som de dagligt opdaterer med alle ændringerne som OpenStreetMaps frivillge har lavet de sidste 24 timer.

Vi kigger på et par eksempler, hvordan Wikipedia benytter sig af deres database kopi af OpenStreetMap. Hvis du i Wikipedias artikel om Arresø kigger oppe i højre hjørne ved “Koordinater“.

Arresø

Klik på den lille globus og du vil nu se omridset af Arresø markeret på et kort. Det er ikke personerne bag Wikipedia artiklen om Arresø, der nu har indtegnet denne polygon af Arresø. Denne polygon kommer frem pga en fra OpenStreetMap har indtegnet samt har indsat dette tag (wikipedia=da:Arresø) på Arresø objektet. Det du ser foran Wikipedia artikel navn “da:” hentyder til dansk sprog og at OpenStreetMap tagget “wikipedia” skrives med småt er ikke en fejl. (læs mere på OpenStreetMaps Wiki)

Arresø

Det virker også for geografiske objekter som er linjer se fx Wikipedia artiklen om Frejasgade i København – Klik her i stedet for på “Kort” oppe i højre hjørne. Her vil nu kunne ses en rød streg gennem Frejasgade. Den streg kommer pga. af tagget “wikipedia=da:Frejasgade” i OpenStreetMap.

Frejasgade

Det er selvfølgelig smart at Wikipedia bruger OpenStreetMap på denne vis, men der er et stort men. Man regner med at ca. 20 % af alle Wikpedias artikler har geografisk islæt. Det vil sige at for Wikipedia Danmark der findes ca. 36.000 artikler, men OpenStreetMap har indtil videre kun flettet ca. 1800 sammen i form af tagget “wikipedia=da:ARTIKELNAVN).

Der udover er det ikke alt OpenStreetMap kan flette sammen med Wikipedias geotaggede artikler. Det drejer sig fx om Saltlageret og Valby Gasbeholder. De to steder findes ikke mere og dermed vil de ikke blive kortlagt i OpenStreetMap. En begivenhed som er blevet geotagget af Wikipedia fx “Dobbelmordet på Peter Bangs Vej” vil heller ikke kunne lægges ind i OpenStreetMap.

Det er ikke til at vide præcis, hvor mange af de ca. 36.000 danske Wikipedia artikler med geografisk islæt som er af historisk natur og dermed uegnet til OpenStreetMap brug. Under alle omstændigheder, så mangler OpenStreetMaps frivillige mange Wikipedia artikler at koble på med tags både lokalt og globalt. Der er kræfter både hos OpenStreetMap og Wikipedia for at endnu mere indhold fra OpenStreetmap knyttes sammen med Wikipedia.

Næste blogindlæg vil handle om, hvad får OpenStreetMap så retur af Wikipedia?

H.O.T. kortdesign – Verden i Humanitarian stil

(Artikelserie Dit og mit kort, 248). H.O.T. (Humanitarian OpenStreetMap Team) har deres helt eget kortdesign Humanitarian, som er baseret på OpenStreetMaps geodata. Dette kortdesign er nu muligt at kalde fra OpenStreetMaps hjemmeside (openstreetmap.org) og det dækker hele verden. Du går ud i højre side og vælger “Lag” i sidemenuen – Rul ned og sæt hak i “Humanitær“.

HOT lag
(Billede – Lag skifteren i OpenStreetMap )

H.O.T. Humanitarian design er baseret på, hvad de finder relevant i deres arbejde. Så POIs er nøje udvalgt til deres formål. Du kan tag et kig på en flygtningelejr i området omkring Gasorwe i Burundi.

Gasorwe
(Billede – Flygtningelejr ved Gasorwe i Burundi)

Designet har helt op til zoomniveau 20 (læs mit forrige indlæg om zoomniveauer) – Så hvis du zoomer helt ind på zoomniveau 20 ved Gasorwe, vil du kunne se fx hvilke POIs H.O.T. finder relevante.

Gasorwe
(Billede – Flygtningelejr ved Gasorwe i Burundi)

Hvis du arbejder for eller er medlem af en NGO, så vil I også blive vist på Humanitarian (læs om NGO tagget i OpenStreetMap her og smid jer ind i OpenStreetMap hvis I ikke er der endnu) – se fx Folkekirkens Nødhjælp hovedkontor i København her.

Folkekirkens Nødhjælp
(Billede – NGO ikon på Humanitarian kortet)

Humanitarian kortdesign er selvfølgelig også lagt ud på GitHub som CartoCSS filer. Så kan man evt. bygge videre på det design.

Vi kan afslutte dette indlæg med at lave en GeoFabrik Map Compare mellem OpenStreetMap, Google Maps og Bing Maps for flygtningelejren ved Gasorwe i Burundi. (interaktivt kort her)

Gasorwe

Det taler vist helt for sig selv, hvem der har mest geodata for området.

Flere zoomniveauer lig med mere micromapping i OpenStreetMap?

(Artikelserie Dit og mit kort, 247). I august måned fik OpenStreetMaps standardkort et zoomniveau mere. Så der er nu i alt 19 zoomniveauer.

Hvad betyder det så? – Lad os tage et eksempel med Johannes Wiedewelts syv mindestatuer over gamle danske konger placeret ved Julianehøj i Jægerspris.

Mindestatuer
(Billede – Julianehøj med Johannes Wiedewelts mindestatuer)

De syv statuer står i en rundkreds med ca. 10 meters afstand i mellem hver. Da OpenStreetMap standardkort kun havde 18 zoomniveauer, var der ikke plads til at teksten for hver enkelt konge på de syv statuer kunne vises (prøv zoom 18 her)

Zoomniveau 18
(Billede – Zoomniveau 18 OpenStreetMap standardkort)

Med et nyt ekstra zoomniveau vil teksten for hver enkelt konge på mindestatuerne kunne ses (prøv zoom 19 her).

Zoomniveau 19
(Billede – Zoomniveau 19 OpenStreetMap standardkort)

Det franske OpenStreetMap community har i ca. 1 års tid haft deres eget kortdesign og med helt op til zoomniveau 20 (læs min artikel om det franske kort her). Christian Quest fortalte til årets State of The Map konference (årlig OpenStreetMap konference), at de i Frankrig havde kunne spore en forøgelse af micromapping objekter efter der var kommet helt op til 20 zoomniveauer på deres kort.

Micromapping er at små geografiske objekter bliver lagt ind i OpenStreetMap i stor stil for et mindre geografisk område. Det er især i OpenStreetMap regi et storbyfænomen, at vi ser micromapping udført. Det kan være geografiske objekter som fx cykelparkering, trapper, postkasser, statuer, hjertestartere osv. da disse bliver mere synlige med flere zoomniveauer.

Nu ved vi ikke på et globalt niveau om et zoomniveau mere per automatik giver en kraftig vækst i micromapping i OpenStreetMap – Eller at micromapping bare skyldes, at i storbyer, hvor der i forvejen findes mange frivillige at de er løbet tør for store objekter at kortlægge, så fokus nu er rettet mod mindre geografisk objekter i byrummmet. Det er virkelig en svær en at komme til bunds i med, at undersøge hvordan OpenStreetMaps frivilliges kortlægningsadfærd udvikler sig over tid. Se fx mit indlæg om Alan McConchies forskning i “Datahavearbejdere og dataemigranter i OpenStreetMap“.

Stor dansk crowdsourcing milepæl – nu over 500.000 vejsegmenter i OpenStreetMap Danmark

(Artikelserie Dit og mit kort, 246). I denne weekend nåede OpenStreetMap Danmark over 500.000 vejsegmenter (motorveje, villaveje, gangstier, trapper osv). Fra 28. december 2010, hvor der var 184.358 vejsegmenter og frem til nu 14. oktober 2013 er tallet vokset til ca. 500.369 vejsegmenter.

Det giver samlet en vækstrate i perioden på ca. 171,41 % – Det giver i gennemsnit ca. 309 nye vejsegmenter hver eneste dag. Samlet set er vejnettet (summen af veje, stier og trapper) nu oppe på ca. 160.000 km.

Vejnettet i OSM DK
(Billede – Vejnettet for OpenStreetMap Danmark)

De danske OpenStreetMap frivillige har været ude og optage GPX spor eller brugt luftfotos fra Fugro, Microsofts Bing og samt her fra i år 2013 også det åbne og frie Geodatastyrelsens forårsluftfoto (2012 udgaven) for at nå denne imponerende mængde crowdsourced geodata. Så send et stort skulderklap og en venlig tanke til de mange danske frivillige, der har brugt masser af fritid for at nå så langt.

JOSM editor over Thorsminde
(Billede – havnen ved Thorsminde set i Geodatastyrelsens luftfoto via JOSM softwaren)

Vejnettet til biler betragtes som værende færdigt, så væksten i nye vejsegmenter fremover skal findes ved crowdsourced stier og ikke mindst trapper i Danmark.

Så hvis du ved i dit lokalområde at fx i en skov, der mangler OpenStreetMap altså en hel del stier endnu. Så tag din GPS med ud på tur og få optaget ruterne som GPX fil. Opret en OpenStreetMap konto, upload filerne, begynd at indtegne nye stier efter dit GPX spor. Jo, flere stier jo bedre bliver fx rutenavigation til cyklister og vandrefolk.

Tips hvis du skal til Kortdage konferencen i år – Så holder Hans Gregers Petersen fra Septima et foredrag om “Ruteplanlægning med OpenStreetMap

Beslægtet artikel, der måske kan give dig sved på panden “Bind snørebåndene og hop med på datamotionsbølgen” i en god sags tjeneste.

Objekterne kom fra nær og fjern

(Artikelserie Dit og mit kort, 245). I serien om Overpass søgninger er vi nået til de to søgeoperatorer “around” og “difference“. De to søgeoperatorer sammen giver mulighed for at søge efter geografiske objekter i OpenStreetMaps geodatabase, der befinder sig i nærheden eller fjernt fra hinanden målt på en bestemt afstand (angivet i meter).

Vi tager her som case danske adresser, da OpenStreetMap har Danmarks ca. 2,3 millioner adresser. Da flere og flere kommuners bygningspolygoner er kommet ind i OpenStreetMap, så fremtræder også fejlplaceret adressepunkter også meget synligt, når man redigerer i disse områder i OpenStreetMap. Hovedreglen for at placere et adressepunkt (kun et koordinatpunkt) i et boligområde er, at den skal placeres ca. 3 meter fra hovedindgangen til boligen (henover bygningspolygonen).

Adressepunkter kan også placeres på byggepladser, vindmøller, transformatorstationer osv. Det er meget op til de enkelte kommuner at vælge om fx en vindmølle skal have et adressepunkt. Det kan fx være af stor praktisk betydning, så evt. ambulance/politi kan finde stedet med vindmøllen i tilfælde af en arbejdsulykke.

Lad os tage en Overpass søgning ved Gerlev Strandpark i Frederikssund Kommune. Søgningen har en buffer på 5 meter mellem et adressepunkt og en bygning (prøv søgningen selv her), derved finder vi dem som er helt oplagte forkert placeret.

Gerlev Strandpark

Vi kan importere de fundne adressepunkter (som en GeoJSON fil) ind i QGIS og så bruge Geodatastyrelsen forårs luftfoto som grundkort. Det ses tydelig i billedet nedenunder at de gule prikker (adressepunkter) ikke er korrekt placeret, de skulle rykkes længere ind og henover bygningerne.

Gerlev Strandpark

Overpass søgningen virker så ikke over adressepunkter som er placeret på byggegrunde, da bygningerne ikke er færdige endnu. Søgningen vil så heller ikke være god at bruge i kommuner der ikke har fået importeret deres FOT bygninger ind i OpenStreetMap endnu.

Gårde er et kapitel for sig selv vedr. adressepunkt placeringer – basisreglen er, at når der er et adressepunkt, så er det henover stuehuset dette punkt skal placeres og ikke over laden/staldene. Der er virkelig mange fejlplaceringer rundt omkring i Danmark ved gårdområder. Jeg vil give her et forsigtigt bud, så snakker vi mindst 3.000 gårdes adresser i Danmark som er fejlplaceret. Du kan se sådan et eksempel i billedet nedenunder [På OpenStreetMap her) – Adressepunktet (4 tallet) skal flyttes hen på stuehuset, som en OSM frivillig har navngivet Druedal. Overpass søgningen vil heller ikke fange disse fejlplaceret gårdadresser.

Druedal - Gård

Nu er der ved at ske ting og sager på adressekvalitets området – Der er blevet afsat penge fra Staten i 2014 til ca. 80 årsværk der skal forbedre adresserne ude i kommunerne. Det kan du læse mere om i “På vej mod endnu bedre adresser” (PDF link).

Vi kan også lave den modsatte Overpass søgning, hvor vi skal finde adressepunkter der er max 5 meter fra en bygning. Prøv søgningen ved Gerlev Strandpark her.

Gerlev Strandpark

Der er mange andre muligheder med “around” og “difference” operatorerne i Overpass – Hvad med at finde værthuse der befinder sig maks. 100 meter fra en kirke? eller hvad med at finde fastfood steder der befinder sig maks. 200 meter fra skoler? Du kan også tage et kig på listen over de mere simple Overpass søgninger, som du finder her.

En stor tak til Martin Raifer, udvikleren af Overpass Turbo for forklaring/hjælp vedr. “around” og “difference“.