Videointerview med Michael Goodchild

James Fee har i denne uge haft den nu pensioneret geografi professor Michael Goodchild inde til en 1/2 times snak om “Crowdsourcing, Volunteered Geographic Information (VGI) og geodata”. Goodchild fortæller en del om Al Gores visioner for “Digital Earth” projektet. Goodchild mener også at samfundvidenskaberne burde bruge mere geografi i formidlingen/forskningen. Når samfundvidenskaberne ofte formilder masser af tal i tabeller om fx bestemte grupper af mennesker, så hvorfor ikke lige få angivet med et kortmashup “Hvor i verden lever disse grupper så?”.

OpenStreetMap er selvfølgelig også nævnt i dette interview, som får stor ros af Goodchild. Goodchild er imponeret over nogle steder i verden. hvor store mængder af geodata, der bliver indsamlet og kvaliteten af disse. Goodchild nævner samtidigt, at masser af disse geografiske objekter ville statslige og kommercielle kortproducenter aldrig nogen sinde indsamle. Så alt i alt kan OpenStreetMap siges at være det første forsøg i verdenshistorien på at lave et verdenskort, som er demokratisk i og med at det er OpenStreetMaps frivillige som bestemmer, hvad der skal med.

Så hvis emnet interesserer dig, så brug en 1/2 time på videointerviewet neden under.

De offentlige stednavne – skal tjekkes hyperlokalt

(Artikelserie Dit og mit kort, 194). Vi tager et kig på endnu et offentligt grunddatasæt som efter planen sættes fri 1. januar 2013. I dag er det stednavne og så evt. med brug for OpenStreetMap Danmark. Om stednavne står der i “Gode grunddata til alle – en kilde til vækst og effektivisering” (PDF link)

Stednavne- og Stamoplysningsregisteret
(SNSOR) indeholder ca. 200.000 stednavne, herunder dem som optræder på de topografiske kort og i Kortforsyningen.

Det lyder meget fint og OpenStreetMap Danmark mangler også i den grad mange stednavne. Det er især lokaliteter, hvor der ingen bor, men stedet har et stednavn. Men nu skal der ikke sættes tankeløs “kopier og indsæt” i gang af disse offentlige stednavne fra OpenStreetMaps side (NB – min personlige holdning). Det kan være at jeg uden at have kendskab til fx Rold Skov området bare tager disse stednavne fra området og plotter ind – uden overhovedet at vide om de er korrekte eller stavet korrekt, da jeg intet ved om området.

Lad mig med nogle eksempler vise, hvorfor lokalkendskab er alfa og omega. På KMS kort lige syd for landsbyen Dalby i Horns Herred finder vi en skov, der er blevet navngivet “Sobakke Skov” (se billede nede under). Nu hedder den altså korrekt “Solbakke Skov“, en privatskov som hører under Svanholm Gods.

Bevæger vi os op til Nordskoven, som hører under Jægerspris Skovdistrikt, så finder vi på KMS kort to lokaliteter “Kohave” og “Bromose“. Nu hedder det korrekte altså “Kohaven” og “Bromosen” for disse to stednavne.


(Kilde: KMS kort viser de forkerte stednavne Kohave og Bromose)

På kortet fra Jægerspris Skovdistrikts naturfolder ses også disse korrekte to korrekte stednavne (se billede nede under)

Hvis det er første gang du nogensinde sinde har har set de ovenstående forkerte stednavne, så ville du aldrig vide, at de er forkerte. Igen og igen kan det ikke understreges nok, hvor vigtigt det er for et projekt som OpenStreetMap at have masser af frivillige som er hyperlokalkendte som garanti for en vis kvalitet af geodata.

I et område på ca. 15 km2 i Nordskoven under Jægerspris Skovdistrikt fandt jeg 5 fejl. Hvis samme rate gør sig gældende på landsbasis, så er det ca. 14.365 fejlstavet stednavne. Det skulle så give en fejlrate på 13,92 % af samtlige offentlige stednavne. Lad mig lige tage et forbehold, det kan være at jeg lige præcis er ramt ned i et område med mange fejl, men at resten af landet ikke har den samme rate af fejl.

De ca. 200.000 offentlige stednavne kan være en stor hjælp til OpenStreetMap, men de skal med hyperlokalkendskab af OpenStreetMap frivillige evalueres og tjekkes før de evt. indsættes i OpenStreetMaps database. Der er jo ingen grund til at overtage andres fejl.

Jeg er også ganske sikker på, at en del stednavne ikke optræder (er blevet digitaliseret) i SNSOR, så registret er ikke fuldstændigt. Da jeg af gode grunde ikke har haft mulighed (ej adgang til data) for at lave tjek mellem OpenStreetMap og SNSOR for stednavne.

Nu har det offentlige jo til enhver tid adgang til at hente OpenStreetMaps data og så lave en sammenligning på stednavne. Det er ikke utænkelig, at det offentlige ad den vej kan få flere og nye stednavne ind i SNSOR. Samtidigt kan der laves sammenligninger på stavemåder af samme geografiske objekt. Dette kan så værdiberige SNSOR. Så frigivelsen af grunddata fra det offentlige kan hjælpe begge veje mellem OpenStreetMap og det offentlige.

Nu skal jeg ikke pudse glorien og spille super hellig på OpenStreetMaps vegne vedr. datakvalitet, der er stavefejl osv. Nu er det så meget lettere at rette en fejl selv i OpenStreetMap og hurtigt optræder det korrekte rettede sig. Der skal ikke ventes måneder/år eller på at andre retter fejlen for dig.

OpenStreetMap USA 2007-12 vækstvisualisering

(Artikelserie Dit og mit kort, 193). ITO World har lavet en OpenStreetMap USA 2007-12 vækstvisualiserings video i forbindelse med weekendens “State Of The Map USA 2012” konference (OpenStreetMap konference). Så nyd videoen, og se hvad geografisk crowdsourcing er i stand til – Tip se visualiseringen i fuldskærm tilstand.

Andre ITO World OpenStreetMap visualiseringsvideoer kan ses her.

Første landsdækkende nye frie offtenlige datasæt på spil hos OpenStreetMap

(Artikelserie Dit og mit kort, 192). Efter mandagens nyhed om, at en masse grunddata nu bliver frie per 1. januar 2013, så er det dansk OpenStreetMap community begyndt at orientere sig i grunddatakataloget, hvad der evt. kunne være relevant af data for at værdiberige OpenStreetMaps database.

Et datasæt som jeg personligt selv mener kunne være en god start for OpenStreetMap Danmark er at få en kopi af alle landets 98 kommuners vej- og stimidter (såkaldt FOT data). Nu har nogle kommuner allerede givet deres vej- og stimidter data fri til brug for OpenStreetMap. Det drejer sig om følgende kommuner Stevns, Kolding, Frederikshavn, Frederikssund, Egedal, Herlev og Ballerup.

Jonas Häggqvist har lavet et online værktøj, hvor der kan sammenlignes mellem OpenStreetMap og så de ovenstående kommuners vej- og stimidter. Hvis vi ser på to eksempler -Vi tager først Frederikssund som er vist i billedet nede under. (Frederikssund kan ses i det interaktive kort her)

Så betyder de røde felter, at her har Frederiksssund Kommune mere vej- og stimidter. Jo kraftigere rød et felt er, jo mere indhold i Frederikssunds favør. Grønne felter betyder så at OpenStreetMap og Frederikssund Kommune har lige meget indhold. Det er så typisk stier, at OpenStreetMap mangler i disse røde felter. En lokalkendt OpenStreetMap frivillig kan så dykke ned i de røde felter, og så få lagt de evt. manglende stier ind.

Tager vi så Kolding Kommune som et andet eksempel. (Kolding kan ses i det interaktive kort her)

Her er et helt anderledes billede – De blå felter betyder, at her har OpenStreetMap mere vej- og stimidter indhold. Kolding Kommune kunne så hente OpenStreetMap data og kigge på, hvor de evt. mangler at få veje og stier ind.

Et landsdækkende vej og stimidter datasæt vil hurtigt kunne give OpenStreetMap frivillige indblik i, hvor der skal sættes ind. Samlet set har landets 98 kommuner ca. 207.000 km vejnet og OpenStreetMap har i skrivende stund ca. 151.000 km vejnet.

Nu er det ikke alt kommunerne har registreret. Faktisk er der nogle kommuner, der bevidst undlader at kortlægge offentligt tilgængelige stier ned til kysten. Det skyldes, at nogle af disse kommuner ikke gider at slås (min tolkning) med lodsejere/godsejere, som absolut ikke synes at folk skal vade langs med stierne på deres jord ned til kysten.

OpenStreetMap frivillige er ganske ligeglade med disse lokale magtkampe og pleasing af bestemte grupper. Er en sti offentligt tilgængelig jfr. loven, så hører den naturligvis til på et kort, uanset hvad nogle måtte mene om dette PUNKTUM!

TED lignende udsendelser for geografi, neogeografi og GIS

James Fee, som driver bloggen Spatially Adjusted, har et ugentlig videointerview med en eller anden person inden for feltet GIS, neogeografi eller geografi. Madeline Steele (hun omtaler sig selv som GIS Geek) er moderator og modtager spørgsmål live fra seerne til ugens gæst under disse interviews. I går havde han Steve Coast (OpenStreetMaps grundlægger) inde i et 1/2 times interview med titlen “Open Is the New Winning“.

Hør Steve Coast fortælle om OpenStreetMap med visionerne og om manglerne. Steve primære anke pt. er manglende adressedata verden over i OpenStreetMap. Nu er OpenStreetMap så heldige i Danmark, at vi allerede har fået løst det problem med at få ca. 2,3 millioner åbne adressedata fra det offentlige importeret for et par år siden.

Et andet godt videointerview er med Peter Batty, en gammel rotte i faget. Interviewet hedder “Our Geospatial Future” og skal vi ganske kort koge Peters tanker ned for fremtiden , så bliver det “Crowdsourcing og Open“.

Hvis du interesserer dig for dette område, så brug en 1/2 time om ugen på at blive klogere. Jeg ser frem til næste uges videointerview, som James Fee afholder med geografiprofessor Michael Goodchild. Mon ikke vi kommer til at høre en masse om neogeografi og VGI (Volunteered geographic information)?

OpenStreetMap vil stadigvæk være på beatet

(Artikelserie Dit og mit kort, 192). I går tirsdag bragte Version2 et interview med Peter Brodersen vedr. de offentlige data som snart begynder at blive sluppet fri (1. januar 2013), og hvad OpenStreetMap så kan tænkes bruge nogle af disse data til. Der dukkede, så en kommentar op fra en Peter Hansen nede under artiklen.

Vi kan give vores brugere langt bedre detaljer om vandrestier, cykelstier, placeringen af vindmøller, vandløb og helt ned til brønddæksler. [artikel citering her]

Det er der bare ikke så meget ved når kortene fra Kort- og Matrikelstyrelsen er håbløst forældede …

Det er en misforståelse at OpenStreetMap frivillige vil sidde og vente på fx kortdata fra det offentlige er klar. OpenStreetMap vil som altid bestræbe sig på, at når fx en ny motorvej eller bro åbner, så er det klar samme dag i databasen. Det kan være hvilket som helst andet geografisk objekt, en OpenStreetMap frivillig har observeret er åbnet (eller er lukket) i sit lokalområde. Det kunne være butikker, svømmehaller, skateboardbaner – You name it -we map it.

Vi lever nu i, hvad geografiprofessor Michael Goodchild (2007) kalder VGI (Volunteered geographic information ) æraen vedr. kortproduktion og geografisk dataindsamling. Her er der ikke tid på, at vente på andre, hvis du selv har viden om geografiske ændringer i dit lokalområde, så bidrager/skaber/deler du naturligvis selv med disse informationer. OpenStreetMap platformen er så stedet par excellence, hvor mange af disse ting kan deles og så genanvendes af andre uden nogen restriktioner.

Hvis du har mod på det, så kan Goodchild (2007) artikel “Citizens as sensors: the world of volunteered geography” på ca. 10 sider anbefales. VGI termen stammer fra den artikel og er siden blevet brugt ret meget inden for faglitteraturen på det geografiske område.


(Billedetitel – Neogeografi møder Verden 1.0 – foto taget på Det kongelige Bibliotek)

Lejlighedssang i dagens anledning : Let the data play

Dagen ubetinget gode super nyhed er at per 1. januar 2013 åbnes der for en lang række offentlige grunddatasæt. Mange mennesker har været involveret gennem flere år for at dette kunne blive virkelighed. Så til ære for disse personer har jeg skrevet en sang

Let the data play


We started REST’ing and Data Love put us into a groove
As soon as we started to query the Danish government API’s.
The data played while our AR bodies displayed through the API interface,
Then data love picked us out for a new data romance
I thought it was clear the data plan was we would share for ever,
This vector feeling just between ourselves.
But when the data licens changed, the plan was re-arranged
He went to REST’ing with someone else.

We started REST’ing and data love put us into a groove
But now danish government is with someone new licens – what does Data Love want me to do?
Data love said:

Let the data play he won’t get away,
Just keep the query groove and then he’ll REST’ing back to you again, let it play.
Let the data play he won’t get away,
This API groove he can’t ignore, he won’t leave you anymore in a licens from hell, no, no, no.

He tried pretending a query is just a query, but I see
He’s querying his way back to me.
Guess he’s discovered we are truly data lovers,
API magic from the very start, ‘cause data love just kept me groovin’,
And he felt me movin’ even though we query apart.
So we started and Data Love put us into the groove
As soon as we started to query, as soon as we started to query.
Data love said:

Let the data play he won’t get away, …
He tried pretending a query is just a query, but I see
He’s querying his API way back to me,
He’s querying his API way back to me.

Data Love said:
Let the data play he won’t get away, …
Let the data play he won’t get away, …

Sangen er skrevet med hel del kunstnerfriheder fra Shannons 80’er klassiker “Let the music play”. Nogen der kan sætte lyd og stemme til?

OpenStreetMap geodata bliver brugt til simulation af 300.000 Android Smart Phones

(Artikelserie Dit og mit kort, 191). Forskningscentret Sandia i Californien arbejder med MegaDroid projektet, som kort fortalt er simulationer af, hvordan fx brugerne af 300.000 Andriod smart phones bevæger sig rundt i byrummet. For at have et netværk af punkter (nodes) disse simulationer kan bevæge sig langs med i byrummet, så er det vej- og stinettet fra OpenStreetMap der bruges (læs mit indlæg om hvad punkter i OpenStreetMap er). OpenStreetMaps geodata er jo som bekendt gratis til rådighed for enhver brug.

Videoen nedenfor omhandler MegaDroid projektet.

Danske forskere har også brugt gratis geodata fra OpenStreetMap – læs om Aalborg Universitets trafikforskningsprojektet her.

Efter Apple Maps kortapokalypsen

(Artikelserie Dit og mit kort, 190). Efter Apple gik i luften med noget nær en kortapokalypse med deres nye Apple Maps for snart 14 dage siden, så har OpenStreetMap kunne spore en vis stigning i antallet af nye frivillige.

Der er lavet et kort (bliver dagligt opdateret), der viser hvor disse helt nye OpenStreetMap frivillige de sidste 2-7 dage har bidraget henne i verden. Fx for Danmarks vedkommende kan du ved at klikke ind på dette her link se hvor henne.

Du kan klikke på ikonerne, og man vil kunne få mere at vide om de nye OpenStreetMap frivillige. Hvis du prøver at se antallet af nye frivillige ved at zoome ud (direkte link her) og se det på verdens niveau. Du vil så opdage at det er primært i Europa området, at der sker tilførsel af nye frivillige.

Nu er det velkendt, at i crowdsourcing projekter, at det er de få personer, der trækker det store læs. Neis & Zipf (2012) har i deres undersøgelse “Analyzing the Contributor Activity of a Volunteered Geographic Information Project — The Case of OpenStreetMap” (december 2011 OpenStreetMap datagrundlag) kommet frem til at det er ca. 14.600 personer, der står for 98% af alt indhold skabt i OpenStreetMaps database. Samlet var der ca. 505.000 (december 2011 tal) med en OpenStreetMap konto verden over.

Neis & Zipf (2012) deler så OpenStreetMap frivillige op i tre grupper (baseret på december 2011 tal)

  • Senior Mappers – folk der har lavet over 1000 punkter (læs hvad punkter betyder i OpenStreetMap regi her) – denne gruppe udgør ca. 24.100
  • Junior Mappers – folk der har lavet mellem 10 og 999 punkter – i alt 73.100 personer
  • Nonrecurring Mappers – folk der kun deltager en gang og aldrig vender tilbage – disse laver mellem 1 og 9 punkter – i alt 96.000 personer

Det tager vel ca. 4-5 timer at blive en “Senior Mapper”, hvis man fx kortlægger de nemme geografiske objekter som bygninger, søer, skove. Så det er “Junior Mappers” gruppen på 73.100 personer, som OpenStreetMap er meget interesseret i at blive længere og bidrage med mere, da disse personer har udvist en vis interesse i projektet. Der er tiltag i gang med en ny arbejdsgruppe, som skal kigge på dette forhold.

Hvis du ikke er helt overbevist om crowdsourcing til skabelse af et digitalt verdenskort, så kan du evt. tage et kig på mit indlæg “Showroom OpenStreetMap Danmark” for gode eksempler.

Så næste gang vi høres ved, er du så rykket op i Senior Mapper” rækken?

Stednavne scrapping fra Wikipedia

(Artikelserie Dit og mit kort, 189). Mit sidste indlæg handlede om hvordan OpenStreetMap hjælper Wikipedia med at blive bedre. Dette indlæg omhandler så om den anden vej rundt. Wikipedia har gennem årene opbygget et kæmpe stednavne korpus på forskellige sprog. Fx København, Copenhagen, Kopenhagen, Copenhague o.s.v.

Disse stednavne kan genbruges i OpenStreetMap til at have multisproget navngivning af geografiske objekter. Jo flere stednavne på forskellige sprog, jo bedre mulighed for genfinding af geografiske objekter, da man aldrig kan vide fra hvilket land folk kommer fra, og på hvilket sprog disse folk vil søge.

Wikipedia Tyskland har i foråret givet OpenStreetMap 20.000 € til at føre sådan et genbrugsprojekt ud i livet. Lad os tage en case med Hans Ø for bedre at forstå konceptet bag. Hvis du ser ude i venstre side på Wikipedia kigger, så er der forskellige andre sprog Hans Ø bliver skrevet om. Men på andre sprog hedder Hans Ø måske noget helt andet.

Hvis vi ser på Hans Ø objektet i OpenStreetMap. Du vil nu se en masse forskellige sprog med hvad Hans Ø hedder på det respektive sprog. “name:de = Hans-Insel” ,
“name:en = Hans Island”, “name:eo = Tartupaluk” o.s.v.

Ideen er nu at spare den OpenStreetMap frivillige for tid med at indsætte alle disse “name:XXsprogkode=NN“. I stedet for skal der køre et script (bot) og undersøge om alle stednavnene er indsat. Hvis ikke, så indsættes de automatisk fra Wikipedia.

Hvordan kan scriptet så vide hvilket geografisk objekt i OpenStreetMap, der hænger sammen med hvilken Wikipedia artikel?

Her det linking (tagging) fra OpenStreetMap til Wikipedia, der er nøglen. Det ses i tagget “wikipedia=da:Hans Ø“, så den OpenStreetMap frivillige skal bare linke en gang, så vil scriptet selv køre og indsætte alle stednavnene på de forskellige sprog. Hvis der så er nogen ude i fremtiden, som skriver en artikel om Hans Ø på latin hos Wikipedia, så vil scriptet så automatisk indsætte den latinske stavemåde (eller hvilket som helst andet sprog).

Det vides ikke i skrivende stund, hvornår dette script er færdig udviklet. Men det er sgu smart genbrug af data fra forskellige åbne videndelingsområder. Så alt mulig grund til at støtte op om Wikipedia eller OpenStreetMap projekterne.

Wikipedia går 2D geotagging

(Artikelserie Dit og mit kort, 188). Det er ikke nogen videre hemmelighed at Wikipedia på iPhone og Android gik all-in med OpenStreetMap i foråret. Og Wikipedia er begyndt at bruge OpenStreetMap mere og mere til at forbedre deres artikler.

Lad os tage et eksempel med artiklen Berlin Zoo. Oppe i højre hjørne vil du se nogle koordinater “52° 30′ 30″ N, 13° 20′ 15″ Ø“. Det er så geotagget for artiklen, som man i flere år har har kunne give en artikel, hvis den indeholder geografisk information.

Nu er der så det lille men, Berlin Zoo er ikke et enkelt punkt (punktet “52° 30′ 30″ N, 13° 20′ 15″ Ø”), men derimod et område (polygon). Her kommer så OpenStreetMaps tagging af Berlin Zoo ind i billedet. Hvis du klikker på det lille globusikon (igen oppe i højre hjørne), så dukker der et lille interaktivt kort op (du skal have slået JavaScript til i din browser) og du vil kunne se Berlin Zoo angivet som et område (rød farve). Kortet i dette WikiMiniAtlas er desuden bygget på OpenStreetMaps geodata.

Hvordan ved Wikipedia hvilke artikler der skal flettes sammen med hvilke geografiske objekter i OpenStreetMap? – Der kan jo være flere byer med samme navn fx Paris, Valby, Dalby o.s.v. Svaret ligger i en standardmetode for at linke geografiske objekter fra OpenStreetMap til Wikipedia artikler. Lad os se på Berlin Zoo området i OpenStreetMap. Områdepolygonen er beskrevet i denne polygon.

Læg mærke til tagget “wikipedia=de:Zoologischer Garten Berlin” – her sker sammenkoblingen. Man behøver kun at angive et wikipedia tag i OpenStreetMap. Reglen er, at man linker til Wikipedia artiklen på det sprog, hvor det geografiske objekt (land) befinder sig i. Nu vil Wikipedia kunne automatisk sammenflette alle sprog, som et givent geografisk emne med hvad artiklen omhandler og hvor henne i verden.

Prøv i dit åbne WikiMiniAtlas med Berlin Zoo at skifte sprog i “Vis etiketter fra” til fx fransk og du vil nu på kortet se, at der står “Zoo de Berlin”.

På denne måde kan Wikipedia opbygge et hav af kort på forskellige sprog med stednavnene stavet på ens eget sprog. Forudsætter selvfølgelig, at der er skrevet en artikel på pågældende sprog.

Så hvis du er OpenStreetMap frivillig, så hjælper du Wikipedia med at blive bedre, hver eneste gang du du samenfletter et geografisk objekt med artiklen i Wikipedia. Der skulle være ca. 1,6 millioner artikler på alle sprog, som er blevet geotagget i Wikipedia. OpenStreetMap har indtil videre flettet ca. 219042 geografiske objekter (verden over) sammen med Wikipedia.

For Danmarks vedkommende har OpenStreetMap frivillige flettet ca. 1100 sammen med Wikipedia, hvor jeg er overbevist om, at der mindst er 5000 artikler for Danmark. Så der er masser af arbejde endnu. OpenStreetMap har på deres wiki en guide til Wikipedia linking.

Min næste artikel er om et projekt med, hvordan Wikipedia sprog- og videnskorpus kan hjælpe OpenStreetMap med at blive endnu bedre.