Et billede af data er ikke data

I Computerworld er der i dag et indlæg om “Huskeseddel til digital innovation: Disse ting skal du vide“, og jeg stejler lidt ved følgende tekst

I mange virksomheder er data lukket inde i siloer, hvor det kan være bøvlet at tilgå dem. Ifølge Accenture er det imidlertid ved at gå op for de mere progressive virksomheder, at deres data bør behandles som enhver anden supply chain: […] for eksempel ved hjælp af helt åbne API’er. Et godt eksempel er Google. I dag anvendes data fra Google Maps eksempelvis på mere end 800.000 websites.

Når data forlader Google Maps servere, så er det ikke data mere, men et billede af data vi ser, og der er en kæmpe forskel. Der er ingen mulighed for videre manipulation fx hente hele vejnettet på Fanø ned og rode med det i software som QGIS, TileMill, Mapertive eller smide det ind i ens egen PostGIS server osv. Forespørgsler om fx alle kirker på Bornholm og returnere det i fx GeoJSON, GPX, KML format er heller ikke muligt i Google Maps API.

Derfor er Google Maps ikke den bedste case at trække op af hatten. Men der findes en endnu bedre case med OpenStreetMap og det digitale økosystem, der er bygget op omkring geodata. Her finder vi et digitalt økosystem, der er gået “all-in“, hvad enten man skal have en en global kopi af OpenStreetMap (der er max 5 min. gammelt) eller bare en fuld geodata kopi af alt fra Bornholm. Eller hvad med alle polygonerne til fodboldbaner i Danmark i et GeoJSON, KML, Shape, XML eller GPX format? Der er ingen begræsninger på, hvordan du får eller bruger disse geodata.

Servere hos firmaer som Mapbox, Geofabrik og ESRI henter konstant nye geodata fra OpenStreetMaps moderdatabase. Hvis du har indtegnet en ny vej i Malawi via en OpenStreetMap editor og gemt dit arbejde, så vil der gå 5 min. og ovennævnte firmaer har den inde i deres systemer. At de så kan tjene penge på disse geodata er helt fint for OpenStreetMap organisationen som helhed, bare de husker at kreditere hvor geodata kommer fra. Wikipedias databasekopi af OpenStreetMap bliver en gang i døgnet fodret med dagens ændringer. Jeg kunne blive ved at nævne eksempler fra dette digitale økosystem OpenStreetMap har opbygget.

Så står du og skal bruge et eksempel på en organisation, der er gået “All-in” med hensyn til åbenhed i data supply-chain regi, så kan du nævne OpenStreetMap som mønstereksemplet på dette.

A day at the Open Data Races

I lørdags blev der afholdt international Open Data Day. I 110 byer verden over var der forskellige events. Af kuriøse indslag kan nævnes, at OpenStreetMap Brasilien ville kortlægge fodboldbaner og fodboldstadioner, at der er VM i fodbold år fornægter sig ikke. I Danmark blev Open Data Day afholdt på CBS (Copenhagen Business School), og hele 61 tilmeldte personer havde valgt at tilbringe lørdagen i de åbne datas tegn. Jeg bringer her nogle indtryk samt lidt uddrag af samtaler, jeg havde med flere folk fra forskellige organisationer.

Open Data Day -CBS
(Billede – Der bliver arbejdet med forskellige projekter på Open Data Day)

Copenhagen Data nævnte at en stor del af deres arbejde var at få de forskellige forvaltninger i Københavns Kommune til at bidrage med datasæt. Jeg kunne forstå at det ikke altid lige var nemt at overtale andre forvaltninger. Jeg kan forestille mig at nogen forvaltninger tænker “Det har vi aldrig gjort og det er ikke relevant for os“. Mens andre forvaltninger synes det er en god ide, men har så intet gjort for bidrage med datasæt. Så er vi jo lige vidt.

Copenhagen Data synes også, at de har famlet lidt rundt i mørke over for udviklere om hvilke datasæt, udviklere/borgere nu måtte ønske af relevans og brugbarhed. Så derfor er man altid velkommen til at skrive forslag og ideer med ønsker ( Twitterkonto @datakkdk). Jeg havde selv på stående fod to datasæt ønsker

  1. Københavns Kommune skal have lavet engelske vejskilte til 76 turiststeder i byen. En liste over hvilke steder kan tjekkes op imod om OpenStreetMap har fået engelske oversættelse af disse steder lagt ind. Der er flere apps fx OsmAnd (off-line kortmulighed) der kan sættes op til engelsk og her ville de 76 steder så optræde på engelsk på kortet
  2. En liste over målestationer i byen, fx trafik (biler/cykler) og luftkvalitet. Disse målestationer kan også bruges i OpenStreetMap regi

Jeg snakkede med FAIR Danmark, som er en organisation der indsamler brugte computere til Malawi. De installerer open source software og styresystem før afsendelse. Da Malawi ikke har gode og hurtige internetforbindelser, ville de høre om man kunne installere off-line OpenStreetMap kort. Jeg nævnte at selve geodata er nemt nok at hente over hele Malawi. Det er også muligt at lave off-line tiles (disse her 256×226 billeder) som et kort er opbygget af.

Jeg lovede at tjekke nærmere i OpenStreetMap miljøet om, der er lavet simple og nemme løsninger for et off-line tile kort, som vil være nemt at installere før afsendelse af computere. Nu er Malawi ikke så godt kortlagt i OpenStreetMap regi, så jeg foreslog at folkene fra FAIR kunne da lave noget sofakortlægning af Malawi, så kort og geodata bliver endnu bedre. Det er altid pokkers nemt at sætte folk i gang med noget i OpenStreetMap regi.

Wikipedia Danmark stillede op med flere folk. Der kom et ønske på sognegrænser fra DAGI datasættet, hvilket jeg så fik lagt op samme dag på GitHub i et GeoJSON format.

Dernæst var polygoner over byer, bydele, sommerhuse og spredt bebyggelse også et emne som Wikipedia Danmark måske ville kunne bruge. Jeg fik også tid til at lave disse i GeoJSON filer og lagt disse ud i GeoJSON filer på GitHub. Disse geodata stammer fra Geodatastyrelsens SNSOR (StedNavne- og StamOplysningsRegister).

Open Data Day -CBS

Jeg fik så også et spørgsmål om Wikidata og OpenStreetMap. Det er ikke noget som OpenStreetMap frivillige har dyrket i videre stor stil endnu. Der er mere end rigeligt at gøre alene med at få kortlagt det globale vejnet, så at finde tid til at koble Wikidatas unikke id’er sammen med geografiske objekter i OpenStreetMap er ikke første prioriet for de fleste OpenStreetMap frivillige. Jeg vil ved lejlighed i et blogindlæg gå i dybden med Wikidata og hvad det kan bruges til i OpenStreetMap regi.

Jeg fandt også tid til at give et 5 min. lynkursus i, hvordan man kan få statistikker og tal om ens bidrag til OpenStreetMap. Følgende OpenStreetMap værktøjer blev vist.

Open Data Day -CBS
(Billede -Screendump af Yesterday’s Edits Per Country værktøjet)

Open Data Day sluttede af med nogle præsentationer af hvad folk havde rodet/leget med i løbet af dagen. Der var flest præsentationer med geografisk indhold. Dette er egentligt ikke så underligt, når man estimerer at ca. 80 % af myndigheders data, kan henføres til et geografiske steder. Så myndigheder der overvejer at frigive åbne data skal tænke i at det primært er geodata, der skal åbnes op for.

Jeg vil her til sidst rette en stor tak til de frivillige, sponsorer samt arrangørerne af Open Data Day i Danmark for en hyggelig og inspirerende dag.

Open Data Day -CBS
(Billede – Show me the Way – visualisering af hvor arbejdes der i OpenStreetMap lige nu)

Hent DAGI som GeoJSON fra GitHub

Du kan nu hente DAGI (Danmarks Administrative Geografiske Inddeling) i GeoJSON format fra GitHub. Jeg har datavasket overflødige attributter væk, så der tilbage kun er relevante attributter tilbage, det er fx. oplysninger om kommunenavn, kommunenummer osv samt konverteret til WGS84. Det er DAGI datasættet i 1:500000, der er blevet datavasket.

DAGI GitHub
(Billede – DAGI mappe vist på GitHub)

Hvis du klikker på fx Politikredse filen på GitHub, vil der dukke et kort op.

DAGI GitHub
(Billede – Politikredse vist på GitHubs kort)

Nu er det kort ikke særligt interessant – Klik på “Raw” knappen oppe, og selve GeoJSON filen dukker frem.

DAGI GitHub
(Billede – Politikreds GeoJSON vist på GitHub)

URLen til denne GeoJSON kan nu bruges i dine egne projekter eller du kan downloade hele DAGI ned via GitHub. Fx er URLen lige til at kalde via TileMill softwaren. Du kan nu via TileMill lave et kartografisk projekt, hvis politikredse skal indgå.

DAGI GitHub
(Billede – Politikredse GeoJSON hentet ind i TileMill)

URLen er også lige til at hente ind i QGIS softwaren.

DAGI GitHub
(Billede – Politikredse GeoJSON hentet ind i QGIS)

Hvis der nu er nogle kommuner som ikke rigtigt har råd eller tid til at opsætte en hjemmmeside med delte geodata som fx Københavns Kommune, Aarhus Kommune eller Stevns Kommune, så er GitHub en let mulighed at gå til. Og det behøver ikke kun være i GeoJSON – Formatter som ESRI Shape, KML, MapInfo kan også benyttes. Kogt simpelt ned – tilbyd i maskinelæsbart format og udviklere og andre nysgerrige skal nok finde ud af det.

Det bedste til mig og mine landmålervenner

Danmark har haft flere matrikel opmålinger gennem tiderne. Der blev ca. 1760 skrevet følgende om de landmålere der deltog i 1688-matrikel opmålingen.

… ey allene ikke have forstaaet Geometrien; Men endog neppelig vidst til Visse, hvor Øster og Vester var; Herforuden vare disse Landmaalere til deels som aftakkede Krigsfolk, et slags maadelige Gesinde, hvilke i Byerne, hvor de kom, meest lagde sig efter Qvindfolk, Drikken og Fraadsen, og maatte hver Bye, hvor de kom, være betænkt paa at forskaffe dem dette, besynderlig drikkende Vahre, af godt Øll og Brændevin, da de og meest hver dag vare beskienkede, førend de rede i marken.

Thi det er bekendt, at om nogen Bye lod dem mangle af drikkende Vahre, blev samme Bye ved deres Maaling og Taxering saaledes klemt, at det svier til Efterkommerne: Men tvert imod, hvor Proprietarier eller andre kunde brav drikke og holde Venskab med dem, kunde Byerne derved vel finde Lettelse, som og naar disse Drikke-Brødre kunde være vrede på en Bye, kunde de vel samme hos Landmaalerne disrecommendere til det Værste;

Hvilke Exempler endnu ere i frisk Minde; Men som de nu alle hvile i Støv, vil jeg ingenlunde have dette skrevet eller forstaaet deres Navns Forkleinelse, som nu alt er i Forglemmelse; men alleene til Underretning for Efterkommerne, som heraf kand vide Aarsagen, hvorfor disse Folkes Forretning ikke altid findes accurat, naar man sligt ved leylighed efterseer og eftermaaler

(Kilde – Historisk Forening i Jægerspris (1999) – Landsbyerne i Jægerspris Kommune)

Ganske underholdende læsning og det er jo en Jeppe på landmålertur (frit efter Holberg – Jeppe på Bjerget) beskrivelse. Det kan med heftige tømmermænd godt være svært at kende forskel på øst og vest. Jeg kan levende forestille mig indbyggerne i en by piske rundt for at finde godt øl,brændvin og mad inden landmålerne kom.

FOT data og digital kartografi i undervisningen med TileMill

Til undervisningsbrug i fx gymnasiet er det landsdækkende FOT datasæt på 19 GB nok lidt for voldsomt og for stor mundfuld at starte ud med. Men der er mulighed for i mindre målestok at introducere eleverne for FOT datasættet samt de laver deres eget kartografi ud fra det datasæt. På Kortforsyningen (når du har oprettet konto) er det muligt at lave FOT udtræk af et geografisk område på op til 5 km2.

Som case har jeg taget et ca. 1 km2 område af byen Bagenkop på Langeland og bestilt et FOT udtræk i ESRI shape format.

FOT udtræk
(Billede – Kortforsyningen Bagenkop udtræk)

Der går et par minutter før FOT udtrækket er klar til download (det bliver sendt en e-mail når det er klar). Det bestilte udtræk (fylder ca. 6 MB) pakkes ud i en mappe. Nu kan der begyndes at lave kartografi på FOT data med det gratis open source software TileMill. De forskellige FOT temaer kan sættes til som lag (eng. layers) i TileMill.

Lag i TileMill
(Billede – FOT lag vist i TileMill)

Dernæst kan der begyndes at leges med kartografien.

Layout i TileMill
(Billede – CartoCSS syntaks – TileMill)

TileMill benytter sig af CartoCSS (et CSS lignende sprog) for at lave kartografi og er relativt nemt at gå til. Ændrer farver, størrelse på linjer osv.

Layout i TileMill
(Billede – Bagenkop layout vist i TileMill)

Nu forventes det ikke at eleverne bliver professionelle kartografer på et par timer. Ideen er mere at man har dem givet en introduktion til, hvordan digital kartografi laves. Fx hvad med at lave et udprint af kun bygninger i ens egen byen i et A1 format?

Det er også en glimrende øvelse i at få et indblik i de åbne data fra de offentlige myndigheder, hvordan de hentes, hvad kan man finde der, hvordan de kan bruges, leges rundt med. Man kan derudover også benytte egne indsamlede geodata, der flettes sammmen i TileMill fx via et simpelt regneark eller GeoJSON filer.

Hvis du er underviser i gymnasiet og har arbejdet med noget af ovenstående i undervisningen, så skriv gerne en kommentar. Jeg vil gerne høre om projekter, der er lavet med åbne geodata.

Med John Snow og Læger uden Grænser i Congo

Læger uden Grænser (Tysklands afdeling) og Humanitarian OpenStreetMap Team (H.O.T.) afholder 15. februar et mapping party (PDF link) i Berlin.

Læger uden Grænser indbydelse
(Billede – fra indbydelsen til mapping party i Berlin)

Mapping party er et event, hvor ældre og nye OpenStreetMap frivillige mødes og nye frivillige får introduktion og hjælp til at lære kortlægning i OpenStreetMap. Temaet for dette mapping party er kortlægning i byen Lubumbashi i Demokratiske Republik Congo. Her skal opbygges et komplet vejnet over byen. Gode gratis og frie geodata og kort over lande i Afrika er ikke nogen selvfølgelighed, som vi kender det fra Europa (se blogindlæg 1,2 vedr. dette). Så man må skabe dem selv for at komme ud af den situation.

Efter dette mapping party er slut, så vil Læger uden Grænser i Lubumbashi i marts måned få hjælp af lokale i Lubumbashi med at få navngivet veje og kvalitetssikret kort og geodata. Dette er ikke noget, man kan klare hjemme fra sofaen uden at man er på stedet eller har lokalkendskab.

Then in March MSF staff will go to DRC and add road names to this data with help from locals.

Hvad skal Læger uden Grænser egentlig bruge OpenStreetMap geodata til? – Svaret giver de selv i indbydelsen til ovenstående mapping party.

This data will help map disease outbreaks and allow life saving decisions to be made. E.g. during cholera outbreaks.

Læger uden Grænser skal bruge geodata i det felt, der hedder medicinsk geografi. Ved at have nogle sygdomsdata lokaliseret (såfremt der sker nogle sygdomsudbrud) – Så kan der udpeges hvilke vejområder/byområder, der skal gøres en særlig indsats i. Hvis vejnettet mangler så gør det arbejdet lidt problematisk, hvor skal man køre hen og hvordan kommer vi frem der til? Ved at have kort og geodata gør det lettere at komme frem i felten samt at planlægge.

Det mest kendte eksempel i medicinsk geografi er lægen John Snows kolerakort fra 1854 – Hvor et heatmap af døde i London gjorde det muligt at spore en vandbrønd på Broad Street som værende den helt store smittekilde til koleraudbrudet.

Hvis du synes, at dette kortlægningprojekt for Læger uden Grænser lyder spændende og vil gerne hjælpe, men du kan ikke lige tage til Berlin den 15. februar. Intet problem, du er mere end velkommen til at gå i gang allerede nu i Lubumbashi. Der er gode satellitbilleder over hele byen. Så enhver hjælp om, det er 1,2 eller 5 timer modtages med kyshånd.

Mapping party
(Billede – Udsnit af Lubumbashi i DR Congo)

Jeg skønner, at ca. 40 % af byens vejnet er indtegnet i skrivende stund. Det er især forstæderne som mangler og vejnettet er ikke så kompleks at optegne i Lubumbashi. Og bemærk det er ikke kun Læger uden Grænser, du hjælper i dette medicinsk geografi projekt. Det er enhver som nu måtte have brug for åbne geodata over området. Der kan måske være andre NGO’er i byen som kan have glæde af disse geodata eller for den sags skyld lokale (se fx Map Kibera i Kenya projektet).

Hvis danske NGO’er mangler geodata/kort over et mindre område eller en by, så kan de gøre de samme som Læger uden Grænser i Tyskland nemlig at afholde et mapping party (læs mit indlæg “Teams af folkekartografer til hjælp for danske nødhjælpsorganisationer?”).

Gamification – New adventures in vector mapping

Kunne du forestille dig at Danmarks ca. 6500 landsbyer med under 200 indbyggere slet ikke kunne ses på nogle digitale kort? Vejene derhen via GPS navigation var ikke muligt, samt vejene var ikke indtegnet overhovedet og stednavnene var ikke søgbare? – Det ville være en slags kartografisk diskrimination af de ca. 500.000 danskere, der bor i disse områder.

Ovenstående eksempel er ikke fiktion andre steder i verden, du ser faktisk den virkelighed mange steder udenfor Europa og Nordamerika vedr. digtiale kort. Dette forhold gælder hos alle store aktører som Google Maps, Nokia Maps, TomTom og for den sags skyld også OpenStreetMap. Jeg har i andet indlæg påpeget at vi ingen gang har 20 % af et globalt vejnet digitaliseret endnu.

I 1901 skrev englænderen Sir Thomas Holdich artiklen “How are we get maps of Africa?” – Problemet var at kolonimagten England havde 6,75 millioner km2 kolonier i Afrika, som ikke var kortlagt – Man havde stort set kun viden på kort om større byer, handelsruter og de store vandveje. De andre kolonimagter som Frankrig, Belgien, Tyskland var også blanke vedr. gode kort i Afrika.

113 år senere er vi stadigvæk i samme situation vedr. kort for Afrika, denne gang i digital form. Større byer, de store veje, jernbaner, store floder, søer kan vi som regel se i udmærket kvalitet. Men landområder er forsømte i de forskellige afrikanske lande. Et kontinent på 30,3 millioner km2 er ikke lige noget man fra dag til dag laver et digitalt kort over.

Så spørgsmålet er, om crowdsourcing og gamification er vejen frem for at løse den gordiske knude med byområder kontra landområder udenfor Europa og Nordamerika. Der bliver brugt oceaner af tid på at spille – alene Minecraft skulle være downloadet over 40 millioner gange. En million spilletimer omsat til OpenStreetMap ville kunne give i omegnen af ca. 100 millioner km vejnet i landområder eller ca. 60 millioner nye bygninger.

Et element af gamification kunne være at du udfordrede en anden OpenStreetMap frivillig med at løse en bestemt opgave. Fx du indtegner en gård eller bygning i et fjernt landområde. Opgaven er så at opbygge et vejnet fra det objekt og så hen til en større by.

Vi kan tage et eksempel fra Zambia som case. Jeg har indtegnet et fjerntliggende gårdområde i Zambia og fra den gård er opgaven så at indtegne et vejnet frem til en vej der fører til byen Zimba.

Udfordring

Der indtegnes nye veje på vej mod byen Zimba.

Udfordring

Udfordringen kan efter endt mission ses visualiseret hos Overpass Turbo.
Udfordring

Vi kan med JOSM regne ud at opgaven har været ca. 27 km kilometer (se mit indlæg hvordan du beregner antal kilometer med JOSM)
Udfordring

Der er mange andre muligheder for at få et element af gamification ind fx find en mindre bæk oppe ad et bjerg og så lad opgaven være “Indtegn denne bæk så den bliver koblet sammen med den større flod NN“. En længere udfordring over et par måneder kunne være en slags korrespondancekortlægning – Der laves udfordringer i samtlige 53 lande i Afrika. Hvor I skiftevis sender en opgave til hinanden

Nu er ideen med udfordringerne også at man skal blive klogere undervejs (eller få genopfrisket sin geografi) og her har Wikipedia en hel del artikler om steder, man kan læse. Det med at blive klogere eller reflektere over, hvad det er man kortlægger har hele tiden været en af OpenStreetMap ideer og ikke et digital sweatshop projekt.

Hvis du aldrig har kortlagt udenfor Europa og kunne tænke dig en lille udfordring, så sig til og jeg laver en til dig.

Kilde vedr. kortlægning af Afrika 1901 – Brotton, Jerry (2012) A History of the World in Twelve Maps.