Alla inlägg av Marie Gustafsson Friberger

Programmera luftdata med Python i Jupyter

Jupyter Notebooks är en interaktiv programmeringsmiljö för Python där man kan varva programsnuttar med förklarande text. Jupyter kan bl a köras genom Colaboratory, en gratis Jupyter-miljö från Google.

I det här exemplet vill vi visa hur man snabbt kan komma igång med Jupyter för att hämta data som samlats in genom mätstationer för luftkvalitet i det globala projektet luftdaten.info som bygger på medborgarforskning. På luftdata.se finns svensk information, bl a om hur du hyfsat enkelt och billigt bygger en egen mätstation.

I detta exempel hämtas  data via ett API, som är en av åtkomstmöjligheterna om man vill programmera med öppna data (läs mer i ett tidigare inlägg: Hur hitta öppna data?). För att få reda på vad man kan hämta för data behöver man läsa i dokumentationen hur man ska formatera sin förfrågan. I detta fallet hittar vi den infon här: luftdata.se/data/.  Vi använder möjligheten att fråga efter alla sensorer inom ett visst antal kilometer från en angiven position (t ex där eleven befinner sig).

Vill du testa själv? Du kan köra koden själv på Google Colaboratory: https://colab.research.google.com/github/infontology/luftdata/blob/master/Luftdata.ipynb

För att köra de små kodsnuttarna med grå bakgrund, klicka på play-knappen längst till vänster i dem eller markera blocket och tryck shift+enter. Tänk på att köra kodblocken i ordning.

Kodexemplet är skrivet av Simon Winter på Infontology.

Vad är data? Vad är information?

Det har inte skrivits något på denna blogg sedan slutet av det Vinnova-projekt som finansierade det 2015. Ämnet är fortfarande aktuellt, och jag som drev Vinnova-projektet tänker, skriver och gör fortfarande en del i området. Bl a visualiseringsprojekt tillsammans med Simon Winter, som också bidrog till projektet Öppna data i skolan. I dessa visualiseringsprojekt, och framförallt när vi ska skriva om dem, kommer vi in på detta med distinktionen mellan data och information. Ibland är vi överens, ibland inte. Simon har skrivit en första text om sin syn, Data och information, del 1 på Infontology. Här kommer min första text, som inte bygger på Simons.

Vad är sammanhanget?

Ett vanligt sätt att definiera data och information är att säga utgå från att data är fakta eller signaler från världen (eller att helt enkelt ta data som något underförstått – sånt som finns i Excel-ark). Sedan definieras information som data som satts i ett sammanhang eller som har tolkats.

Ett problem med detta påstående är att det låter som att data är en helt neutral sak, utan tolkning, utan sammanhang. Men om man ser till hur system där flera delar av en organisation ska dela på samma data (var sig det är vården eller säg en affärsverksamhet)  ser man att data samlas in eller skapas i ett sammanhang och att man vid själva tillfället för datainsamling samlar dem i vissa kategorier och strukturer.

Oväntat svårt med exempel

Även om man bortser från att den ”råa” datan samlats in i ett sammanhang, och alltså kan bära med sig vissa värderingar, så är sammanhangsdefinitionen problematisk när man ser till enskilda exempel. För på vilken nivå ska sammanhanget läggas? Vilket sammanhang, eller tolkning, är tillräckligt avancerat för att göra något till information?

Jag har t ex läst texter som lyfter fram ”Det regnar” som ett exempel på data. Informationen blir då vad man gör med det faktum att det regnar, eller att det finns någon tolkning kring orsak och verkan. Men är ”Det regnar” data? Någonstans har en signal tolkats som regn, på en viss plats, vid ett visst tillfälle. En person eller en mätare av något slag har tolkat att mängden vatten som faller från molnen överstiger ett visst tröskelvärde. Som jag ser det är ”det regnar” information.

Ett annat exempel. Min skostorlek är 40. Känns som data. Utan sammanhang – nej, det bygger på ett (av flera) system för skostorlekar. Vi kan tolka in en del saker, som storleken på min fot (via kunskap om storlekssystemen) och (om man vet lite om distributionen för skostorlekar bland kvinnor) att jag har hyfsat, men inte anmärkningsvärt stora fötter. Om man dessutom har data från flera personer kan man sammanställa olika statisktiska mått kring skostorlek, hur de ändras beroende på när man är född, etc. Är denna statistik data eller information? Mycket av det som presenteras som öppna data är just statistik. Men statistik är en tolkning, och i så fall information.

Bort med pyramiden

Det finns en visuell förklaring kring förhållandet mellan data, information och kunskap som brukar kallas för DIKW-pyramiden. Jag har framförallt stött på den i sammanhanget informationssystem och knowledge management (dvs system för att hantera kunskap). I pyramidens bas finner vi data, sedan byggs det på med information, kunskap och visdom. Förklaringen kommunicerar att varje nivå lägger till något till den förra och innebär att den nivån har ett högre värde än den innan. Ganska länge har jag stört mig på denna förklaring. Delvis handlar det om att den lite lättvindigt slänger upp visdom överst – ett koncept som är ännu mer svårdefinierat än kunskap. Dessutom antyder den att all kunskap kommer från data (via information).

DIKW-pyramiden uppstod på 80-talet, då de som byggde och sålde system behövde förtydliga värdet med det som de höll på med, genom att sätta den data som systemen hanterade i ett kontext. Pyramiden har sedan dykt upp i alla möjliga sammanhang, men även blivit kritiserad (se t ex Weinbergers artikel eller en summering av kritik från knowledge management-håll).

Sammanhang och kommunikativ avsikt?

Ofta används data och information som synonymer, och anges som sådana av exempelvis ordboken Marriam-Webster. Är detta ett problem? Och framförallt, hur ska vi kunna prata om de olika lager av tolkningar som görs när vi samlar in och lagrar ”saker” i tabeller och sedan gör mer eller mindre intressanta saker med dem? En sak jag tycker är viktigt att ta fasta på är det kommunikativa ursprunget i ordet information.

Data och information som ett kontinuum där saker kan vara mer rå:a eller mer informativa (dvs kommunicerande), men där många exempel hamnar i ett gränsland. Alla data samlas in i något sammanhang, och det sker ett urval av vad som ska samlas in. Jag skulle säga att i de flesta fall där det inte finns ett syfte i grunden är det svårt att finna svar i sina dataset. Ibland kan man byta sammanhang efter att data samlats in, men inte alltid.

Where is the life we lost in living?

Till sist, eventuellt ovidkommande, men intressant för mig. Sista året i gymnasiet (jag läste International Baccalaureate-programmet) skrev jag en uppsats utifrån några rader ur The Rock av T. S. Eliot. Detta var en av en liten lista med ämnen vi kunde välja på och utdraget var så här:

Where is the life we have lost in living?
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?

Jag minns inte att jag då undersökte sammanhanget för dessa rader. Det har jag inte heller gjort när jag genom åren stött på dem flera gånger, gärna som en en inramning för kopplingen information-kunskap-visdom. Ofta är det folk som skriver om informationssystem som tar upp dem, antingen för att visa på att hierarkin information-kunskap-visdom har varit beskriven flera decennier tillbaks eller för att visa på utmaningarna med system som hanterar kunskap.

Vad är då sammanhanget? The Rock skrevs för att pjäsen skulle samla in pengar för att bygga en större mängd kyrkor i London på 30-talet. Den sörjer förlusten av kontakten med Gud och argumenterar mot rörelsen mot ett rationellt, sekulärt samhälle.

Projektsummering Öppna data i skolan

Three men with saws från Field Museum Library. Inga kända copyright-begränsningar.
Three men with saws från Field Museum Library.

Så kommer det Vinnova-finansierade projektet ”Öppna data i skolan” till sitt slut. Materialet som tagits fram lever kvar på bloggen och en PDF har tagits fram för att ge en snabb introduktion till projektet. I detta inlägg ges en översikt av de publicerade inläggen. Hur väl stämde detta överens med planen? Vad händer i framtiden?

Översikt över innehållet på Öppna data i skolan

Inom ramen för projektet har 15 inlägg publicerats (om man inte räknar detta). Tre inlägg handlar om varför öppna data i skolan och hur data och visualiseringar kan kopplas till läroplanen:

Inlägg som introducerar öppna data (detta tas även upp i det första inlägget i listan ovan):

Inlägg som fokuserar på visualisering:

Inlägg som handlar om möjliga lektionsupplägg (detta återfinns även i Gapminder-inlägget ovan):

Till sist, ett inlägg om kommande arbete och ett som summerar några erfarenheter från projektet:

Kartan och verkligheten

I bloggens första inlägg fanns en lista med planerade inlägg. Hur förhåller sig innehållet på bloggen till dessa? Bloggen har kommit att innehålla mer material om visualisering än vad som var planerat från början, eftersom detta är en naturlig ingång för skolan.

Dataexpeditionen utfördes inte, men bloggen innehåller en beskrivning av upplägget som jag hoppas kommer till användning. I stället togs ett lektionsupplägg om etik och öppna data fram. Detta har genomförts i en gymnasieklass. Det finns inget inlägg som fokuserar på en steg för steg guide om hur man arbetar med dataset med elever, men material om hur man visualiserar data (se lista ovan), hittar data och hur man kan använda Gapminder. Det finns ett exempel på hur man kan visualisera med mat, men inget övergripande inlägg om att använda öppna data gestaltande och i praktiska ämnen. Inlägg om problemen med reduktionism och att ljuga med statistik saknas, liksom hur man samlar in egna dataset.

Framåt

Under våren kommer jag delta i Simons projekt att skapa ett  interaktivt läromedel om migration inom ramen för omvärld.se (se tidigare inlägg). Jag har några fler inlägg som jag hoppas skriva här på bloggen och kommer även att undersöka möjligheterna för vidare finansiering. Kanske blir fokus då snarare på ”data literacy” än på öppna data.

Gott nytt år!

Lektionsupplägg om öppna data och etik för gymnasieklass

I november genomförde jag en lektion om öppna data och etik med en ekonomigymnasieklass i Malmö. Tanken var att jag skulle ha besökt klassen redan i våras och då på en samhällskunskapslektion. Nu blev det under hösten och på en religionslektion – därav att etik blev ett tema. Jag ville även knyta an till ekonomi, vilket jag gjorde genom att välja dataset med ekonomisk koppling.

Min originaltanke för detta lektionstillfälle var att köra en dataexpedition, ett upplägg som jag skrivit om tidigare här på bloggen. Tanken var då att ta ett första tillfälle att introducera några verktyg för att analysera och visualisera data, och att eleverna vid ett andra tillfälle jobbar i grupp för att utforska data. Nu blev det inte tid till detta, och det passade inte in med etikvinkeln. I stället blev det, på gott och ont, mer fokus på konceptet öppna data.

Kort beskrivning av lektionen

Lektionsupplägget i sin helhet: Öppna data och etik för ekonomigymnasieklass

Lektionen börjar med en kort introduktion om varför öppna data och hur lektionen kan kopplas till läroplanen.

För att skapa förståelse för öppna data får eleverna välja två dataset att undersöka utifrån frågor som vad det handlar om, vem som skapat det och om det finns några etiska aspekter. Dessa två väljs från en lista med fem exempel.

Efter att eleverna tittat på två exempel diskuteras dessa i par, samt ett antal olika aspekter med öppna data. Lektionen avslutas med diskussion i helklass kring dessa.

Några reflektioner

De dataset exempel som flest valde var Ohio Online Checkbook och Skattekollen.se. Dessvärre har det förstnämnda inte ett värst bra användargränssnitt, och var inte så lätt att interagera med. Skattekollen var den som eleverna fann intressantast, med kommentarer som ”varför har förskolan större budget än gymnasiet” och ”detta kan vara användbart för att kunna påverka”.

Upplägget var lite för mycket för de 1,5 timma jag hade. Jag lät dessutom undersökandet av exempel ta mer tid än planerat, så det blev lite mindre tid än jag tänkt för en strukturerad diskussion i helklass. Detta ledde till en kortare ostrukturerad diskussion, där alla grupper inte kom till tals. Utvärderingen kom tyvärr inte med under lektionen, utan skickades ut av läraren. Tyvärr har den för få svar för användas.

Vid diskussionen i slutet av lektionen och när jag gick runt och pratade med eleverna när de tittade på exempel kom följande upp:

  • Det var lätt att landa i en allmän diskussion om värdet av öppenhet, och framförallt dess extremer, typ att man inte ska dela försvarshemligheter och om Wikileaks var rätt eller fel.
  • Ett flertal tyckte att detta med öppna data verkade irrelevant: ”varför skulle någon vara intresserad av hur Sveriges bistånd fördelas?”
  • Några tyckte att eftersom offentlighetsprincipen finns, att man ändå kan begära ut transaktioner, så är initiativ som det från Ohio helt irrelevanta. Här skulle man ju behöva både en diskussion om fördelar med automatisering men också om transparens som tillitsskapande.

Några funderingar om upplägget: Hur förmedla vad öppna data är på ett intressant men nyanserat sätt? Kan man få tillräcklig förståelse för öppna data på denna korta tid och från två exempel för att svara på diskussionsfrågorna? Öppenhetsbegreppet i sig och hur det kan appliceras är en utmaning i sig, utan att blanda in data. Om man vill ha mer av ett diskussionsupplägg tror jag att fokus på just öppenhet kan funka bättre än att bara ta upp öppna data.

Elevprojekt med dataexpeditioner?

Tre utforskare på väg.
Pillar of Darkness Expedition: 1913 av davidd, CC BY 2.0.

Data Expeditions are quests to map uncharted territory, discover hidden stories and solve unsolved mysteries in the Land of Data. In a team you’ll tackle a problem, answer a question or work on a project. We help you to get started and it’s up to you to decide where you go…

Så skriver schoolofdata.org om upplägget data expeditions. Dataexpeditioner är upptäcksfärder där det som utforskas är data. Utforskningarna görs i grupp, där de olika deltagarna har olika roller. Upplägget har vad jag vet främst använts med vuxna, men jag tror att det med lite anpassning kan användas för elever där man med data som hjälp vill göra en djupdykning i ett tema.

Roller i en dataexpedition

I School of Datas upplägg återfinns olika roller som behövs i gruppen:

  • Berättare (storyteller) – hittar intressanta vinklar att utforska och som kan skriva tilltalande berättelser. Viktiga för att hitta utgångspunkter och knyta ihop säcken.
  • Spanare (scout) – Letar reda på dataset som är tillgänliga på webben.
  • Analytiker (analyst) – Den som gör en djupdykning i datasetet för att testa hypoteserna som gruppen tagit fram.
  • Utvecklare (engineers) – Denna roll behöver inte vara med, men om man vill göra något mer än att skriva en rapport kan det vara bra med någon som kan skriva kod eller använda mjukvara för att skapa visualiseringar.
  • Designers – skapar tilltalande produkter och hjälper datasetets berättelse att komma fram.

Utöver detta så ingår det en guide i upplägget. En roll för läraren, eller kanske en äldre elev? Deras Guide for guides har mycket material kring upplägget.

Vad produceras i en dataexpedition?

Produkten av en dataexpedition behöver inte vara tekniskt avancerad, men kan givetvis vara det om förutsättningar finns. Det kan vara en visualisering, en skiss för en visualisering, ett blogginlägg eller en rapport. Vad produkten ska vara kan antingen vara förutbestämt eller bero på vilken typ av dataset som utforskas, hur komplicerat det är, lärandemål, osv.

Läs och om vad andra dataexpeditioner har resulterat i.

Dataexpedition i skolan?

Jag tror att detta är ett spännande upplägg för att låta eleverna göra en djupdykning i data och skapa en berättelse utifrån detta. Det är dock ett utmanande upplägg. Det kräver en del förberedelser så att eleverna har de färdigheter kring data som behövs. En lösning för detta är att ge stöd fokuserat för de olika rollerna som deltagarna tar.

Tanken var att en dataexpedition skulle genomföras inom ramen för detta projekt, men det fungerade inte inom ramarna för den möjlighet jag fick att jobba med en gymnasieklass. Jag hoppas att jag får möjlighet att testa detta i framtiden, eller att någon annan provar.

Utmaningar med öppna data i undervisning

I denna blogg vill vi visa hur öppna data kan utgöra ett källmaterial av nytta för skolan. Vi har bland annat skrivit om exempel på öppna data, visualiseringar av öppna data och hur Gapminder är ett steg mot öppna data i undervisning.

Det finns en del utmaningar vad gäller att använda öppna data, både generellt och i undervisning. I detta inlägg tar jag upp några sådana utmaningar och hur man kan hantera dem. Jag ger även några uppslag på hur vi kommer vidare med användande av öppna data i skolan.

Club Obi Wan (C.O.W.) "Challenge Coin" and Indy Gear av davidd.
Club Obi Wan (C.O.W.) ”Challenge Coin” and Indy Gear av davidd, CC BY 2.0.

Utmaning: Hitta relevanta dataset

Säg att en  lärare (eller utvecklare, eller journalist) har kommit fram till att det kanske skulle kunna finnas ett dataset som kan användas i en viss lektion (eller app eller artikel). Hur går hen då till väga för att hitta detta dataset (om det ens finns)?

I ett tidigare inlägg har jag skrivit om hur man kan hitta data och på vilka format dessa kan vara. En variant är att söka efter det i en dataportal (t ex öppnadata.se, om det rör sig om en svensk datakälla). Ibland innehåller dataportalen inte alla öppna data som finns tillgängliga (vilket är fallet i dagsläget för öppnadata.se). Då får man fundera på vilken myndighet eller dylikt som kan tänkas ha de data som man letar efter. En annan utmaning är att man för att hitta data behöver veta vilka termer som används i dess beskrivning.

Dataportaler vara lite överväldigande. Här är några tips för att snabbare komma in och komma vidare. När man väl har kollat runt lite så får man grepp om vad som finns. En del dataportaler ger hjälp på traven kring vad man kan söka på och vad andra sökt på, eller vad som är populärt. För att begränsa sig kan man även fundera på vilka myndigheter som kan ha data som man är intresserad av, och gå direkt till dem i portalen eller söka på myndighetens namn och öppna data. Man kan även avgränsa sig genom att specifikt titta efter dataset på formaten CSV, XLS (Excel) och HTML (som ofta är visualiseringar).

Ett annat sätt att hitta ämnesrelevanta data är att fråga i grupper med öppna data-intressenter (t ex Facebook grupperna Opengov och Nordic Open Data Ecosystem).

Utmaning: Utvärdera datakällor

När en datakälla har hittats, hur går man vidare då? Man behöver utvärdera om det är förståeligt och användbart för det syfte som man tänkt sig. Förutom att ladda ner och titta på datasetet, så kan man titta på hur det beskrivs. Man behöver även undersöka om det är av tillräcklig kvalitet, exempelvis om det är hyfsat komplett (t ex att det inte saknas datapunkter i allt för stor utsträckning) och om det beskrivs i tillräcklig detalj. För att göra detta behövs det en del förkunskaper kring datahantering och ämnet i sig.

Uppslag: Börja med visualiseringar

Om man inte känner sig redo att hitta och använda data själv är ett alternativ att utgå ifrån redan skapade visualiseringar. Ibland hittar man dessa via dataportaler och myndigheters sidor. Man kan också prova att googla ämnet man är intresserad av tillsammans med nyckelordet visualisering och visualization. Se även blogginlägg med kategori visualisering.

Även för visualiseringar måste det till källkritik. Vem är det som har skapat visualiseringen? Vilka datakällor bygger den på? Är visualiseringen vilseledande på något vis?

Uppslag: Utgå från lektionsmaterial baserat på (öppna) data

Man kan också använda mer eller mindre förpackade lektionsmaterial som bygger på öppna data och visualiseringar. Några exempel:

  • Projektet omvärld.se har tagit fram en del material, se bl a Simons summering för öppna data i skolan.
  • Att använda Gapminder, se t ex min sammanställning av upplägg. Sannolikt ett av de vanligaste sätten att inkludera data och visualiseringar idag.
  • Tuvalabs har tagit fram ett antal lektioner som bygger på öppna data. De har då städat och sammanställt data, skapat interaktiva grafer och frågeställningar som man skulle kunna svara på med hjälp av datasetet. Materialet är på engelska. I dagsläget finns där 25 dataset och aktiviteter som är gratis.

Man kan också tänka sig att läromedelsföretag börjar tillhandahålla eller tipsa om visualiseringar i större utsträckning.

Uppslag: Öka kännedom om öppenhets-begreppet

I detta projekt har vi fokuserat mer på data-biten av öppna data, snarare än att se till hur öppenhet kommer in i läroplanen. I den lektion som jag höll med en gymnasieklass om öppna data och etik valde jag dock att fokusera delvis på öppenhets-biten. Jag märkte då att detta begrepp tolkas på varierande sätt, och värderades mycket olika.

Om man pratar om öppna data så kan man även prata om andra saker som hamnar under öppenhetsparaplyet, som öppna lärresurser, open access, öppen källkod och Creative Commons. Om man vill komma igång med detta så kan Webbstjärnans kurs om just Creative Commons vara en startpunkt. Bilden som används i detta blogginlägg är via en Creative Commons-licens.

Uppslag: Fokus på ”data literacy”

Om vi ser specifikt till användandet av öppna data i skolan, så är två utmaningar tid och datahanteringsfärdigheter. Här har jag inga siffror på hur det ser ut i dagsläget (sådana hade varit intressanta), men min bild är att det är ganska få som har möjlighet att arbeta direkt med dataset.

Ovan skriver jag att en väg framåt är att utgå från visualiseringar snarare än att själv hitta och använda datakällor. Men om man utgår ifrån data-baserat pedagogiskt material framtaget av myndigheter, journalister och läromedelsföretag så försvinner en del av fidusen med att gå till källan även vad gäller data. Man när inte heller kompetensen att själv ta sig an data från grunden. Om man ser bortom öppna data och nyttan med att använda dessa, så är data literacy, bl a att kunna läsa, skapa, hantera och kommunicera data, det överordnade behovet. Tuvalabs, som är ett exempel ovan, har även en blogg om att lära ut data literacy.

För nå de möjligheter som finns med att använda öppna data i undervisning, och gå bortom användandet av färdigförpackade visualiseringar, så är det det behovet som behöver tillgodoses.

Föredrag om öppna data i skolan, Malmö juni 2015

Bild från MINC Malmö Instagram
Bild från MINC Malmö Instagram

Som ett första steg i projektet så höll jag i juni ett föredrag om öppna data i skolan på MINC i Malmö, som en del av Nordic Open Data Week. I föredraget pratade jag om varför vi behöver mer allmänbildning kring data och dess användning, ger exempel på hur öppna data kan användas och hur den kan knytas till skolans undervisning.

Omvärldbloggen av Stefan Pålsson skrev ett inlägg om föredraget och relaterade projekt. Stefan tar även upp en hel del relaterat material, om vilka andra som gjort och skrivit om data i skolan tidigare.

Presentationen finns även på Slidshare, se nedan.

Hur hitta öppna data?

I ett tidigare blogginlägg har jag skrivit om tre exempel på öppna data (bistånd, luftkvalitet och kommuner)Jag hoppas att du blivit lite nyfiken på att hitta öppna data relevanta för ditt ämne och dina elever. Hur kan man gå till väga om man vill göra det? Vilka format brukar data finnas på?

Man kan hitta öppna data på flera olika ställen, eftersom dataseten kan röra olika ämnen och ha olika avsändare. Exempel på ämnen är befolkning, miljö, trafik, ekonomi, kvalitetsarbete, livsmedelskontroll, etc. Exempel på vilka som tillhandahåller data är FN, EU och olika delar av en nations verksamheter.

Detta inlägg är rätt mastigt, därför avslutar jag inlägget med några tips om startpunkter. Om du inte redan gjort det, läs inläggen om visualiseringar, del 1 och del 2. Läs även inlägget om omvärld.se, som bl a har en beskrivning om hur man kan gå från kursplan till visualisering.

Hitta öppna data från kommuner

Om det lokala perspektivet tilltalar så är det glädjande att fler och fler kommuner börjar dela med sig av sina data. Några som varit föregångare på området är:

  • Örebro – till exempel luftkvalitetsmätningar, trafikflöden och information om inköpta livsmedel
  • Helsingborg – till exempel Smileygodkända-platser och Flygfoton
  • Stockholm – till exempel miljödata och flygfoton
  • Open North (bl a Umeå och Skellefteå kommun) – till exempel kommunbudget och livsmedelsinspektioner

Vill du kolla om din kommun har öppna data kan du prova att lägga till ”psidata” (PSI står för Public Sector Information, dvs information från den offentliga sektorn) efter deras webbadress (som i http://www.vasteras.se/psidata). PSI-datakollen kan du kolla vilka kommuner som har en sådan sida. Ett första steg för  många kommuner har varit att lägga upp Kolada-data för sin kommun (Kolada samlar data från kommuner och landsting, läs mer i inlägget med exempel på öppna data.

Fler ställen där man kan hitta öppna data

Det finns flera myndigheter som tillhandahåller öppna data som kan vara relevanta som underlag för lektionsmaterial:

Dataportaler

Eftersom det kan vara lite klyddigt att veta vem man ska gå till för att hitta data så har det skapats så kallade dataportaler, som ger en gemensam ingång till en större mängd data. Ofta lyfter dessa även fram datakällor och dess användningar som man tycker är extra intressanta. Nackdelen med dataportaler är att de kan vara överväldigande.

Screenshot från öppnadata.se
Den svenska dataportalen öppnadata.se.

Den svenska dataportalen öppnadata.se är under uppbyggnad. I nuläget finns det en del svenska öppna data som inte finns med här.

Screenshot av kategorier i EUs öppna data portal, som kan användas för att hitta öppna data.
Kategorier i EU:s öppna data portal.

EU-nivå finns det dels en dataportal med data från EU.  Det finns också en dataportal som samlar ihop öppna data från EU-länder (där en hel del av denna på gott och ont är på originalspråk).

Även FN, WHO och Världsbanken har dataportaler.

Det kan även vara intressant att gå in och titta på portaler från andra länder, som kommit längre med sina dataportaler (i att där finns fler dataset, tydligare kategorier och exempel på hur deras data används). Några exempel: USA, Storbrittanien och Singapore.

Format

Som jag tar upp i inlägget varför öppna data har olika målgrupper olika behov vad gäller formatet som data hämtas i. I undervisning är tabelldata mest intressant. De vanligaste formaten för tabelldata är Excel och CSV. CSV står för Comma Separated Values och har fördelen att det inte är bundet till ett visst program. Men om det är Excel du är van vid kan du importera en CSV-fil dit.

I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.
I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.

För en programmerare så kan ett så kallat API (som anropas från programkod) vara värdefullt. Om syftet är att använda data i undervisning så är detta inte så användbart (om inte ämnet är programmering eller webbutveckling).

Andra möjliga format är sådana som beskriver geografiska områden, PDF:er och textfiler.

Startpunkter

Börja med att fundera på vilka offentliga verksamheter som kan ha material som är relevant för ditt ämne. Kanske någon av myndigheterna ovan? Bläddra bland deras material och leta efter ”färdigförpackat” material med olika visualiseringar (finns exempelvis hos SMHI, Riksantikvarieämbetet och SCB). Om du själv vill arbeta med tabeller (eller att dina elever ska göra det), leta efter Excel- och CSV-filer.

Hör gärna av dig om vad du skulle behöva för att komma igång och använda öppna data! Jag nås på marie.gustafsson@gmail.com

Att visualisera med mat

Vill man skapa visualiseringar så är man inte begränsad till det digitala. Ett spännande sätt att skapa visualiseringar, bortom Excel och Gapminder, är att använda mat som visualiseringsmaterial.

Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de "gömda" oliverna i botten. Bild från data-cuisine.net.
Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de ”gömda” oliverna i botten. Bild från data-cuisine.net.

Det finns ett roligt projekt som har just att  visualisera med mat som tema: data-cuisine.net. Några exempel på rätter:

  • Happines cocktail – räkcoctails baserade på Facebook, där antalet vänner ger antalet riskorn och hur många som ler på sina profilbilder ger antalet räkor
  • Lakmoussetikka – en dessert för att visa hur lite av Finlands blåbär som plockas, där det tunna blåbärslagret representerar de plockade blåbären och moussen i botten andelen som uppskattas bli kvar i skogen
  • Taste of migration – proportionen mellan olika ursprungsländer för personer som invandrat till Finland
  • Tortilla Feliz Catalana – utgår från data för Spanien från OECDs Better Life Index ställer spanjorernas nöjdhet i fyra kategorier mot hur viktig de anser att den kategorin är

Ofta så handlar det om att matcha proportioner ur dataset med passande ingredienser. I de workshops som finns hos Data Cuisine försöker de anknyta till data om staden eller landet som workshoppen hålls i. Det finns liknande upplägg från andra håll också.

Ett roligt sätt att kombinera något av hemkunskap, bild, samhällskunskap och/eller matematik!

Varför öppna data?

Ett tidigare blogginlägg handlade om varför öppna data är relevant för skolan. Där argumenterar vi för att öppna data är en tillgänglig resurs som det finns goda anledningar att ta del av även i skolan. Men varför öppna data från början?

Filmen nedan, ”What can open data do for you?”, är framtagen av Brittiska Open Data Institute, visar på några av de värden som skapas genom öppna data.

Varför öppnar offentliga och privata organisationer upp sin data så att andra kan ta del av den? De två vanligaste anledningarna är att skapa innovation och insyn, mer om det nedan. Förutom dessa anledningar så kan öppna data vara en del i ett internt kvalitetsarbete.  För offentliga institutioner är det även en del i att uppfylla PSI-direktivet (Public Sector Information) från EU-kommissionen, som syftar till att offentlig information ska bli mer tillgänglig.

Innovation

En anledning att tillgängliggöra data är att möjliggöra skapandet av socialt och ekonomiskt värde. Detta kan exempelvis ske genom att fler kan komma på hur en datakälla kan användas eller genom hur datakällor kombineras på nya, användbara sätt.  I filmen ovan är Citymapper ett exempel i denna kategori.

Insyn och delaktighet

Det andra vanliga argumentet för öppna data är att skapa transparens. Genom att medborgare får tillgång till information om samhället kan möjligheten att förstå och påverka öka. Exempel på detta är när kommuner som Örebro kommun tillgängliggör information om inköpta livsmedel och leverantörsfakturor (för att nämna några exempel), eller Riksdagens öppna data kring dokument, voteringar och ledamöter.

Öppna data för vem?

Det finns flera olika grupper som kan vara intresserade av öppna data, så som allmänheten, journalister och programmerare. Dessa grupper har olika behov, vilket är en utmaning när organisationer öppnar data. Det som är av mest nytta för programmeraren är sannolikt inte det som är viktigast för medborgaren. Har den som tillgängliggjort data främst haft innovationer i åtanke, så gör man det ofta lätt för programmeraren att ta del av dataseten. Då kan det kan vara svårt för den utan programmeringskunskap att ta del av det. Å andra sidan, om man väljer att förpacka data så att den är lätt för allmänheten att ta till sig, så kan den vara mindre användbar om man vill utveckla något nytt. Detta är en avvägning och en resursfråga, och beror i viss mån på typ av data.

Varför är detta relevant för den som vill använda öppna data i skolan? Dels för att det sätter öppna data i ett bredare sammanhang. Men också för att förstå bakgrunden till  de olika dataformat som används för att tillgängliggöra data. Mer om detta i ett kommande inlägg om hur man hittar öppna data.