Vad är data? Vad är information?

Det har inte skrivits något på denna blogg sedan slutet av det Vinnova-projekt som finansierade det 2015. Ämnet är fortfarande aktuellt, och jag som drev Vinnova-projektet tänker, skriver och gör fortfarande en del i området. Bl a visualiseringsprojekt tillsammans med Simon Winter, som också bidrog till projektet Öppna data i skolan. I dessa visualiseringsprojekt, och framförallt när vi ska skriva om dem, kommer vi in på detta med distinktionen mellan data och information. Ibland är vi överens, ibland inte. Simon har skrivit en första text om sin syn, Data och information, del 1 på Infontology. Här kommer min första text, som inte bygger på Simons.

Vad är sammanhanget?

Ett vanligt sätt att definiera data och information är att säga utgå från att data är fakta eller signaler från världen (eller att helt enkelt ta data som något underförstått – sånt som finns i Excel-ark). Sedan definieras information som data som satts i ett sammanhang eller som har tolkats.

Ett problem med detta påstående är att det låter som att data är en helt neutral sak, utan tolkning, utan sammanhang. Men om man ser till hur system där flera delar av en organisation ska dela på samma data (var sig det är vården eller säg en affärsverksamhet)  ser man att data samlas in eller skapas i ett sammanhang och att man vid själva tillfället för datainsamling samlar dem i vissa kategorier och strukturer.

Oväntat svårt med exempel

Även om man bortser från att den ”råa” datan samlats in i ett sammanhang, och alltså kan bära med sig vissa värderingar, så är sammanhangsdefinitionen problematisk när man ser till enskilda exempel. För på vilken nivå ska sammanhanget läggas? Vilket sammanhang, eller tolkning, är tillräckligt avancerat för att göra något till information?

Jag har t ex läst texter som lyfter fram ”Det regnar” som ett exempel på data. Informationen blir då vad man gör med det faktum att det regnar, eller att det finns någon tolkning kring orsak och verkan. Men är ”Det regnar” data? Någonstans har en signal tolkats som regn, på en viss plats, vid ett visst tillfälle. En person eller en mätare av något slag har tolkat att mängden vatten som faller från molnen överstiger ett visst tröskelvärde. Som jag ser det är ”det regnar” information.

Ett annat exempel. Min skostorlek är 40. Känns som data. Utan sammanhang – nej, det bygger på ett (av flera) system för skostorlekar. Vi kan tolka in en del saker, som storleken på min fot (via kunskap om storlekssystemen) och (om man vet lite om distributionen för skostorlekar bland kvinnor) att jag har hyfsat, men inte anmärkningsvärt stora fötter. Om man dessutom har data från flera personer kan man sammanställa olika statisktiska mått kring skostorlek, hur de ändras beroende på när man är född, etc. Är denna statistik data eller information? Mycket av det som presenteras som öppna data är just statistik. Men statistik är en tolkning, och i så fall information.

Bort med pyramiden

Det finns en visuell förklaring kring förhållandet mellan data, information och kunskap som brukar kallas för DIKW-pyramiden. Jag har framförallt stött på den i sammanhanget informationssystem och knowledge management (dvs system för att hantera kunskap). I pyramidens bas finner vi data, sedan byggs det på med information, kunskap och visdom. Förklaringen kommunicerar att varje nivå lägger till något till den förra och innebär att den nivån har ett högre värde än den innan. Ganska länge har jag stört mig på denna förklaring. Delvis handlar det om att den lite lättvindigt slänger upp visdom överst – ett koncept som är ännu mer svårdefinierat än kunskap. Dessutom antyder den att all kunskap kommer från data (via information).

DIKW-pyramiden uppstod på 80-talet, då de som byggde och sålde system behövde förtydliga värdet med det som de höll på med, genom att sätta den data som systemen hanterade i ett kontext. Pyramiden har sedan dykt upp i alla möjliga sammanhang, men även blivit kritiserad (se t ex Weinbergers artikel eller en summering av kritik från knowledge management-håll).

Sammanhang och kommunikativ avsikt?

Ofta används data och information som synonymer, och anges som sådana av exempelvis ordboken Marriam-Webster. Är detta ett problem? Och framförallt, hur ska vi kunna prata om de olika lager av tolkningar som görs när vi samlar in och lagrar ”saker” i tabeller och sedan gör mer eller mindre intressanta saker med dem? En sak jag tycker är viktigt att ta fasta på är det kommunikativa ursprunget i ordet information.

Data och information som ett kontinuum där saker kan vara mer rå:a eller mer informativa (dvs kommunicerande), men där många exempel hamnar i ett gränsland. Alla data samlas in i något sammanhang, och det sker ett urval av vad som ska samlas in. Jag skulle säga att i de flesta fall där det inte finns ett syfte i grunden är det svårt att finna svar i sina dataset. Ibland kan man byta sammanhang efter att data samlats in, men inte alltid.

Where is the life we lost in living?

Till sist, eventuellt ovidkommande, men intressant för mig. Sista året i gymnasiet (jag läste International Baccalaureate-programmet) skrev jag en uppsats utifrån några rader ur The Rock av T. S. Eliot. Detta var en av en liten lista med ämnen vi kunde välja på och utdraget var så här:

Where is the life we have lost in living?
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?

Jag minns inte att jag då undersökte sammanhanget för dessa rader. Det har jag inte heller gjort när jag genom åren stött på dem flera gånger, gärna som en en inramning för kopplingen information-kunskap-visdom. Ofta är det folk som skriver om informationssystem som tar upp dem, antingen för att visa på att hierarkin information-kunskap-visdom har varit beskriven flera decennier tillbaks eller för att visa på utmaningarna med system som hanterar kunskap.

Vad är då sammanhanget? The Rock skrevs för att pjäsen skulle samla in pengar för att bygga en större mängd kyrkor i London på 30-talet. Den sörjer förlusten av kontakten med Gud och argumenterar mot rörelsen mot ett rationellt, sekulärt samhälle.

Projektsummering Öppna data i skolan

Three men with saws från Field Museum Library. Inga kända copyright-begränsningar.
Three men with saws från Field Museum Library.

Så kommer det Vinnova-finansierade projektet ”Öppna data i skolan” till sitt slut. Materialet som tagits fram lever kvar på bloggen och en PDF har tagits fram för att ge en snabb introduktion till projektet. I detta inlägg ges en översikt av de publicerade inläggen. Hur väl stämde detta överens med planen? Vad händer i framtiden?

Översikt över innehållet på Öppna data i skolan

Inom ramen för projektet har 15 inlägg publicerats (om man inte räknar detta). Tre inlägg handlar om varför öppna data i skolan och hur data och visualiseringar kan kopplas till läroplanen:

Inlägg som introducerar öppna data (detta tas även upp i det första inlägget i listan ovan):

Inlägg som fokuserar på visualisering:

Inlägg som handlar om möjliga lektionsupplägg (detta återfinns även i Gapminder-inlägget ovan):

Till sist, ett inlägg om kommande arbete och ett som summerar några erfarenheter från projektet:

Kartan och verkligheten

I bloggens första inlägg fanns en lista med planerade inlägg. Hur förhåller sig innehållet på bloggen till dessa? Bloggen har kommit att innehålla mer material om visualisering än vad som var planerat från början, eftersom detta är en naturlig ingång för skolan.

Dataexpeditionen utfördes inte, men bloggen innehåller en beskrivning av upplägget som jag hoppas kommer till användning. I stället togs ett lektionsupplägg om etik och öppna data fram. Detta har genomförts i en gymnasieklass. Det finns inget inlägg som fokuserar på en steg för steg guide om hur man arbetar med dataset med elever, men material om hur man visualiserar data (se lista ovan), hittar data och hur man kan använda Gapminder. Det finns ett exempel på hur man kan visualisera med mat, men inget övergripande inlägg om att använda öppna data gestaltande och i praktiska ämnen. Inlägg om problemen med reduktionism och att ljuga med statistik saknas, liksom hur man samlar in egna dataset.

Framåt

Under våren kommer jag delta i Simons projekt att skapa ett  interaktivt läromedel om migration inom ramen för omvärld.se (se tidigare inlägg). Jag har några fler inlägg som jag hoppas skriva här på bloggen och kommer även att undersöka möjligheterna för vidare finansiering. Kanske blir fokus då snarare på ”data literacy” än på öppna data.

Gott nytt år!

Lektionsupplägg om öppna data och etik för gymnasieklass

I november genomförde jag en lektion om öppna data och etik med en ekonomigymnasieklass i Malmö. Tanken var att jag skulle ha besökt klassen redan i våras och då på en samhällskunskapslektion. Nu blev det under hösten och på en religionslektion – därav att etik blev ett tema. Jag ville även knyta an till ekonomi, vilket jag gjorde genom att välja dataset med ekonomisk koppling.

Min originaltanke för detta lektionstillfälle var att köra en dataexpedition, ett upplägg som jag skrivit om tidigare här på bloggen. Tanken var då att ta ett första tillfälle att introducera några verktyg för att analysera och visualisera data, och att eleverna vid ett andra tillfälle jobbar i grupp för att utforska data. Nu blev det inte tid till detta, och det passade inte in med etikvinkeln. I stället blev det, på gott och ont, mer fokus på konceptet öppna data.

Kort beskrivning av lektionen

Lektionsupplägget i sin helhet: Öppna data och etik för ekonomigymnasieklass

Lektionen börjar med en kort introduktion om varför öppna data och hur lektionen kan kopplas till läroplanen.

För att skapa förståelse för öppna data får eleverna välja två dataset att undersöka utifrån frågor som vad det handlar om, vem som skapat det och om det finns några etiska aspekter. Dessa två väljs från en lista med fem exempel.

Efter att eleverna tittat på två exempel diskuteras dessa i par, samt ett antal olika aspekter med öppna data. Lektionen avslutas med diskussion i helklass kring dessa.

Några reflektioner

De dataset exempel som flest valde var Ohio Online Checkbook och Skattekollen.se. Dessvärre har det förstnämnda inte ett värst bra användargränssnitt, och var inte så lätt att interagera med. Skattekollen var den som eleverna fann intressantast, med kommentarer som ”varför har förskolan större budget än gymnasiet” och ”detta kan vara användbart för att kunna påverka”.

Upplägget var lite för mycket för de 1,5 timma jag hade. Jag lät dessutom undersökandet av exempel ta mer tid än planerat, så det blev lite mindre tid än jag tänkt för en strukturerad diskussion i helklass. Detta ledde till en kortare ostrukturerad diskussion, där alla grupper inte kom till tals. Utvärderingen kom tyvärr inte med under lektionen, utan skickades ut av läraren. Tyvärr har den för få svar för användas.

Vid diskussionen i slutet av lektionen och när jag gick runt och pratade med eleverna när de tittade på exempel kom följande upp:

  • Det var lätt att landa i en allmän diskussion om värdet av öppenhet, och framförallt dess extremer, typ att man inte ska dela försvarshemligheter och om Wikileaks var rätt eller fel.
  • Ett flertal tyckte att detta med öppna data verkade irrelevant: ”varför skulle någon vara intresserad av hur Sveriges bistånd fördelas?”
  • Några tyckte att eftersom offentlighetsprincipen finns, att man ändå kan begära ut transaktioner, så är initiativ som det från Ohio helt irrelevanta. Här skulle man ju behöva både en diskussion om fördelar med automatisering men också om transparens som tillitsskapande.

Några funderingar om upplägget: Hur förmedla vad öppna data är på ett intressant men nyanserat sätt? Kan man få tillräcklig förståelse för öppna data på denna korta tid och från två exempel för att svara på diskussionsfrågorna? Öppenhetsbegreppet i sig och hur det kan appliceras är en utmaning i sig, utan att blanda in data. Om man vill ha mer av ett diskussionsupplägg tror jag att fokus på just öppenhet kan funka bättre än att bara ta upp öppna data.

Elevprojekt med dataexpeditioner?

Tre utforskare på väg.
Pillar of Darkness Expedition: 1913 av davidd, CC BY 2.0.

Data Expeditions are quests to map uncharted territory, discover hidden stories and solve unsolved mysteries in the Land of Data. In a team you’ll tackle a problem, answer a question or work on a project. We help you to get started and it’s up to you to decide where you go…

Så skriver schoolofdata.org om upplägget data expeditions. Dataexpeditioner är upptäcksfärder där det som utforskas är data. Utforskningarna görs i grupp, där de olika deltagarna har olika roller. Upplägget har vad jag vet främst använts med vuxna, men jag tror att det med lite anpassning kan användas för elever där man med data som hjälp vill göra en djupdykning i ett tema.

Roller i en dataexpedition

I School of Datas upplägg återfinns olika roller som behövs i gruppen:

  • Berättare (storyteller) – hittar intressanta vinklar att utforska och som kan skriva tilltalande berättelser. Viktiga för att hitta utgångspunkter och knyta ihop säcken.
  • Spanare (scout) – Letar reda på dataset som är tillgänliga på webben.
  • Analytiker (analyst) – Den som gör en djupdykning i datasetet för att testa hypoteserna som gruppen tagit fram.
  • Utvecklare (engineers) – Denna roll behöver inte vara med, men om man vill göra något mer än att skriva en rapport kan det vara bra med någon som kan skriva kod eller använda mjukvara för att skapa visualiseringar.
  • Designers – skapar tilltalande produkter och hjälper datasetets berättelse att komma fram.

Utöver detta så ingår det en guide i upplägget. En roll för läraren, eller kanske en äldre elev? Deras Guide for guides har mycket material kring upplägget.

Vad produceras i en dataexpedition?

Produkten av en dataexpedition behöver inte vara tekniskt avancerad, men kan givetvis vara det om förutsättningar finns. Det kan vara en visualisering, en skiss för en visualisering, ett blogginlägg eller en rapport. Vad produkten ska vara kan antingen vara förutbestämt eller bero på vilken typ av dataset som utforskas, hur komplicerat det är, lärandemål, osv.

Läs och om vad andra dataexpeditioner har resulterat i.

Dataexpedition i skolan?

Jag tror att detta är ett spännande upplägg för att låta eleverna göra en djupdykning i data och skapa en berättelse utifrån detta. Det är dock ett utmanande upplägg. Det kräver en del förberedelser så att eleverna har de färdigheter kring data som behövs. En lösning för detta är att ge stöd fokuserat för de olika rollerna som deltagarna tar.

Tanken var att en dataexpedition skulle genomföras inom ramen för detta projekt, men det fungerade inte inom ramarna för den möjlighet jag fick att jobba med en gymnasieklass. Jag hoppas att jag får möjlighet att testa detta i framtiden, eller att någon annan provar.

Data om migration

Flyktingkrisen har skapat ett ökat behov av läromedel om migration. Inom ramen för projektet Omvärld.se ska jag skapa ett interaktivt läromedel om migration, och i det arbetet ska Marie också vara med. Roligt!

Det finns massor av infallsvinklar på migration, och en hel massa politiska ståndpunkter och känslomässiga laddningar, så det känns väldigt svårt att veta var man ska börja.

Man kan försöka lära av historien och fördjupa sig i folkomflyttningar under den stora emigrationen till Amerika för ett hundratal år sen, eller under folkvandringstiden.

Urbaniseringen är en annan stor faktor som påverkar befolkningen, liksom ändrade mönster för när i livet vi skaffar barn, och hur många vi får.

Ekonomiska aspekter är extra svåra att visa upp, för det är så komplexa samband mellan olika gruppers bidrag till skatteintäkter, Sveriges rykte som ett säkert land, ett förutsägbart land, ett land med högtstående moral etc.

Kanske blir visualiseringarnas främsta bidrag att visa att det är en komplex verklighet bakom det till synes enkla valet att vara för eller emot invandring?

Ett par visualiseringar att börja med är i alla fall den här finska sidan Lucify som visar flyktingflödet mot Europa och den här från SVT Pejl som egentligen visar samma sak fast i en helt annan sorts visualisering: hur flyktingarna fördelar sig över EU-länderna.

Migrationsverket har en del svensk statistik, men den är inte helt lättanvänd. Här är till exempel ett väldigt konstigt diagram över det totala antalet asylsökande de senaste åren:

Total_sök

Alla åren ser ut att ha en stor ökning om man ser på året från januari och framåt. Ja, det blir ju ganska självklart, eftersom grafen visar det ackumulerade antalet! September månads siffror visar exempelvis alla som sökt asyl under januari till och med september!

Jag brukar tänka på diagram i termer av frågor: vilken fråga svarar det här diagrammet på? Och i det här exemplet kan jag verkligen inte komma på någon fråga. Här hos SCB hittar jag samma information för 2014 presenterat på ett betydligt mer lättfattligt sätt:

Antal-inkomna-asylsokningar-per-manad-2014

Självklart behöver det diagrammet kompletteras med det totala antalet för året, men visst är det mer man kan läsa ut av det här diagrammet: om flyktingströmmen är jämnt fördelad över året, hur stor den är per månad, vilka månader som har mest flyktingar etc.

Jag ser fram emot arbetet med data runt migrationen. Det finns mycket att undra över och mycket att förstå.

Utmaningar med öppna data i undervisning

I denna blogg vill vi visa hur öppna data kan utgöra ett källmaterial av nytta för skolan. Vi har bland annat skrivit om exempel på öppna data, visualiseringar av öppna data och hur Gapminder är ett steg mot öppna data i undervisning.

Det finns en del utmaningar vad gäller att använda öppna data, både generellt och i undervisning. I detta inlägg tar jag upp några sådana utmaningar och hur man kan hantera dem. Jag ger även några uppslag på hur vi kommer vidare med användande av öppna data i skolan.

Club Obi Wan (C.O.W.) "Challenge Coin" and Indy Gear av davidd.
Club Obi Wan (C.O.W.) ”Challenge Coin” and Indy Gear av davidd, CC BY 2.0.

Utmaning: Hitta relevanta dataset

Säg att en  lärare (eller utvecklare, eller journalist) har kommit fram till att det kanske skulle kunna finnas ett dataset som kan användas i en viss lektion (eller app eller artikel). Hur går hen då till väga för att hitta detta dataset (om det ens finns)?

I ett tidigare inlägg har jag skrivit om hur man kan hitta data och på vilka format dessa kan vara. En variant är att söka efter det i en dataportal (t ex öppnadata.se, om det rör sig om en svensk datakälla). Ibland innehåller dataportalen inte alla öppna data som finns tillgängliga (vilket är fallet i dagsläget för öppnadata.se). Då får man fundera på vilken myndighet eller dylikt som kan tänkas ha de data som man letar efter. En annan utmaning är att man för att hitta data behöver veta vilka termer som används i dess beskrivning.

Dataportaler vara lite överväldigande. Här är några tips för att snabbare komma in och komma vidare. När man väl har kollat runt lite så får man grepp om vad som finns. En del dataportaler ger hjälp på traven kring vad man kan söka på och vad andra sökt på, eller vad som är populärt. För att begränsa sig kan man även fundera på vilka myndigheter som kan ha data som man är intresserad av, och gå direkt till dem i portalen eller söka på myndighetens namn och öppna data. Man kan även avgränsa sig genom att specifikt titta efter dataset på formaten CSV, XLS (Excel) och HTML (som ofta är visualiseringar).

Ett annat sätt att hitta ämnesrelevanta data är att fråga i grupper med öppna data-intressenter (t ex Facebook grupperna Opengov och Nordic Open Data Ecosystem).

Utmaning: Utvärdera datakällor

När en datakälla har hittats, hur går man vidare då? Man behöver utvärdera om det är förståeligt och användbart för det syfte som man tänkt sig. Förutom att ladda ner och titta på datasetet, så kan man titta på hur det beskrivs. Man behöver även undersöka om det är av tillräcklig kvalitet, exempelvis om det är hyfsat komplett (t ex att det inte saknas datapunkter i allt för stor utsträckning) och om det beskrivs i tillräcklig detalj. För att göra detta behövs det en del förkunskaper kring datahantering och ämnet i sig.

Uppslag: Börja med visualiseringar

Om man inte känner sig redo att hitta och använda data själv är ett alternativ att utgå ifrån redan skapade visualiseringar. Ibland hittar man dessa via dataportaler och myndigheters sidor. Man kan också prova att googla ämnet man är intresserad av tillsammans med nyckelordet visualisering och visualization. Se även blogginlägg med kategori visualisering.

Även för visualiseringar måste det till källkritik. Vem är det som har skapat visualiseringen? Vilka datakällor bygger den på? Är visualiseringen vilseledande på något vis?

Uppslag: Utgå från lektionsmaterial baserat på (öppna) data

Man kan också använda mer eller mindre förpackade lektionsmaterial som bygger på öppna data och visualiseringar. Några exempel:

  • Projektet omvärld.se har tagit fram en del material, se bl a Simons summering för öppna data i skolan.
  • Att använda Gapminder, se t ex min sammanställning av upplägg. Sannolikt ett av de vanligaste sätten att inkludera data och visualiseringar idag.
  • Tuvalabs har tagit fram ett antal lektioner som bygger på öppna data. De har då städat och sammanställt data, skapat interaktiva grafer och frågeställningar som man skulle kunna svara på med hjälp av datasetet. Materialet är på engelska. I dagsläget finns där 25 dataset och aktiviteter som är gratis.

Man kan också tänka sig att läromedelsföretag börjar tillhandahålla eller tipsa om visualiseringar i större utsträckning.

Uppslag: Öka kännedom om öppenhets-begreppet

I detta projekt har vi fokuserat mer på data-biten av öppna data, snarare än att se till hur öppenhet kommer in i läroplanen. I den lektion som jag höll med en gymnasieklass om öppna data och etik valde jag dock att fokusera delvis på öppenhets-biten. Jag märkte då att detta begrepp tolkas på varierande sätt, och värderades mycket olika.

Om man pratar om öppna data så kan man även prata om andra saker som hamnar under öppenhetsparaplyet, som öppna lärresurser, open access, öppen källkod och Creative Commons. Om man vill komma igång med detta så kan Webbstjärnans kurs om just Creative Commons vara en startpunkt. Bilden som används i detta blogginlägg är via en Creative Commons-licens.

Uppslag: Fokus på ”data literacy”

Om vi ser specifikt till användandet av öppna data i skolan, så är två utmaningar tid och datahanteringsfärdigheter. Här har jag inga siffror på hur det ser ut i dagsläget (sådana hade varit intressanta), men min bild är att det är ganska få som har möjlighet att arbeta direkt med dataset.

Ovan skriver jag att en väg framåt är att utgå från visualiseringar snarare än att själv hitta och använda datakällor. Men om man utgår ifrån data-baserat pedagogiskt material framtaget av myndigheter, journalister och läromedelsföretag så försvinner en del av fidusen med att gå till källan även vad gäller data. Man när inte heller kompetensen att själv ta sig an data från grunden. Om man ser bortom öppna data och nyttan med att använda dessa, så är data literacy, bl a att kunna läsa, skapa, hantera och kommunicera data, det överordnade behovet. Tuvalabs, som är ett exempel ovan, har även en blogg om att lära ut data literacy.

För nå de möjligheter som finns med att använda öppna data i undervisning, och gå bortom användandet av färdigförpackade visualiseringar, så är det det behovet som behöver tillgodoses.

Data, visualiseringar och kursplanen

Att jobba med data och visualiseringar i skolan innebär att man behöver förhålla sig på något sätt till kursplaner och kunskapsmål.

Helst skulle man vilja kunna ta texten i kursplanen och härleda övningar med data och visualiseringar från dem. Kursplanerna är i princip teknikneutrala — det står inte mycket om digital (eller annan) teknik i dem. Därför blir det svårt att gå från kursplan till visualisering på ett entydigt sätt.

En ganska vanlig strategi är därför att lärare skapar aktiviteter i klassen först och mappar på kursplanen i efterhand, typ så här (fast det exemplet gäller inte just visualisering):

Därefter förkovrade jag mig i läroplanen och började bena ut vilket centralt innehåll jag kunde väva in i elevernas idéer.

Teacherhack är ett projekt som främst har haft programmering i fokus, men som har gått igenom alla ämnens kursplaner för att hitta kopplingar till vad man kan göra med digital teknik. De kallar det för ”den hackade läroplanen”.

För vissa ämnen finns det tydliga kopplingar i läroplanen vad gäller användande av visualiseringar och öppna data. Marie tar upp en del i sina bilder här, med exempel från geografi, samhällskunskap, fysik och matematik.

Hur värdefullt det är att använda visualiseringar och att utforska data i klassrummet kan vara avhängigt av vilken pedagogisk modell läraren anammat. En studie från Århus universitet (Levinsen & Sørensen 2011, refererad av Skolverket) visar hur digitala verktyg är mer användbara i ett problemorienterat arbetssätt än i ett lärarcentrerat.

Får eleverna arbeta problemorienterat och ta ansvar för att meningsfullt konstruera sin förståeelse blir också data och visualiseringar ett verktyg man kan använda som underlag för att skapa hypoteser runt hur världen funkar, och få sina mentala modeller utmanade.

Jag övertygad om att det finns en stor potential i att använda data och visualiseringar i skolan, och förvånad över att det inte görs i större utsträckning. Ska man tänka på kursplanerna utifrån den övertygelsen är det frestande att gå ett steg till: hur skulle man kunna använda data och visualiseringar för att utforska och lära sig för skolan nya områden? 

Som exempel: att använda en lärobok för att lära sig om väderförhållanden gör det svårt att komma djupare i sin förståelse än en viss nivå. Om man har en karta som Windyty går det att få en uppfattning om många fler dimensioner av väder, och hur de hänger ihop, genom att titta på olika delar av det geografiska området, i översikt och i detalj, och även lära sig tolka väderprognoserna.

En lärare som argumenterat väl för den här pedagogiska övergången (från katederundervisning och formler, till problemorientering) är Dan Meyer, som jag har skrivit lite om här.

Levinsen, Karin and Birgitte Holm Sørensen. ”Formalized informal learning: ICT and Learning for the 21stCentury”International Journal of Digital Literacy and Digital Competence. 2011, 2(1). 7-26.

Föredrag om öppna data i skolan, Malmö juni 2015

Bild från MINC Malmö Instagram
Bild från MINC Malmö Instagram

Som ett första steg i projektet så höll jag i juni ett föredrag om öppna data i skolan på MINC i Malmö, som en del av Nordic Open Data Week. I föredraget pratade jag om varför vi behöver mer allmänbildning kring data och dess användning, ger exempel på hur öppna data kan användas och hur den kan knytas till skolans undervisning.

Omvärldbloggen av Stefan Pålsson skrev ett inlägg om föredraget och relaterade projekt. Stefan tar även upp en hel del relaterat material, om vilka andra som gjort och skrivit om data i skolan tidigare.

Presentationen finns även på Slidshare, se nedan.

Hur hitta öppna data?

I ett tidigare blogginlägg har jag skrivit om tre exempel på öppna data (bistånd, luftkvalitet och kommuner)Jag hoppas att du blivit lite nyfiken på att hitta öppna data relevanta för ditt ämne och dina elever. Hur kan man gå till väga om man vill göra det? Vilka format brukar data finnas på?

Man kan hitta öppna data på flera olika ställen, eftersom dataseten kan röra olika ämnen och ha olika avsändare. Exempel på ämnen är befolkning, miljö, trafik, ekonomi, kvalitetsarbete, livsmedelskontroll, etc. Exempel på vilka som tillhandahåller data är FN, EU och olika delar av en nations verksamheter.

Detta inlägg är rätt mastigt, därför avslutar jag inlägget med några tips om startpunkter. Om du inte redan gjort det, läs inläggen om visualiseringar, del 1 och del 2. Läs även inlägget om omvärld.se, som bl a har en beskrivning om hur man kan gå från kursplan till visualisering.

Hitta öppna data från kommuner

Om det lokala perspektivet tilltalar så är det glädjande att fler och fler kommuner börjar dela med sig av sina data. Några som varit föregångare på området är:

  • Örebro – till exempel luftkvalitetsmätningar, trafikflöden och information om inköpta livsmedel
  • Helsingborg – till exempel Smileygodkända-platser och Flygfoton
  • Stockholm – till exempel miljödata och flygfoton
  • Open North (bl a Umeå och Skellefteå kommun) – till exempel kommunbudget och livsmedelsinspektioner

Vill du kolla om din kommun har öppna data kan du prova att lägga till ”psidata” (PSI står för Public Sector Information, dvs information från den offentliga sektorn) efter deras webbadress (som i http://www.vasteras.se/psidata). PSI-datakollen kan du kolla vilka kommuner som har en sådan sida. Ett första steg för  många kommuner har varit att lägga upp Kolada-data för sin kommun (Kolada samlar data från kommuner och landsting, läs mer i inlägget med exempel på öppna data.

Fler ställen där man kan hitta öppna data

Det finns flera myndigheter som tillhandahåller öppna data som kan vara relevanta som underlag för lektionsmaterial:

Dataportaler

Eftersom det kan vara lite klyddigt att veta vem man ska gå till för att hitta data så har det skapats så kallade dataportaler, som ger en gemensam ingång till en större mängd data. Ofta lyfter dessa även fram datakällor och dess användningar som man tycker är extra intressanta. Nackdelen med dataportaler är att de kan vara överväldigande.

Screenshot från öppnadata.se
Den svenska dataportalen öppnadata.se.

Den svenska dataportalen öppnadata.se är under uppbyggnad. I nuläget finns det en del svenska öppna data som inte finns med här.

Screenshot av kategorier i EUs öppna data portal, som kan användas för att hitta öppna data.
Kategorier i EU:s öppna data portal.

EU-nivå finns det dels en dataportal med data från EU.  Det finns också en dataportal som samlar ihop öppna data från EU-länder (där en hel del av denna på gott och ont är på originalspråk).

Även FN, WHO och Världsbanken har dataportaler.

Det kan även vara intressant att gå in och titta på portaler från andra länder, som kommit längre med sina dataportaler (i att där finns fler dataset, tydligare kategorier och exempel på hur deras data används). Några exempel: USA, Storbrittanien och Singapore.

Format

Som jag tar upp i inlägget varför öppna data har olika målgrupper olika behov vad gäller formatet som data hämtas i. I undervisning är tabelldata mest intressant. De vanligaste formaten för tabelldata är Excel och CSV. CSV står för Comma Separated Values och har fördelen att det inte är bundet till ett visst program. Men om det är Excel du är van vid kan du importera en CSV-fil dit.

I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.
I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.

För en programmerare så kan ett så kallat API (som anropas från programkod) vara värdefullt. Om syftet är att använda data i undervisning så är detta inte så användbart (om inte ämnet är programmering eller webbutveckling).

Andra möjliga format är sådana som beskriver geografiska områden, PDF:er och textfiler.

Startpunkter

Börja med att fundera på vilka offentliga verksamheter som kan ha material som är relevant för ditt ämne. Kanske någon av myndigheterna ovan? Bläddra bland deras material och leta efter ”färdigförpackat” material med olika visualiseringar (finns exempelvis hos SMHI, Riksantikvarieämbetet och SCB). Om du själv vill arbeta med tabeller (eller att dina elever ska göra det), leta efter Excel- och CSV-filer.

Hör gärna av dig om vad du skulle behöva för att komma igång och använda öppna data! Jag nås på marie.gustafsson@gmail.com

Att visualisera med mat

Vill man skapa visualiseringar så är man inte begränsad till det digitala. Ett spännande sätt att skapa visualiseringar, bortom Excel och Gapminder, är att använda mat som visualiseringsmaterial.

Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de "gömda" oliverna i botten. Bild från data-cuisine.net.
Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de ”gömda” oliverna i botten. Bild från data-cuisine.net.

Det finns ett roligt projekt som har just att  visualisera med mat som tema: data-cuisine.net. Några exempel på rätter:

  • Happines cocktail – räkcoctails baserade på Facebook, där antalet vänner ger antalet riskorn och hur många som ler på sina profilbilder ger antalet räkor
  • Lakmoussetikka – en dessert för att visa hur lite av Finlands blåbär som plockas, där det tunna blåbärslagret representerar de plockade blåbären och moussen i botten andelen som uppskattas bli kvar i skogen
  • Taste of migration – proportionen mellan olika ursprungsländer för personer som invandrat till Finland
  • Tortilla Feliz Catalana – utgår från data för Spanien från OECDs Better Life Index ställer spanjorernas nöjdhet i fyra kategorier mot hur viktig de anser att den kategorin är

Ofta så handlar det om att matcha proportioner ur dataset med passande ingredienser. I de workshops som finns hos Data Cuisine försöker de anknyta till data om staden eller landet som workshoppen hålls i. Det finns liknande upplägg från andra håll också.

Ett roligt sätt att kombinera något av hemkunskap, bild, samhällskunskap och/eller matematik!