Projektsummering Öppna data i skolan

Three men with saws från Field Museum Library. Inga kända copyright-begränsningar.
Three men with saws från Field Museum Library.

Så kommer det Vinnova-finansierade projektet ”Öppna data i skolan” till sitt slut. Materialet som tagits fram lever kvar på bloggen och en PDF har tagits fram för att ge en snabb introduktion till projektet. I detta inlägg ges en översikt av de publicerade inläggen. Hur väl stämde detta överens med planen? Vad händer i framtiden?

Översikt över innehållet på Öppna data i skolan

Inom ramen för projektet har 15 inlägg publicerats (om man inte räknar detta). Tre inlägg handlar om varför öppna data i skolan och hur data och visualiseringar kan kopplas till läroplanen:

Inlägg som introducerar öppna data (detta tas även upp i det första inlägget i listan ovan):

Inlägg som fokuserar på visualisering:

Inlägg som handlar om möjliga lektionsupplägg (detta återfinns även i Gapminder-inlägget ovan):

Till sist, ett inlägg om kommande arbete och ett som summerar några erfarenheter från projektet:

Kartan och verkligheten

I bloggens första inlägg fanns en lista med planerade inlägg. Hur förhåller sig innehållet på bloggen till dessa? Bloggen har kommit att innehålla mer material om visualisering än vad som var planerat från början, eftersom detta är en naturlig ingång för skolan.

Dataexpeditionen utfördes inte, men bloggen innehåller en beskrivning av upplägget som jag hoppas kommer till användning. I stället togs ett lektionsupplägg om etik och öppna data fram. Detta har genomförts i en gymnasieklass. Det finns inget inlägg som fokuserar på en steg för steg guide om hur man arbetar med dataset med elever, men material om hur man visualiserar data (se lista ovan), hittar data och hur man kan använda Gapminder. Det finns ett exempel på hur man kan visualisera med mat, men inget övergripande inlägg om att använda öppna data gestaltande och i praktiska ämnen. Inlägg om problemen med reduktionism och att ljuga med statistik saknas, liksom hur man samlar in egna dataset.

Framåt

Under våren kommer jag delta i Simons projekt att skapa ett  interaktivt läromedel om migration inom ramen för omvärld.se (se tidigare inlägg). Jag har några fler inlägg som jag hoppas skriva här på bloggen och kommer även att undersöka möjligheterna för vidare finansiering. Kanske blir fokus då snarare på ”data literacy” än på öppna data.

Gott nytt år!

Lektionsupplägg om öppna data och etik för gymnasieklass

I november genomförde jag en lektion om öppna data och etik med en ekonomigymnasieklass i Malmö. Tanken var att jag skulle ha besökt klassen redan i våras och då på en samhällskunskapslektion. Nu blev det under hösten och på en religionslektion – därav att etik blev ett tema. Jag ville även knyta an till ekonomi, vilket jag gjorde genom att välja dataset med ekonomisk koppling.

Min originaltanke för detta lektionstillfälle var att köra en dataexpedition, ett upplägg som jag skrivit om tidigare här på bloggen. Tanken var då att ta ett första tillfälle att introducera några verktyg för att analysera och visualisera data, och att eleverna vid ett andra tillfälle jobbar i grupp för att utforska data. Nu blev det inte tid till detta, och det passade inte in med etikvinkeln. I stället blev det, på gott och ont, mer fokus på konceptet öppna data.

Kort beskrivning av lektionen

Lektionsupplägget i sin helhet: Öppna data och etik för ekonomigymnasieklass

Lektionen börjar med en kort introduktion om varför öppna data och hur lektionen kan kopplas till läroplanen.

För att skapa förståelse för öppna data får eleverna välja två dataset att undersöka utifrån frågor som vad det handlar om, vem som skapat det och om det finns några etiska aspekter. Dessa två väljs från en lista med fem exempel.

Efter att eleverna tittat på två exempel diskuteras dessa i par, samt ett antal olika aspekter med öppna data. Lektionen avslutas med diskussion i helklass kring dessa.

Några reflektioner

De dataset exempel som flest valde var Ohio Online Checkbook och Skattekollen.se. Dessvärre har det förstnämnda inte ett värst bra användargränssnitt, och var inte så lätt att interagera med. Skattekollen var den som eleverna fann intressantast, med kommentarer som ”varför har förskolan större budget än gymnasiet” och ”detta kan vara användbart för att kunna påverka”.

Upplägget var lite för mycket för de 1,5 timma jag hade. Jag lät dessutom undersökandet av exempel ta mer tid än planerat, så det blev lite mindre tid än jag tänkt för en strukturerad diskussion i helklass. Detta ledde till en kortare ostrukturerad diskussion, där alla grupper inte kom till tals. Utvärderingen kom tyvärr inte med under lektionen, utan skickades ut av läraren. Tyvärr har den för få svar för användas.

Vid diskussionen i slutet av lektionen och när jag gick runt och pratade med eleverna när de tittade på exempel kom följande upp:

  • Det var lätt att landa i en allmän diskussion om värdet av öppenhet, och framförallt dess extremer, typ att man inte ska dela försvarshemligheter och om Wikileaks var rätt eller fel.
  • Ett flertal tyckte att detta med öppna data verkade irrelevant: ”varför skulle någon vara intresserad av hur Sveriges bistånd fördelas?”
  • Några tyckte att eftersom offentlighetsprincipen finns, att man ändå kan begära ut transaktioner, så är initiativ som det från Ohio helt irrelevanta. Här skulle man ju behöva både en diskussion om fördelar med automatisering men också om transparens som tillitsskapande.

Några funderingar om upplägget: Hur förmedla vad öppna data är på ett intressant men nyanserat sätt? Kan man få tillräcklig förståelse för öppna data på denna korta tid och från två exempel för att svara på diskussionsfrågorna? Öppenhetsbegreppet i sig och hur det kan appliceras är en utmaning i sig, utan att blanda in data. Om man vill ha mer av ett diskussionsupplägg tror jag att fokus på just öppenhet kan funka bättre än att bara ta upp öppna data.

Elevprojekt med dataexpeditioner?

Tre utforskare på väg.
Pillar of Darkness Expedition: 1913 av davidd, CC BY 2.0.

Data Expeditions are quests to map uncharted territory, discover hidden stories and solve unsolved mysteries in the Land of Data. In a team you’ll tackle a problem, answer a question or work on a project. We help you to get started and it’s up to you to decide where you go…

Så skriver schoolofdata.org om upplägget data expeditions. Dataexpeditioner är upptäcksfärder där det som utforskas är data. Utforskningarna görs i grupp, där de olika deltagarna har olika roller. Upplägget har vad jag vet främst använts med vuxna, men jag tror att det med lite anpassning kan användas för elever där man med data som hjälp vill göra en djupdykning i ett tema.

Roller i en dataexpedition

I School of Datas upplägg återfinns olika roller som behövs i gruppen:

  • Berättare (storyteller) – hittar intressanta vinklar att utforska och som kan skriva tilltalande berättelser. Viktiga för att hitta utgångspunkter och knyta ihop säcken.
  • Spanare (scout) – Letar reda på dataset som är tillgänliga på webben.
  • Analytiker (analyst) – Den som gör en djupdykning i datasetet för att testa hypoteserna som gruppen tagit fram.
  • Utvecklare (engineers) – Denna roll behöver inte vara med, men om man vill göra något mer än att skriva en rapport kan det vara bra med någon som kan skriva kod eller använda mjukvara för att skapa visualiseringar.
  • Designers – skapar tilltalande produkter och hjälper datasetets berättelse att komma fram.

Utöver detta så ingår det en guide i upplägget. En roll för läraren, eller kanske en äldre elev? Deras Guide for guides har mycket material kring upplägget.

Vad produceras i en dataexpedition?

Produkten av en dataexpedition behöver inte vara tekniskt avancerad, men kan givetvis vara det om förutsättningar finns. Det kan vara en visualisering, en skiss för en visualisering, ett blogginlägg eller en rapport. Vad produkten ska vara kan antingen vara förutbestämt eller bero på vilken typ av dataset som utforskas, hur komplicerat det är, lärandemål, osv.

Läs och om vad andra dataexpeditioner har resulterat i.

Dataexpedition i skolan?

Jag tror att detta är ett spännande upplägg för att låta eleverna göra en djupdykning i data och skapa en berättelse utifrån detta. Det är dock ett utmanande upplägg. Det kräver en del förberedelser så att eleverna har de färdigheter kring data som behövs. En lösning för detta är att ge stöd fokuserat för de olika rollerna som deltagarna tar.

Tanken var att en dataexpedition skulle genomföras inom ramen för detta projekt, men det fungerade inte inom ramarna för den möjlighet jag fick att jobba med en gymnasieklass. Jag hoppas att jag får möjlighet att testa detta i framtiden, eller att någon annan provar.

Data om migration

Flyktingkrisen har skapat ett ökat behov av läromedel om migration. Inom ramen för projektet Omvärld.se ska jag skapa ett interaktivt läromedel om migration, och i det arbetet ska Marie också vara med. Roligt!

Det finns massor av infallsvinklar på migration, och en hel massa politiska ståndpunkter och känslomässiga laddningar, så det känns väldigt svårt att veta var man ska börja.

Man kan försöka lära av historien och fördjupa sig i folkomflyttningar under den stora emigrationen till Amerika för ett hundratal år sen, eller under folkvandringstiden.

Urbaniseringen är en annan stor faktor som påverkar befolkningen, liksom ändrade mönster för när i livet vi skaffar barn, och hur många vi får.

Ekonomiska aspekter är extra svåra att visa upp, för det är så komplexa samband mellan olika gruppers bidrag till skatteintäkter, Sveriges rykte som ett säkert land, ett förutsägbart land, ett land med högtstående moral etc.

Kanske blir visualiseringarnas främsta bidrag att visa att det är en komplex verklighet bakom det till synes enkla valet att vara för eller emot invandring?

Ett par visualiseringar att börja med är i alla fall den här finska sidan Lucify som visar flyktingflödet mot Europa och den här från SVT Pejl som egentligen visar samma sak fast i en helt annan sorts visualisering: hur flyktingarna fördelar sig över EU-länderna.

Migrationsverket har en del svensk statistik, men den är inte helt lättanvänd. Här är till exempel ett väldigt konstigt diagram över det totala antalet asylsökande de senaste åren:

Total_sök

Alla åren ser ut att ha en stor ökning om man ser på året från januari och framåt. Ja, det blir ju ganska självklart, eftersom grafen visar det ackumulerade antalet! September månads siffror visar exempelvis alla som sökt asyl under januari till och med september!

Jag brukar tänka på diagram i termer av frågor: vilken fråga svarar det här diagrammet på? Och i det här exemplet kan jag verkligen inte komma på någon fråga. Här hos SCB hittar jag samma information för 2014 presenterat på ett betydligt mer lättfattligt sätt:

Antal-inkomna-asylsokningar-per-manad-2014

Självklart behöver det diagrammet kompletteras med det totala antalet för året, men visst är det mer man kan läsa ut av det här diagrammet: om flyktingströmmen är jämnt fördelad över året, hur stor den är per månad, vilka månader som har mest flyktingar etc.

Jag ser fram emot arbetet med data runt migrationen. Det finns mycket att undra över och mycket att förstå.

Utmaningar med öppna data i undervisning

I denna blogg vill vi visa hur öppna data kan utgöra ett källmaterial av nytta för skolan. Vi har bland annat skrivit om exempel på öppna data, visualiseringar av öppna data och hur Gapminder är ett steg mot öppna data i undervisning.

Det finns en del utmaningar vad gäller att använda öppna data, både generellt och i undervisning. I detta inlägg tar jag upp några sådana utmaningar och hur man kan hantera dem. Jag ger även några uppslag på hur vi kommer vidare med användande av öppna data i skolan.

Club Obi Wan (C.O.W.) "Challenge Coin" and Indy Gear av davidd.
Club Obi Wan (C.O.W.) ”Challenge Coin” and Indy Gear av davidd, CC BY 2.0.

Utmaning: Hitta relevanta dataset

Säg att en  lärare (eller utvecklare, eller journalist) har kommit fram till att det kanske skulle kunna finnas ett dataset som kan användas i en viss lektion (eller app eller artikel). Hur går hen då till väga för att hitta detta dataset (om det ens finns)?

I ett tidigare inlägg har jag skrivit om hur man kan hitta data och på vilka format dessa kan vara. En variant är att söka efter det i en dataportal (t ex öppnadata.se, om det rör sig om en svensk datakälla). Ibland innehåller dataportalen inte alla öppna data som finns tillgängliga (vilket är fallet i dagsläget för öppnadata.se). Då får man fundera på vilken myndighet eller dylikt som kan tänkas ha de data som man letar efter. En annan utmaning är att man för att hitta data behöver veta vilka termer som används i dess beskrivning.

Dataportaler vara lite överväldigande. Här är några tips för att snabbare komma in och komma vidare. När man väl har kollat runt lite så får man grepp om vad som finns. En del dataportaler ger hjälp på traven kring vad man kan söka på och vad andra sökt på, eller vad som är populärt. För att begränsa sig kan man även fundera på vilka myndigheter som kan ha data som man är intresserad av, och gå direkt till dem i portalen eller söka på myndighetens namn och öppna data. Man kan även avgränsa sig genom att specifikt titta efter dataset på formaten CSV, XLS (Excel) och HTML (som ofta är visualiseringar).

Ett annat sätt att hitta ämnesrelevanta data är att fråga i grupper med öppna data-intressenter (t ex Facebook grupperna Opengov och Nordic Open Data Ecosystem).

Utmaning: Utvärdera datakällor

När en datakälla har hittats, hur går man vidare då? Man behöver utvärdera om det är förståeligt och användbart för det syfte som man tänkt sig. Förutom att ladda ner och titta på datasetet, så kan man titta på hur det beskrivs. Man behöver även undersöka om det är av tillräcklig kvalitet, exempelvis om det är hyfsat komplett (t ex att det inte saknas datapunkter i allt för stor utsträckning) och om det beskrivs i tillräcklig detalj. För att göra detta behövs det en del förkunskaper kring datahantering och ämnet i sig.

Uppslag: Börja med visualiseringar

Om man inte känner sig redo att hitta och använda data själv är ett alternativ att utgå ifrån redan skapade visualiseringar. Ibland hittar man dessa via dataportaler och myndigheters sidor. Man kan också prova att googla ämnet man är intresserad av tillsammans med nyckelordet visualisering och visualization. Se även blogginlägg med kategori visualisering.

Även för visualiseringar måste det till källkritik. Vem är det som har skapat visualiseringen? Vilka datakällor bygger den på? Är visualiseringen vilseledande på något vis?

Uppslag: Utgå från lektionsmaterial baserat på (öppna) data

Man kan också använda mer eller mindre förpackade lektionsmaterial som bygger på öppna data och visualiseringar. Några exempel:

  • Projektet omvärld.se har tagit fram en del material, se bl a Simons summering för öppna data i skolan.
  • Att använda Gapminder, se t ex min sammanställning av upplägg. Sannolikt ett av de vanligaste sätten att inkludera data och visualiseringar idag.
  • Tuvalabs har tagit fram ett antal lektioner som bygger på öppna data. De har då städat och sammanställt data, skapat interaktiva grafer och frågeställningar som man skulle kunna svara på med hjälp av datasetet. Materialet är på engelska. I dagsläget finns där 25 dataset och aktiviteter som är gratis.

Man kan också tänka sig att läromedelsföretag börjar tillhandahålla eller tipsa om visualiseringar i större utsträckning.

Uppslag: Öka kännedom om öppenhets-begreppet

I detta projekt har vi fokuserat mer på data-biten av öppna data, snarare än att se till hur öppenhet kommer in i läroplanen. I den lektion som jag höll med en gymnasieklass om öppna data och etik valde jag dock att fokusera delvis på öppenhets-biten. Jag märkte då att detta begrepp tolkas på varierande sätt, och värderades mycket olika.

Om man pratar om öppna data så kan man även prata om andra saker som hamnar under öppenhetsparaplyet, som öppna lärresurser, open access, öppen källkod och Creative Commons. Om man vill komma igång med detta så kan Webbstjärnans kurs om just Creative Commons vara en startpunkt. Bilden som används i detta blogginlägg är via en Creative Commons-licens.

Uppslag: Fokus på ”data literacy”

Om vi ser specifikt till användandet av öppna data i skolan, så är två utmaningar tid och datahanteringsfärdigheter. Här har jag inga siffror på hur det ser ut i dagsläget (sådana hade varit intressanta), men min bild är att det är ganska få som har möjlighet att arbeta direkt med dataset.

Ovan skriver jag att en väg framåt är att utgå från visualiseringar snarare än att själv hitta och använda datakällor. Men om man utgår ifrån data-baserat pedagogiskt material framtaget av myndigheter, journalister och läromedelsföretag så försvinner en del av fidusen med att gå till källan även vad gäller data. Man när inte heller kompetensen att själv ta sig an data från grunden. Om man ser bortom öppna data och nyttan med att använda dessa, så är data literacy, bl a att kunna läsa, skapa, hantera och kommunicera data, det överordnade behovet. Tuvalabs, som är ett exempel ovan, har även en blogg om att lära ut data literacy.

För nå de möjligheter som finns med att använda öppna data i undervisning, och gå bortom användandet av färdigförpackade visualiseringar, så är det det behovet som behöver tillgodoses.

Data, visualiseringar och kursplanen

Att jobba med data och visualiseringar i skolan innebär att man behöver förhålla sig på något sätt till kursplaner och kunskapsmål.

Helst skulle man vilja kunna ta texten i kursplanen och härleda övningar med data och visualiseringar från dem. Kursplanerna är i princip teknikneutrala — det står inte mycket om digital (eller annan) teknik i dem. Därför blir det svårt att gå från kursplan till visualisering på ett entydigt sätt.

En ganska vanlig strategi är därför att lärare skapar aktiviteter i klassen först och mappar på kursplanen i efterhand, typ så här (fast det exemplet gäller inte just visualisering):

Därefter förkovrade jag mig i läroplanen och började bena ut vilket centralt innehåll jag kunde väva in i elevernas idéer.

Teacherhack är ett projekt som främst har haft programmering i fokus, men som har gått igenom alla ämnens kursplaner för att hitta kopplingar till vad man kan göra med digital teknik. De kallar det för ”den hackade läroplanen”.

För vissa ämnen finns det tydliga kopplingar i läroplanen vad gäller användande av visualiseringar och öppna data. Marie tar upp en del i sina bilder här, med exempel från geografi, samhällskunskap, fysik och matematik.

Hur värdefullt det är att använda visualiseringar och att utforska data i klassrummet kan vara avhängigt av vilken pedagogisk modell läraren anammat. En studie från Århus universitet (Levinsen & Sørensen 2011, refererad av Skolverket) visar hur digitala verktyg är mer användbara i ett problemorienterat arbetssätt än i ett lärarcentrerat.

Får eleverna arbeta problemorienterat och ta ansvar för att meningsfullt konstruera sin förståeelse blir också data och visualiseringar ett verktyg man kan använda som underlag för att skapa hypoteser runt hur världen funkar, och få sina mentala modeller utmanade.

Jag övertygad om att det finns en stor potential i att använda data och visualiseringar i skolan, och förvånad över att det inte görs i större utsträckning. Ska man tänka på kursplanerna utifrån den övertygelsen är det frestande att gå ett steg till: hur skulle man kunna använda data och visualiseringar för att utforska och lära sig för skolan nya områden? 

Som exempel: att använda en lärobok för att lära sig om väderförhållanden gör det svårt att komma djupare i sin förståelse än en viss nivå. Om man har en karta som Windyty går det att få en uppfattning om många fler dimensioner av väder, och hur de hänger ihop, genom att titta på olika delar av det geografiska området, i översikt och i detalj, och även lära sig tolka väderprognoserna.

En lärare som argumenterat väl för den här pedagogiska övergången (från katederundervisning och formler, till problemorientering) är Dan Meyer, som jag har skrivit lite om här.

Levinsen, Karin and Birgitte Holm Sørensen. ”Formalized informal learning: ICT and Learning for the 21stCentury”International Journal of Digital Literacy and Digital Competence. 2011, 2(1). 7-26.

Föredrag om öppna data i skolan, Malmö juni 2015

Bild från MINC Malmö Instagram
Bild från MINC Malmö Instagram

Som ett första steg i projektet så höll jag i juni ett föredrag om öppna data i skolan på MINC i Malmö, som en del av Nordic Open Data Week. I föredraget pratade jag om varför vi behöver mer allmänbildning kring data och dess användning, ger exempel på hur öppna data kan användas och hur den kan knytas till skolans undervisning.

Omvärldbloggen av Stefan Pålsson skrev ett inlägg om föredraget och relaterade projekt. Stefan tar även upp en hel del relaterat material, om vilka andra som gjort och skrivit om data i skolan tidigare.

Presentationen finns även på Slidshare, se nedan.

Hur hitta öppna data?

I ett tidigare blogginlägg har jag skrivit om tre exempel på öppna data (bistånd, luftkvalitet och kommuner)Jag hoppas att du blivit lite nyfiken på att hitta öppna data relevanta för ditt ämne och dina elever. Hur kan man gå till väga om man vill göra det? Vilka format brukar data finnas på?

Man kan hitta öppna data på flera olika ställen, eftersom dataseten kan röra olika ämnen och ha olika avsändare. Exempel på ämnen är befolkning, miljö, trafik, ekonomi, kvalitetsarbete, livsmedelskontroll, etc. Exempel på vilka som tillhandahåller data är FN, EU och olika delar av en nations verksamheter.

Detta inlägg är rätt mastigt, därför avslutar jag inlägget med några tips om startpunkter. Om du inte redan gjort det, läs inläggen om visualiseringar, del 1 och del 2. Läs även inlägget om omvärld.se, som bl a har en beskrivning om hur man kan gå från kursplan till visualisering.

Hitta öppna data från kommuner

Om det lokala perspektivet tilltalar så är det glädjande att fler och fler kommuner börjar dela med sig av sina data. Några som varit föregångare på området är:

  • Örebro – till exempel luftkvalitetsmätningar, trafikflöden och information om inköpta livsmedel
  • Helsingborg – till exempel Smileygodkända-platser och Flygfoton
  • Stockholm – till exempel miljödata och flygfoton
  • Open North (bl a Umeå och Skellefteå kommun) – till exempel kommunbudget och livsmedelsinspektioner

Vill du kolla om din kommun har öppna data kan du prova att lägga till ”psidata” (PSI står för Public Sector Information, dvs information från den offentliga sektorn) efter deras webbadress (som i http://www.vasteras.se/psidata). PSI-datakollen kan du kolla vilka kommuner som har en sådan sida. Ett första steg för  många kommuner har varit att lägga upp Kolada-data för sin kommun (Kolada samlar data från kommuner och landsting, läs mer i inlägget med exempel på öppna data.

Fler ställen där man kan hitta öppna data

Det finns flera myndigheter som tillhandahåller öppna data som kan vara relevanta som underlag för lektionsmaterial:

Dataportaler

Eftersom det kan vara lite klyddigt att veta vem man ska gå till för att hitta data så har det skapats så kallade dataportaler, som ger en gemensam ingång till en större mängd data. Ofta lyfter dessa även fram datakällor och dess användningar som man tycker är extra intressanta. Nackdelen med dataportaler är att de kan vara överväldigande.

Screenshot från öppnadata.se
Den svenska dataportalen öppnadata.se.

Den svenska dataportalen öppnadata.se är under uppbyggnad. I nuläget finns det en del svenska öppna data som inte finns med här.

Screenshot av kategorier i EUs öppna data portal, som kan användas för att hitta öppna data.
Kategorier i EU:s öppna data portal.

EU-nivå finns det dels en dataportal med data från EU.  Det finns också en dataportal som samlar ihop öppna data från EU-länder (där en hel del av denna på gott och ont är på originalspråk).

Även FN, WHO och Världsbanken har dataportaler.

Det kan även vara intressant att gå in och titta på portaler från andra länder, som kommit längre med sina dataportaler (i att där finns fler dataset, tydligare kategorier och exempel på hur deras data används). Några exempel: USA, Storbrittanien och Singapore.

Format

Som jag tar upp i inlägget varför öppna data har olika målgrupper olika behov vad gäller formatet som data hämtas i. I undervisning är tabelldata mest intressant. De vanligaste formaten för tabelldata är Excel och CSV. CSV står för Comma Separated Values och har fördelen att det inte är bundet till ett visst program. Men om det är Excel du är van vid kan du importera en CSV-fil dit.

I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.
I många dataportaler finns små färgkodade taggar som visar på vilka format som datakällan finns tillgänglig i. I detta exemplet ser man att det bl a finns tabelldata i form av CSV.

För en programmerare så kan ett så kallat API (som anropas från programkod) vara värdefullt. Om syftet är att använda data i undervisning så är detta inte så användbart (om inte ämnet är programmering eller webbutveckling).

Andra möjliga format är sådana som beskriver geografiska områden, PDF:er och textfiler.

Startpunkter

Börja med att fundera på vilka offentliga verksamheter som kan ha material som är relevant för ditt ämne. Kanske någon av myndigheterna ovan? Bläddra bland deras material och leta efter ”färdigförpackat” material med olika visualiseringar (finns exempelvis hos SMHI, Riksantikvarieämbetet och SCB). Om du själv vill arbeta med tabeller (eller att dina elever ska göra det), leta efter Excel- och CSV-filer.

Hör gärna av dig om vad du skulle behöva för att komma igång och använda öppna data! Jag nås på marie.gustafsson@gmail.com

Att visualisera med mat

Vill man skapa visualiseringar så är man inte begränsad till det digitala. Ett spännande sätt att skapa visualiseringar, bortom Excel och Gapminder, är att använda mat som visualiseringsmaterial.

Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de "gömda" oliverna i botten. Bild från data-cuisine.net.
Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de ”gömda” oliverna i botten. Bild från data-cuisine.net.

Det finns ett roligt projekt som har just att  visualisera med mat som tema: data-cuisine.net. Några exempel på rätter:

  • Happines cocktail – räkcoctails baserade på Facebook, där antalet vänner ger antalet riskorn och hur många som ler på sina profilbilder ger antalet räkor
  • Lakmoussetikka – en dessert för att visa hur lite av Finlands blåbär som plockas, där det tunna blåbärslagret representerar de plockade blåbären och moussen i botten andelen som uppskattas bli kvar i skogen
  • Taste of migration – proportionen mellan olika ursprungsländer för personer som invandrat till Finland
  • Tortilla Feliz Catalana – utgår från data för Spanien från OECDs Better Life Index ställer spanjorernas nöjdhet i fyra kategorier mot hur viktig de anser att den kategorin är

Ofta så handlar det om att matcha proportioner ur dataset med passande ingredienser. I de workshops som finns hos Data Cuisine försöker de anknyta till data om staden eller landet som workshoppen hålls i. Det finns liknande upplägg från andra håll också.

Ett roligt sätt att kombinera något av hemkunskap, bild, samhällskunskap och/eller matematik!

Visualiseringar av öppna data, del 2

I det här inlägget tänkte jag skriva lite översiktligt om några av de verktyg som är lättast att börja med när man vill skapa egna visualiseringar.

De fyra stegen

Som lärare kan man bekanta sig med visualiseringar i undervisningen i flera steg. Först går det ju utmärkt att titta på en video av exempelvis Hans Rosling som berättar runt sina egna Gapminder-diagram. Steg två blir att själv visa samma eller en liknande visualisering för att få mer interaktivitet i klassrummet. Då kan man välja vilka länder och tidsperioder man vill titta på.

För de två första stegen spelar det inte så stor roll vilket verktyg eller programmeringsspråk som visualiseringen är skapad med. Men om man vill ta ett tredje steg, och själv skapa visualiseringar, då behövs det ett delvis annat fokus, så att man får tekniken rätt. Det fjärde steget brukar jag se som att låta eleverna själva skapa visualiseringar. I projektet Omvärld.se kom vi i några fall igenom alla fyra stegen, och såg eleverna skapa både interaktiva kartor med datalager i Google maps, och interaktiva tidslinjer med timeline.js.

Microsoft Excel och Google kalkylark

Ett kalkylark är på många sätt grunden för allt arbete med data, och var också en av hörnstenarna när PCn slog igenom i början på 1980-talet.

I kalkylprogrammen finns både stöd för att bearbeta data med formler, och att automatiskt skapa diagram. Diagrammen kan sen inkluderas i olika former av presentationer.

I del 1 gick jag igenom ett enkelt exempel, och visade hur man kan visualisera inkomstfördelning.

Formler skriver man på ett speciellt sätt: man börjar med ett likhetstecken, och sen namnet på funktionen, och sen det område som funktionen ska tillämpas på. Vill man summera det som finns i cellerna A1-A25 sätter man markören i en valfri cell och skriver ”=SUMMA(A1:A25)” Det finns bra hjälpfunktioner som visar vilka funktioner som finns och hur de används.

Det man behöver tänka på är sådant som talformat och om man har decimalpunkt eller decimalkomma. I vissa program får man formlerna på svenska, och då är det inte säkert att man kan kopiera formler direkt från kalkylark man hittar på nätet om de är på engelska.

En av de roligaste sakerna jag har gjort med ett kalkylark är att analysera historiskt konsumentprisindex, från 1200-talet till nutid, med öppna data från Riksbanken och Statistiska centralbyrån. (Här har jag valt en logaritmisk skala för priserna.)

Gapminder

Gapminder-verktyget, alltså själva bubbelgraferna, utvecklades av Hans Rosling och hans son Ola och dennes fru Anna. Det visade sig vara ett enormt kraftfullt verktyg som fångar många dimensioner i en lättfattlig presentation. Marie har redan skrivit ett inlägg om hur man använder Gapminder i skolan, men jag tänkte komplettera med lite om verktyget.

Efter ett par år sålde Gapminder verktyget för att göra bubbelgraferna till Google, som integrerade det i sitt kalkylarksprogram. Gapminder har en kort guide till verktyget på sin webbplats, och därifrån har jag tagit den här bilden:

Det är noga med hur man formaterar och ställer upp data för att man ska få det att funka. Verktyget är byggt på Flash, så det går inte alls att köra på en del datorer, eller exempelvis iPad. Det har ryktats att de skulle göra om verktyget i html5, men det är oklart hur det har gått med de planerna.

Mitt roligaste exempel på användningen av Gapminders enorma datamängder är det här med ”branden i diagrammet”.

Google Fusion tables

Det mest fascinerande verktyg som jag har använt är Googles Fusion tables. Det var det som fick mig att förstå potentialen med datavisualisering av ”big data”, det man ibland kallar datamängder som är så stora att man inte vill hantera dem i ett kalkylark.

Fusion tables liknar ett kalkylark, men är lite mer fast i formerna, eller vad man ska säga. Det är inte lika lätt att direkt lägga in formler och ändra data, men när man har sina data på plats kan man göra saker som känns som magi, helt utan att programmera. (Och om man kan programmera kan man prata SQL direkt med sin tabell.)

Den roligaste funktionen är att kombinera sitt data-ark med ett annat ark med geografiska gränser, för exempelvis kommuner eller valdistrikt. Som namnet antyder kan man göra en ”fusion” av två tabeller.

I det här exemplet tar jag befolkningsdata på kommun-nivå och lägger på en karta. När inlägget skrevs fick jag inte till en interaktiv karta direkt i bloggen, men här är den nu:

Det andra exemplet gjorde jag inför valet 2014, för att visa Sverigedemokraternas starka och svaga valdistrikt:

För mig illustrerar det här visualiseringens kanske starkaste sida: att kunna få överblick, genom att zooma ut, och samtidigt i samma karta få den lokala förankringen, var i Sverige man än bor, genom att zooma in och se hur det ser ut i närområdet.

(Hade jag gjort en liknande visualisering idag skulle jag hämtat valresultatet 2014 från Valmyndigheten och först gjort motsvarande karta idag, och sen gjort en karta över förändringarna – var har Sverigedemokraterna ökat mest och minst. Ja, förresten, i kartan ligger inte bara Sverigedemokraternas valresultat, utan samtliga partiers! Klicka på ett valdistrikt så visas alla data för distriktet i en popup. (Och i ett uppföljande inlägg använder jag Gapminder-diagrammen för att studera korrelationer mellan främlingsfientlighet och utbildningsnivå.))