Kategoriarkiv: Visualisering

Data om migration

Flyktingkrisen har skapat ett ökat behov av läromedel om migration. Inom ramen för projektet Omvärld.se ska jag skapa ett interaktivt läromedel om migration, och i det arbetet ska Marie också vara med. Roligt!

Det finns massor av infallsvinklar på migration, och en hel massa politiska ståndpunkter och känslomässiga laddningar, så det känns väldigt svårt att veta var man ska börja.

Man kan försöka lära av historien och fördjupa sig i folkomflyttningar under den stora emigrationen till Amerika för ett hundratal år sen, eller under folkvandringstiden.

Urbaniseringen är en annan stor faktor som påverkar befolkningen, liksom ändrade mönster för när i livet vi skaffar barn, och hur många vi får.

Ekonomiska aspekter är extra svåra att visa upp, för det är så komplexa samband mellan olika gruppers bidrag till skatteintäkter, Sveriges rykte som ett säkert land, ett förutsägbart land, ett land med högtstående moral etc.

Kanske blir visualiseringarnas främsta bidrag att visa att det är en komplex verklighet bakom det till synes enkla valet att vara för eller emot invandring?

Ett par visualiseringar att börja med är i alla fall den här finska sidan Lucify som visar flyktingflödet mot Europa och den här från SVT Pejl som egentligen visar samma sak fast i en helt annan sorts visualisering: hur flyktingarna fördelar sig över EU-länderna.

Migrationsverket har en del svensk statistik, men den är inte helt lättanvänd. Här är till exempel ett väldigt konstigt diagram över det totala antalet asylsökande de senaste åren:

Total_sök

Alla åren ser ut att ha en stor ökning om man ser på året från januari och framåt. Ja, det blir ju ganska självklart, eftersom grafen visar det ackumulerade antalet! September månads siffror visar exempelvis alla som sökt asyl under januari till och med september!

Jag brukar tänka på diagram i termer av frågor: vilken fråga svarar det här diagrammet på? Och i det här exemplet kan jag verkligen inte komma på någon fråga. Här hos SCB hittar jag samma information för 2014 presenterat på ett betydligt mer lättfattligt sätt:

Antal-inkomna-asylsokningar-per-manad-2014

Självklart behöver det diagrammet kompletteras med det totala antalet för året, men visst är det mer man kan läsa ut av det här diagrammet: om flyktingströmmen är jämnt fördelad över året, hur stor den är per månad, vilka månader som har mest flyktingar etc.

Jag ser fram emot arbetet med data runt migrationen. Det finns mycket att undra över och mycket att förstå.

Att visualisera med mat

Vill man skapa visualiseringar så är man inte begränsad till det digitala. Ett spännande sätt att skapa visualiseringar, bortom Excel och Gapminder, är att använda mat som visualiseringsmaterial.

Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de "gömda" oliverna i botten. Bild från data-cuisine.net.
Maträtt som visar på hur stor del av den grekiska ekonomin som man uppskattar är utanför skattesystemet, genom de ”gömda” oliverna i botten. Bild från data-cuisine.net.

Det finns ett roligt projekt som har just att  visualisera med mat som tema: data-cuisine.net. Några exempel på rätter:

  • Happines cocktail – räkcoctails baserade på Facebook, där antalet vänner ger antalet riskorn och hur många som ler på sina profilbilder ger antalet räkor
  • Lakmoussetikka – en dessert för att visa hur lite av Finlands blåbär som plockas, där det tunna blåbärslagret representerar de plockade blåbären och moussen i botten andelen som uppskattas bli kvar i skogen
  • Taste of migration – proportionen mellan olika ursprungsländer för personer som invandrat till Finland
  • Tortilla Feliz Catalana – utgår från data för Spanien från OECDs Better Life Index ställer spanjorernas nöjdhet i fyra kategorier mot hur viktig de anser att den kategorin är

Ofta så handlar det om att matcha proportioner ur dataset med passande ingredienser. I de workshops som finns hos Data Cuisine försöker de anknyta till data om staden eller landet som workshoppen hålls i. Det finns liknande upplägg från andra håll också.

Ett roligt sätt att kombinera något av hemkunskap, bild, samhällskunskap och/eller matematik!

Visualiseringar av öppna data, del 2

I det här inlägget tänkte jag skriva lite översiktligt om några av de verktyg som är lättast att börja med när man vill skapa egna visualiseringar.

De fyra stegen

Som lärare kan man bekanta sig med visualiseringar i undervisningen i flera steg. Först går det ju utmärkt att titta på en video av exempelvis Hans Rosling som berättar runt sina egna Gapminder-diagram. Steg två blir att själv visa samma eller en liknande visualisering för att få mer interaktivitet i klassrummet. Då kan man välja vilka länder och tidsperioder man vill titta på.

För de två första stegen spelar det inte så stor roll vilket verktyg eller programmeringsspråk som visualiseringen är skapad med. Men om man vill ta ett tredje steg, och själv skapa visualiseringar, då behövs det ett delvis annat fokus, så att man får tekniken rätt. Det fjärde steget brukar jag se som att låta eleverna själva skapa visualiseringar. I projektet Omvärld.se kom vi i några fall igenom alla fyra stegen, och såg eleverna skapa både interaktiva kartor med datalager i Google maps, och interaktiva tidslinjer med timeline.js.

Microsoft Excel och Google kalkylark

Ett kalkylark är på många sätt grunden för allt arbete med data, och var också en av hörnstenarna när PCn slog igenom i början på 1980-talet.

I kalkylprogrammen finns både stöd för att bearbeta data med formler, och att automatiskt skapa diagram. Diagrammen kan sen inkluderas i olika former av presentationer.

I del 1 gick jag igenom ett enkelt exempel, och visade hur man kan visualisera inkomstfördelning.

Formler skriver man på ett speciellt sätt: man börjar med ett likhetstecken, och sen namnet på funktionen, och sen det område som funktionen ska tillämpas på. Vill man summera det som finns i cellerna A1-A25 sätter man markören i en valfri cell och skriver ”=SUMMA(A1:A25)” Det finns bra hjälpfunktioner som visar vilka funktioner som finns och hur de används.

Det man behöver tänka på är sådant som talformat och om man har decimalpunkt eller decimalkomma. I vissa program får man formlerna på svenska, och då är det inte säkert att man kan kopiera formler direkt från kalkylark man hittar på nätet om de är på engelska.

En av de roligaste sakerna jag har gjort med ett kalkylark är att analysera historiskt konsumentprisindex, från 1200-talet till nutid, med öppna data från Riksbanken och Statistiska centralbyrån. (Här har jag valt en logaritmisk skala för priserna.)

Gapminder

Gapminder-verktyget, alltså själva bubbelgraferna, utvecklades av Hans Rosling och hans son Ola och dennes fru Anna. Det visade sig vara ett enormt kraftfullt verktyg som fångar många dimensioner i en lättfattlig presentation. Marie har redan skrivit ett inlägg om hur man använder Gapminder i skolan, men jag tänkte komplettera med lite om verktyget.

Efter ett par år sålde Gapminder verktyget för att göra bubbelgraferna till Google, som integrerade det i sitt kalkylarksprogram. Gapminder har en kort guide till verktyget på sin webbplats, och därifrån har jag tagit den här bilden:

Det är noga med hur man formaterar och ställer upp data för att man ska få det att funka. Verktyget är byggt på Flash, så det går inte alls att köra på en del datorer, eller exempelvis iPad. Det har ryktats att de skulle göra om verktyget i html5, men det är oklart hur det har gått med de planerna.

Mitt roligaste exempel på användningen av Gapminders enorma datamängder är det här med ”branden i diagrammet”.

Google Fusion tables

Det mest fascinerande verktyg som jag har använt är Googles Fusion tables. Det var det som fick mig att förstå potentialen med datavisualisering av ”big data”, det man ibland kallar datamängder som är så stora att man inte vill hantera dem i ett kalkylark.

Fusion tables liknar ett kalkylark, men är lite mer fast i formerna, eller vad man ska säga. Det är inte lika lätt att direkt lägga in formler och ändra data, men när man har sina data på plats kan man göra saker som känns som magi, helt utan att programmera. (Och om man kan programmera kan man prata SQL direkt med sin tabell.)

Den roligaste funktionen är att kombinera sitt data-ark med ett annat ark med geografiska gränser, för exempelvis kommuner eller valdistrikt. Som namnet antyder kan man göra en ”fusion” av två tabeller.

I det här exemplet tar jag befolkningsdata på kommun-nivå och lägger på en karta. När inlägget skrevs fick jag inte till en interaktiv karta direkt i bloggen, men här är den nu:

[googlemaps https://www.google.com/fusiontables/embedviz?q=select+col0%3E%3E1+from+11n1Jp32qWTd6hBqTMBE2dvogG81vYQUnLk-APIs&viz=MAP&h=false&lat=56.820605986011344&lng=13.757299551337491&t=1&z=7&l=col0%3E%3E1&y=2&tmplt=2&hml=GEOCODABLE&w=600&h=400]

Det andra exemplet gjorde jag inför valet 2014, för att visa Sverigedemokraternas starka och svaga valdistrikt:

[googlemaps https://www.google.com/fusiontables/embedviz?q=select+col0%3E%3E1+from+1HkeQ8cPuKCw5RMmcd6Bug8oXz3LX15sbZhHH-5g&viz=MAP&h=false&lat=56.754411160369415&lng=15.171789297431246&t=1&z=9&l=col0%3E%3E1&y=2&tmplt=2&hml=GEOCODABLE&w=600&h=400]

För mig illustrerar det här visualiseringens kanske starkaste sida: att kunna få överblick, genom att zooma ut, och samtidigt i samma karta få den lokala förankringen, var i Sverige man än bor, genom att zooma in och se hur det ser ut i närområdet.

(Hade jag gjort en liknande visualisering idag skulle jag hämtat valresultatet 2014 från Valmyndigheten och först gjort motsvarande karta idag, och sen gjort en karta över förändringarna – var har Sverigedemokraterna ökat mest och minst. Ja, förresten, i kartan ligger inte bara Sverigedemokraternas valresultat, utan samtliga partiers! Klicka på ett valdistrikt så visas alla data för distriktet i en popup. (Och i ett uppföljande inlägg använder jag Gapminder-diagrammen för att studera korrelationer mellan främlingsfientlighet och utbildningsnivå.))

Omvärld.se – Interaktiva visualiseringar för skolan

Marie har bett mig skriva lite kortfattat om Omvärld.se, som handlar om interaktiva visualiseringar för skolan.

Visualiseringarna har potentialen att låta eleverna utforska ett område på ett kreativt sätt, genom data, och bygga ett berättande på de fakta man hittar i datamängderna.

Headern för omvarld.se

Omvärld.se fas 1-3

Omvärld.se finansierades i två faser till största delen av Internetfonden, och resterande del av AV-media Kronoberg som höll ihop projektet. Den första fasen utgick från Gapminder och försökte hitta bra ingångar på olika skolstadier för Hans Roslings berättelser (se länkar till en del av detta material i det tidigare inlägget om Gapminder). Några lärare, framför allt från Katedralskolan i Växjö, ville fortsätta, och vi fick ytterligare finansiering för en fortsättning med gymnasielärare i geografi och samhällskunskap. Jag var projektledare för den fasen.

Nu i höst har vi dragit igång projektet igen, och skriver blogginlägg om aktuella ämnen och verktyg. Det svåraste med projektet är att hitta lärare som är intresserade av att testa verktygen i klassrummet och komma med input angående vad som funkar på olika ämnen och stadier. Men vi ser det som att man först måste bygga en plattform så att intresserade lärare kan se vad som finns att tillgå. Vet man inte vad som finns är det svårt att själv börja från grunden, givet att arbetspressen är så stor för de flesta lärare.

Från kursplan till visualisering

Det finns nyskrivna inlägg på bloggen i en serie som handlar om hur man går från kursplan till visualisering:

Verktyg för visualisering

Det finns också en sammanfattande sida med de olika inlägg där vi beskriver olika verktyg för visualiseringar som man kan använda. Det är sådana verktyg som Google Fusion tables, Google Maps, Google kalkylark, tidslinjer etc. Jag har även testat några färdiga visualiseringslektionsplaner från exempelvis NASA, men det finns tyvärr inte så mycket sådant ännu.

Googles verktyg är ganska pålitliga, och börjar bli mer lättillgängliga för skolan via Googles program Google apps for education (GAFE). Man får vara lite uppmärksam på att det ibland är olika användningsvillkor för GAFE-konton, jämfört med vanliga enskilda konton, exempelvis när man skapar kartor.

Fler visualiseringslänkar

Det finns många länkar som inte kommer med in i inläggen, och de samlar jag på Delicious, som är en gammal trogen bokmärkestjänst. Visualiseringslänkarna finns här.

Visualiseringar av öppna data, del 1

Redan en enkel visualisering av data gör att man direkt ser fler samband än genom att bara titta på en tabell med siffror.

Moderna verktyg gör att det är lätt att skapa diagram av i stort sett vilka data som helst. Det blir ett bra sätt för lärare att visa och berätta om olika samband, men går också att använda för att eleverna själva ska göra visualiseringarna.

SCBs Statistikdatabas är ganska svåröverskådlig, men innehåller väldigt mycket där man snabbt kan visa olika samband. Som ett exempel: hur mycket tjänar man under olika delar av sitt liv, och hur har det förändrats de senare åren?

Det finns en tabell som heter ”Disponibel inkomst för samtliga hushåll 18- år (HEK) efter hushållstyp och ålder. Urvalsundersökning, se fotnoter. År 1991 – 2009

Ur den väljer jag så här:

För att undvika problem med decimalkomma/-punkt exporterar jag tabellen som en Excel-fil. I Excel kopierar jag de värden jag är intresserad av och klistrar in i ett Google Kalkylark.

I Google Kalkylark finns numera en ”Utforska”-knapp som hjälper till med visualiseringar och samband. Beroende på hur ens tabell ser ut går det olika bra för systemet att hitta rätt, men just för sådana här tabeller funkar det väldigt bra. Här är hela mitt kalkylark. Och det går att direkt publicera de diagram man är intresserad av. Som detta:

Jag publicerade det ”interaktivt”, och inte bara som en bild, så att man kan föra muspilen över linjerna och få exakta värden för varje punkt.

Några av de samband man kan se i diagrammet är vilka åldersgrupper som har störst/minst disponibel inkomst, eller hur det kan gå bättre eller sämre för en viss åldersgrupp under en period (ofta som resultat av skattepolitik etc).

Om man vill kan man relativt lätt konvertera årsinkomst till månadsinkomst, och det går också att lägga till konsumentprisindex för att jämföra med inflationen. (Det gjorde jag manuellt för varje år.)

I början är det förstås ganska mycket jobb med varje diagram, men det går betydligt fortare när man kommer igång. Det här är en del av det som brukar kallas ”data literacy”, att kunna hantera data på ett sätt som liknar det man har vant sig vid för text.

Jämför med de olika hjälpmedel och program vi har för att hantera text: papper och penna, epost, SMS, webbläsare, ordbehandlare etc. Vi är vana vid att behöva konvertera och formatera text i många fall. Att arbeta med interaktiva diagram är ett steg i samma riktning, fast för data.