Visualiseringar av öppna data, del 2

I det här inlägget tänkte jag skriva lite översiktligt om några av de verktyg som är lättast att börja med när man vill skapa egna visualiseringar.

De fyra stegen

Som lärare kan man bekanta sig med visualiseringar i undervisningen i flera steg. Först går det ju utmärkt att titta på en video av exempelvis Hans Rosling som berättar runt sina egna Gapminder-diagram. Steg två blir att själv visa samma eller en liknande visualisering för att få mer interaktivitet i klassrummet. Då kan man välja vilka länder och tidsperioder man vill titta på.

För de två första stegen spelar det inte så stor roll vilket verktyg eller programmeringsspråk som visualiseringen är skapad med. Men om man vill ta ett tredje steg, och själv skapa visualiseringar, då behövs det ett delvis annat fokus, så att man får tekniken rätt. Det fjärde steget brukar jag se som att låta eleverna själva skapa visualiseringar. I projektet Omvärld.se kom vi i några fall igenom alla fyra stegen, och såg eleverna skapa både interaktiva kartor med datalager i Google maps, och interaktiva tidslinjer med timeline.js.

Microsoft Excel och Google kalkylark

Ett kalkylark är på många sätt grunden för allt arbete med data, och var också en av hörnstenarna när PCn slog igenom i början på 1980-talet.

I kalkylprogrammen finns både stöd för att bearbeta data med formler, och att automatiskt skapa diagram. Diagrammen kan sen inkluderas i olika former av presentationer.

I del 1 gick jag igenom ett enkelt exempel, och visade hur man kan visualisera inkomstfördelning.

Formler skriver man på ett speciellt sätt: man börjar med ett likhetstecken, och sen namnet på funktionen, och sen det område som funktionen ska tillämpas på. Vill man summera det som finns i cellerna A1-A25 sätter man markören i en valfri cell och skriver ”=SUMMA(A1:A25)” Det finns bra hjälpfunktioner som visar vilka funktioner som finns och hur de används.

Det man behöver tänka på är sådant som talformat och om man har decimalpunkt eller decimalkomma. I vissa program får man formlerna på svenska, och då är det inte säkert att man kan kopiera formler direkt från kalkylark man hittar på nätet om de är på engelska.

En av de roligaste sakerna jag har gjort med ett kalkylark är att analysera historiskt konsumentprisindex, från 1200-talet till nutid, med öppna data från Riksbanken och Statistiska centralbyrån. (Här har jag valt en logaritmisk skala för priserna.)

Gapminder

Gapminder-verktyget, alltså själva bubbelgraferna, utvecklades av Hans Rosling och hans son Ola och dennes fru Anna. Det visade sig vara ett enormt kraftfullt verktyg som fångar många dimensioner i en lättfattlig presentation. Marie har redan skrivit ett inlägg om hur man använder Gapminder i skolan, men jag tänkte komplettera med lite om verktyget.

Efter ett par år sålde Gapminder verktyget för att göra bubbelgraferna till Google, som integrerade det i sitt kalkylarksprogram. Gapminder har en kort guide till verktyget på sin webbplats, och därifrån har jag tagit den här bilden:

Det är noga med hur man formaterar och ställer upp data för att man ska få det att funka. Verktyget är byggt på Flash, så det går inte alls att köra på en del datorer, eller exempelvis iPad. Det har ryktats att de skulle göra om verktyget i html5, men det är oklart hur det har gått med de planerna.

Mitt roligaste exempel på användningen av Gapminders enorma datamängder är det här med ”branden i diagrammet”.

Google Fusion tables

Det mest fascinerande verktyg som jag har använt är Googles Fusion tables. Det var det som fick mig att förstå potentialen med datavisualisering av ”big data”, det man ibland kallar datamängder som är så stora att man inte vill hantera dem i ett kalkylark.

Fusion tables liknar ett kalkylark, men är lite mer fast i formerna, eller vad man ska säga. Det är inte lika lätt att direkt lägga in formler och ändra data, men när man har sina data på plats kan man göra saker som känns som magi, helt utan att programmera. (Och om man kan programmera kan man prata SQL direkt med sin tabell.)

Den roligaste funktionen är att kombinera sitt data-ark med ett annat ark med geografiska gränser, för exempelvis kommuner eller valdistrikt. Som namnet antyder kan man göra en ”fusion” av två tabeller.

I det här exemplet tar jag befolkningsdata på kommun-nivå och lägger på en karta. När inlägget skrevs fick jag inte till en interaktiv karta direkt i bloggen, men här är den nu:

Det andra exemplet gjorde jag inför valet 2014, för att visa Sverigedemokraternas starka och svaga valdistrikt:

För mig illustrerar det här visualiseringens kanske starkaste sida: att kunna få överblick, genom att zooma ut, och samtidigt i samma karta få den lokala förankringen, var i Sverige man än bor, genom att zooma in och se hur det ser ut i närområdet.

(Hade jag gjort en liknande visualisering idag skulle jag hämtat valresultatet 2014 från Valmyndigheten och först gjort motsvarande karta idag, och sen gjort en karta över förändringarna – var har Sverigedemokraterna ökat mest och minst. Ja, förresten, i kartan ligger inte bara Sverigedemokraternas valresultat, utan samtliga partiers! Klicka på ett valdistrikt så visas alla data för distriktet i en popup. (Och i ett uppföljande inlägg använder jag Gapminder-diagrammen för att studera korrelationer mellan främlingsfientlighet och utbildningsnivå.))

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *