Hvorfor

Sammen med nye tenner, soverutiner og mulige fall i boligmarkedet er skolekvaliteten et vanlig samtaletema blant foreldre på østkanten av Oslo. En kveld forsøkte jeg å finne å finne noen tall på hvordan det egentlig går med skolene her i nærheten, men kom bare tilbake fra Google med et excel-ark fra Dagbladet og minner om et lite behjelpelig utdanningsdirektorat. Jeg tenkte derfor at det hadde vært en fin liten øvelse å gjøre denne informasjonen mer tilgjengelig.

Kartnøkkel

  • Grønne skoler gjorde det bra
  • Røde skoler gjorde det dårlig
  • Større markører betyr flere elever
  • Kartet er tilgjengelig i svart/hvitt for de som er farveblinde

Nasjonale prøver

Man skal være forsiktig med hva man måler ettersom måling ofte endrer adferd på utilsiktede måter. Incentivene du trodde skulle effektivisere og forenkle, perverterer prosessene du forsøkte å styre. I USA har de senket nasjonale krav for læreplaner samtidig som de har lagt vekt på nasjonale prøver. Den angrende Diane Ravitch som hjalp til å innføre dette systemet har skrevet om hvordan det gikk i The Death and Life of the Great American School System: How Testing and Choice Are Undermining Education.

Så hvorfor sitte oppe om natten for å gjøre disse resultatene tilgjengelige? De nasjonale prøvene brukes allerede av utdanningsdisrektoratet til å belønne skolene. Så viktig har det blitt for skolene at de holder svake elever hjemme. De eneste som ikke har god tilgang til tallene er vi som ikke har skolen som arbeidsplass. Jeg synes man burde se lenge og hardt på hvorvidt man skal måle skolene på denne måten, men når informasjonen først eksisterer kan jeg ikke se noen grunn til at den ikke skulle være allment tilgjengelig på en god måte.

Datakvalitet

Datagrunnlaget for skoleporten.bengler.no er overlevert fra utdanningsdirektoratet. De mente imidlertid det var for arbeidskrevende å legge ved unike nøkler for skolene og prøvene. Derfor er resultater på tvers av år og adresse- og elevinformasjon spleiset sammen ved å sammenligne skolenavn. Det var en ganske omfattende oppgave (les: som å skjære av seg armen med en slu saks) og det kan forekomme feil. Fremgangsmåten for 2009 var forresten som følger:

  • Les resultatsettene for 2008
  • Opprett skoler, fylker og kommuner fortløpende
  • Les resultatsettene for 2009
  • Legg de resultatene man kan på skolene fra 2008 som har samme navn
  • Ta resultatene som ikke matcher noe skolenavn og
  • Finn skolene i kommunen fra 2008 som ennå ikke har fått resultater for 2009
  • Forsøk med match på hele 2008 navnet mot 2009 navnet som substreng og vise versa
  • Kjør så levenshtein-distanse på navnene til skolene i samme kommune og match de over en gitt terskel. Bruk alle navnene skolen noengang har hatt.
  • Opprett skolene som fortsatt ikke har fått en match

Det sparer muligens utdanningsdirektoratet tid å ikke nøkle informasjonen sin skikkelig (f.eks på organisasjonsnummer), men for oss som forsøker å bruke informasjonen på en strukturert måte er det relativt kostbasrt.

Det mangler også forresten rundt 218 skoler hvor navnene i adresselistene ikke stemte overens med navnene på skolene. Om du ikke finner en skole er det sansynligvis på grunn av dette. Du kan eventelt sende en mail til utdanningsdirektoratet og be de sende meg nasjonale prøver, adresser og elevtall nøklet sammen på en skikkelig måte. Nuvel.

Om du finner et lurt hjørne du har lyst til å legge til her kan du sjekke ut all kildekoden og datagrunnlaget fra github. Hele første runde av utviklingsprosessen er også forresten overgrundig dokumentert.

Hilsen Even Westvang – mail origo twitter