– Det er jo ikke sånn at jeg kom ut av ingenting, jeg har alltid vært interessert i å skrive, sier Sondre Ulvund Solstad til Journalisten. Han tar seg tid til å snakke før han skal holde foredrag på årets Skup-konferanse.Foto: Marte Vike Arnesen
The Economist
Nordmannen bestemte seg for å finne pandemiens sanne dødstall
Overdødelighetstall ble nøkkelen for datajournalist Sondre Ulvund Solstad i The Economist.
Denne artikkelen er over ett år gammel og kan derfor inneholde utdatert informasjon.
Journalistikk var egentlig aldri planen, men da redaktøren for datateamet i The Economist ringte og spurte om han var interessert i å jobbe for dem, konkluderte Sondre Ulvund Solstad med at det var det nyttigste han kunne gjøre med utdannelsen sin.
Annonse
Da var han i ferd med å fullføre en doktorgrad i statsvitenskap fra amerikanske Princeton.
I tillegg til doktorgraden, som handlet om forbindelser mellom makt og ny teknologi, har han studert «International Relations» ved New York University, psykologi ved NTNU, og kinesisk ved Pekinguniversitetet.
En ikke fullt så tradisjonell vei inn i journalistikken, med andre ord.
– Det er jo ikke sånn at jeg kom ut av ingenting, jeg har alltid vært interessert i å skrive, sier Solstad til Journalisten. Han har tatt seg tid til en prat før han skal holde foredrag på årets Skup-konferanse.
Siteres i vitenskapelige artikler
Det er nå tre år siden han begynte i stillingen som datajournalist i den snart 180 år gamle engelske avisa. På den tiden har sakene han har skrevet rukket å bli sitert i over 100 akademiske publikasjoner, samt i tunge internasjonale medier som BBC World News, Le Monde, Der Spiegel, New York Times, Politico, Nature og New York Magazine, for å nevne noen.
Han har også vunnet flere priser for datajournalistikken, og reiser jorda rundt for å snakke om sakene han har laget.
Det er i hovedsak to saker som har gjort at nordmannen nå kun mellomlander i Norge etter å ha sittet i paneldebatt i Italia med Google for å snakke om kunstig intelligens (KI) og fremtiden, på vei hjem igjen til London.
De skal vi komme tilbake til.
Annonse
Hva kan vi lære av dataene?
Først til innføringen i Solstads metode, eller analytisk datajournalistikk, som han kaller det.
Det er den han er her for å snakke om, det er den som har gjort at The Economist gang på gang setter dagsorden.
Datadrevne artikler, modeller, algoritmer og simuleringer. Tanken er å la hver sak ha en tese som de så prøver å bevise. Med 1,2 millioner abonnenter og over 60 millioner følgere på sosiale medier, når journalistikken til The Economist bredt.
Data fra satellitter som viser hvordan kampene foregår i Ukraina, kart som viser lys og mørke i diktaturstater, og en analyse av fra hvem og hvor emneknaggen «I stand with Putin» kom fra. Målet er å finne mønstre i store datasett for så å vise det fram så nærmest alle kan se med egne øyne hva som skjer.
– Det er ikke konteksten det handler om, heller ikke dataene vi finner i historien, men det er hva vi kan lære av dataene, sier Solstad og legger til:
– Jeg bruker verktøyene jeg har lært som en del av forskningsbakgrunnen til å finne ut nye ting, prøve å etablere nye faktagrunnlag, slik at leserne våre kan ta bedre beslutninger.
Det er ikke mange andre som driver med denne formen for datajournalistikk, ennå. Solstads hypotese er at vi vil se en økning i antall datajournalister nå som det private IT-markedet er i ferd med å bli mettet for folk med tallkunnskap.
Han håper at flere med riktig kompetanse vil hoppe over til journalistikken og at flere medier vil følge på med å satse på analytisk datajournalistikk.
Selv er han ikke spesielt god på koding, men han er god på å se sammenhenger, finne informasjon i tomrommet der offisielle data ikke eksisterer, for så å legge det fram på en måte som alle forstår.
Vi kan godt kalle det forskningsdesign. Den viktigste egenskapen for å lykkes innen analytisk datajournalistikk er evnen til å tenke klart, og se de store sammenhengene, mener han.
«Covid-19 risk estimator»
Vi hadde så vidt begynt å se konturene av pandemien da Solstad startet hos The Economist i februar 2020.
Allerede samme høst var han i gang med det første store prosjektet:
Enkelt fortalt estimerer den risikoen for å bli lagt inn på sykehus eller dø av viruset, om du bor i et rikt land og ikke er vaksinert, vel og merke. Da den kom ut i mars 2021 hadde de færreste tilgang til vaksinen. Den ble en hit.
Selve siden er enkelt designet og lett å bruke, og vitner lite om hvor mye arbeid som ligger bak.
– Det var et veldig frustrerende prosjekt. Jeg fikk aldri se en eneste pasientfil, sier Solstad og forklarer:
I USA sender helseforetak krav til forsikringsselskapene. Såkalte «Clearing houses» fungerer som elektroniske mellomstasjoner mellom sykehus og forsikringsselskap designet for å beskytte pasientenes helseinformasjon.
Det var de som til slutt donerte data til Solstad og teamet.
– Jeg måtte inn i ett system, og så inn i et annet, og så inn i enda et nytt system som ikke var tilkoblet internett. De beskytter informasjonen som om det skulle være en statshemmelighet, forteller han.
Da informasjon fra 700.000 pasienter var hentet ut, trente han opp 100 maskiner til å analysere dataene.
– Da følte jeg virkelig på tidspress. Dette var midt under en av de store bølgene i 2020. Men vi fikk det ut og så vidt jeg vet, fungerte det veldig bra. Jeg har blitt kontaktet av amerikanske CDC og noen forskere på NYU Langone, som er det store medisinske systemet i New York. De har brukt det nå i sitt arbeid, og forhåpentligvis har det vært nyttig.
Annonse
Pandemiens sanne dødstall
Det andre store prosjektet ble satt i gang parallelt. Hvor mange døde egentlig av viruset? Solstad begynte å samle data på totale antall dødsfall, og dermed overdødelighet, i landene der myndighetene faktisk delte informasjon.
Solstad bestemte seg for å finne pandemiens sanne dødstall. Det skulle vise seg å være vanskeligere enn man kanskje skulle tro.
Våren 2021 gikk han i gang med prosjektet om å finne ut hva som hadde skjedd globalt, inkludert i alle de landene hvor slik data ikke er tilgjengelig.
De fleste hadde ikke blitt vaksinert på dette tidspunktet, og mange snakket om at fattige land hadde lite pandemi og ikke trengte vaksiner.
– Det var nok en naturlig konklusjon ut i fra de offisielle, villedende, tallene på dødsfall, forteller Solstad .
Han fortsetter:
– Min motivasjon var i hovedsak å gi et sant bilde av pandemien slik den var globalt, ikke bare i rike land, og dermed styre ressurser for å bekjempe den dit de faktisk trengtes mest.
Ifølge offisielle tall er det globale dødstallet 6,9 millioner. Ifølge Solstad og The Economist er tallet rundt 22 millioner, nesten fire ganger så høyt. Med 95 prosent sikkerhet slår de fast at tallet ligger et sted mellom 17,7 og 30,6 millioner. Tallet har de kommet fram til ved å fokusere på overdødeligheten i verden. Solstad skrev koden og analysen selv, resten av teamet koblet han på når funnene skulle gjøres om til journalistikk.
– Å se på hvor mange som er testet er lett i et land som Norge, men i de aller fleste land er det nesten ingen som blir testet, forklarer han.
Han fortsetter:
– Hvis det er 200 folk som har blitt testet i et land på 40 millioner, har man maks 200 dødsfall. Om alle hadde blitt testet, eller om alle som døde ble testet, ville jeg likevel foretrekke å se på overdødeligheten. Det er et par grunner til det, sier han og fortsetter:
– Det ene er at det er forskjell på om du dør med covid eller av covid, den andre grunnen er at man kan dø på grunn av pandemien, selv om man ikke dør av covid-19-sykdom. I mange land er det enorme økonomiske konsekvenser og mange land har hatt overfylte sykehus på grunn av pandemien, da er det folk som dør, sier han og presiserer:
– Men de aller fleste, etter hva vi forstår, dør på grunn av sykdommen.
Måtte telle graver
De startet med innsamling av data i Italia allerede i mars 2020. Det ble etterhvert tydelig at de offisielle dødstallene ikke stemte med overdødeligheten i landet, og Solstad bestemte seg for å undersøke nærmere.
– I starten var det en utrolig manuell oppgave. Vi sendte folk til gravplasser for å telle graver, forteller han.
Innhentingen av data ble etter hvert mer strukturert da han fikk hjelp av forskere til å sette opp et onlinesystem for å samle inn offisielle dødstall. Likevel var de ikke i mål, mange land gir nemlig ikke ut tall på antall døde. Noen land ønsker å pynte på tallet, andre har rett og slett ikke kapasitet til å telle.
Å finne det globale tallet på antall døde av covid ble med ett mer komplisert.
Solstad forklarer:
– Heldigvis har vi veldig mye annen data. Vi har har covid-data, vi har også data på demografi, data på hvor mye folk beveger seg, vi har data på restriksjoner, vi har data på tester, hvor mange som er positive og vi har data fra landene rundt de landene, og hvordan det går med dem. Vi er oppe i over 140 forskjellige datakilder som vi bruker. I de tilfellene vi ikke har tall på overdødelighet bruker vi mønstrene og de dataene vi har til å prosjektere.
– Da får vi et intervall, hvor tallet på overdødelighet kan ligge, med god sannsynlighet.
Selv om sannsynligheten virker stor i noen tilfeller, mener Solstad det uansett er bedre med en viss prosent usikkerhet i resultatene deres, enn ingen tall overhodet, som er tilfelle i flere land.
Det mener også Verdens helseorganisasjon (WHO), som mye senere publiserte sine egne anslag, tett opp mot Solstads.
Open source
Siden høsten 2021 blir dødstallet oppdatert daglig. Hver morgen blir dataene oppdatert, og hver kveld oppdaterer modellene seg. De trener seg på nytt. Om det kommer en ny virusvariant, oppdager de hvor dødelig den er.
All kodingen er åpen, eller «open source» som det heter, det er ikke bare The Economist som bruker den til daglig.
– Veldig mange organisasjoner bruker verktøyet nå, også nyhetsorganisasjoner. Det har vært betydelig mer arbeid å holde det gående, hvis noe går galt får jeg en e-post, og så må jeg fikse det, forteller Solstad.
Fremtidens datajournalistikk
Han kom flyvende fra Italia, og med Google-møtet klart i minnet er han også villig til å svare på spørsmål som så mange av oss lurer på.
– Hva med fremtidens datajournalistikk og kunstig intelligens, hvor er vi på vei?
Han mener datajournalister har et spesielt ansvar for hvordan journalistikken skal forholde seg til KI, men mener samtidig det er et veldig vanskelig felt å dekke. Det er rett og slett vanskelig å få innsyn.
– Jeg satt med en fyr fra Google og sa rett ut at jeg føler at vi ikke har oversikt over hva som skjer. Vi har ikke innsyn. De ruller ut disse systemene nå, fordi de har fått konkurranse. Først gikk OpenAI ut, da satte de andre i høygir. Det er veldig vanskelig å forstå hva de virkelig gjør.
Han sa bare: «Vi har veldig mange smarte folk som jobber med det. Stol på oss.»
Solstad er likevel forsiktig optimistisk, og minner oss på at mange hadde de samme tankene da søkemotorene kom.
– Det som er nytt er at interaksjonene har blitt gjort mulig uten å kunne kode. Det som vil skje da er at det blir mye mer demokratisk og veldig mange flere får muligheten å bruke det. Det er kjempebra. Samtidig vil man da også få en god del folk som ikke vet hvor sårbare disse systemene er.
Framtiden for analytisk datajournalistikk ser han på som veldig lys. At vi vil få mer journalistikk på store datasett, er han sikker på.
Han følger med på hva som blir gjort på feltet her hjemme.
– Det er vel bare å si det at det blir gjort veldig mye kjempespennende arbeid i Norge. Det er veldig hyggelig å følge med fra utsiden, sier han og minner samtidig på at analytisk datajournalistikk også kan brukes lokalt:
– De samme verktøyene vi bruker til global journalistikk kan vi også bruke til lokaljournalistikk, det tror jeg blir veldig kult. Hvis man da får tilgang til data.