- Dette er et debattinnlegg. Innlegget uttrykker skribentens egne synspunkter.
Høstens høydepunkt nærmer seg for alle entusiaster som interesserer seg for datajournalistikk, og lørdag 16. oktober er det Data-Skup. Der er det alltid mye å lære på foredragene, men i mine øyne ligger likevel den største gevinsten i å kunne diskutere erfaringer, muligheter og problemstillinger med likesinnede på tvers av redaksjonene.
Mye av datajournalistikken gjøres i forbindelse med store tidkrevende gravesaker, og derfra kommer det stadig nye innovasjoner og kreative metoder som kan gjenbrukes i andre saker.
Selv er jeg mest interessert i den datastøttede hverdagsjournalistikken, og måten vi kan bruke digitale verktøy og utvikle nye metoder for det jeg kaller å «intervjue data». Med det mener jeg å hente ut redaksjonelt interessante nyhetspoeng fra datakilder.
Datakilder kommer i mange varianter. Som regel er det snakk om en eller annen form for database med strukturert informasjon, men det kan også være store datamengder i form av ustrukturert tekst som må prosesseres og analyseres. Fra et nyhetsperspektiv er det kanskje tidsserier som er de mest interessante datakildene.
En tidsserie er en serie med sekvensielle observasjoner av en verdi over en tidsperiode.
Vi intervjuer strømprisen
Et eksempel på en tidsserie som vi i Europower er veldig opptatt av, er strømprisen. Den oppgis for hver eneste time, og det settes forskjellige priser for forskjellige prisområder i Norge, Norden og Europa. Mange av våre beste og mest leste saker er mer eller mindre intervjuer av strømprisen, ispedd sitater fra bransjeeksperter og informasjon fra vår egne opparbeidede erfaringer.
Andre eksempler på tidsserier kan være børskurser, valutakurser, oljeprisen, temperaturer, prisindekser, rentenivåer, arbeidsledighetstall, kvartalsresultater, utslippstall, trafikkdødsfall, medaljefangst i OL og meningsmålinger over tid. Tidsserier kommer i utallige varianter, og de viktigste inneholder nøkkeltall som kan påvirke samfunnet vårt på en måte som kan og bør dekkes av journalistikken.
Det gjøres i dag, men mye av jobben gjøres manuelt. Det er ikke nødvendigvis noe galt i det, men det er tidkrevende. Det blir derfor litt tilfeldig hvilke tidsserier som til enhver tid får pressedekning, og ikke minst hva som oppdages og fremheves av nyhetspoeng. Dessuten brukes det mye tid på å studere tidsserien for å hente ut innsikt.
Vi jobber som nevnt mye med strømprisen i Europower, men det er mange varianter av den, og vi fokuserer derfor mest på systemprisen. Det vil si den offisielle gjennomsnittsprisen for Norden. Så forsøker vi å manuelt fange opp interessante avvik i de fem prisområdene som Norge er delt opp i, samt prisutviklingen i de markedene som Norge er tilknyttet gjennom utenlandskabler.
Robotene må lære journalistikk
Her er det i mine øyne et stort potensial for automatisering, og kanskje også det som gjerne kalles robotjournalistikk. Det vil si dataprogrammer som skriver ut hele saker eller utkast til saker basert på datakilder.
Det er teknisk mulig å lage robotjournalister for de forskjellige tidsseriene, men det er ofte mer tidkrevende å lage robotene enn å skrive sakene. Dessuten er det en utfordring å gjøre slike saker interessante for leserne. Alt for ofte blir robotsakene litt for statiske selv om innholdet er dynamisk.
Før man eventuelt setter i gang et slikt utviklingsprosjekt, bør man stille et viktig kontrollspørsmål: Hvorfor skal noen gidde å lese en sak som ingen journalister har giddet å skrive?
Dette spørsmålet er viktig, for den største utfordringen med robotjournalistikk er ikke teknisk kompleksitet eller muligheten for automatisk produksjon av tekst. Utfordringen er å lage roboter som produserer tekster med nyhetsverdige opplysninger.
Dette er en problemstilling jeg har grublet mye over de siste årene, og jeg har prøvd og feilet flere ganger når vi har utviklet dedikerte robotjournalister for blant annet strømprisen, fyllingsgraden i vannmagasinene og bensinprisen. Robotene har virket, men sakene blir fort kjedelige når de har kjørt noen ganger. Det er rett og slett ikke interessant nok å rapportere at et tall har gått opp eller ned.
En robotjournalist må være noe mer enn fancy statistisk analyse, og det betyr at den må lære journalistikk.
Robot-KVISA
Hva som er en nyhetssak kan til tider være en utfordring også for helt vanlige menneskelige journalister. Vi er ikke alltid enig om hva som er en nyhet og hva som ikke er det, og dette vil også variere litt fra redaksjon til redaksjon. I bunn har vi likevel noen grunnleggende nyhetskriterier som veileder oss om en sak er en nyhet eller ikke. Disse kriteriene forkortes gjerne KVISA eller VISAK, og det står for konflikt, vesentlighet, identifikasjon, sensasjon og aktualitet.
I artikler med menneskelige kilder er disse nyhetskriteriene relativt selvforklarende, men det kan kanskje være litt vanskeligere å sette informasjon i tidsserier opp mot dem. Hvis man får det til, kan man få mer interessante saker ut av robotjournalistikken.
Her skal jeg derfor komme med noen tanker og innspill om hvordan det kan gjøres med utgangspunkt i strømprisen. Det er bare ment som et eksempel. Jeg tror dette er like aktuelt for tidsserier i andre fagfelt.
Konflikt
Konflikt mellom parter er alltid et viktig nyhetskriterier. I en tidsserie kan det være i form av at en tidsserie utvikler seg i en annen retning enn den andre, eller at en høy verdi er fordelaktig for noen, mens en lav verdi gavner motparten.
For strømprisen kan dette nyhetskriteriet ta utgangspunkt i at det er store forskjeller i strømprisen avhengig av om man bor Sør-Norge, hvor strømmen for tiden er veldig dyr, mens man kommer langt billigere ut hvis man bor i det nordligste prisområdet.
Dette kriteriet kan også brukes i en sak der nyhetspoenget er at høy strømpris er bra for kraftprodusentene og kommunebudsjettene i kraftkommunene, men negativt for både private husholdninger og kraftkrevende industri.
Vesentlighet
Vesentlighet går på at saken må være viktig for noen. Den må bety noe for målgruppen, og nyheten bør ha en eller annen konsekvens.
Her er det mange tidsserier som har gode utgangspunkt for gode nyhetssaker. Nesten hver eneste arbeidsdag publiserer for eksempel SSB flere nye datasett med tidsserier som inneholder vesentlig nøkkelinformasjon om viktige temaer i samfunnet.
Når det gjelder strømprisen, så utgjør strømregningen betydelige beløp for både privatpersoner og næringslivet. I mange tilfeller er strømprisen avgjørende for om de dårligst stilte har penger nok til å klare seg, og for næringslivet er prisnivået for strømmen ofte avgjørende for om de gjør en investering eller ikke.
Identifikasjon
Identifikasjon går på nærhet og tilknytning. Det kan gå på nasjonalitet eller gruppetilhørighet, eller noe så enkelt som at leserne selv kan sette seg inn i den omtaltes situasjon.
Her vil tidsseriene slite med å oppnå en slik tilhørighet på egen hånd, men det er ofte mulig å bruke den som et utgangspunkt for en sak med en person eller en bedrift som er berørt av opplysningene.
I saker om strømprisen kan dette løses ved å intervjue og tilføre saken et eksempel i form av en person eller bedrift som kommer dårlig eller godt ut av eventuell høy eller lav strømpris.
Sensasjon
En nyhet må være noe nytt og spennende. Det kan være et brudd med det vanlige eller noe som ikke har skjedd før. Her fungerer tidsserier godt, og når man ser etter er det ikke rent få oppslag som kommer med utgangspunkt i at en eller annen tidsserie har et oppsiktsvekkende tall.
For strømprisen har det vært mange sensasjonsmuligheter. Rekordhøye strømpriser skaper alltid stort engasjement, og det var definitivt en nyhet da Norge for første gang hadde negativ strømpris i en enkelttime.
Aktualitet
En nyhetshendelse kan ikke være for gammel. Dersom det skal være en nyhet, må det være noe som er nytt og hendelsen må skje i et tidsrom som kan dekkes. Dette fungerer godt med tidsserier. De kan ofte knyttes til dagsaktuelle nyheter om utviklingen siste døgn, uke, måned, kvartal og år.
Strømprisen settes fra time til time, og nyheter knyttet til den blir veldig aktuelle hver gang det er et nytt døgn, uke, måned, kvartal eller år. I hvert fall for oss som dekker kraftbransjen.
Nyhetspoeng og innsikt
Denne gjennomgangen av hvordan nyhetskriteriene kan brukes på tidsserier er på ingen måte komplett. Tanken min er å påpeke behovet for å redusere omfanget av robotjournalistens produktivitet slik at den produserer noe som er nyhetsmessig interessant, istedenfor masseproduksjon av artikler med alle nyhetspoeng som kan hentes frem.
Vi må på et vis gjøre et redaksjonelt valg av hva vi ønsker å bruke, og hva vi eventuelt publiserer.
Det valget blir både krevende og kjedelig hvis robotjournalisten bare ramser opp lange repetitive tekster om hvorvidt strømprisen, eller andre tidsserier, har gått opp eller ned. Hvis vi derimot starter med nyhetskriteriene kan det tenkes at vi klarer å legge grunnlaget for noe ordentlig interessant.
I Europower kan vi selvsagt gjøre dette på egen hånd. Vi bruker såpass mye tid på strømprisen at vi har rimelig god kontroll på hva som utgjør de mest interessante nyhetspoengene der.
Jeg ønsker likevel å dele disse tankene fordi alle de forskjellige tidsseriene har mye felles. Programmerte nyhetsregler for strømprisen vil ha mye som kan gjenbrukes, og dette kan komme andre redaksjoner til gode. Tilbake håper jeg å få bistand, innspill og tips fra de som jobber med andre tidsserier.
Kanskje kan vi klare å få robotjournalistene til å lage gode førsteutkast med de viktigste nyhetspoengene og de mest interessante innsiktene. Så kan vi vanlige dødelig journalister følge opp, intervjue flere kilder, og bygge videre på sakene til de blir ordentlig interessante.
Jeg gleder meg i hvert fall veldig til å diskutere dette med likesinnede entusiaster på Data-Skup. Vi ses!