Ifølge Anders Lie Brennas regnestykke får «hund biter postmann» 50,0 nyhetspoeng, mens «postmann biter hund» 88,0 nyhetspoeng

Foto: Anna Stjern

DEBATT:

Dette er nyhetsverdien for postmann biter hund

Overaskende informasjon er mer verdt enn forventet informasjon. Det kan brukes til å regne ut nyhetsverdiene for renteendringer, oljeprisen, strømprisen og postmann som biter hund.

Anders Lie Brenna Redaktør EnergiWatch

Publisert 02.09.2024 - 13:37 Sist oppdatert 02.09.2024 - 16:24

Dette er et debattinnlegg. Innlegget uttrykker skribentens egne synspunkter.

Jeg har tilbragt omtrent halvparten av min yrkeskarriere i pressen og halvparten i IT-bransjen. Nå bruker jeg tiden på å skrive om energi om og for energibransjen sammen med mine kollegaer i næringslivsavisen EnergiWatch, men i sommer har jeg brukt litt av ferien min til å sysle med utforskning av mulighetene for å bruke kunstig intelligens i journalistikken.

Her skjer det veldig mye spennende, og utviklingen går fort. I en kronikk her i Journalisten, argumenterte jeg for å bruke kunstig intelligens til å gjennomføre intervjuer:

«Tenk så interessant det hadde vært å utvikle noe tilsvarende der vi kunne intervjuet alle politikerne som stemte i kommunestyret eller stortinget eller alle spillerne på laget som vant, istedenfor bare de mest kjente som alltid spørres?»

Automatiserte telefonintervju

Det har allerede blitt gjort, for i august brukte teknologijournalist Evan Ratliff kunstig intelligens til å klone sin egen stemme. I sin podkastserie ShellGame brukte han blant annet denne klonen til å snakke med sin kone, barn, gamle venner, terapeuter og innpåslitne selgere og svindlere.

For oss i pressen var det mest spennende i episode fem, for der brukte han dette både til å intervjue en teknologigründer og til å la en annen teknologijournalist intervjue seg selv.

Dette synes jeg er utrolig interessant, men det har også noen problematiske sider. Jeg tror mange toppledere og politikere ville blitt ganske lei hvis de stadig ble ringt opp av en kunstig intelligens med spørsmål om å få en kommentar. Vi skal ikke se bort fra at dette i så fall blir en teknologi som brukes mot journalister, slik Ratliff gjorde da han lot sin klone ta seg av intervjuet med en journalistkollega.

Samtidig ser jeg på dette som en spennende utvikling for de som ikke opplever pressedekning. Det ville for eksempel vært veldig interessant å se en slik teknologi tatt i bruk på Norway Cup eller andre breddeidretter, der hver klubb kunne fått sin egen avis med intervju av alle spillerne på alle klubbens lag. For lokalavisene rundt om i landet bør dette absolutt være noe å se nærmere på.

Teknologien er nok mer moden på engelsk enn norsk, men det kommer ikke til å vare. Enten gjør vi i pressen noe med dette, eller så overlater vi det til Silicon Valley eller noen andre teknologigründere. For dette kommer uansett.

Redaksjonelt kontrollspørsmål

Jeg har gjennom årene utviklet flere forskjellige varianter av robotjournalistikk. Det er spennende, nyttig og egentlig ikke så vanskelig. Det er fort gjort å snekre sammen en automatisert løsning for å skrive en tekst, og med store språkmodeller som ChatGPT med flere er mulighetene tilsynelatende endeløse.

Det er også muligheten for både misbruk og overdrivelser. For det er ikke alt som kan skrives, som bør skrives. Jeg utviklet derfor tidlig et kontrollspørsmål som alltid må stilles før man tar i bruk robotjournalistikk:

Hvorfor skal noen gidde å lese noe som ingen har giddet å skrive?

Nå som vi nærmer oss bruk av kunstig intelligens til å gjøre telefonintervjuer, tenker jeg at det også er på sin plass å legge til et nytt kontrollspørsmål:

Hvorfor skal noen gidde å svare på spørsmål som ingen har giddet å stille?

Det finnes gode svar på disse spørsmålene, og når man har det mener jeg det er bare er positivt om man tar i bruk kunstig intelligens som en del av det journalistiske arbeidet.

Redaktørstyrt presse

Teknologien som nå kommer er kul og spennende, men vi er redaktørstyrte medier. Det betyr at vi velger ut hva vi skriver om, og hva vi velger bort. Det må vi aldri glemme, og vi må ikke overlate dette til algoritmer.

For uansett hvor mye vi eventuelt investerer i utvikling av teknologi og algoritmer, vil IT-bransjen med sine giganter og sine godt finansierte oppstartsselskaper bli bedre enn oss. Vi kan ikke slå dem på teknologi, og vi undergraver journalistikken hvis vi prioriterer å bruke vår tid og vår begrensede investeringsevne på algoritmer som skal styre våre forsider.

De som har vært i pressen noen år, husker sikkert hvor galt det bar av sted da norsk presse hev seg på Buzzfeed-hypen med tabloide virale saker. Det inkluderte både den nåværende Amedia-toppsjefen da han ledet Buzzit og til og med DN med sin Bisbuzz. Det vi så den gangen, var algoritme-kåte journalister og redaktører som mistet gangsynet.

Jeg frykter at det er i ferd med å skje igjen. I boken «Tett på nyheitene: Nyheitsvurderingar i fem redaksjonar» har forskerne ved Høgskolen i Volda blant annet vært på besøk hos Aftenposten. Der beskriver de et system hvor man legger inn en vurdering av nyhetsverdien på en skale fra 0,5 til 5, og et parameter om hvor lenge saken skal vare. Så tar algoritmene seg av å styre hvor saken til enhver tid skal ligge på forsiden.

Dette både skuffet og gledet meg. Skuffet ble jeg, fordi jeg mener en slik algoritmestyring av forsiden er feil vei å gå – selv om den ikke får lov til å bestemme hvilken sak som ligger helt øverst.

Samtidig gledet det meg fordi det å sette en tallverdi for nyhetsverdien på en sak er noe jeg har tenkt på i mange år, og som inngår i mitt lille sommerprosjekt.

For selv om jeg mener bruken av algoritmer til å styre forsiden er en uting, har jeg tidligere utforsket muligheten for å bruke algoritmer til å tallfeste hvor godt titlene på forsiden reflekterer innholdet i sakene våre.

På samme måte mener jeg det kan være fornuftig å bruke et tall for nyhetsverdi til å vurdere om en sak skal lages og publiseres eller ikke, og det har jeg forsøkt å se nærmere på.

Overaskende informasjon

Claude Shannon utviklet sin informasjonsteori tilbake i 1938. Da publiserte han "«A Mathematical Theory of Communication». Med det la han grunnlaget for det moderne samfunnet vi nå lever i, ettersom hans informasjonsteori er en av grunnpilarene i data- og kommunikasjonsløsningene vi alle bruker.

Informasjonsteorien omfatter mye som er både viktig og interessant, men i journalistisk sammenheng er det mest aktuelt å se på informasjonsverdien. Der påpeker Shannon at informasjonsverdien er størst når informasjonen er overaskende.

Rent teknisk forklarte han at det trengs lite informasjon for å sende en melding om at alt er som før, mens det krever mer informasjon (flere bits) i en melding som inneholder ny informasjon.

Litt forenklet, kan vi forklare dette med at det holdt med et enkelt «nei» på spørsmålet om Har mannen fallt? da det var en av de store nyhetssakene tilbake i 2014. Når svaret til slutt ble «tja», kreves det mer informasjon for å formidle hva som egentlig skjedde.

Teknisk sett hadde det holdt å overføre én bit med et binært tall med 0 eller 1 for å formidle nei eller ja til en mottaker da saken fortløpende ble rapportert. Før og etter denne livedekningen var det imidlertid nødvendig med mye mer informasjon for å forklare hva saken dreide seg om og hva som skjedde, og det ville krevd overføring av mange flere bits.

Dette kan med fordel overføres til journalistikken. For på samme måte som informasjonsverdien er størst når det kommer en ny overaskende opplysning, er nyhetsverdien størst når nyheten kommer som en overraskelse.

Postmann biter hund

Når pressefolk snakker om hva som er en nyhet og hva som ikke er det, brukes ofte eksempelet med en postmann og en hund. Vi sier gjerne at det ikke er en nyhet at hunden biter postmannen, men at det er en nyhet hvis postmannen biter hunden.

Dette er en god beskrivelse av hva som er en nyhet og hva som ikke er det, men det sier ikke noe om hvor stor nyheten er.

Vi kan kvantifisere nyhetsverdien ved hjelp av Claude Shannons informasjonsteori. Den gjør det mulig å måle informasjonens overraskelsesverdi eller informasjonsinnhold i form av det som kalles entropi. Det gjøres ved hjelp av en matematisk formel som vurderer mengden usikkerhet i informasjonen og hvor sannsynlig hendelsen er.

Hvis vi for eksempel tar utgangspunkt i at det er én million hendelser, der 999.999 er at hund biter postmann og 1 er at postmann biter hund, kan vi med denne formelen regne ut nyhetsverdien. Da ser vi at nyhetsverdien for at hund biter postmann blir det ekstremt lave tallet 0,0000014427, mens nyhetsverdien for postmann biter hund blir 19,93.

Rent teknisk viser formelen informasjonsverdien i antall bits. For vår bruk holder det å vite at det ene tallet er helt marginalt, mens det andre er høyt. Dermed har vi fått en matematisk utregning der vi har sammenlignet nyhetsverdien, noe som gjør det mulig å rangere forskjellige nyheter.

Samtidig er antall bits en vanskelig enhet å forholde seg til. For å gjøre det litt enklere, har jeg eksperimentert med å konvertere denne nyhetsverdien til et tall mellom 0 og 100 ved hjelp av sigmoid-funksjonen, en matematisk formel som brukes mye innen blant annet kunstig intelligens.

Da får jeg følgende nyhetsverdier:

Hund biter postmann: 0,0000014427 bits - 50,0 nyhetspoeng
Postmann biter hund: 19,93 bits - 88,0 nyhetspoeng

Nyheter som scorer rundt 50 nyhetspoeng i mitt system er i praksis ikke nyhetsverdige. Det er først når man kommer opp på et visst nivå, at det blir interessant nok til å vurdere publisering.

Hvor den nyhetsterskelen bør settes kommer an på redaksjonen, og nyhetsbildet den dagen sakene vurderes.

Renteendring

Norge har for tiden høy rente, og det merkes godt i de fleste husholdninger. Det er derfor en soleklar nyhet hvis Norges Bank setter opp eller ned styringsrenten, men det er også en nyhet med en viss interesse hvis de holder den på samme nivå.

Hvor stor nyhetsverdien er, kommer an på hva de gjør sett opp mot forventningen.

Hvis vi antar at det er 80 prosent sjanse for at Norges Bank holder renten uendret, 19 prosents sjanse for at de øker den og én prosents sjanse for rentekutt, kan vi regne oss frem til følgende:

Uendret rente (80 %): 0,3219 bits - 50,8 nyhetspoeng
Renteøkning: (19 %): 2,396 bits - 56.0 nyhetspoeng
Rentekutt (1 %): 6,644 bits - 66,0 nyhetspoeng

Her ser vi at nyhetsverdien er svært lav hvis Norges Bank fortsetter med uendret rente, men at den er relativt høy hvis den økes og veldig høy hvis de overasker med rentekutt.

Ettersom styringsrenten er så vesentlig for både næringslivet og husholdningene, vil det bli publisert nyhetssaker om rentebeslutningen uansett resultat. Det er imidlertid ingen tvil om at oppslaget og oppmerksomheten vil bli mye større ved renteøkning eller rentekutt, enn hvis Norges Bank holder den stabilt.

Masseproduserte kunstige nyheter

Redaktører trenger ikke å regne ut en matematisk formel for å finne ut om det er redaksjonelt interessant å skrive artikler om Norges Banks rentebeslutninger. Det er – og bør forbli – en redaksjonell beslutning som tas av et menneske.

Formelen er likevel nyttig, og blir kanskje også nødvendig, etter hvert som kunstig intelligens kommer for fullt inn i journalistikken med masseproduserte nyheter.

Her tror jeg bruk av informasjonsteoriens formål kan bidra på en konstruktiv måte. For det finnes mye interessant data som publiseres fortløpende, og som ofte danner grunnlag for nyhetsartikler. Det kan for eksempel være endringer i valutakurser, diverse energipriser, smittetall under koronakrisen eller andre nøkkeltall fra SSB.

Dette er saker som kunstig intelligens kan skrive et førsteutkast på, og så kan kladdene ligge klare i til publisering i en liste sortert etter hvilke saker som har størst beregnet nyhetsverdi.

På en nyhetsrik dag er det ikke sikkert at noen av disse forslagene blir brukt, men på stille nyhetsdager kan det være greit å sette journalister til å utfylle og ferdigstille sakene med høyest nyhetsverdi.

Oljepris og negative strømpriser

I EnergiWatch skriver vi om hele energibransjen, og selskapene der påvirkes av prisen på olje og strøm. Dette er verdier som endrer seg hver dag, og til tider kan det være ganske store variasjoner.

Det gjelder spesielt strømprisen, noe som blant annet har fått NTB til å lage en enkel strømprisrobot som skriver artikler om snittpriser og makspriser på strøm i de fem forskjellige norske prisområdene. Disse sakene skrives og publiseres uansett om nyhetsverdien er høy eller lav.

Oljeprisen svinger ikke fullt så mye, men konsekvensene er store. For svingninger i oljeprisen gir store utslag for både Norges og verdens økonomi når den går opp eller ned.

Med utgangspunkt i en oljepris på 80 dollar fatet, en dollarkurs på 11 kroner og et daglig oljeforbruk på 104 millioner fat, gir selv små endringer store økonomiske konsekvenser. For en prisendring på 0,1 prosent tilsvarer omtrent 9,2 milliarder kroner – per dag.

Norge eksporterer hver dag omtrent 1,7 millioner fat olje. Med andre oljerelaterte væsker som NGL og kondensat, kommer vi opp i cirka 2,0 millioner daglige fat. Gassen kommer i tillegg til dette.

Med utgangspunkt oljeproduksjonen alene, vil en prisendring på 0,1 prosent utgjøre 149,6 millioner kroner dagen for Norge. Samlet for væskeproduksjonen tilsvarer det 176 millioner kroner per dag.

Det er såpass mye penger at man kanskje skulle tro det var nyhetsverdig når oljeprisen endrer seg, selv om det bare er 0,1 prosent. Det er det imidlertid ikke, og det kan vi regne ut med informasjonsteori.

En gjennomgang av historiske oljepriser viser at det er veldig vanlig at den går mer enn 0,1 prosent opp eller ned fra dag til dag. Fra 1. januar 2005 og frem til i dag har det skjedd 95,6 prosent av handelsdagene.

Det er langt sjeldnere at oljeprisen går mer enn 10 prosent opp eller ned på en enkeltdag. Det skjer ikke hvert år, men det har skjedd syv av de siste 20 årene. En så stor prisendring har skjedd 0,4 prosent av de siste 5000 handelsdagene.

Med dette som utgangspunkt kan vi regne ut nyhetsverdien av endret oljepris:

Oljepris endres 0,1 %: 0,0807 bits – 50.2 nyhetspoeng
Oljepris endres 10 %: 7,966 bits – 68,9 nyhetspoeng

Vi ser dermed raskt at en liten endring i oljeprisen har liten nyhetsverdi, mens en stor endring har stor verdi. Det er i utgangspunktet opplagt, men her har vi kvantifisert verdien.

Mange av nyhetene om strømprisen har nå gått på at det har vært timer med negative strømpriser. Før 2020 var det helt utenkelig at det ville skje i Norge, men etter at det skjedde første gang 6. juli 2020 har det blitt tilnærmet vanlig. I fjor var det over 400 timer med negative strømpriser i Norge, og hittil i år har det vært 207 timer med minuspriser. Det tilsvarer 3,5 prosent av tiden.

I henhold til informasjonsteorien tilsvarer dette 4,816 bits, og med min nyhetsformel gir det en nyhetsverdi med 61,8 nyhetspoeng.

Rangerte nyheter

Med utgangspunkt i utregnede nyhetsverdier, kan vi nå sette opp en rangert liste, og med de eksemplene jeg har brukt blir listen seende slik ut:

Postmann biter hund: 88,0 nyhetspoeng
Oljepris endres 10 %: 68,9 nyhetspoeng
Rentekutt (1 %): 66,0 nyhetspoeng
Negative strømpriser: 61,8 nyhetspoeng
Renteøkning: (19 %): 56.0 nyhetspoeng
Uendret rente (80 %): 50,8 nyhetspoeng
Oljepris endres 0,1 %: 50.2 nyhetspoeng
Hund biter postmann: 50,0 nyhetspoeng

På samme måte tror jeg det skal mye til for at Journalisten hadde publisert en slik sak. Det måtte eventuelt være hvis jeg bet postmannen etter at han bet hunden min Simba. Uten at jeg har regnet på nyhetsverdien, tror tittelen «EnergiWatch-redaktør bet postmann som bet hunden hans» ville vært oppsiktsvekkende nok til at også andre medier ville hoppet på.

Så må jeg selvsagt påpeke at de utvalgte eksemplene er nettopp det: eksempler.

Tilnærmingen kan imidlertid brukes på nyttige måter. Vi kan for eksempel bruke den til å automatisk følge med på aksjekursen til alle energiselskaper som er relevant for vår pressedekning, og vi kan legge til strømprisene i alle prisområdene, gassprisen i de forskjellige markedene, fyllingsgraden i vannmagasinene og i Europas gasslagre og en rekke andre nøkkeltall.

Når vi ser nærmere på alle tidsseriene med nøkkeltall som er relevante for våre lesere, kommer vi fort opp i flere hundre. Vi kan ikke manuelt følge med på alle sammen, og da er vi avhengige av å raskt fange opp når det har vært endringer som er store og viktige nok til at de har nyhetsverdi. Med automatisering og en utregnet nyhetsverdi, kan vi på denne måten bli bedre til å dekke mer raskere.

Samtidig beholder vi den redaksjonelle utvelgelsen. For selv om jeg selvsagt ser at dette kunne blitt brukt til å styre forsiden, er jeg tydelig på at det ikke bør gjøres. Slik jeg ser det, er algoritmen en god tjener, men en farlig herre.

Ikke implementert

Det må påpekes at dette er en umoden løsning som ikke er implementert på noe som helst vis. Enn så lenge er det en teoretisk tilnærming som kun brukes til å utforske muligheter og løsninger knyttet til det som trolig kommer som en del av den raske utviklingen innen kunstig intelligens.

Vi går fra en verden der vi i pressen har brukt mye tid på å finne nyheter, til en situasjon der vi kan oversvømmes. Da blir det viktig å kunne filtrere innkommende saker, enten det er fra robotjournalister, kommunikasjonsrådgivere eller andre, ut fra sakens nyhetsverdi.

Jeg har også et håp om at en mer systematisk tilnærming til nyhetsverdi kan gi oss bedre journalistikk. For jeg tror ikke jeg er alene om å tenke at det er litt vel mye fjas som får mye oppmerksomhet av oss i pressen.

En kvantifisert nyhetsverdi kan kanskje bidra til mer substans i journalistikken?

Jeg mener uansett at det absolutt kan være på sin plass å vurdere en del nyhetssaker opp mot hvor mye nytt de egentlig kommer med.

Dette må selvsagt bli opp til hver enkelt medie å avgjøre selv, men jeg tror mange ville fått seg en aha-opplevelse hvis de gjorde det.

Verdiskapende nyheter

Jeg har som nevnt tilbragt omtrent halvparten av min karriere i journalistikken, og det er jeg veldig glad for. Vi i pressen gjør en viktig jobb når vi er gode, og så skorter det litt på våre dårlige dager.

Vi bør hele tiden etterstrebe å bli litt bedre, og på den måten skape litt mer verdi for våre lesere gjennom vår journalistikk. Her tror jeg informasjonsteorien til Claude Shannon har mye å lære oss, og jeg håper det er flere enn meg som blir nysgjerrige på å utforske mer om hvordan den kan brukes i journalistikken.

Som redaktør i en næringslivsavis med en avgrenset nisje, er det viktig for meg at vi ikke bare skriver det energibransjen selv sier og vil høre. Den mest verdiskapende journalistikken vi bidrar med, er når vi overasker med ny informasjon som aktørene ikke visste fra før.