- Dette er et debattinnlegg. Innlegget uttrykker skribentens egne synspunkter.
Jeg har tilbragt omtrent halvparten av min yrkeskarriere i pressen og
halvparten i IT-bransjen. Nå bruker jeg tiden på å skrive om energi om og for energibransjen sammen med mine kollegaer i næringslivsavisen EnergiWatch, men i
sommer har jeg brukt litt av ferien min til å sysle med utforskning av
mulighetene for å bruke kunstig intelligens i journalistikken.
Her skjer det veldig mye spennende, og utviklingen går fort. I en kronikk
her i Journalisten, argumenterte jeg for å bruke kunstig intelligens
til å gjennomføre intervjuer:
«Tenk så interessant det hadde vært å utvikle
noe tilsvarende der vi kunne intervjuet alle politikerne som stemte i
kommunestyret eller stortinget eller alle spillerne på laget som vant,
istedenfor bare de mest kjente som alltid spørres?»
Automatiserte telefonintervju
Det har allerede
blitt gjort, for i august brukte teknologijournalist Evan Ratliff
kunstig intelligens til å klone sin egen stemme. I sin podkastserie ShellGame brukte han
blant annet denne klonen til å snakke med sin kone, barn, gamle venner, terapeuter
og innpåslitne selgere og svindlere.
For oss i pressen
var det mest spennende i episode fem, for der brukte han dette
både til å intervjue en teknologigründer og til å la en annen
teknologijournalist intervjue seg selv.
Dette synes jeg er utrolig interessant, men det har også noen
problematiske sider. Jeg tror mange toppledere og politikere ville blitt ganske
lei hvis de stadig ble ringt opp av en kunstig intelligens med spørsmål om å få
en kommentar. Vi skal ikke se bort fra at dette i så fall blir en teknologi som
brukes mot journalister, slik Ratliff gjorde da han lot sin klone ta seg av
intervjuet med en journalistkollega.
Samtidig ser jeg på dette som en spennende utvikling for de som ikke
opplever pressedekning. Det ville for eksempel vært veldig interessant å se en
slik teknologi tatt i bruk på Norway Cup eller andre breddeidretter, der hver
klubb kunne fått sin egen avis med intervju av alle spillerne på alle klubbens
lag. For lokalavisene rundt om i landet bør dette absolutt være noe å se
nærmere på.
Teknologien er nok mer moden på engelsk enn norsk, men det kommer ikke
til å vare. Enten gjør vi i pressen noe med dette, eller så overlater vi det
til Silicon Valley eller noen andre teknologigründere. For dette kommer
uansett.
Redaksjonelt kontrollspørsmål
Jeg har gjennom årene utviklet flere forskjellige varianter av
robotjournalistikk. Det er spennende, nyttig og egentlig ikke så vanskelig. Det
er fort gjort å snekre sammen en automatisert løsning for å skrive en tekst, og
med store språkmodeller som ChatGPT med flere er mulighetene tilsynelatende endeløse.
Det er også muligheten for både misbruk og overdrivelser. For det er
ikke alt som kan skrives, som bør skrives. Jeg utviklet derfor tidlig et kontrollspørsmål
som alltid må stilles før man tar i bruk robotjournalistikk:
Hvorfor skal noen gidde å lese noe som ingen har
giddet å skrive?
Nå som vi nærmer oss bruk av kunstig intelligens til å gjøre
telefonintervjuer, tenker jeg at det også er på sin plass å legge til et nytt
kontrollspørsmål:
Hvorfor skal noen gidde å svare på spørsmål som ingen
har giddet å stille?
Det finnes gode svar på disse spørsmålene, og når man har det mener jeg
det er bare er positivt om man tar i bruk kunstig intelligens som en del av det
journalistiske arbeidet.
Redaktørstyrt presse
Teknologien som nå kommer er kul og spennende, men vi er redaktørstyrte
medier. Det betyr at vi velger ut hva vi skriver om, og hva vi velger bort. Det
må vi aldri glemme, og vi må ikke overlate dette til algoritmer.
For uansett hvor mye vi eventuelt investerer i utvikling av teknologi
og algoritmer, vil IT-bransjen med sine giganter og sine godt finansierte
oppstartsselskaper bli bedre enn oss. Vi kan ikke slå dem på teknologi, og vi
undergraver journalistikken hvis vi prioriterer å bruke vår tid og vår
begrensede investeringsevne på algoritmer som skal styre våre forsider.
De som har vært i pressen noen år, husker sikkert hvor galt det bar av
sted da norsk presse hev seg på Buzzfeed-hypen med tabloide virale saker. Det
inkluderte både den nåværende Amedia-toppsjefen da han
ledet Buzzit og til og
med DN med sin
Bisbuzz. Det vi så den gangen, var algoritme-kåte
journalister og redaktører som mistet gangsynet.
Jeg frykter at det er i ferd med å skje igjen. I boken
«Tett på nyheitene: Nyheitsvurderingar i fem redaksjonar» har
forskerne ved Høgskolen i Volda blant annet vært på besøk hos Aftenposten. Der
beskriver de et system hvor man legger inn en vurdering av nyhetsverdien på en
skale fra 0,5 til 5, og et parameter om hvor lenge saken skal vare. Så tar
algoritmene seg av å styre hvor saken til enhver tid skal ligge på forsiden.
Dette både skuffet og gledet meg. Skuffet ble jeg, fordi
jeg mener en slik algoritmestyring av forsiden er feil vei å gå – selv om
den ikke får lov til å bestemme hvilken sak som ligger helt øverst.
Samtidig gledet det meg fordi det å sette en tallverdi for
nyhetsverdien på en sak er noe jeg har tenkt på i mange år, og som inngår i
mitt lille sommerprosjekt.
For selv om jeg mener bruken av algoritmer til å styre forsiden er en
uting, har jeg tidligere utforsket muligheten for å bruke algoritmer til å tallfeste
hvor godt titlene på forsiden reflekterer innholdet i sakene våre.
På samme måte mener jeg det kan være fornuftig å bruke et tall for
nyhetsverdi til å vurdere om en sak skal lages og publiseres eller ikke, og det
har jeg forsøkt å se nærmere på.
Overaskende informasjon
Claude
Shannon utviklet sin informasjonsteori tilbake i 1938. Da publiserte han "«A Mathematical Theory of Communication». Med
det la han grunnlaget for det moderne samfunnet vi nå lever i, ettersom hans
informasjonsteori er en av grunnpilarene i data- og kommunikasjonsløsningene vi
alle bruker.
Informasjonsteorien omfatter mye som er både viktig og interessant, men
i journalistisk sammenheng er det mest aktuelt å se på informasjonsverdien. Der
påpeker Shannon at informasjonsverdien er størst når informasjonen er
overaskende.
Rent teknisk forklarte han at det trengs lite informasjon for å sende
en melding om at alt er som før, mens det krever mer informasjon (flere bits) i
en melding som inneholder ny informasjon.
Litt forenklet, kan vi forklare dette med at det holdt med et enkelt «nei»
på spørsmålet
om Har mannen fallt? da det var en av de store
nyhetssakene tilbake i 2014. Når svaret til slutt ble «tja»,
kreves det mer informasjon for å formidle hva som egentlig skjedde.
Teknisk sett hadde det holdt å overføre én bit med et binært tall med 0
eller 1 for å formidle nei eller ja til en mottaker da saken fortløpende ble
rapportert. Før og etter denne livedekningen var det imidlertid nødvendig med
mye mer informasjon for å forklare hva saken dreide seg om og hva som skjedde,
og det ville krevd overføring av mange flere bits.
Dette kan med fordel overføres til journalistikken. For på samme måte
som informasjonsverdien er størst når det kommer en ny overaskende opplysning,
er nyhetsverdien størst når nyheten kommer som en overraskelse.
Postmann biter hund
Når pressefolk snakker om hva som er en nyhet og hva som ikke er det,
brukes ofte eksempelet med en postmann og en hund. Vi sier gjerne at det ikke
er en nyhet at hunden biter postmannen, men at det er en nyhet hvis postmannen
biter hunden.
Dette er en god beskrivelse av hva som er en nyhet og hva som ikke er
det, men det sier ikke noe om hvor stor nyheten er.
Vi kan kvantifisere nyhetsverdien ved hjelp av Claude Shannons
informasjonsteori. Den gjør det mulig å måle informasjonens overraskelsesverdi
eller informasjonsinnhold i form av det som kalles entropi. Det gjøres ved
hjelp av en matematisk formel som vurderer mengden usikkerhet i informasjonen
og hvor sannsynlig hendelsen er.
Hvis vi for eksempel tar utgangspunkt i at det er én million hendelser,
der 999.999 er at hund biter postmann og 1 er at postmann biter hund, kan vi
med denne formelen regne ut nyhetsverdien. Da ser vi at nyhetsverdien for at
hund biter postmann blir det ekstremt lave tallet 0,0000014427, mens
nyhetsverdien for postmann biter hund blir 19,93.
Rent teknisk viser formelen informasjonsverdien i antall bits. For vår
bruk holder det å vite at det ene tallet er helt marginalt, mens det andre er
høyt. Dermed har vi fått en matematisk utregning der vi har sammenlignet
nyhetsverdien, noe som gjør det mulig å rangere forskjellige nyheter.
Samtidig er antall bits en vanskelig enhet å forholde seg til. For å
gjøre det litt enklere, har jeg eksperimentert med å konvertere denne
nyhetsverdien til et tall mellom 0 og 100 ved hjelp av sigmoid-funksjonen, en
matematisk formel som brukes mye innen blant annet kunstig intelligens.
Da får jeg følgende nyhetsverdier:
- Hund biter postmann: 0,0000014427 bits - 50,0
nyhetspoeng
- Postmann biter hund: 19,93 bits - 88,0 nyhetspoeng
Nyheter som scorer rundt 50 nyhetspoeng i mitt system er i praksis ikke
nyhetsverdige. Det er først når man kommer opp på et visst nivå, at det blir
interessant nok til å vurdere publisering.
Hvor den nyhetsterskelen bør settes kommer an på redaksjonen, og
nyhetsbildet den dagen sakene vurderes.
Renteendring
Norge har for tiden høy rente, og det merkes godt i de fleste
husholdninger. Det er derfor en soleklar nyhet hvis Norges Bank setter opp
eller ned styringsrenten, men det er også en nyhet med en viss interesse hvis
de holder den på samme nivå.
Hvor stor nyhetsverdien er, kommer an på hva de gjør sett opp mot
forventningen.
Hvis vi antar at det er 80 prosent sjanse for at Norges Bank holder
renten uendret, 19 prosents sjanse for at de øker den og én prosents sjanse for
rentekutt, kan vi regne oss frem til følgende:
- Uendret rente (80 %): 0,3219 bits - 50,8 nyhetspoeng
- Renteøkning: (19 %): 2,396 bits - 56.0 nyhetspoeng
- Rentekutt (1 %): 6,644 bits - 66,0 nyhetspoeng
Her ser vi at nyhetsverdien er svært lav hvis Norges Bank fortsetter
med uendret rente, men at den er relativt høy hvis den økes og veldig høy hvis
de overasker med rentekutt.
Ettersom styringsrenten er så vesentlig for både næringslivet og
husholdningene, vil det bli publisert nyhetssaker om rentebeslutningen uansett
resultat. Det er imidlertid ingen tvil om at oppslaget og oppmerksomheten vil
bli mye større ved renteøkning eller rentekutt, enn hvis Norges Bank holder den
stabilt.
Masseproduserte kunstige nyheter
Redaktører trenger ikke å regne ut en matematisk formel for å finne ut
om det er redaksjonelt interessant å skrive artikler om Norges Banks
rentebeslutninger. Det er – og bør forbli – en redaksjonell beslutning som tas
av et menneske.
Formelen er likevel nyttig, og blir kanskje også nødvendig, etter hvert
som kunstig intelligens kommer for fullt inn i journalistikken med
masseproduserte nyheter.
Her tror jeg bruk av informasjonsteoriens formål kan bidra på en
konstruktiv måte. For det finnes mye interessant data som publiseres
fortløpende, og som ofte danner grunnlag for nyhetsartikler. Det kan for
eksempel være endringer i valutakurser, diverse energipriser, smittetall under
koronakrisen eller andre nøkkeltall fra SSB.
Dette er saker som kunstig intelligens kan skrive et førsteutkast på,
og så kan kladdene ligge klare i til publisering i en liste sortert etter
hvilke saker som har størst beregnet nyhetsverdi.
På en nyhetsrik dag er det ikke sikkert at noen av disse forslagene
blir brukt, men på stille nyhetsdager kan det være greit å sette journalister
til å utfylle og ferdigstille sakene med høyest nyhetsverdi.
Oljepris og negative strømpriser
I EnergiWatch skriver vi om hele energibransjen, og selskapene der
påvirkes av prisen på olje og strøm. Dette er verdier som endrer seg hver dag,
og til tider kan det være ganske store variasjoner.
Det gjelder spesielt strømprisen, noe som blant annet har fått NTB til
å lage en enkel strømprisrobot som skriver artikler om snittpriser og
makspriser på strøm i de fem forskjellige norske prisområdene. Disse sakene
skrives og publiseres uansett om nyhetsverdien er høy eller lav.
Oljeprisen svinger ikke fullt så mye, men konsekvensene er store. For
svingninger i oljeprisen gir store utslag for både Norges og verdens økonomi
når den går opp eller ned.
Med utgangspunkt i en oljepris på 80 dollar fatet, en dollarkurs på 11
kroner og et daglig oljeforbruk på 104 millioner fat, gir selv små endringer
store økonomiske konsekvenser. For en prisendring på 0,1 prosent tilsvarer
omtrent 9,2 milliarder kroner – per dag.
Norge eksporterer hver dag omtrent 1,7 millioner fat olje. Med andre
oljerelaterte væsker som NGL og kondensat, kommer vi opp i cirka 2,0 millioner
daglige fat. Gassen kommer i tillegg til dette.
Med utgangspunkt oljeproduksjonen alene, vil en prisendring på 0,1
prosent utgjøre 149,6 millioner kroner dagen for Norge. Samlet for
væskeproduksjonen tilsvarer det 176 millioner kroner per dag.
Det er såpass mye penger at man kanskje skulle tro det var nyhetsverdig
når oljeprisen endrer seg, selv om det bare er 0,1 prosent. Det er det
imidlertid ikke, og det kan vi regne ut med informasjonsteori.
En gjennomgang av historiske oljepriser viser at det er veldig vanlig
at den går mer enn 0,1 prosent opp eller ned fra dag til dag. Fra 1. januar
2005 og frem til i dag har det skjedd 95,6 prosent av handelsdagene.
Det er langt sjeldnere at oljeprisen går mer enn 10 prosent opp eller
ned på en enkeltdag. Det skjer ikke hvert år, men det har skjedd syv av de
siste 20 årene. En så stor prisendring har skjedd 0,4 prosent av de siste 5000
handelsdagene.
Med dette som utgangspunkt kan vi regne ut nyhetsverdien av endret
oljepris:
- Oljepris endres 0,1 %: 0,0807 bits – 50.2 nyhetspoeng
- Oljepris endres 10 %: 7,966 bits – 68,9 nyhetspoeng
Vi ser dermed raskt at en liten endring i oljeprisen har liten
nyhetsverdi, mens en stor endring har stor verdi. Det er i utgangspunktet
opplagt, men her har vi kvantifisert verdien.
Mange av nyhetene om strømprisen har nå gått på at det har vært timer
med negative strømpriser. Før 2020 var det helt utenkelig at det ville skje i
Norge, men etter at det skjedde første gang 6. juli 2020 har det blitt
tilnærmet vanlig. I fjor
var det over 400 timer med negative strømpriser i Norge, og hittil
i år har det vært 207 timer med minuspriser. Det tilsvarer 3,5 prosent av
tiden.
I henhold til informasjonsteorien tilsvarer dette 4,816 bits, og med
min nyhetsformel gir det en nyhetsverdi med 61,8 nyhetspoeng.
Rangerte nyheter
Med utgangspunkt i utregnede nyhetsverdier, kan vi nå sette opp en
rangert liste, og med de eksemplene jeg har brukt blir listen seende slik ut:
- Postmann biter hund: 88,0 nyhetspoeng
- Oljepris endres 10 %: 68,9 nyhetspoeng
- Rentekutt (1 %): 66,0 nyhetspoeng
- Negative strømpriser: 61,8 nyhetspoeng
- Renteøkning: (19 %): 56.0 nyhetspoeng
- Uendret rente (80 %): 50,8 nyhetspoeng
- Oljepris endres 0,1 %: 50.2 nyhetspoeng
- Hund biter postmann: 50,0 nyhetspoeng
På samme måte tror jeg det skal mye til for at Journalisten hadde
publisert en slik sak. Det måtte eventuelt være hvis jeg bet postmannen etter
at han bet hunden min Simba. Uten at jeg har regnet på nyhetsverdien, tror tittelen
«EnergiWatch-redaktør bet postmann som bet hunden hans» ville vært oppsiktsvekkende
nok til at også andre medier ville hoppet på.
Så må jeg selvsagt påpeke at de utvalgte eksemplene er nettopp det:
eksempler.
Tilnærmingen kan imidlertid brukes på nyttige måter. Vi kan for
eksempel bruke den til å automatisk følge med på aksjekursen til alle
energiselskaper som er relevant for vår pressedekning, og vi kan legge til
strømprisene i alle prisområdene, gassprisen i de forskjellige markedene,
fyllingsgraden i vannmagasinene og i Europas gasslagre og en rekke andre
nøkkeltall.
Når vi ser nærmere på alle tidsseriene med nøkkeltall som er relevante
for våre lesere, kommer vi fort opp i flere hundre. Vi kan ikke manuelt følge
med på alle sammen, og da er vi avhengige av å raskt fange opp når det har vært
endringer som er store og viktige nok til at de har nyhetsverdi. Med
automatisering og en utregnet nyhetsverdi, kan vi på denne måten bli bedre til
å dekke mer raskere.
Samtidig beholder vi den redaksjonelle utvelgelsen. For selv om jeg
selvsagt ser at dette kunne blitt brukt til å styre forsiden, er jeg tydelig på
at det ikke bør gjøres. Slik jeg ser det, er algoritmen
en god tjener, men en farlig herre.
Ikke implementert
Det må påpekes at dette er en umoden løsning som ikke er implementert
på noe som helst vis. Enn så lenge er det en teoretisk tilnærming som kun
brukes til å utforske muligheter og løsninger knyttet til det som trolig kommer
som en del av den raske utviklingen innen kunstig intelligens.
Vi går fra en verden der vi i pressen har brukt mye tid på å finne
nyheter, til en situasjon der vi kan oversvømmes. Da blir det viktig å kunne
filtrere innkommende saker, enten det er fra robotjournalister,
kommunikasjonsrådgivere eller andre, ut fra sakens nyhetsverdi.
Jeg har også et håp om at en mer systematisk tilnærming til nyhetsverdi
kan gi oss bedre journalistikk. For jeg tror ikke jeg er alene om å tenke at
det er litt vel mye fjas som får mye oppmerksomhet av oss i pressen.
En kvantifisert nyhetsverdi kan kanskje bidra til mer substans i
journalistikken?
Jeg mener uansett at det absolutt kan være på sin plass å vurdere en
del nyhetssaker opp mot hvor mye nytt de egentlig kommer med.
Dette må selvsagt bli opp til hver enkelt medie å avgjøre selv, men jeg
tror mange ville fått seg en aha-opplevelse hvis de gjorde det.
Verdiskapende nyheter
Jeg har som nevnt tilbragt omtrent halvparten av min karriere i
journalistikken, og det er jeg veldig glad for. Vi i pressen gjør en viktig
jobb når vi er gode, og så skorter det litt på våre dårlige dager.
Vi bør hele tiden etterstrebe å bli litt bedre, og på den måten skape
litt mer verdi for våre lesere gjennom vår journalistikk. Her tror jeg
informasjonsteorien til Claude Shannon har mye å lære oss, og jeg håper det er
flere enn meg som blir nysgjerrige på å utforske mer om hvordan den kan brukes
i journalistikken.
Som redaktør i en næringslivsavis med en avgrenset nisje, er det viktig
for meg at vi ikke bare skriver det energibransjen selv sier og vil høre. Den
mest verdiskapende journalistikken vi bidrar med, er når vi overasker med ny
informasjon som aktørene ikke visste fra før.