– Det er mange som kjenner at hverdagen blir veldig mye lettere, sier en tydelig fornøyd produktdirektør i VG, Ola Stenberg. Her sammen med Johannes Gorset, Johannes Andersen og Edvard Høiby.Foto: Marte Vike Arnesen
Transkribering av tekst
VG-utviklernes app har spart journalistene over 1000 arbeidstimer på tre uker: – Ekstremt
Transkriberings-app revolusjonerer intervjuarbeid, og snart kan andre få tilgang.
Denne artikkelen er over ett år gammel og kan derfor inneholde utdatert informasjon.
Annonse
Ideen kom under en lunsjpause:
VG-utvikler Johannes Andersen overhørte en journalist i podkast-avdelingen snakke om hvor mye tid som gikk med på å transkribere lydfiler.
Kunne det finnes en måte å få transkribert automatisk på norsk?
Selv hadde han nettopp lest en bloggpost der det kom fram at «OpenAI» hadde laget en åpen transkriberingsmodell, og med en «hack day» som nærmet seg fikk han med leder for teknologi i VG, Johannes Gorset, til å finne ut om løsningen var brukbar eller ikke.
– Ideen bak «hack day» er egentlig bare å ta en dag og fokusere på noe annet enn man vanligvis gjør. Hensikten med denne dagen for oss, var bare å lære mer om kunstig intelligens og transkriberingsmodellene, forklarer Gorset.
De forsto fort at dette var noe som fungerte.
Steiro-testen
De fikk med seg lærling i VG, Edvard Høiby, og etter tre uker med intens jobbing hadde de en løsning klar.
Programmet JOJO, basert på navnene til de to Johannesene, ble testet ut på sjefsredaktør Gard Steiros bergensdialekt under et fellesmøte i VG-redaksjonen.
– Det var en bra test, sier Gorset og smiler.
– Etter det kom det en hel gjeng til oss fra podkast-avdelingen i VG. De mente appen kunne spare dem måneder med tid. Det var da vi skjønte hvor viktig dette kunne bli for folk.
I løpet av november hadde de programmet klart til testing. VG og Schibsted-ansatte kunne via en nettside laste opp lydfiler til en felles server. Lydfilen ble så satt i en transkriberingskø, og når transkriberingen var klar, fikk de teksten tilsendt på epost.
Programmet bruker en tredel av lengden på lydfilen. En times intervju tar derfor ikke mer enn 20 minutter å transkribere. På de tre ukene programmet har vært tilgjengelig, beregner VG og Schibsted å allerede ha spart 1000 arbeidstimer.
Annonse
Gjenkjenner over 100 språk
Nettstedet fungerte bra for intervjuer som ikke er så sensitive, men ikke for filer som inneholder svært sensitiv informasjon, der man har grunn til å frykte for kildenes jobb eller sikkerhet. Da må alt skje uten internett, på egen maskin.
Løsningen ble at VG-utvikler Christian Bogstad laget en app med utgangspunkt i den samme teknologien.
Appen tar utgangspunkt i egen maskin som lagringsplass for lydfilen. Den sendes ingen steder, ingen informasjon blir tracket, alt skjer lokalt.
– I appen har vi gjort det enkelt, sier Gorset, og forklarer:
– Du får transkribert alt sammen, i tillegg kan du trykke på en tekstlinje for å høre på akkurat den linja. Du kan eksportere hele lydfiler, eller du kan klippe i teksten og velge selv hva du eksporterer.
Appen gjenkjenner over 100 språk, og bruker de første 30 sekundene til å finne ut hvilket språk som snakkes.
– Softwaren baserer seg på «open source» og ligger ute på nettet tilgjengelig for alle, så har vi bygget grensesnittet rundt så det er lett å bruke, forklarer lærling Høiby. Han har hatt ansvaret for utseendet til nettsiden.
Vurderer kodedugnad
Siden nettsiden er basert på åpen kildekode, kan alle selskaper med utviklingsmiljøer sette det opp på egne maskiner og bruke det.
Så langt har VG samarbeidet med Nasjonalbiblioteket. Men for å få programmet til å fungere best mulig for mediebransjen, ønsker de å få med andre mediehus til å fortsette å utvikle det videre.
– Nå ønsker vi oss at folk gjør det, og bidrar til å gjøre den enda bedre, sier Gorset, og oppfordrer samtidig folk til å ta kontakt med dem om videre samarbeid.
– Det aller kuleste hadde vært hvis vi i medie-Norge, eller kanskje i hele medieverden, bidrar til å gjøre programmet stadig bedre. At vi får koden tilbake og gjør det enda bedre for alle, sier Gorset.
– Det er ekstremt mye tid spart. Så det gjør oss veldig mye mer effektive, det er mange som kjenner at hverdagen blir veldig mye lettere, sier en tydelig fornøyd produktdirektør i VG, Ola Stenberg.
Han får ikke fullrost teamet bak JOJO.
– Det er mange som er på dette sporet nå, men her var det en gjeng som agerte veldig raskt.
Selv om betaversjonen av appen nå er ute til testing, er de usikre på om og når den blir tilgjengelig for folk utenfor VG og Schibsted-systemet. Det er fortsatt en del ting som må testes før den kan slippes fri.
– Den er jo ferdig, den funker, men hvis det er noe som blir ødelagt, eller hvis det er noen bugs, så er det noen som må fikse det. Det er ansvaret man må vurdere, sier Høiby.
Snakk med utviklere
Andersen oppfordrer de redaksjonelt ansatte og utviklerne i mediebedriftene til å snakke mer og oftere sammen om å finne løsninger på teknologiske utfordringer.
– Vi er jo utviklere. Det er greit å vite hvordan redaksjonen jobber, det er bare tilfeldig at jeg snakket med en fra podkast i lunsjpausen en gang. Det som for noen ser ut som en kjempevanskelig jobb, kan for en utvikler være ganske lett, sier han, og avslutter:
– De som jobbet med Nerid-podkasten har fortalt oss at programmet kunne spart dem sju uker med transkribering.
Denne saken ble skrevet med hjelp av transkriberingsappen JOJO, som Journalisten har fått tilgang til å teste. Vi anslår at vi sparte opptil én arbeidstime.