Markus Tobiassen (til venstre) og Kjetil Sæter er journalistene bak Tidal-saken. Foto: Glenn Slydal Johansen
Markus Tobiassen (til venstre) og Kjetil Sæter er journalistene bak Tidal-saken. Foto: Glenn Slydal Johansen

Slik jobbet Markus Tobiassen og Kjetil Sæter fram Tidal-saken

Ufrivillig pause, statistikklov, vasking av metadata og grundig kildearbeid er noe av det som ligger til grunn.

Published Updated

Den siste måneden har Dagens Næringsliv (DN) fått mye skryt for dokumentaren om at Tidals strømmetall for musikkartistene Beyoncé og Kanye West i perioder er manipulert.

Tidal avviser og bestrider påstandene, og mener artiklene viser en manglende forståelse for hvordan royalty betales.

Journalisten har møtt journalistene Markus Tobiassen og Kjetil Sæter, som forteller om hvordan de har jobbet.

For DNs del strekker opphavet til saken seg helt tilbake til januar 2015 da Etterbørs-journalist Markus Tobiassen begynte å dekke Jay Zs kjøp av daværende norske Wimp nyhetsmessig.

Våren 2016 meldte selskapet om tre millioner strømmekunder og 250 millioner avspillinger i løpet av ti dager for Kanye Wests plate Life of Pablo. Samtidig varslet Jay Z søksmål mot Wimp-selgerne fordi han mente antallet abonnenter var lavere enn han hadde blitt forespeilet.

– Der begynte vi å jobbe på to hypoteser: Én, at de gamle eierne hadde jukset med tallene og to, at de nye eierne hadde gjort det, sier Tobiassen.

Faksimile Dagens Næringsliv
Faksimile Dagens Næringsliv

Lang vei

Like etter tok kilder fra plate- og musikkbransjen med innsyn i rapporter kontakt fordi de ikke fikk tallene til å gå opp. Så går månedene.

Historien er så stor at den fortjener et større format

– På et tidspunkt skjønner vi at historien er så stor at den fortjener et større format. I oktober 2016 blir jeg koblet på, sier DNs gravejournalist Kjetil Sæter, som mange også kjenner som gitarist og sterkt musikkinteressert.

Allerede på dette tidspunktet er redaksjonen på sporet av saken de nylig publiserte.

– Veien med å gå derfra til å ha full dokumentasjon har vært kjempelang.

Underveis publiserte DN i januar 2017 reportasjen Project Panther om at Tidal blåste opp abonnementstall.

Bak arbeidet for dette årets feature ligger et omfattende kildearbeid, en flere måneder lang ufrivillig pause, verifisering og jakten på imøtegåelse fra Tidal.

Sæter skryter av kollegaens kildearbeid og systematiseringsferdigheter.

– Mer enn 100 personer i musikkbransjen med kunnskap om Tidal er kartlagt for å finne kilder med kjennskap til Tidals strømmetall.

Tobiassen vil ikke si hvor viktig det har vært med gode kilder i musikkbransjen i Norge og utlandet:

– Men det har viktig å forstå den kompliserte økonomien for å kunne bygge tillit til folk.

Journalistene viser til at strømmebransjen bygger på en mikrotransaksjonsmodell der hver eneste lytting på sett og vis er en handel i seg selv der det skal fordeles noen øre til flere ulike aktører.

– Ikke stjålet

Hvordan de fikk dataene som er grunnlaget for saken vil de ikke utdype utover det de skriver om at en person i en travel handlegate på et ukjent sted nikker til DNs journalist hvorpå en harddisk skifter hender.

– Det enkle svaret er å vise til det enorme kildearbeidet som er lagt ned, svarer Sæter på Journalistens spørsmål om hvordan de kom dit.

– Henvender du deg bredt og forsiktig så får du til slutt napp.

Vi stod på et tidspunkt fast

– Vi stod på et tidspunkt fast og var ikke sikre på å komme i mål. Vi tok tiden til hjelp, legger Tobiassen til.

– Over flere måneder skjedde ingenting annet enn kontakt med kildenettverket. Så forandrer noe seg, og plutselig har du det. Det er vanskelig å være mer konkret enn at noen ga det til oss.

Hva det var som forandret seg så mye at de fikk tak i databasene vil de to ikke gå inn på i dag.

– Vi må være veldig forsiktig med å peke, sier Sæter som minner om kildevernet.

– Men det blir nok kjent en dag, legger han til, med henvisning til at det er noe som kan komme fram i politiavhør eller i en rettssal dersom det blir straffesak av noen av politianmeldelsene mot Tidal.

Tidal mener for øvrig at dataene på harddisken DN fikk hånd på er stjålet fra selskapet.

– Er dataene stjålet?

– Vi har ikke stjålet noen data.

Sikksakkmønstre

Da redaksjonen hadde fått hånd om de enorme datamengden begynte bearbeidingen av dem internt i redaksjonen.

Det første som skjedde var at Excel kræsjet

- Det første som skjedde var at Excel kræsjet. Det har ikke skjedd før i DN, sier Sæter.

Tobiassen fikk hjelp av kollega og dessuten svoger Rune Ytreberg. De måtte sette seg inn i hvordan de intervjuer store datasett, som dreier seg om å kjøre spørringer gjennom programmeringsspråk for å hente ut funn av databaser.

Journalistisk handler det om å stille riktige og gode spørsmål, og ikke enkle spørsmål som hvor mange sanger som er spilt en bestemt dag.

Det var spørsmålet om distribusjonen av hvor mange sanger hver bruker spilte som penset redaksjonen inn på riktig spor. Altså hvor mange som har spilt én sang, hvor mange som har spilt to sanger også videre.

Slik er sikksakk-kurvene illustrert i rapporten fra NTNU.
Slik er sikksakk-kurvene illustrert i rapporten fra NTNU.

I svarene fra hele databasen fant redaksjonen brudd med statistikkens Benfords lov, som sier at det er flere forekomster av lave tall enn av høyere tall.

– Fordi gatenummer begynner på én skjønner du for eksempel hvorfor du vil få flere lave tall om du gjør statistikk på alle gatenumre i Norge. Det samme gjelder når vi lytter på musikk. Den største sekken med brukere er de som hørte én sang den dagen, så kommer to, tre også videre. Det følger en omvendt eksponensiell kurve, forklarer Tobiassen.

I dataene redaksjonen satt på var det imidlertid ikke en slik fallende kurve de fant for noen av sangene på bestemte tidspunkter.

– I den perioden hvor de slipper disse albumene får den plutselig et sikksakkmønster.

Tobiassen viser til at mønstrene kommer fram i forbindelse med de eksklusive plateslippene av Beyoncé og Kanye West hos Tidal. Grafene viste at lyttere hørte på 2, 4, 6 også videre sanger av artistene.

– Du må ha en spesiell tvangslidelse hvis du har behov for å høre partallssanger hver gang du hører på musikk. At alle Tidals kunder skulle ha det var usannsynlig.

Hypoteser

Funnet identifiserte noen interessante perioder, men ga ikke svar på hva som hadde skjedd. Derfor gravde redaksjon videre i enkeltbrukeres lyttinger.

– Vi brukte kriteriet at brukeren måtte ha hørt minst én sang fra Beyoncé-albumet. Det neste steget var å sette opp listen over avspillinger. Og da kan du sette det opp i Excel, som gjør det enklere.

Slik presenterte DN pivot-tabellen som viser en brukers avspillinger av en sang til ulike tidspunkter. Illustrasjonen her er kun et utsnitt av hele DNs illustrasjon.
Slik presenterte DN pivot-tabellen som viser en brukers avspillinger av en sang til ulike tidspunkter. Illustrasjonen her er kun et utsnitt av hele DNs illustrasjon.

Men de måtte ned på millisekundnivå for å få fram den grafiske fremstillingen som DN har gjengitt med markeringer for hver avspilling.

– Da så vi at det var avspillinger på identiske sekunder og millisekunder. Da har du noe som er statistisk umulig.

Her var redaksjonen ved sist nyttårsskifte. Tobiassen sier han selv sjekket 1.000 brukere, men at det fortsatt var under en halv promille av brukerne i databasen redaksjonen satt på.

– Hvis du tar tusen brukere og alle de treffer ligger du statistisk godt an allerede der. Men det holder ikke. For vi visste hva slags motstand vi ville møte på dette. Derfor måtte det være vanntett.

Siden nyttår har en stor del av arbeidet dreid seg om verifisering, og det er her NTNU på Gjøvik kom inn i bildet med sin ekspertise og datakraft til å analysere 74,1 GB med data.

– Når du holder på med undersøkende journalistikk handler det ikke bare om å bekrefte hypoteser. Du må jobbe litt for å avkrefte dem også. Du må ha en kvalitetssikring, sier Sæter.

Bestillingen til NTNU gikk ut på at redaksjonen hadde mistanke om manipulasjon av et anonymisert datasett fra en ikke navngitt strømmetjeneste.

– De delte seg i to lag der det blå laget skulle prøve å bekrefte manipulasjon mens det røde laget skulle komme opp med motforestillinger og alternative forklaringer, sier Tobiassen.

Større skala

NTNU stilte sju betingelser for å ta oppdraget, inkludert at dataene er skaffet på lovlig vis, at de er levert i original form, at tidsperiodene er komplette, at avisen ikke har endret dataene på en betydningsfull måte og at DN har vært åpne og ærlige overfor universitetet. Tidal mener at avisen har brutt alle betingelsene.

På spørsmål om hvordan det er å stole på NTNU, viser Sæter til at grunnhypotesen og -funnene allerede var gjort av redaksjonen:

NTNU finner det samme som oss, men i større skala

– NTNU finner det samme som oss, men i større skala.

Tobiassen sammenligner bruken av NTNU med Dagbladets bestilling av DNA-analyse i prosjektet Våtdraktmysteriet. Han viser også til at NTNUs rapport er publisert sammen med koden, noe som gjør at alle med tilgang til tallene, inkludert Tidal, kan etterprøve deres metode.

– Det fikk de god til å gjøre før vi publiserte, skyter Sæter inn.

Da DN henvender seg til Tidal for intervju i midten av februar, sier journalistene at strømmetjenesten begynner å svare gjennom advokat i stedet.

Frem til publisering jobbet DN-journalistene med å verifisere dataene på flere måter, som de ikke vil gå nærmere inn på overfor Journalisten.

Men en som nevnes i av DN er at summeringstall i datasettene er sammenlignet med tall fra rettighetshavere og platebransjen. Journalistene sier de sitter på en lengre liste av tall som matcher.

– De får jo full rapportering fra Tidal. Du kan sjekke om totaltallet på måneds-, ukes- og i noen tilfeller dagsbasis er likt med det datasettet vi har. Alle disse tallene stemte med en sikkerhetsmargin på fem promille, sier Sæter.

Journalistikkrevisjon

Men en dokumentar om strømmetall verifiseres ikke bare gjennom analyse av store datasett. Det gjøres også gjennom mennesker som en del av historien: Tidal-brukere som ikke kjenner seg igjen i sine egne logger.

– Det var viktig å intervjue de faktiske brukerne for å verifisere at dette var Tidals data. De gjenkjenner det fordi det er deres egen logg. Noe annet er at det betyr mye for at folk forstår historiefortellingen, sier Tobiassen og skryter av DNs videofotograf Marte Christensen som filmet disse møtene.

Journalistene opplevde at ansiktene i historien bidro mye for sakens gjennomslag.

– Vi var nøye med å fortelle dem så lite som mulig slik at vi kunne filme det når de gjorde seg opp en mening om det var sannsynlig eller ikke.

Sæter understreker hvor nøye redaksjonen er på at det de publiserer er sant og riktig.

Vi gjør alt i vår makt

– Vi gjør alt i vår makt for å være sikker på noe vi skriver som er kjempealvorlig som selskapet som omtales.

Det er featureredaktør Gry Egenes som leder det som internt kalles revisjonen av featuresaker i DN. Gjennom denne gjennomgangen granskes setning for setning og dokumentasjon for påstander avkreves. Det gjør også journalistene trygge.

– Det viktigste for oss er at vi er trygge på at det vi skriver er sant og riktig.

En setning som resultat av revisjonen er at det i reportasjen står at «DN har ingen opplysninger om at Beyoncé eller Kanye West har vært kjent med at lyttertallene deres er blitt endret.»

– Det er riktig at det var flere runder i revisjonen hvor vi snakket om det, sier Tobiassen.

– Det er litt kinkig fordi det står at de er medeiere i tjenesten. Også svarte de ikke på våre henvendelser, sier Sæter.

– Det var redelig å gjøre. Det handler om hva vi etterlater av inntrykk, sier Tobiassen.

Da redaktør Egenes nylig fortalte om arbeidet under en mediekonferanse, sa hun at det har vært trusler og påstander fra Tidal om at avisen er skurker, bedragere, manipulatorer og antisemitter.

– Det er helt håpløst. Tullball. Barnslig, rett og slett, sier Sæter. Som gravejournalist er han blitt vant med trusler om søksmål.

Tobiassen sier at man ikke skal tulle bort personangrep, men ikke overdramatisere det heller.

Jeg er kalt verre ting av sinte foreldre da jeg dømte miniputtfotball

– Jeg er kalt verre ting av sinte foreldre da jeg dømte miniputtfotball, sier Tobiassen.

– Så er det også det. Jeg kommer selv fra et delvis jødisk opphav.

– Hva svarer dere til beskyldningen om at dere har forfalsket dataene?

– Det er tullball og tøys. Jeg tar det fryktelig med ro, sier Sæter.

– Har dere tuklet med dataene?

– Nei, nei. Vi driver ikke med svertekampanjer. Vi driver med journalistikk. Vi har ingen personlig interesse av det her. Gud forby. Det gir liksom ingen mening. Hvorfor skulle vi gjøre det?

Et absolutt krav i journalistikken er retten til imøtegåelse. At Tidal ikke ville svare på spørsmål, gjorde øvelsen med å hente inn den krevende.

Derfor har DN levert spørsmål og etterhvert logger og annen dokumentasjon ved hjelp av budtjenester for å kunne dokumentere at selskapet har fått muligheten.

I likhet med andre av DNs kjente kilder, som NTNU, svarte de DN med advokat og søksmålsvarsler. Dermed ble det også runder med advokater internt i DN.

– Her var det snakk om andre land og sånn som gjør det enda mer arbeidskrevende.

Med henvisning til blant annet pressemeldinger i etterkant av publiseringen, sier Tobiassen at de i grunn har fått svar på hva Tidal mener har skjedd.

– De mener det er gjort feil fra vår side, at vi har tuklet med dataene og misforstått dem, sier Tobiassen.

– De mener det er skjedd et datainnbrudd hos dem?

– Ja, de undersøker hva som er skjedd.

– Det får de bare gjøre. Det er ikke noe vi får gjort noe med, slutter Sæter til.

På spørsmål om det er redaktørene eller journalistene som har presset på for å undersøke saken nøyere, sier han at alle har vært inneforstått med alvoret i saken.

Du vil jo alltid på da

– Men det er klart. Du vil jo alltid på da. Du blir gående i en evig boble. Alle vil ha den på, men vi forstår at redaktørene har et ansvar overfor eieren.

Ansvar overfor leserne

Featureredaktør Egenes vil ikke si at forholdet til eierne er hovedgrunnen til at hun er pirkete med sikring og revisjon av saker. Hun mener det er viktig at leserne og de som avisen skriver om får journalistikk som holder mål.

– Jeg føler et ansvar for at det vi publiserer er riktig og for at vi ikke anklager folk, bedrifter eller organisasjoner for noe som er feil. Det er alminnelig redaktøransvar, sier Egenes.

– Du har ikke følt et ansvar overfor eiere med tanke på pengekrav i et søksmål?

– Selvfølgelig har vi et ansvar. Men det faller i hovedsak sammen med å sørge for at det journalistiske holder mål. Det er det vi har konsentrert oss om når vi har jobbet med Tidal-saken.

Featureredaktør Gry Egenes i Dagens Næringsliv. Foto: Kristine Lindebø
Featureredaktør Gry Egenes i Dagens Næringsliv. Foto: Kristine Lindebø

Generelt sier hun om Tidal-saken at databasejournalistikk har vært et nytt område å jobbe med.

– Du må sette deg inn i nye krav til verifisering og ting som du må være oppmerksom på som vi ikke kjente så mye til fra før i DN.

Hun viser til at det blant eksperter på sikkerhetskonferanser rundt om i verden diskuteres om databaser som slippes kan være manipulert.

Man må være aktsom

– Man må være aktsom.

Redaktøren ler da hun får spørsmålet om hun kjente begrepet «å intervjue data» for et halvt år siden.

– Det vet jeg ikke. Men dette er i hvert fall et av de største datasettene vi har intervjuet.

Dokumentaren har fått mye ros, men en ting den har fått kritikk for er den digitale historiefortellingen der leserne må scrolle eller sveipe mye for å lese saken.

Vi tar med oss alle tilbakemeldinger.

– Jeg kan bare beklage. Vi kommer til å utvikle nye digitale måter å fortelle på. Her var det mange som likte det, og noen som syns det var slitsomt. Vi tar med oss alle tilbakemeldinger.

Vasket metadata

Andre hensyn journalistene har måttet ta underveis i saken, er ulike hensyn til kilder. Som hvor hardt de kan gå på kilder som de mener har visst. Sæter viser til lignende avveielser i Boligbygg-saken, som han tidligere i år fikk graveprisen Skup for. Der tok redaksjonen spionbilder og banket på bilruter.

– Vurderingene av hvor tett du skal gå på holder vi på med hele tiden.

Et annet hensyn var å verne og beskytte anonyme kilder i så stor grad at de prøvde å fange opp alle muligheter de ikke kunne tenke på. En metode var å endre skriftfont og skrive ut og scanne logger før de ble sendt for å være helt sikre på at informasjon de sendte Tidal ikke inneholdt digitale spor.

– Folk dummer seg ut hele tiden på metadata du ikke kan se, sier Tobiassen, og viser for eksempel til at et Excel-ark kan vise hvem som opprettet det.

Det å skrive ut og scanne er som å vasse i elva så du vasker bort digitale spor

– Det holder ikke å si at vi har data, men at dere ikke kan få se på den. Vi måtte gi tilstrekkelig informasjon. Da handler det om å vaske metadata. Det å skrive ut og scanne er som å vasse i elva så du vasker bort digitale spor. Du må ta hensyn til alt du har og ikke har tenkt på og bare gjøre så mye du kan.

Sikker kommunikasjon, som kryptert e-post og krypterte meldingstjenester, har journalistene brukt lenge. Men også krypterte tjenester legger igjen spor.

– At det har vært kommunikasjon mellom to telefoner vil fortsatt være synlig.

Tobiassen sier at det også er utfordringer knyttet til at kilder har arbeidsverktøy som telefon og e-post gjennom jobben. Selv om det er krav til hvordan arbeidsgiver kan få innsyn i en ansatts e-post.

– Man skal ikke anta at folk som går på kildejakt følger reglene.

Hvordan DN har omgått dette vil journalistene ikke gå nærmere inn på.

Avviser påstander

Journalisten har under arbeidet med denne saken spurt Tidal om deres mening av DNs dekning, hva som er deres svar til tallene DN omtaler og hvordan selskapet vil følge opp det som er omtalt.

Det er PR-rådgiver Daniel Barhom i Geelmuyden.Kiese som svarer på henvendelsen. Han skriver først at Tidal ikke ønsker å gi ytterligere kommentarer utover det som ble kommunisert i pressemeldingen 18. mai.

– Vi avviser og benekter påstandene som er fremmet av Dagens Næringsliv, het det i meldingen.

Tidal skriver også at de forfølger ulike veier, inkludert rettslige skritt, for å komme til bunns i hva som er skjedd.

– I tillegg har vi engasjert et uavhengig tredjeparts nettverkssikkerhetsfirma for å gjøre en gjennomgang av hva som skjedde og hjelpe oss med å beskytte sikkerheten og integriteten til våre data ytterligere.

I løpet av de siste dagene har Tidal fulgt opp med flere pressemeldinger til saken. Der gjentar Tidal at de avviser og bestrider påstandene som er kommet frem i DN, samt at resultatene av den omtalte undersøkelsen vil bli delt med artister, fans og partnere når den foreligger. Dette skal skje så raskt som mulig.

– Vi ber om at offentligheten ikke konkluderer i denne saken før undersøkelsene er gjennomført, heter det i meldingen.

Tidal skriver også at de ikke har mottatt harddisken som DN sitter på.

– På nåværende tidspunkt kan vi derfor ikke si noe om harddisken faktisk kom fra oss eller hva som skjedde med dataene etter det potensielle datainnbruddet.

Tidal mener at DNs artikler viser en manglende forståelse for betaling av royalty håndteres.

– Påstandene ville ikke gitt økonomisk mening for verken Tidal eller artistene. Verken Tidal, eller de spesifikke artistene, ville fått økonomiske fordeler hvis påstandene var sanne, heter det i meldingen.

Tidal mener også at NTNU ble forledet i oppdraget fra DN.

Vi mener forutsetningene er falske, og at NTNU ble forledet

– Vi har undersøkt påstandene fra Dagens Næringsliv fra begynnelsen. En gjennomgang av den begrensede informasjon vi fikk fra Dagens Næringsliv og rapporten fra NTNU, kombinert med vår tillit til våre ansatte og integriteten til vår rapportering, gjorde at vi kunne avvise og bestride påstandene fra avisen. Vi har ikke mottatt harddisken som hele NTNU-rapporten er basert på. NTNU-rapporten sier at den forutsetter at dataene var presise og anskaffet på en lovlig måte. Vi mener begge disse forutsetningene er falske, og at NTNU ble forledet, heter det i en tredje pressemelding fra Tidal.

Den nye økonomien

Et underliggende tema i DNs reportasje er problematikken rundt måling, rapportering og fordeling av penger i den nye digitale økonomien. De to journalistene sier at de har snakket mye om tematikken underveis, men de er fornøyd med å ha laget en historie der dette temaet ikke er det eksplisitte.

– Det er litt show, don't tell i journalistikken. Selv om vi ikke skriver det spesifikt, viser denne saken problemstillingen med at det er litt vill vest. God journalistikk er når det setter i gang noe oppe i hodet, når det blir større enn historien. Vi var veldig bevisst på at vi ville fortelle en tett historie strippet for glamour og kjendiseri, sier Sæter.

– Og det er gøy at folk plukker nettopp det opp, legger Tobiassen til.

Journalistene viser til at alle er enig om hva en krone er verdt, men at det ikke er omforente standarder om hva en bruker, abonnent eller betalende abonnent egentlig er.

– Du har de som betaler fullpris. Så har du familieabonnementene., Og alle som har fått abonnement gjennom Canal Digital eller som har tjenesten til halv pris gjennom telekomselskapet sitt. Selv om to selskaper sier de har én million abonnenter, kan det bety to ganske forskjellige ting.

– Vi har standarder for regnskaper og den gamle måten å drive business på, men nå har andre måleenheter blitt like viktige. Og aktører kan shoppe den enheten som passer dem best. Selv børsnoterte selskaper slipper unna med dette fordi det ikke fins revisorer eller standarder som ettergår det. Det kommer det til å komme en debatt om.

Rørende forsvar av journalistikk

Ikke bare snakkes det om at Tidal-reportasjen er DNs dyreste hva advokatsalærer angår, men også at de aldri har hatt en sak som har spredd seg så mye digitalt før.

– Noe av det morsomste er å sitte og se når saken trendet på Reddit. Da sitter det tilsynelatende helt vanlige nordmenn der som forklarer hva DN er og tar DN i forsvar.

– At det er en seriøs norsk avis, og ikke et sladreblad, sier Sæter.

– Når du ser folk som ikke er kollega av deg eller i slekt med deg forsvare journalistikk...

– Det er rørende rett og slett.