Algoritmin tuottamia uutisia
Robottien tekemät uutiset ovat Suomessakin nurkan takana. Kustantaja
saattaa nähdä euronkuvia, toimittaja ehkä uhkakuvia. Journalismille ja journalisteille robotiikka on kuitenkin mahdollisuus, ei uhka. Mielipiteen muodostamista
helpottaa, jos tietää suurin piirtein, mistä puhutaan.
”Puhtaimmillaan automatisoitu uutistuotanto tarkoittaa
prosessia, joka tuottaa valmiita tekstejä algoritmien pohjalta ilman, että
kukaan puuttuu prosessiin. Ja sitten tästä on kaikenlaisia välimuotoja”,
määrittelee aihetta tutkinut Carl-Gustav Lindén. Yliopistonlehtorina
Svenska social- och kommunalhögskolanissa (Helsingin yliopisto) toimiva Lindén
sai vuonna 2014 Åkerlundin säätiöltä apurahan tutustuakseen Yhdysvalloissa robotiikkajournalismi-ilmiöön
ja sen vaikutuksiin.
Carl-Gustav Lindén
”Voi olla haku-suodatintyyppinen algoritmi, josta
Google Search on kehittynein esimerkki. Voi olla uutishälytyksiä: hakukone käy
vaikka läpi poliisipöytäkirjoja ja hälyttää, jos joku julkkis on jäänyt jostain
kiinni – mutta ihminen kirjoittaa jutun. Tietääkseni tätä ei tehdä vielä
Suomessa, mutta jo Ruotsissa Aftonbladet hyödyntää tällaista mallia. Ja on
monenlaista tapaa yhdistellä erilaisia automaattisesti suodatettuja tietoja
keskenään.”
Suomessa alkuaskeleita, USA jo pitkällä
Jotta algoritmit voi pistää täysimittaisesti töihin,
pohjana olevan tiedon tulee olla tiukasti strukturoitua. Tästä muodostuu helposti
pullonkaula, sillä data on harvoin vaaditussa muodossa.
Tavallisimmin tiedon muotovaatimukset täyttää urheilu-
ja talousdata. Yhdysvalloissa osavuosikatsaukset ovat tarkasti määriteltyjä,
ulkoasu ja lukujen sijainti ovat vakioita. Osavuosikatsaukset syntyvätkin
automaattisesti, ja niiden antamia tietoja voi myös hyödyntää algoritmien
avulla.
Näin ei ole Suomessa eikä muuallakaan EU:ssa, jossa
vasta odotellaan talousdatan standardointipäätöksiä. Tähän on törmännyt muun
muassa Kauppalehti, joka ei juurikaan ole kyennyt automatisoimaan tuloskauden
uutisointia, vaikka alustavaa kiinnostusta on ollut. Tanskassa Ritzau Finans on
joutunut kehittämään omia räätälöityjä ratkaisuja tuottaakseen automatisoituja
tulosuutisia.
Suomessa tiedon standardivaatimukset täyttää lähinnä
urheilun tulosdata, mutta journalismia siitä ei Lindénin tiedon mukaan ole
vielä Suomessa luotu.
”Sääuutisia tuotetaan kyllä jo automaattisesti, sen
näkee jokainen omasta kännykästään. Suomi on aidosti avoimen datan mallimaa:
täytyy vain löytää mielenkiintoiset tiedot ja tutkia, voiko ne yhdistää
johonkin muuhun dataan.”
Yhdysvalloissa automatisoituja uutisia tuotetaan jo
isossa skaalassa. Associated Press (AP) julkaisee automaattisesti erityisesti
yritysten tulosuutisia.
”On kaksi firmaa, jotka ovat tavallaan luoneet uuden
markkinan. AP:n aiemmin omistama ja sittemmin isolla rahalla myyty Automated
Insights tuottaa yritysten tulosinfoa nyt muillekin kuin AP:lle. Ja Narrative
Science taas keskittyy urheilutuloksiin”, Lindén kertoo.
Hänen mukaansa vastaavia yrityksiä on myös Ruotsissa, Saksassa
ja Ranskassa sekä Kiinassa – kieli ei ole yksinkertaisissa uutisissa mikään
ongelma.
Eroon rutiineista vai työpaikoista?
Lindén on itse taustaltaan kokenut journalisti. Eikö
tulevaisuus automatisoitujen uutisten maailmassa kuulosta pelottavalta?
”Eikö ole hyvä, jos kone tekee tylsät ja aikaa vievät
rutiinijutut ja ihminen voi keskittyä johonkin järkevämpään? Jos työpaikat häipyvät,
ne häipyvät muutenkin. Automatisointi voi päinvastoin pelastaa työpaikkoja,
koska julkaisija voi sen avulla ylläpitää tarvittavaa uutisvolyymiä pienemmillä
kustannuksilla. Parhaassa tapauksessa näin saadaan enemmän resursseja keskittyä
syvälliseen uutisointiin.”
Näin on käynyt AP:ssä, jossa oli jo aiemmin leikattu
paljon työpaikkoja. Tuloskaudessa syntyi jäljelle jäänein voimin 300 juttua, joista
suurin osa rutiininomaisia tulosjuttuja. Nyt robotit tuottavat 3 000
juttua tuloskaudessa, ja toimittajat keskittyvät muutamaan isoon yritykseen,
jotka pitää analysoida käsin. Siellä toimittajat ovat kuulemma tyytyväisiä.
”Mutta on siellä päin sellainenkin firma, joka ostaa
paikallislehtiä, automatisoi ja pistää suuren osan toimittajista pois. En usko
tämän firman jäävän kuitenkaan pitkäikäiseksi, sillä näin syntyvät jutut ovat
paljon luettuina tylsiä.”
Metajournalistille riittää töitä
Lindénin mielestä toimittajia tarvitaan väistämättä myös
jatkossa. Toimittaja tekee uutiskulmat, päättää mikä on kiinnostavaa ja
relevanttia, sen, mitä ihmisten pitäisi tietää. Tätä vastuuta ei voi jättää
esimerkiksi koodareiden käsiin.
Toimittajien työ kuitenkin muuttuu.
”Tiettyjen toimittajien on osattavat ohjelmoida
ainakin vähän, ja heidän on pystyttävä ajattelemaan rakenteita: sitä, miten
rakennetaan tiedon infrastruktuuri. Heitä kutsutaan metajournalisteiksi. Heitä on
jo olemassa ainakin Yhdysvalloissa.”
”Jos toimittaja päättää, että algoritmien maailma on
hänen kompetenssialueensa ulkopuolella, hän on ongelmissa. Mutta jos toimittaja
ottaa homman haltuun ja suostuu oppimaan, hän pärjää taatusti ja työmarkkinat
vain kasvavat.”
Lindén korostaa, että kaikissa tapauksissa on tärkeää
toimia läpinäkyvästi. Yleisön on aina tiedettävä, miten ja millä periaatteilla
juttu on tuotettu ja mihin dataan se perustuu.
Voimakaksikko: kone ja ihminen
Lindén kutsuu koneen ja ihmisen yhdistelmää
voittamattomaksi. Esimerkiksi ihmisen on liki mahdotonta ja ainakin
turhauttavaa kirjoittaa samasta jutusta kymmeniä variaatioita, mutta koneelle
tämä ei ole mikään ongelma.
”Kone oppii tunnistamaan lukijan tavan käyttää
sisältöä ja muokkaa juttua sen mukaan. Se voi vaihtaa kuvia, kirjoittaa otsikot
uusiksi, kokeilla eri värejä – ja oppia valitsemaan aina toimivimmat
vaihtoehdot eri kohteille. Tämä voi olla tärkeää esimerkiksi nuoria lukijoita
tavoiteltaessa.”
Mainonnassa tätä jo tapahtuu. Journalismin puolella
ainakin Guardian ja New York Times kokeilevat mallia verkkojulkaisuissaan. Lindén
korostaa, että kyseessä on kokonaisuus, jossa tuotettu teksti on vain osa.
Käyttäjäanalyysi on vähintään yhtä tärkeää, ja sekin tapahtuu automaattisesti.
Kehitys on huiman nopeaa, ja algoritmeista tulee itseoppivia.
Jo nyt ihmisen on usein mahdotonta tietää, onko teksti koneen vai ihmisen
tuottamaa. Tämä koskee paitsi journalismia myös kirjallisuutta ja runoutta.
Lindén on silti tässäkin peloton.
”Tietokoneet myös säveltävät ja tekevät taidetta.
Silti meillä on säveltäjiä ja taidemaalareita.”
Lue lisää:
Alma Median finanssijournalismin kehityshankkeelle tukea Googlelta
Alma Media tutkii automatisointia paikallislehdissä