Algoritmin tuottamia uutisia

Robottien tekemät uutiset ovat Suomessakin nurkan takana. Kustantaja saattaa nähdä euronkuvia, toimittaja ehkä uhkakuvia. Journalismille ja journalisteille robotiikka on kuitenkin mahdollisuus, ei uhka. Mielipiteen muodostamista helpottaa, jos tietää suurin piirtein, mistä puhutaan.

”Puhtaimmillaan automatisoitu uutistuotanto tarkoittaa prosessia, joka tuottaa valmiita tekstejä algoritmien pohjalta ilman, että kukaan puuttuu prosessiin. Ja sitten tästä on kaikenlaisia välimuotoja”, määrittelee aihetta tutkinut Carl-Gustav Lindén. Yliopistonlehtorina Svenska social- och kommunalhögskolanissa (Helsingin yliopisto) toimiva Lindén sai vuonna 2014 Åkerlundin säätiöltä apurahan tutustuakseen Yhdysvalloissa robotiikkajournalismi-ilmiöön ja sen vaikutuksiin. 

Gusse_Linden_770_370

Carl-Gustav Lindén

”Voi olla haku-suodatintyyppinen algoritmi, josta Google Search on kehittynein esimerkki. Voi olla uutishälytyksiä: hakukone käy vaikka läpi poliisipöytäkirjoja ja hälyttää, jos joku julkkis on jäänyt jostain kiinni – mutta ihminen kirjoittaa jutun. Tietääkseni tätä ei tehdä vielä Suomessa, mutta jo Ruotsissa Aftonbladet hyödyntää tällaista mallia. Ja on monenlaista tapaa yhdistellä erilaisia automaattisesti suodatettuja tietoja keskenään.”

Suomessa alkuaskeleita, USA jo pitkällä

Jotta algoritmit voi pistää täysimittaisesti töihin, pohjana olevan tiedon tulee olla tiukasti strukturoitua. Tästä muodostuu helposti pullonkaula, sillä data on harvoin vaaditussa muodossa.

Tavallisimmin tiedon muotovaatimukset täyttää urheilu- ja talousdata. Yhdysvalloissa osavuosikatsaukset ovat tarkasti määriteltyjä, ulkoasu ja lukujen sijainti ovat vakioita. Osavuosikatsaukset syntyvätkin automaattisesti, ja niiden antamia tietoja voi myös hyödyntää algoritmien avulla.

Näin ei ole Suomessa eikä muuallakaan EU:ssa, jossa vasta odotellaan talousdatan standardointipäätöksiä. Tähän on törmännyt muun muassa Kauppalehti, joka ei juurikaan ole kyennyt automatisoimaan tuloskauden uutisointia, vaikka alustavaa kiinnostusta on ollut. Tanskassa Ritzau Finans on joutunut kehittämään omia räätälöityjä ratkaisuja tuottaakseen automatisoituja tulosuutisia.

Suomessa tiedon standardivaatimukset täyttää lähinnä urheilun tulosdata, mutta journalismia siitä ei Lindénin tiedon mukaan ole vielä Suomessa luotu.

”Sääuutisia tuotetaan kyllä jo automaattisesti, sen näkee jokainen omasta kännykästään. Suomi on aidosti avoimen datan mallimaa: täytyy vain löytää mielenkiintoiset tiedot ja tutkia, voiko ne yhdistää johonkin muuhun dataan.”

Yhdysvalloissa automatisoituja uutisia tuotetaan jo isossa skaalassa. Associated Press (AP) julkaisee automaattisesti erityisesti yritysten tulosuutisia.

”On kaksi firmaa, jotka ovat tavallaan luoneet uuden markkinan. AP:n aiemmin omistama ja sittemmin isolla rahalla myyty Automated Insights tuottaa yritysten tulosinfoa nyt muillekin kuin AP:lle. Ja Narrative Science taas keskittyy urheilutuloksiin”, Lindén kertoo.

Hänen mukaansa vastaavia yrityksiä on myös Ruotsissa, Saksassa ja Ranskassa sekä Kiinassa – kieli ei ole yksinkertaisissa uutisissa mikään ongelma.

Eroon rutiineista vai työpaikoista?

Lindén on itse taustaltaan kokenut journalisti. Eikö tulevaisuus automatisoitujen uutisten maailmassa kuulosta pelottavalta?

”Eikö ole hyvä, jos kone tekee tylsät ja aikaa vievät rutiinijutut ja ihminen voi keskittyä johonkin järkevämpään? Jos työpaikat häipyvät, ne häipyvät muutenkin. Automatisointi voi päinvastoin pelastaa työpaikkoja, koska julkaisija voi sen avulla ylläpitää tarvittavaa uutisvolyymiä pienemmillä kustannuksilla. Parhaassa tapauksessa näin saadaan enemmän resursseja keskittyä syvälliseen uutisointiin.”

Näin on käynyt AP:ssä, jossa oli jo aiemmin leikattu paljon työpaikkoja. Tuloskaudessa syntyi jäljelle jäänein voimin 300 juttua, joista suurin osa rutiininomaisia tulosjuttuja. Nyt robotit tuottavat 3 000 juttua tuloskaudessa, ja toimittajat keskittyvät muutamaan isoon yritykseen, jotka pitää analysoida käsin. Siellä toimittajat ovat kuulemma tyytyväisiä.

”Mutta on siellä päin sellainenkin firma, joka ostaa paikallislehtiä, automatisoi ja pistää suuren osan toimittajista pois. En usko tämän firman jäävän kuitenkaan pitkäikäiseksi, sillä näin syntyvät jutut ovat paljon luettuina tylsiä.”

Metajournalistille riittää töitä

Lindénin mielestä toimittajia tarvitaan väistämättä myös jatkossa. Toimittaja tekee uutiskulmat, päättää mikä on kiinnostavaa ja relevanttia, sen, mitä ihmisten pitäisi tietää. Tätä vastuuta ei voi jättää esimerkiksi koodareiden käsiin.

Toimittajien työ kuitenkin muuttuu.

”Tiettyjen toimittajien on osattavat ohjelmoida ainakin vähän, ja heidän on pystyttävä ajattelemaan rakenteita: sitä, miten rakennetaan tiedon infrastruktuuri. Heitä kutsutaan metajournalisteiksi. Heitä on jo olemassa ainakin Yhdysvalloissa.”

”Jos toimittaja päättää, että algoritmien maailma on hänen kompetenssialueensa ulkopuolella, hän on ongelmissa. Mutta jos toimittaja ottaa homman haltuun ja suostuu oppimaan, hän pärjää taatusti ja työmarkkinat vain kasvavat.”

Lindén korostaa, että kaikissa tapauksissa on tärkeää toimia läpinäkyvästi. Yleisön on aina tiedettävä, miten ja millä periaatteilla juttu on tuotettu ja mihin dataan se perustuu.

Voimakaksikko: kone ja ihminen

Lindén kutsuu koneen ja ihmisen yhdistelmää voittamattomaksi. Esimerkiksi ihmisen on liki mahdotonta ja ainakin turhauttavaa kirjoittaa samasta jutusta kymmeniä variaatioita, mutta koneelle tämä ei ole mikään ongelma.

”Kone oppii tunnistamaan lukijan tavan käyttää sisältöä ja muokkaa juttua sen mukaan. Se voi vaihtaa kuvia, kirjoittaa otsikot uusiksi, kokeilla eri värejä – ja oppia valitsemaan aina toimivimmat vaihtoehdot eri kohteille. Tämä voi olla tärkeää esimerkiksi nuoria lukijoita tavoiteltaessa.”

Mainonnassa tätä jo tapahtuu. Journalismin puolella ainakin Guardian ja New York Times kokeilevat mallia verkkojulkaisuissaan. Lindén korostaa, että kyseessä on kokonaisuus, jossa tuotettu teksti on vain osa. Käyttäjäanalyysi on vähintään yhtä tärkeää, ja sekin tapahtuu automaattisesti.

Kehitys on huiman nopeaa, ja algoritmeista tulee itseoppivia. Jo nyt ihmisen on usein mahdotonta tietää, onko teksti koneen vai ihmisen tuottamaa. Tämä koskee paitsi journalismia myös kirjallisuutta ja runoutta. Lindén on silti tässäkin peloton.

”Tietokoneet myös säveltävät ja tekevät taidetta. Silti meillä on säveltäjiä ja taidemaalareita.”

Lue lisää: 
Alma Median finanssijournalismin kehityshankkeelle tukea Googlelta
Alma Media tutkii automatisointia paikallislehdissä


Päivämäärä: 24.2.2016
Teema: Journalismi
Teksti: Diana Törnroos