Journalismi

Uutisrobotit tulivat vihdoin Suomeen

Kotimaisten uutisautomaattien näytön paikka koittaa kevään kuntavaaleissa. Ainakin Yle ja Helsingin Sanomat aikovat tarjota tietokoneohjelman kirjoittamia tulosuutisia.

Journalismin robotisaatio on ottanut viime kuukausina huiman loikan Suomessa.

Ensin HSS Media ilmoitti marraskuussa ottavansa ensimmäisenä suomalaisena mediatalona käyttöön robotin, joka kirjoittaa jalkapallouutisia ruotsiksi Vasabladetiin, Syd-Österbotteniin ja Österbottens Tidningiin, niin verkkoon kuin printtiin. HSS Median robotin nimi on Rosalinda ja sen on kehittänyt ruotsalaisfirma United Robots. Ruotsissa sanomalehtikonserni MittMedia on käyttänyt samaa robottia jo pitkään.

Joulukuun lopussa teki debyyttinsä Ylen Voitto-robotti, joka työsti yhden yön aikana kymmenen julkaistua urheilu-uutista NHL-otteluista.

Tammikuun lopussa Helsingin Sanomat kertoi aloittaneensa ”artikkeleiden tuottamisen ohjelmallisesti”. Kokeilu alkoi jääkiekkouutisilla, jotka oli suurelta osin kirjoittanut tietokoneohjelma nimeltä Latoja.

Suomi ei varsinaisesti ole robottijournalismin edelläkävijä. Yhdysvalloissa kehitettiin varsin pätevä automatisoitu urheilutoimittaja jo vuonna 2009, ja sittemmin Narrative Science -firman robottitoimittajat ovat ottaneet haltuun muun muassa pörssitiedotteet, kiinteistökaupan ja liikenteestä raportoinnin. Yhtiön merkittävin kilpailija englanninkielisillä markkinoilla on Automated Insights, joka alkoi vuonna 2014 tuottaa AP-uutistoimistolle uutisia pörssiyhtiöiden osavuosikatsauksista. Robotti kymmenkertaisti tämäntyyppisten uutisten määrän.

Viimeistään tuolloin, vuonna 2014, robottijournalismista tuli valtavirtaa.

Sana robotti on vakiintunut metaforaksi, jota käytetään kun puhutaan automaattisesti datan pohjalta tekstiä tuottavista tietokoneohjelmista tai algoritmeista. Voitaisiin puhua vaikka automatisoiduista uutisista.

”Ei se robotti-sana siinä olekaan ongelma, vaan se journalismi”, sanoo Svenska social- och kommunalhögskolanin (Soc&kom) tutkija Carl-Gustav Lindén, joka on viettänyt pari viime vuotta perehtyen automatisoituun tekstintuotantoon.

”Eihän se ole varsinaista journalismia vaan pelkkää datan raportoimista.”

Tyypillisesti niin robotteja kehittävät firmat kuin niitä käyttävät mediatalot sanovat, etteivät robottitoimittajat vie työpaikkoja ihmistoimittajilta. Niiden tarkoitus on vapauttaa toimittajat monotonisesta liukuhihnatyöstä, jotta he voisivat keskittyä merkittävämpiin tehtäviin. Tai ainakin tämä on se optimistinen skenaario.

Pitkään on ajateltu, että suomen kieltä on vaikeampi opettaa robotille kuin vaikkapa englantia, ja että tämä hidastaisi alan kehitystä Suomessa. Lindén ei usko suomen olevan sen vaikeampaa tietokoneohjelmalle kuin englannin tai ruotsinkaan.

Ylen Voitto kirjoittaa toki aika tönkköä ja kliseistä suomea, mutta sen kieli onkin vain kahden koodarin ja yhden tuottajan laatimaa. Koko projekti syntyi kolmen hengen työryhmältä parin kuukauden sivutöinä. Siihen nähden Voitto pärjää hyvin.

”Sen käyttämät ilmaisut, kuten voittoputki ja häntäpää, ovat oikeiden urheilutoimittajien käyttämiä. Googlailin urheilujuttuja ja otin niistä lauseita”, kertoo Ylen palvelukehittäjä Oskari Blomberg.

”Lisäsimme taivutusmuodot kaikille NHL-joukkueille. Voitto osaa taivuttaa myös suomalaispelaajien sukunimet, mutta muista se puhuu vain perusmuodossa.”

Blomberg lisää, että Voitto pystyttiin toteuttamaan näin nopeasti vain siksi, että Ylen taustajärjestelmät on laitettu kuntoon jo aiemmin.

Seuraavan kerran kotimaiset uutisautomaatit joutuvat suureen testiin keväällä kuntavaalien aikaan. Sekä Yle että Helsingin Sanomat suunnittelevat käyttävänsä ohjelmiaan vaalien tulosten pikaiseen uutisointiin.

Toimitustyön kannalta roboteilla on kaksi erityisen kiinnostavaa kehityssuuntaa. Ensinnäkin ne mahdollistavat hyvin pienten erikoisyleisöjen palvelemisen. Hyperlokaalin journalismin tulevaisuus voi olla toimitusroboteissa, samoin niiden urheilulajien, joita ihmistoimittajat eivät ehdi seurata. Kun robotin työn hinta laskee sopivan alas, kannattaa palvella hyvinkin pieniä yleisöjä.

”Räätälöityjä uutisia voi tehdä jopa yhden hengen yleisöille. Mutta niiden täytyy olla alueita, joilla ei ole demokratian kannalta merkitystä, kuten vaikka sää ja liikenne. Median ei pidä luoda filtterikuplia”, Carl-Gustav Lindén sanoo.

Toinen kiinnostava mahdollisuus on tehdä roboteista eräänlaisia taustatoimittajia tai sihteereitä. Niiden ei tarvitse kirjoittaa kokonaista juttua, vaan ne voivat esimerkiksi poimia juttuaiheita tarjolle suurista datamääristä. Aamulehdellä on ollut viime kesästä lähtien käytössään botti, joka seuloo toimituksen määrittelemiä avainsanoja Tampereen kaupungin esityslistoista.

Myös Helsingin Sanomien Latoja on ainakin alkuvaiheessa enemmän apulainen kuin itsenäinen toimija. Iltavuoron urheilutoimittaja lukee Latojan tuottaman raakatekstin ja lisäilee juttuun asioita, joita kone ei huomaa.

Uutistoimisto AP:lla on meneillään projekti, jossa tutkitaan mahdollisuuksia automatisoida juttujen versiointia eri välineisiin. Ihmisiltä kuluu nimittäin tolkuttomasti aikaa, kun he tuottavat samasta jutusta eri mittaisia nettiversioita ja sitten vielä broadcast-juttuja. AP:n kunniahimoinen tavoite on tuottaa kirjoitetusta jutusta automaattisesti broadcast-versio. Tähän tarvitaan jo koneoppimista.

”Tähän asti robottien tekemät jutut ovat perustuneet oikeastaan kaikkialla tekstipohjiin, joita ohjelma täyttää. Koneoppimista niissä ei ole”, Lindén sanoo.

Koneuutiset jo tavallisia

Saksalainen AX Semantics tarjoaa automatisoitua tekstiä pian 18 kielellä. Uuden kielen oppiminen kestää muutaman viikon. Firma on juuri lisäämässä suomen kielen valikoimaansa.

Pohjoismaiden johtava robottijournalismin tuottaja on ruotsalainen MittMedia.

Norjan tietotoimiston NTB:n kone tuottaa urheilu- ja vaaliuutisia.

Espanjalainen Narrativa on valloittanut arabiankieliset markkinat.

Carl-Gustav Lindén vetää Soc&komissa automatisointihanketta, jossa on mukana useita suomalaisia mediataloja.

Aamulehden hakukone on kehitetty Soc&komin tutkimusprojektissa, jossa yhteistyökumppaneina olivat kieli- ja käännöstoimisto Lingsoft ja Journalism++ Stockholm.