Journalismi

Koneellinen uutisnenä haistelee poikkeuksia

Helsingin yliopistolla kehitetty “uutisrobotin” prototyyppi selvittää faktat ja panee ne tärkeysjärjestykseen.

Helsingin yliopistolla kehitetty uutisrobotti Valtteri kirjoitti vuodentakaisista kuntavaaleista hieman yli 750 000 uutisjuttua. Viime vuoden lopulla lukijapaneeli vertaili sokkotestissä Valtterin uutisia kahden toimittajan kirjoittamiin uutisiin.

Valtterin jutut saivat lukijoilta selvästi huonommat arvosanat kuin toimittajien kirjoittamat, mutta silti lukijat pitivät niitä vähintäänkin tyydyttävinä.

Jos haluat kokeilla sokkotestiä itse, löydät esimerkkijutut täältä. Sokkotestin vastaus on tämän jutun lopussa.

Hankkeessa mukana olevat mediatalot ovat kiinnostuneita kokeilemaan uutisrobottia käytännön toimitustyössä. Mikäli Valtterista tulee työkaveri, voi olla kiinnostavaa tietää, miten sen uutisnenä on rakentunut.

Valtterin vaaliuutisten pohjana on sama oikeusministeriön vaalitulosdata, jonka päivittymistä toimittajat vaali-iltoina odottavat. Näiden 311 kunnan 2012 äänestysalueen ja 3 3 316 ehdokkaan tuloksista Valtteri koosti miljoonia erilaisia tosiasiaväitteitä. Ne olivat sellaisia kuin ”kokoomus sai 25 valtuustopaikkaa Helsingissä” tai ”Katri Kulmuni sai 7,9 prosenttia äänistä Torniossa”.

Jokaiselle näistä laskettiin uutisarvo. Siihen vaikuttivat asian poikkeuksellisuus, sen yleinen kiinnostavuus ja yksilöllinen kiinnostavuus lukijalle. Esimerkiksi äänisaaliin poikkeuksellisuus voidaan arvioida suoraan laskemalla.

Yleinen kiinnostavuus määrittyy Valtterin algoritmeissa useiden ihmisten tekemien valintojen pohjalta. Valtterille esimerkiksi koko kunnan tulokset ovat kiinnostavampia kuin yksittäisen äänestysalueen.

Samoin puolueiden äänisaaliit ovat kiinnostavampia kuin yksittäisen ehdokkaan. Näin vain todelliset ääniharavat ylsivät yksilöinä Valtterin juttujen otsikkoihin.

Yksityistä kiinnostavuutta taas olisi mahdollista käyttää apuna esimerkiksi painottamaan lukijan kotikuntaa koskevat faktat uutisarvoisemmiksi kuin kaukaisemmat asiat.

Kun laskutoimitukset on tehty, Valtteri aloittaa kirjoittamisen. Se panee tärkeimmäksi arvostamansa faktan jutun kärkeen ja lataa samaan kappaleeseen seuraavaksi uutisarvoisimmat faktat samasta aihepiiristä.

Kun enintään kuusi tärkeintä faktaa on listattu, aloittaa se uuden kappaleen seuraavaksi tärkeimmästä aiheesta ja niin edelleen, kunnes määritelty juttupituus on saavutettu.


Vastaus: Esimerkkijutuista juttu 1 on mediarobotin kirjoittama, ja juttu 2 toimittajan käsialaa. 

Valtteri-uutisrobotti on kehitetty Immersive Automation -tutkimushankkeessa

Hanke on VTT:n, Helsingin yliopiston ja Social- och kommunalhögskolanin yhteinen. Mediataloista siinä ovat mukana Alma, Kaleva, KeskiPohjanmaa, KSF Media ja Sanoma. Päärahoittajana hankkeessa on Tekes eli nykyiseltä nimeltään BusinessFinland.

VTT testasi Valtterin kirjoittamia vaaliuutisia antamalla lukijapaneelin arvioida niitä rinnakkain ammattitoimittajien samasta aineistosta kirjoittamien uutisten kanssa.

Ihmisten kirjoittamat uutiset saivat joka suhteessa paremmat arvosanat, mutta myös Valtteri pärjäsi kohtalaisesti, mikä lisäsi mediatalojen kiinnostusta sen jatkokehittelyyn.

Robotin ja toimittajan työn jälkeen voit tutustua täältä.