Journalismi

Toimittajien tiedonhakutaidoissa on puutteita. Nyt meidän pitäisi oppia ohittamaan tekoälyn tyrkyttämät vastaukset, kirjoittaa Johanna Vehkoo.

Kaikkihan googlettaa osaavat, eikö niin? Toimittajat käyttävät maailman suosituinta hakukonetta tiedonhakuun joka päivä, mutta valtaosa ei käytä Googlen hakuoperaattoreita, joilla hakuja voi merkittävästi ­syventää, rajata ja tarkentaa.

Olen noin 12 vuoden ajan kouluttanut toimittajia tiedonhaun, faktantarkistuksen ja tiedon verifioinnin taidoissa. Hakuoperaattorit ovat näissä työpajoissa useimmille uutta tietoa. Jotkut taas tietävät kyllä niiden olemassaolosta, mutta käyttö jää vähäiseksi.

Jos on tehnyt hakuja kirjastojen hakujärjestelmissä, voi helposti ymmärtää, mihin hakuoperaattorit perustuvat. Googlen operaat­torit ovat osin erilaisia, mutta perustuvat samaan Boolen logiikkaan: ne ohjeistavat hakukonetta rajaamaan hakua tietyllä tavalla.

Esimerkiksi operaattorilla site: voi käskeä Googlea hakemaan vain tietyltä sivustolta. Miinusmerkillä voidaan jättää joitakin sanoja hausta pois, lainausmerkit pakottavat hakemaan sanoja tietyssä järjestyksessä, ja niin edelleen.

Monessa tapauksessa hakija pääsee toivomiensa lähteiden ­äärelle toki laittamalla sanoja peräkkäin hakukenttään. Käyttäjän kannattaa kuitenkin olla tietoinen siitä, että hakutuloksiin vaikuttavat monet asiat: oma hakuhistoria, kieli, sijainti sekä materiaalin tuoreus ja se, kuinka suositusta aineistosta on kyse.

Google profiloi käyttäjiään, ja hakutulokset vaihtelevat käyttäjän mukaan. Hakuoperaattoreita käyttämällä voi väistää tulosten personointia ja saada tarkempia osumia.

Tiedonhaun ammattilaiselle on aina parempi saada muutama tarkka osuma kuin miljoonia Google-tuloksia.


Nyt toimittajat tarvitsevat myös kykyä ohittaa tekoälyn tyrkyttämät vastaukset. Google ja sen kilpailijat kisaavat parhaillaan siitä, mikä niistä saa nopeimmin integroitua tekoälyn hakutuloksiinsa.

Tämä tarkoittaa sitä, että hakukoneet pyrkivät jatkossa tarjoamaan kysymyksiin yhden generatiivisen tekoälyn muotoileman vastauksen, johon tiedon etsijä tyytyy sen sijaan, että kahlaisi ­läpi lukuisia verkkosivuja. Toki Google huomauttaa, että tekoäly voi hallusinoida eli keksiä asioita tyhjästä. Väitän, että ­varoituksista huolimatta valtaosa käyttäjistä hyväksyy tekoälyvastauksen sitä kummemmin tarkistelematta.

Tutkimuksista tiedetään, että suurin osa on tähänkin asti klikannut vain ensimmäistä Googlen tarjoamaa linkkiä. Ani harva viitsii mennä hakutulosten ensimmäistä sivua pidemmälle.

Suuret kielimallit on ohjelmoitu kuulostamaan vakuuttavilta. Miksi käyttäjä ei uskoisi, kun maailman luotetuin hakukone tarjoaa ensimmäiseksi tulokseksi tekoälyn generoimaa, uskottavalta vaikuttavaa tiivistelmää?


Lokakuussa Google toi AI Overviews -toiminnon yli sataan uuteen maahan kokeiltuaan sitä ensin Yhdysvalloissa. Suomi ei ole vielä mukana.

Kun AI Overviews lanseerattiin Yhdysvalloissa, joistakin sen vastauksista tuli viraalihittejä, mutta ei Googlea mairittelevassa mielessä. Tekoäly esimerkiksi neuvoi laittamaan liimaa pitsaan, jotta juusto pysyisi paremmin kiinni. Kävi ilmi, että tekoälyn käyttämä lähde oli nimimerkki fucksmith vuosikymmenen takaisessa Reddit-keskustelussa. Googlen tekoäly myös kehotti syömään kiviä, lähteenään perinteikäs satiirinen verkkojulkaisu The Onion.

AI Overviews -toimintoa ei voi Googlen mukaan kytkeä pois päältä, mutta haun tehtyään käyttäjä voi käskeä Googlea näyttämään vain verkkosivujen linkkejä.

Samoihin aikoihin Open AI lisäsi ChatGPT-malliinsa mahdollisuuden etsiä tietoa reaaliaikaisesti verkosta.

Siis: maailman tunnetuin hakukone haluaa olla enemmän kuin tekoälybotti, ja maailman tunnetuin tekoälybotti haluaa olla enemmän kuin hakukone.


Journalistien on erityisen tärkeää ymmärtää, miksi ­generatiivista tekoälyä ei tule käyttää hakukoneena. Suuret kielimallit, kuten ChatGPT tai Googlen Gemini, eivät tiedä, mikä on fakta.

Generatiivinen tekoäly ennustaa seuraavaa todennäköisintä sanaa tai lausetta. Se antaa vastauksen, joka kuulostaa ­uskottavalta, mutta perustuu kielelliseen todennäköisyyteen. Siksi ne ovat eräänlaisia puppugeneraattoreita, jotka voivat osua oikeaan tai sitten eivät.

Monista tekoälytyökaluista on hyötyäkin toimittajille, mutta faktantarkistus jää aina ihmisen vastuulle.

Generatiivisesta tekoälystä on tullut uusi tiedontuotannon ­muoto, jonka ytimessä ei ole pyrkimys faktuaalisuuteen. Ihmiset käyttävät suuria kielimalleja hakukoneina, vaikka ne eivät sellaisia ole.

Ajattelen, että varsinaiset hakukoneet, Google ja Bing etunenässä, voimistavat tätä väärinkäsitystä lisäämällä tekoälyvastauksia hakutulosten kärkeen.

Monet tutkijat ovat huolissaan tulevaisuuden skenaariosta, jota kutsutaan nimellä ”kuollut internet”. Tällä tarkoitetaan tilannetta, jossa suurten kielimallien tulevia versioita koulutetaan vanhempien versioiden tuottamilla tekoälysisällöillä. Näin internet täyttyy merkityksettömästä tauhkasta. Luotettavaa, kriittistä ja tutkittua tietoa on silloin entistä vaikeampi löytää.

Edistyneistä tiedon hakemisen ja verifioinnin taidoista tulee toimittajille yhä tärkeämpiä. Tämä asettaa vaatimuksia ammattitaidon päivittämiselle.

Internetin ansiosta myös yleisöllä on pääsy moninaisille tiedonlähteille. Joku kyllä huomaa, jos toimittaja ei ole osannut hakea ja varmentaa tietoa. Meidän pitäisi tiedontuotannon ammattilaisina olla keskivertogooglettajaa parempia tiedonhaussa, verifioinnissa ja faktojen tarkistamisessa.

Vain sellaisesta journalismista kannattaa maksaa, joka tarjoaa jotakin parempaa kuin sen, mitä kuka tahansa voi ohimennen googletella.


Hakuoperaattoreiden haltuunotto on vain yksi palanen tiedonhaun ja verifioinnin taitojen kohentamisessa. Se on kuitenkin helposti omaksuttavissa, samoin kuin vaikkapa käänteinen kuvahaku. Uusien työkalujen harjoitteleminen on tärkeää, mutta kaikkein olennaisinta on oman kriittisen ajattelun vaaliminen. Siihen kuuluu myös omien ennakko-oletusten ja oman maailmankuvan haastaminen.

Journalistin pitää virittää hälytyskellot soimaan aina, kun vastaan tulee harhaanjohtavaa tietoa. Jatkossa sitä tapahtuu entistä useammin. Ihmiskunta tuottaa kasvavan määrän informaatiota joka ikinen päivä, ja on väistämätöntä, että osa tästä on mis- tai disinformaatiota. Toimittajat eivät pääse karkuun väärän tiedon ongelmaa, ja siksi meidän täytyy tulla paremmiksi tiedon hakijoiksi ja faktantarkistajiksi.