Journalisten

AI-röster tar mer plats i kommersiella medier – Yle avvaktar

Kommersiella bolag använder AI-röster för ljudböcker, nyheter och väder­rapporter. På public service är fokus på stödfunktioner, verktyg och på att förbättra tillgängligheten. Samtidigt uppmanar ljudpionjären ­Reidar Wasenius journalister att licensiera sina röster och Bauer Media och STT vinner pris för sina AI-nyheter. Det händer ­mycket inom den digitala utvecklingen och AI-röster är ett hett ämne.

Vi börjar i Böle. För snart ett år sedan, strax efter midsommaren, berättade Svenska Yle att man i ett pilotprojekt på Yle Arenan börjar sända ­väder- och sjörapporten (som inkluderar vädret på kuststationerna) uppläst av en AI-genererad talsyntes. Talsyntesen var baserad på radiojournalisten Ida Rislakkis röst och namngavs ”Aida”.

”Om försöket utfaller väl fortsätter sändningarna hösten 2024 på Yle Vega”, lovade Yle då.

Pilotprojektet fick ingen fortsättning men AI-rösten Aida finns kvar. Det är den röst man i dag hör när man klickar på ”lyssna”-ikonen intill Svenska Yles webbartiklar.

”Det känns konstigt att höra sin röst och veta att det inte är jag. I princip är det en kopia av min röst men den andas inte och har inte rätt uttal på vissa ord”, säger Rislakki.

När hon blev tillfrågad att delta i utvecklingen av Svenska Yles talsyntes var hon genast positivt inställd. Beställningen var att läsa in texter som kunde användas för att utveckla en talsyntes för webben – pilotprojektet med väder- och sjörapporten på Arenan blev aktuellt i ett senare skede.

”Ursprungsbeställningen var att göra tillgängligheten bättre på vår sajt och det är jag för på ­alla sätt.”

Rislakki säger att hon själv har en ganska försiktig inställning till AI och betonar att det är viktigt att det är tydligt både för branschfolk och konsumenter när och i vilken omfattning AI används.

Yle äger inte Rislakkis röst, utan AI-rösten som bolaget utvecklat.

”Jag är mycket mer än min röst, utan min personlighet är jag bara ett eko.”


På Svenska Yle var det produktionschefen J­an-Ulrik Lindberg och redaktionschefen Mattias ­Erkkilä som jobbade med väder- och sjörapporten men också med talsyntesen Aida. Lindberg säger att pilotprojektet visade vad AI-rösten kan användas till men också när den inte fungerar.

”Det är många som hyser varma känslor för vädret och vi fick bekräftelse för att man kanske ­inte ska ersätta befintligt innehåll med en syntetisk röst, utan använda den till att skapa större tillgänglighet eller mervärde”, säger han.

Lindberg konstaterar att största delen av ­responsen handlade om att man inte ska röra väder- och sjörapporten. Själva rösten i sig fick främst positiv feedback.

Vi diskuterar Bauer Medias och STT:s AI-nyheter som i våras mottog Stora journalistpriset i kate­gorin Årets förnyare. Erkkilä säger att Svenska Yle inte har några som helst planer på att ersätta det innehåll man gör i dag med automatisk produktion.

”Det är en ickefråga på Svenska Yle just nu.”

Visst används AI på bolaget i många sammanhang, via det interna gränssnittet YleGPT, bland annat för transkribering, rubrikförslag, sammanfattningar och språkkoll.

”Men, man stöter snabbt på en massa problem: kvalitet, innehåll och etiska problem, till exempel när det gäller upphovsrätten”, ­säger Erkkilä.

Han påpekar att Yle har tydliga interna regler vid användningen av generativ AI. För publiken ska det också tydligt anges om man använt AI vid innehållsproduktion.


Reidar Wasenius är tidigare journalist, i dag vd och grundare av uppstartsföretaget Lexofon. ­Företaget säljer AI-röster baserade på kända och ­erfarna röstartisters och skådespelares röster.

Han säger att den som vill vara med i spelet och få pengar för det ska göra som han och skapa en AI-röst baserad på sin egen röst.

”Det är en möjlighet för vilken journalist som helst att positionera sig själv, i en helt egen roll och kanske ta sig an helt nya roller, till exempel som ljudboksuppläsare.”

Wasenius tes är att människan ändå hela tiden ska hållas i centrum.

”Då när något låter riktigt bra (som AI-röst) base­rar det sig på en kunnig människovarelse som gett sin talang till datorn. Det handlar om människor som bemödat sig om att träna sin röst och kultiverat den kanske i flera årtionden.”

I de fall där AI-röster låter stela, robotaktiga eller har svårt att uttrycka olika känslolägen skyller Wasenius på tekniken. Det handlar om företag som inte bemödat sig om att uppdatera sin ­programvara enligt de senaste rönen eller tränat AI-rösten tillräckligt bra.

Hur är det med att berätta om när det handlar om en AI-röst och när det inte gör det?

”Jag tycker att det inte finns någon orsak att ­berätta – det är irrelevant, undantaget om det handlar om en personlig dialog, till exempel i en kristelefon. Du ska ha rätt att veta vem som lyssnar på dina tankar.”

Men ja, handlar det om envägskommunikation, som Reidar Wasenius uttrycker det, då spelar det ingen roll. Professionella ska ändå få erkännande för sin kunskap eller sitt arbete. I framtiden tänker Wasenius att nyheter sänds med hjälp av en AI-röst, som i slutet av sändningen berättar vem som sammanställt nyheterna.

Och på tal om att bli ersatt. Inom en snar framtid kommer Wasenius röst att försvinna från VR:s tåg. Eventuellt blir den ersatt av hans egen AI-röst men upphandlingen pågår så allt är osäkert, som det ofta är med AI.

Journalisti
Yleiskatsaus