Mikko Kurimo: Puheentunnistus tuo tekoälyn reaalimaailmaan
Tulevaisuudessa tekoäly ratkoo yhä vaikeampia ongelmia esimerkiksi lääkkeiden ja käyttöliittymien suunnittelussa.
Suomen kieli voi olla asiakaspalveluautomaateille ja ääniohjatuille sovelluksille kova pala.
”Puhuttu suomen kieli poikkeaa paljon kirjoitetusta kielestä. Sanat ovat erilaisia ja niitä lyhennellään ja yhdistellään paljon. Sen hallitsemiseen vaaditaan sekä suuria puhekielisiä opetusaineistoja että uusia monikerroksisia algoritmeja”, sanoo Aalto-yliopiston puheen- ja kielenkäsittelyn professori Mikko Kurimo.
Tulevaisuuden tekniikka ymmärtää kuitenkin paremmin myös suomenkielistä puhetta.
Puheentunnistus on jo vuosikymmeniä ollut tärkeä tekoälymenetelmien koealusta. Prosessin eri vaiheissa sovelletaan syviä neuroverkkoja. Ne ovat koneoppimismalleja, jotka koostuvat eräänlaisista kerroksittain kootuista, toistensa kanssa kommunikoivista laskureista.
”Puheentunnistus on yksi niistä teknologian sovelluksista, jotka ovat tuoneet tekoälyn reaalimaailmaan”, Kurimo sanoo.
Kieliteknologiaa kehittävät suomalaisyritykset hyödyntävät jo nyt Aallon tutkimusta niin puheella toimivissa asiakaspalveluroboteissa, televisio-ohjelmien tekstittämisessä kuin terveydenhuollon puheentunnistusratkaisuissa.
Puheentunnistuksen tutkiminen suomen, suomenruotsin ja pohjoissaamen kaltaisilla pienillä kielillä on Kurimon mukaan tärkeää siksi, että maailman teknojätit panostavat etupäässä englantiin ja muihin suuriin kieliin.
”Kukaan ei puolestamme kehitä meidän kieliimme parhaiten sopivia algoritmeja ja teknologioita, joten meidän täytyy tehdä se itse”, Kurimo sanoo.
Aalto-yliopiston tietojenkäsittelytieteen professori ja Suomen tekoälykeskuksen (FCAI) johtaja Samuel Kaski lisää, että pienten kielten tutkimus voi tuottaa yleispäteviä puheentunnistuksen malleja, jotka taipuisivat muillekin maailman pienille kielille.
”Tässä suomi hyvinvoivana pienenä kielenä on hyvä tutkimuskohde”, Kaski sanoo.
Huippututkimusta arvostava ympäristö
FCAI painottaa etenkin tilastomatematiikkaa ja tietojenkäsittelytiedettä yhdistävään koneoppimiseen perustuvien älykkäiden apuvälineiden kehittämistä. Sovellusalueita ihmistä auttavalle tekoälylle löytyy esimerkiksi koneiden, käyttöliittymien tai vaikkapa lääkemolekyylien suunnittelusta.
Tärkeä tutkimuskohde on myös koneoppimisen yhdistäminen data-analyysiin siten, ettei lähdeaineistosta voida tunnistaa yksilöityjä henkilötietoja.
”Näin esimerkiksi sairaaloiden dataa olisi mahdollista käyttää lääketieteelliseen tutkimukseen uhraamatta yksityisyydensuojaa”, Kaski sanoo.
FCAI toimii osana tekoälytutkimuksen tutkimuskeskittymien ELLIS-verkostoa, joka pyrkii parantamaan tekoälytutkimuksen toimintamahdollisuuksia Euroopassa. Kaski muistuttaa, että kansallisen kilpailukyvyn nimissä myös Suomen kannattaa pysyä kiinnostavana tutkimusympäristönä tekoälyn osaajille.
"Meidän pitää luoda huippututkimusta arvostava ympäristö. Siitä saadaan maailman mittakaavassa johtava sillä, että verkotetaan huippututkijat keskenään.”
Teksti: Panu Räty