Sivistyksen voitto byrokratiasta – eurooppalainen tekoälyvallankumous
Euroopan unionin toiminta näyttäytyy toisinaan varsin mutkikkaana ja vaikeaselkoisena. EU on kuitenkin Suomellekin paras vaikutuskanava monien globaalien ilmiöiden suhteen. Tällaisia ovat valtioiden rajoista piittaamattomat ympäristöhaasteet ja kansainväliset ihmisoikeuskysymykset, mutta myös tekoälyvallankumous, josta olen aiemminkin kirjoittanut tällä palstalla. Mitä EU on tekemässä tekoälyn suhteen, ja mitä mieltä me Suomessa olemme asiasta? Pitääkö olla huolissaan?
Euroopan komissio julkaisi ensimmäisen tekoälyn koordinoidun toimintasuunnitelman vuonna 2018. Lisäksi komissio nimitti tekoälyä käsittelevän korkean tason asiantuntijaryhmän, joka laati luotettavan tekoälyn etiikka-, politiikka- ja investointisuositukset. Komission sääntelyehdotus on ensimmäinen laatuaan maailmassa ja se pyrkii edelläkävijänä viitoittamaan suuntaa globaalisti.
Viime keväänä komissio päivitti suunnitelman, antoi tiedonannon tekoälyn eurooppalaisesta lähestymistavasta sekä teki ehdotuksen Euroopan parlamentin ja neuvoston asetukseksi tekoälyn harmonisoidusta sääntelystä (Artificial Intelligence Act). Asetusehdotus pohjautuu komission viime vuonna antamaan tiedonantoon Euroopan digitaalisesta tulevaisuudesta sekä tekoälyä koskevaan valkoiseen kirjaan.
Eikä tässä vielä kaikki. Komissio julkaisi keväällä myös tiedonannon ns. digitaalisesta kompassista – 2030 digitaalinen kompassi: eurooppalainen lähestymistapa digitaalista vuosikymmentä varten. Tiedonannon pohjalta komissio antoi syksyllä ehdotuksen Euroopan parlamentin ja neuvoston päätökseksi vuoteen 2030 ulottuvan Polku digitaaliselle vuosikymmenelle -ohjelman perustamisesta.
EU:n yleinen tietosuoja-asetus (General Data Protection Regulation, GDPR) on ollut voimassa jo vuodesta 2018. Viime vuonna komissio ilmoitti suunnitelmistaan antaa Euroopan unionin datasäädös osana Euroopan unionin datastrategiaa. Komission tarkoituksena on antaa ehdotus Euroopan parlamentin ja neuvoston asetukseksi loppuvuodesta 2021.
Nyt alkaa jo hirvittää. Dokumentteja on paljon ja ne ovat uuvuttavan pitkiä ja vaikeaselkoisia. En voi väittää niitä kaikkia itsekään lukeneeni. Uhkaavaa byrokratiaepätoivoa vältellen yritän kuitenkin kosketella muutamia keskeisiä digitalisaatioon ja datafikaatioon sekä kilpailukykyyn ja turvallisuuteen liittyviä näkökohtia. Esille nostamani seikat perustuvat eduskunnan tulevaisuusvaliokunnan uunituoreeseen lausuntoon (TuVL 9/2021 vp 29.11.2021), minkä valmisteluun itsekin osallistuin asiantuntijaroolissa. Kirjoitukseni sisältää useita lainauksia lausunnosta ja edustaa siten isossa kuvassa Suomen kantaa, mutta valinnat, painotukset, kommentit ja mielipiteet ovat omiani.
Digitalisaatio
Euroopan ja samalla Suomen kilpailukyky perustuvat digitaaliselle kehitykselle, innovaatioille, tutkimukselle, osaamiselle ja toimiville sisämarkkinoille. Yleisesti Euroopan vahvuutena pidetään ihmiskeskeistä ja luottamusta korostavaa digitalisaatiokehitystä. EU:n strategisen autonomian ja kilpailukyvyn on perustuttava sen omien vahvuuksien kehittämiselle sekä reilulle kilpailulle ja maailmantalouteen osallistumiselle. Erityisesti kaksoissiirtymää eli samanaikaisesti sekä digitaalista että vihreää siirtymää edistävät innovaatiot nähdään Euroopan mahdollisuutena.
Euroopan digitaalisen sisämarkkinan tulokset ovat kuitenkin tähän saakka jääneet vähäisiksi. Perustellusti voidaan väittää, että Eurooppa on ylipäätään jäänyt jälkeen teknologian kehityksestä, kansainvälisestä liiketoiminnasta ja näihin liittyvästä arvonkehityksestä. Suurimmat viisi yhdysvaltalaista teknologiayhtiötä ovat yhtä arvokkaat kuin kaikki Lontoon pörssin, Saksan pörssin, kaikkien pohjoismaiden ja Baltian maiden pörssien listayhtiöt yhteensä. Maailman suurimpien 40 teknologiayhtiön joukossa on 21 yhdysvaltalaista, 10 kiinalaista ja 4 EU-alueen yhtiötä. Näistä yhdysvaltalaisten yhtiöiden keski-ikä on noin 40 vuotta, kiinalaisten noin 25 vuotta ja eurooppalaisten yli 100 vuotta. Sinänsä arvostettava vanha eurooppalainen yrityskulttuuri ei selvästikään ole ainakaan ratkaiseva ylivoimatekijä.
Kyvyttömyyttä synnyttää teknologiajättejä voidaan pitää Euroopan vakavana ongelmana. Euroopassa syntyy startup-yrityksiä yhtä paljon kuin Yhdysvalloissa, mutta heikommat rahoitusmahdollisuudet ja digitaalisen sisämarkkinan puuttuminen ohjaavat yritykset skaalautumaan muualla. Yrityksiä olisikin kannustettava uusien innovaatioiden ja disruptiivisten liiketoimintamallien kehittämisen lisäksi niiden skaalaamiseen Euroopassa.
Digitalisaatiolla on valtava potentiaali etenkin palveluiden parantamisessa. Eurooppalainen sähköinen identiteetti ja digitaalinen kansalaisuus ovat tärkeitä tavoitteita. Myös tekoälyavusteisen päätöksenteon vastuut ja oikeudellinen pohja tulisi määrittää. Suomella voisi olla tässä keskeinen rooli, mutta se edellyttää yksityisen ja julkisen sektorin yhteistyön parantamista. Sote-uudistus olisi mainio momentum, mutta julkisuudessa käytävä keskustelu ei nostata suuria toiveita.
Data, data, data
Laadukas ja runsas data on nykyaikaiselle koneoppimiseen perustuvalle tekoälylle välttämätöntä. Monen kehityskohteen osalta paras osaaminen on kuitenkin siirtynyt suuryrityksiin, koska niillä on resursseja kerätä ja annotoida valtavia määriä dataa. Tällöin tekoälyn kehityssuunnat määräytyvät yritysten intressien mukaan.
Facebookin kaltaisten menestyvien jättiyritysten koko liiketoiminta perustuu uudenlaiselle mallille, jossa palvelun käyttäjä ei ole yrityksen asiakas, vaan myytävä tuote. Facebookin asiakkaita ovat mainostajat, jotka ostavat käyttäjäprofiileja: tietoa, jonka yksityiset ihmiset luovuttavat yritykselle vapaaehtoisesti ja korvauksetta ”ilmaista” palvelua käyttäessään. Tesla soveltaa samankaltaista lähestymistapaa autonomisen autonsa kehitystyöhön.
Tekoälymenetelmien antamien tulosten luotettavuus palautuu vahvasti opetusdataan: määrän kasvattaminen parantaa tuloksia. Myös laadulla on väliä: esimerkkidatasta opitaan samanarvoisesti kaikki sen piirteet, ei pelkästään niitä, joita tavoitellaan. Jos ja kun esimerkiksi kielimallien opetuksessa käytetyt tekstit sisältävät syrjiviä piilomerkityksiä ja jopa epätotuuksia, nekin opitaan.
Arkaluonteisen datan käytön sääntely on erityisen tärkeätä, mutta mallien monimutkaisuuden vuoksi kontrolli on vaikeata, ja hyvää tarkoittavat teot saattavat kääntyä itseään vastaan. Google pyrkii sensuroimaan hakutuloksistaan loukkaavaksi miellettyä sisältöä ja tuottaa samalla systemaattisen vääristymän, minkä vuoksi etniset ja seksuaalivähemmistöt ovat tuloksissa aliedustettuina.
Myös pienten kielialueiden asema on otettava huomioon tekoälyn kehityksessä. Suomenkielen teknologian kehittymättömyys ja annotoidun aineiston pieni määrä on haaste, jonka voittamiseksi Turun yliopisto on tehnyt uraauurtavaa työtä. Parasta olisi, jos tekoälyn opetus voisi tapahtua globaalilla aineistolla, ja käyttö kansallisilla kielillä. Standardoitujen rajapintojen edistäminen olisi pienten (eurooppalaisten) kielten näkökulmasta tärkeätä.
Datafuusiolla, eri lähteistä saatavan datan yhdistämisellä voidaan saavuttaa merkittävää yhteiskunnallista hyötyä ja luoda kukoistavia liiketoimintaekosysteemejä. Haasteita aiheuttaa datan semanttisen yhteismitallisuuden puute, mutta myös yksityisen, julkisen ja kolmannen sektorin datan sekä omadatan jakamisen alustojen puute, lainsäädännön tulkinnanvaraisuus ja lupaprosessien raskaus. Tieteen näkökulmasta avoimella datalla ja ohjelmistolla on tässä keskeinen rooli, mutta avointa dataa olisi mahdollisuuksien mukaan voitava käyttää myös muihin kuin pelkästään tutkimuksellisiin tarkoituksiin, yksityisyyden suoja huomioon ottaen.
Komissio esittää yrityksiä velvoittavaa datan jakamista kansalaisia paremmin palvelevien ratkaisuiden ja yhteiskunnallisesti merkittävien ongelmien ratkaisemiseksi. Kyseinen sääntelytehtävä ei ole helppo, mutta ainakin julkisin varoin tuotetun datan tulisi olla julkista ja rajoituksitta hyödynnettävissä eri palveluissa, ellei ole jotakin esimerkiksi yksityisyyden suojaan liittyvää syytä olla julkaisematta dataa. Vastaava säännöstö on ollut jo kauan voimassa Yhdysvalloissa, jossa liittovaltion rahoituksella julkaistut aineistot ovat olleet vapaasti käytettävissä mihin tahansa tarkoitukseen. Tällä on ollut suuri merkitys paitsi tieteelliselle tutkimukselle, myös erilaisten digitaalisten palvelujen kehitykselle.
Datan keskittämisen sijaan kannattaa pohtia datan hajauttamista tietosuojariskien pienentämiseksi. Vaihtoehtona nykyisille keskitetyille pilvipalveluille on kehittymässä uusi ns. reuna– tai sumulaskennan paradigma, jossa datan paikallinen käsittely korostuu. Toisin kuin pilvessä, sumussa laskeminen tuodaan lähelle dataa tuottavia ja käyttäviä laitteita, ja vain olennainen tieto välitetään pilveen. Hajautettua tekoälyä hyödyntäen esimerkiksi terveystietoja ei tarvitse luovuttaa ulkopuolisille, vaan käyttäjälle voidaan järjestää pääsy tarvitsemaansa dataan turvallisesti suojatussa ympäristössä.
Tekoälyn uhat
Mediaa seuratessa muodostuu helposti kuva, että itsenäisesti päätöksiä tekevä tekoäly on jo keskuudessamme tuottaen tieteellisiä ja kaupallisia läpimurtoja, ja on vain ajan kysymys, milloin kone kehittyy ihmistä älykkäämmäksi ja itsestään tietoisena kaappaa vallan. Vaikka tällainen singulariteetti ei olekaan mahdoton, tekoälyn kehityksen suurin yhteiskunnallinen uhka ovat heikkolaatuista dataa käyttävät ja huonosti suunnitellut tekoälyjärjestelmät, joiden innokkaat käyttäjät eivät ymmärrä niiden toimintaa. Tällaisessa villissä lännessä kenelläkään ei ole kontrollia, vaan syntyy otollinen maaperä mitä mielikuvituksellisimmille huijareille.
Tekoälyjen opetusaineistoihin liittyy useita turvallisuusuhkia. Aineistoja manipuloimalla järjestelmän kehittäjä tai ulkopuolinen hyökkääjä voi rakentaa järjestelmään hyvin vaikeasti havaittavissa olevan takaoven, joka saa järjestelmän toimimaan valituissa tilanteissa halutulla tavalla. Esimerkiksi hakemusten käsittelyn järjestelmä voidaan manipuloida hyväksymään tai hylkäämään hakemukset, joissa on tietty harmittomalta vaikuttava avainsana tai muu piirre. Jos opetusaineistot sisältävät arkaluontoisia tietoja, saattaa niiden paljastuminen valmiista järjestelmästä osoittautua ongelmaksi, johon perinteiset salausmenetelmät eivät pure.
Eettiset kysymykset ja intressiristiriidat jakavat tekoälysovellusten käyttäjäryhmiä. Milloin yksilön etu voidaan asettaa yhteisen edun edelle, ja päin vastoin? Perustuuko yhteiskunnan vastuu yksilöstä vastavuoroisuuteen vai onko se pyyteetöntä? Olemme saaneet kokemuksia voimakkaasta yhteiskunnallisesta jännitteestä nyt pandemia-aikana rokotettujen ja rokottamattomien välisten intressiristiriitojen muodossa. Perusoikeudet ja velvollisuudet sekä yhteiskunnan turvallisuus voivat asettua monin tavoin vastakkain. Arvojen yhteensovittamista helpottaa se, että useinkaan kyseessä ei ole dikotominen ominaisuus, vaan teknologisin keinoin eri vaikutusten tasapainoa ja myös kustannuksia voidaan säätää.
Eräs yhteiskunnallinen uhkakuva liittyy tekoälyjärjestelmätoimittajien kasvavaan taloudellis-poliittiseen valtaan. Globaalien alustojen toimittajat uhkaavat monopolisoida sovellusten tuottamat taloudelliset hyödyt ja muodostaa merkittäviä ylikansallisia yhteiskunnallisia toimijoita valtioiden rinnalle. Digitaalisten palvelujen yhdentyminen mahdollistaa yksilön toiminnasta kertovan datan yhdistelyn, minkä avulla voidaan vaikuttaa ihmisten käyttäytymiseen, yritysten toimintaan ja yhteiskunnalliseen päätöksentekoon. Tällaisesta on jo nähty esimerkkejä Yhdysvaltain presidentinvaaleissa sekä Britannian brexit-äänestyksessä.
Vuorovaikutteinen, tekoluova tukiäly tuottaa sisältöä yhä automaattisemmin, mikä parantaa mahdollisuuksien tasa-arvoa, mutta luo valitettavasti tilaisuuksia myös haitalliselle informaatiovaikuttamiselle. Yritysten ja valtioiden lisäksi myös yksityiset ihmiset alkavat käyttää tekoälyä vaikeasti ennakoitavin tavoin. Tarve sisäisten ja ulkoisten turvallisuusriskien ennakoinnille, uudenlaiselle sääntelylle sekä kyber- ja informaatiopuolustukselle kasvaa. Käyttäjien ymmärrys sisällön alkuperästä ja oikeellisuudesta muodostuu keskeiseksi kysymykseksi. Yhteiskunnan resilienssi riippuukin yhä enemmän kansalaisten yleisestä tieto- ja taitotasosta, yhteisöllisyyden tunteesta ja puolustustahdosta.
Toimenpiteet kilpailukyvyn parantamiseksi
Julkisuudessa on kannettu huolta Euroopan kilpailukyvystä tekoälykehityksessä. Eurooppalaisten yritysten on vaikeaa saada jalansijaa kuluttajadataa hyödyntävillä markkinoilla, koska määräävät kansainväliset yhtiöt ovat kasvaneet liian suuriksi eikä Eurooppa ole kyennyt estämään datan kulkeutumista niille. Samaan aikaan kriitikkojen mielestä tiukka datalainsäädäntö on haitannut eurooppalaisten toimijoiden kehitystä.
Yleinen näkemys Euroopan kilpailukyvystä perustuu kuitenkin nimenomaan kulttuurisille vahvuuksillemme vastuullisen ja eettisen tekoälyn kehittäjänä. Vastuullisessa markkinataloudessa ajatellaan kuluttajan valitsevan lopulta luotettavimmaksi ja kestävimmäksi koetun palvelun. Yhdysvaltain valitsema yritysten toimintaedellytyksiä korostava vähäisemmän sääntelyn tie ja Kiinan suoraviivainen keskusjohtoinen politiikka ovat tässä suhteessa toisenlaisia. Niillä molemmilla on vahvuutensa, ja nähtäväksi jää, kuka veikkaa oikeaa hevosta.
Eettisyyttä ja vastuullisuutta korostavassa katsannossa kilpailukyvyn edistämiseksi on kehitettävä teknologisten ratkaisujen yhteensopivuutta edistäviä standardeja ja avoimia rajapintoja. Tekoälyä ei pidä yrittää lainsäädännössä määritellä eikä vaatimuksia tule asettaa käytettävälle teknologialle, vaan käytetyn datan laadulle ja eettisesti hyväksyttävälle, kestävän kehityksen mukaiselle käyttötarkoitukselle. Kilpailukykyä rakentaisi myös tekoälyn määrätietoinen ja strategisesti johdettu hyödyntäminen julkisella sektorilla terveydenhuollosta maanpuolustukseen. (Sotilaallisiin tarkoituksiin kehitettävä tai käytettävä tekoäly rajataan komission ehdotuksessa sääntelyn ulkopuolelle, mikä saattaa johtaa tulkintahaasteisiin.)
Korkea osaaminen on kenties kaikkein keskeisin kilpailukyvyn tae. Tarvitaan merkittäviä panostuksia sekä huippututkimukseen ja -koulutukseen että laajaan yleissivistykseen. Yhteiskunnallisesti kestävä tekoäly ei vaadi vain erikoistuneita asiantuntijoita ja tutkijoita, vaan myös huomattavan laajaa datan merkitykseen ja tekoälyn käyttöön liittyvää ymmärrystä niin kansalaisten kuin päätöksentekijöidenkin keskuudessa. Lainsäädännöllä ja viranomaisilla tulee olla mahdollistava ja turvaava rooli, ei estävä.
Uuden teknillisen kehityksen kulttuurin luominen vaatii organisaatioilta paljon. Moniosaavat ryhmät ovat tärkeitä sekä tekoälyä suunniteltaessa että hankintoja tehtäessä. Suunnitteluosaaminen edellyttää datatieteen menetelmien ohella tietoturvan hallintaa jo kehitystyön alkuvaiheessa, sillä sitä ei voi lisätä jälkikäteen. Kehitettävän tai hankittavan järjestelmän sisällöllinen kelpoisuus tulee varmistaa riittävän laajalla monitieteisellä osaamisella.
Järjestelmän käyttäjien ja muiden keskeisten sidosryhmien näkökulmat tulee integroida suunnitteluprosessiin alusta alkaen. Myös organisaation johdolta vaaditaan ymmärrystä tekoälyn mahdollisuuksista ja rajoituksista: kun aiemmin ihmisen älykkyyttä vaatineita työtehtäviä korvataan teknisillä järjestelmillä, tulee organisaation toiminnan muuttumista katsoa kokonaisuutena. Työntekijät johtoa myöden on koulutettava uusiin toimintamalleihin.
Rohkeasti kohti utopiaa!
Tekoälyvallankumouksen tavoitteeksi pitää asettaa utopia, ei dystopia. Vaihtoehtoisia tulevaisuuksia kohtaan ei ole syytä lietsoa pelkoa eikä rakentaa vastakkainasetteluja. Robotit eivät vie työpaikkojamme, vaan muuttavat työmme (mielenkiintoisemmaksi); teknologia ei tuhoa ympäristöämme ja terveyttämme (enää), vaan pelastaa meidät. Tekoäly ei korvaa ihmistä; ihminen ja älykäs kone yhdessä ovat voittava yhdistelmä. Yhteiskunta, joka nopeimmin ja laajimmin omaksuu tämän periaatteen, selviää voittajana. Ja jos ja kun – kuten tutkimus kertoo – tekoälyn avulla todella saadaan merkittävästi edistettyä suurinta osaa kestävän kehityksen tavoitteista, olemme kaikki voittajia.
Kirjoittaja on matemaattis-luonnontieteellisen tiedekunnan dekaani, tekoälytutkija ja opettaja sekä monialaisen sivistysyliopiston vankkumaton kannattaja.