Sivistyksen voitto byrokratiasta – eurooppalainen tekoälyvallankumous

7.12.2021 Tapio Salakoski

Euroopan unionin toiminta näyttäytyy toisinaan varsin mutkikkaana ja vaikeaselkoisena. EU on kuitenkin Suomellekin paras vaikutuskanava monien globaalien ilmiöiden suhteen. Tällaisia ovat valtioiden rajoista piittaamattomat ympäristöhaasteet ja kansainväliset ihmisoikeuskysymykset, mutta myös tekoälyvallankumous, josta olen aiemminkin kirjoittanut tällä palstalla. Mitä EU on tekemässä tekoälyn suhteen, ja mitä mieltä me Suomessa olemme asiasta? Pitääkö olla huolissaan?

Euroopan komissio julkaisi ensimmäisen tekoälyn koordinoidun toimintasuunnitelman vuonna 2018. Lisäksi komissio nimitti tekoälyä käsittelevän korkean tason asiantuntijaryhmän, joka laati luotettavan tekoälyn etiikka-, politiikka- ja investointisuositukset. Komission sääntelyehdotus on ensimmäinen laatuaan maailmassa ja se pyrkii edelläkävijänä viitoittamaan suuntaa globaalisti.

Viime keväänä komissio päivitti suunnitelman, antoi tiedonannon tekoälyn eurooppalaisesta lähestymistavasta sekä teki ehdotuksen Euroopan parlamentin ja neuvoston asetukseksi tekoälyn harmonisoidusta sääntelystä (Artificial Intelligence Act). Asetusehdotus pohjautuu komission viime vuonna antamaan tiedonantoon Euroopan digitaalisesta tulevaisuudesta sekä tekoälyä koskevaan valkoiseen kirjaan.

Eikä tässä vielä kaikki. Komissio julkaisi keväällä myös tiedonannon ns. digitaalisesta kompassista – 2030 digitaalinen kompassi: eurooppalainen lähestymistapa digitaalista vuosikymmentä varten. Tiedonannon pohjalta komissio antoi syksyllä ehdotuksen Euroopan parlamentin ja neuvoston päätökseksi vuoteen 2030 ulottuvan Polku digitaaliselle vuosikymmenelle -ohjelman perustamisesta.

EU:n yleinen tietosuoja-asetus (General Data Protection Regulation, GDPR) on ollut voimassa jo vuodesta 2018. Viime vuonna komissio ilmoitti suunnitelmistaan antaa Euroopan unionin datasäädös osana Euroopan unionin datastrategiaa. Komission tarkoituksena on antaa ehdotus Euroopan parlamentin ja neuvoston asetukseksi loppuvuodesta 2021.

Nyt alkaa jo hirvittää. Dokumentteja on paljon ja ne ovat uuvuttavan pitkiä ja vaikeaselkoisia. En voi väittää niitä kaikkia itsekään lukeneeni. Uhkaavaa byrokratiaepätoivoa vältellen yritän kuitenkin kosketella muutamia keskeisiä digitalisaatioon ja datafikaatioon sekä kilpailukykyyn ja turvallisuuteen liittyviä näkökohtia. Esille nostamani seikat perustuvat eduskunnan tulevaisuusvaliokunnan uunituoreeseen lausuntoon (TuVL 9/2021 vp 29.11.2021), minkä valmisteluun itsekin osallistuin asiantuntijaroolissa. Kirjoitukseni sisältää useita lainauksia lausunnosta ja edustaa siten isossa kuvassa Suomen kantaa, mutta valinnat, painotukset, kommentit ja mielipiteet ovat omiani.

Digitalisaatio

Euroopan ja samalla Suomen kilpailukyky perustuvat digitaaliselle kehitykselle, innovaatioille, tutkimukselle, osaamiselle ja toimiville sisämarkkinoille. Yleisesti Euroopan vahvuutena pidetään ihmiskeskeistä ja luottamusta korostavaa digitalisaatiokehitystä. EU:n strategisen autonomian ja kilpailukyvyn on perustuttava sen omien vahvuuksien kehittämiselle sekä reilulle kilpailulle ja maailmantalouteen osallistumiselle. Erityisesti kaksoissiirtymää eli samanaikaisesti sekä digitaalista että vihreää siirtymää edistävät innovaatiot nähdään Euroopan mahdollisuutena.

Euroopan digitaalisen sisämarkkinan tulokset ovat kuitenkin tähän saakka jääneet vähäisiksi. Perustellusti voidaan väittää, että Eurooppa on ylipäätään jäänyt jälkeen teknologian kehityksestä, kansainvälisestä liiketoiminnasta ja näihin liittyvästä arvonkehityksestä. Suurimmat viisi yhdysvaltalaista teknologiayhtiötä ovat yhtä arvokkaat kuin kaikki Lontoon pörssin, Saksan pörssin, kaikkien pohjoismaiden ja Baltian maiden pörssien listayhtiöt yhteensä. Maailman suurimpien 40 teknologiayhtiön joukossa on 21 yhdysvaltalaista, 10 kiinalaista ja 4 EU-alueen yhtiötä. Näistä yhdysvaltalaisten yhtiöiden keski-ikä on noin 40 vuotta, kiinalaisten noin 25 vuotta ja eurooppalaisten yli 100 vuotta. Sinänsä arvostettava vanha eurooppalainen yrityskulttuuri ei selvästikään ole ainakaan ratkaiseva ylivoimatekijä.

Kyvyttömyyttä synnyttää teknologiajättejä voidaan pitää Euroopan vakavana ongelmana. Euroopassa syntyy startup-yrityksiä yhtä paljon kuin Yhdysvalloissa, mutta heikommat rahoitusmahdollisuudet ja digitaalisen sisämarkkinan puuttuminen ohjaavat yritykset skaalautumaan muualla. Yrityksiä olisikin kannustettava uusien innovaatioiden ja disruptiivisten liiketoimintamallien kehittämisen lisäksi niiden skaalaamiseen Euroopassa.

Digitalisaatiolla on valtava potentiaali etenkin palveluiden parantamisessa. Eurooppalainen sähköinen identiteetti ja digitaalinen kansalaisuus ovat tärkeitä tavoitteita. Myös tekoälyavusteisen päätöksenteon vastuut ja oikeudellinen pohja tulisi määrittää. Suomella voisi olla tässä keskeinen rooli, mutta se edellyttää yksityisen ja julkisen sektorin yhteistyön parantamista. Sote-uudistus olisi mainio momentum, mutta julkisuudessa käytävä keskustelu ei nostata suuria toiveita.

Data, data, data

Laadukas ja runsas data on nykyaikaiselle koneoppimiseen perustuvalle tekoälylle välttämätöntä. Monen kehityskohteen osalta paras osaaminen on kuitenkin siirtynyt suuryrityksiin, koska niillä on resursseja kerätä ja annotoida valtavia määriä dataa. Tällöin tekoälyn kehityssuunnat määräytyvät yritysten intressien mukaan.

Facebookin kaltaisten menestyvien jättiyritysten koko liiketoiminta perustuu uudenlaiselle mallille, jossa palvelun käyttäjä ei ole yrityksen asiakas, vaan myytävä tuote. Facebookin asiakkaita ovat mainostajat, jotka ostavat käyttäjäprofiileja: tietoa, jonka yksityiset ihmiset luovuttavat yritykselle vapaaehtoisesti ja korvauksetta ”ilmaista” palvelua käyttäessään. Tesla soveltaa samankaltaista lähestymistapaa autonomisen autonsa kehitystyöhön.

Tekoälymenetelmien antamien tulosten luotettavuus palautuu vahvasti opetusdataan: määrän kasvattaminen parantaa tuloksia. Myös laadulla on väliä: esimerkkidatasta opitaan samanarvoisesti kaikki sen piirteet, ei pelkästään niitä, joita tavoitellaan. Jos ja kun esimerkiksi kielimallien opetuksessa käytetyt tekstit sisältävät syrjiviä piilomerkityksiä ja jopa epätotuuksia, nekin opitaan.

Arkaluonteisen datan käytön sääntely on erityisen tärkeätä, mutta mallien monimutkaisuuden vuoksi kontrolli on vaikeata, ja hyvää tarkoittavat teot saattavat kääntyä itseään vastaan. Google pyrkii sensuroimaan hakutuloksistaan loukkaavaksi miellettyä sisältöä ja tuottaa samalla systemaattisen vääristymän, minkä vuoksi etniset ja seksuaalivähemmistöt ovat tuloksissa aliedustettuina.

Myös pienten kielialueiden asema on otettava huomioon tekoälyn kehityksessä. Suomenkielen teknologian kehittymättömyys ja annotoidun aineiston pieni määrä on haaste, jonka voittamiseksi Turun yliopisto on tehnyt uraauurtavaa työtä. Parasta olisi, jos tekoälyn opetus voisi tapahtua globaalilla aineistolla, ja käyttö kansallisilla kielillä. Standardoitujen rajapintojen edistäminen olisi pienten (eurooppalaisten) kielten näkökulmasta tärkeätä.

Datafuusiolla, eri lähteistä saatavan datan yhdistämisellä voidaan saavuttaa merkittävää yhteiskunnallista hyötyä ja luoda kukoistavia liiketoimintaekosysteemejä. Haasteita aiheuttaa datan semanttisen yhteismitallisuuden puute, mutta myös yksityisen, julkisen ja kolmannen sektorin datan sekä omadatan jakamisen alustojen puute, lainsäädännön tulkinnanvaraisuus ja lupaprosessien raskaus. Tieteen näkökulmasta avoimella datalla ja ohjelmistolla on tässä keskeinen rooli, mutta avointa dataa olisi mahdollisuuksien mukaan voitava käyttää myös muihin kuin pelkästään tutkimuksellisiin tarkoituksiin, yksityisyyden suoja huomioon ottaen.

Komissio esittää yrityksiä velvoittavaa datan jakamista kansalaisia paremmin palvelevien ratkaisuiden ja yhteiskunnallisesti merkittävien ongelmien ratkaisemiseksi. Kyseinen sääntelytehtävä ei ole helppo, mutta ainakin julkisin varoin tuotetun datan tulisi olla julkista ja rajoituksitta hyödynnettävissä eri palveluissa, ellei ole jotakin esimerkiksi yksityisyyden suojaan liittyvää syytä olla julkaisematta dataa. Vastaava säännöstö on ollut jo kauan voimassa Yhdysvalloissa, jossa liittovaltion rahoituksella julkaistut aineistot ovat olleet vapaasti käytettävissä mihin tahansa tarkoitukseen. Tällä on ollut suuri merkitys paitsi tieteelliselle tutkimukselle, myös erilaisten digitaalisten palvelujen kehitykselle.

Datan keskittämisen sijaan kannattaa pohtia datan hajauttamista tietosuojariskien pienentämiseksi. Vaihtoehtona nykyisille keskitetyille pilvipalveluille on kehittymässä uusi ns. reuna– tai sumulaskennan paradigma, jossa datan paikallinen käsittely korostuu. Toisin kuin pilvessä, sumussa laskeminen tuodaan lähelle dataa tuottavia ja käyttäviä laitteita, ja vain olennainen tieto välitetään pilveen. Hajautettua tekoälyä hyödyntäen esimerkiksi terveystietoja ei tarvitse luovuttaa ulkopuolisille, vaan käyttäjälle voidaan järjestää pääsy tarvitsemaansa dataan turvallisesti suojatussa ympäristössä.

Tekoälyn uhat

Mediaa seuratessa muodostuu helposti kuva, että itsenäisesti päätöksiä tekevä tekoäly on jo keskuudessamme tuottaen tieteellisiä ja kaupallisia läpimurtoja, ja on vain ajan kysymys, milloin kone kehittyy ihmistä älykkäämmäksi ja itsestään tietoisena kaappaa vallan. Vaikka tällainen singulariteetti ei olekaan mahdoton, tekoälyn kehityksen suurin yhteiskunnallinen uhka ovat heikkolaatuista dataa käyttävät ja huonosti suunnitellut tekoälyjärjestelmät, joiden innokkaat käyttäjät eivät ymmärrä niiden toimintaa. Tällaisessa villissä lännessä kenelläkään ei ole kontrollia, vaan syntyy otollinen maaperä mitä mielikuvituksellisimmille huijareille.

Tekoälyjen opetusaineistoihin liittyy useita turvallisuusuhkia. Aineistoja manipuloimalla järjestelmän kehittäjä tai ulkopuolinen hyökkääjä voi rakentaa järjestelmään hyvin vaikeasti havaittavissa olevan takaoven, joka saa järjestelmän toimimaan valituissa tilanteissa halutulla tavalla. Esimerkiksi hakemusten käsittelyn järjestelmä voidaan manipuloida hyväksymään tai hylkäämään hakemukset, joissa on tietty harmittomalta vaikuttava avainsana tai muu piirre. Jos opetusaineistot sisältävät arkaluontoisia tietoja, saattaa niiden paljastuminen valmiista järjestelmästä osoittautua ongelmaksi, johon perinteiset salausmenetelmät eivät pure.

Eettiset kysymykset ja intressiristiriidat jakavat tekoälysovellusten käyttäjäryhmiä. Milloin yksilön etu voidaan asettaa yhteisen edun edelle, ja päin vastoin? Perustuuko yhteiskunnan vastuu yksilöstä vastavuoroisuuteen vai onko se pyyteetöntä? Olemme saaneet kokemuksia voimakkaasta yhteiskunnallisesta jännitteestä nyt pandemia-aikana rokotettujen ja rokottamattomien välisten intressiristiriitojen muodossa. Perusoikeudet ja velvollisuudet sekä yhteiskunnan turvallisuus voivat asettua monin tavoin vastakkain. Arvojen yhteensovittamista helpottaa se, että useinkaan kyseessä ei ole dikotominen ominaisuus, vaan teknologisin keinoin eri vaikutusten tasapainoa ja myös kustannuksia voidaan säätää.

Eräs yhteiskunnallinen uhkakuva liittyy tekoälyjärjestelmätoimittajien kasvavaan taloudellis-poliittiseen valtaan. Globaalien alustojen toimittajat uhkaavat monopolisoida sovellusten tuottamat taloudelliset hyödyt ja muodostaa merkittäviä ylikansallisia yhteiskunnallisia toimijoita valtioiden rinnalle. Digitaalisten palvelujen yhdentyminen mahdollistaa yksilön toiminnasta kertovan datan yhdistelyn, minkä avulla voidaan vaikuttaa ihmisten käyttäytymiseen, yritysten toimintaan ja yhteiskunnalliseen päätöksentekoon. Tällaisesta on jo nähty esimerkkejä Yhdysvaltain presidentinvaaleissa sekä Britannian brexit-äänestyksessä.

Vuorovaikutteinen, tekoluova tukiäly tuottaa sisältöä yhä automaattisemmin, mikä parantaa mahdollisuuksien tasa-arvoa, mutta luo valitettavasti tilaisuuksia myös haitalliselle informaatiovaikuttamiselle. Yritysten ja valtioiden lisäksi myös yksityiset ihmiset alkavat käyttää tekoälyä vaikeasti ennakoitavin tavoin. Tarve sisäisten ja ulkoisten turvallisuusriskien ennakoinnille, uudenlaiselle sääntelylle sekä kyber- ja informaatiopuolustukselle kasvaa. Käyttäjien ymmärrys sisällön alkuperästä ja oikeellisuudesta muodostuu keskeiseksi kysymykseksi. Yhteiskunnan resilienssi riippuukin yhä enemmän kansalaisten yleisestä tieto- ja taitotasosta, yhteisöllisyyden tunteesta ja puolustustahdosta.

Toimenpiteet kilpailukyvyn parantamiseksi

Julkisuudessa on kannettu huolta Euroopan kilpailukyvystä tekoälykehityksessä. Eurooppalaisten yritysten on vaikeaa saada jalansijaa kuluttajadataa hyödyntävillä markkinoilla, koska määräävät kansainväliset yhtiöt ovat kasvaneet liian suuriksi eikä Eurooppa ole kyennyt estämään datan kulkeutumista niille. Samaan aikaan kriitikkojen mielestä tiukka datalainsäädäntö on haitannut eurooppalaisten toimijoiden kehitystä.

Yleinen näkemys Euroopan kilpailukyvystä perustuu kuitenkin nimenomaan kulttuurisille vahvuuksillemme vastuullisen ja eettisen tekoälyn kehittäjänä. Vastuullisessa markkinataloudessa ajatellaan kuluttajan valitsevan lopulta luotettavimmaksi ja kestävimmäksi koetun palvelun. Yhdysvaltain valitsema yritysten toimintaedellytyksiä korostava vähäisemmän sääntelyn tie ja Kiinan suoraviivainen keskusjohtoinen politiikka ovat tässä suhteessa toisenlaisia. Niillä molemmilla on vahvuutensa, ja nähtäväksi jää, kuka veikkaa oikeaa hevosta.

Eettisyyttä ja vastuullisuutta korostavassa katsannossa kilpailukyvyn edistämiseksi on kehitettävä teknologisten ratkaisujen yhteensopivuutta edistäviä standardeja ja avoimia rajapintoja. Tekoälyä ei pidä yrittää lainsäädännössä määritellä eikä vaatimuksia tule asettaa käytettävälle teknologialle, vaan käytetyn datan laadulle ja eettisesti hyväksyttävälle, kestävän kehityksen mukaiselle käyttötarkoitukselle. Kilpailukykyä rakentaisi myös tekoälyn määrätietoinen ja strategisesti johdettu hyödyntäminen julkisella sektorilla terveydenhuollosta maanpuolustukseen. (Sotilaallisiin tarkoituksiin kehitettävä tai käytettävä tekoäly rajataan komission ehdotuksessa sääntelyn ulkopuolelle, mikä saattaa johtaa tulkintahaasteisiin.)

Korkea osaaminen on kenties kaikkein keskeisin kilpailukyvyn tae. Tarvitaan merkittäviä panostuksia sekä huippututkimukseen ja -koulutukseen että laajaan yleissivistykseen. Yhteiskunnallisesti kestävä tekoäly ei vaadi vain erikoistuneita asiantuntijoita ja tutkijoita, vaan myös huomattavan laajaa datan merkitykseen ja tekoälyn käyttöön liittyvää ymmärrystä niin kansalaisten kuin päätöksentekijöidenkin keskuudessa. Lainsäädännöllä ja viranomaisilla tulee olla mahdollistava ja turvaava rooli, ei estävä.

Uuden teknillisen kehityksen kulttuurin luominen vaatii organisaatioilta paljon. Moniosaavat ryhmät ovat tärkeitä sekä tekoälyä suunniteltaessa että hankintoja tehtäessä. Suunnitteluosaaminen edellyttää datatieteen menetelmien ohella tietoturvan hallintaa jo kehitystyön alkuvaiheessa, sillä sitä ei voi lisätä jälkikäteen. Kehitettävän tai hankittavan järjestelmän sisällöllinen kelpoisuus tulee varmistaa riittävän laajalla monitieteisellä osaamisella.

Järjestelmän käyttäjien ja muiden keskeisten sidosryhmien näkökulmat tulee integroida suunnitteluprosessiin alusta alkaen. Myös organisaation johdolta vaaditaan ymmärrystä tekoälyn mahdollisuuksista ja rajoituksista: kun aiemmin ihmisen älykkyyttä vaatineita työtehtäviä korvataan teknisillä järjestelmillä, tulee organisaation toiminnan muuttumista katsoa kokonaisuutena. Työntekijät johtoa myöden on koulutettava uusiin toimintamalleihin.

Rohkeasti kohti utopiaa!

Tekoälyvallankumouksen tavoitteeksi pitää asettaa utopia, ei dystopia. Vaihtoehtoisia tulevaisuuksia kohtaan ei ole syytä lietsoa pelkoa eikä rakentaa vastakkainasetteluja. Robotit eivät vie työpaikkojamme, vaan muuttavat työmme (mielenkiintoisemmaksi); teknologia ei tuhoa ympäristöämme ja terveyttämme (enää), vaan pelastaa meidät. Tekoäly ei korvaa ihmistä; ihminen ja älykäs kone yhdessä ovat voittava yhdistelmä. Yhteiskunta, joka nopeimmin ja laajimmin omaksuu tämän periaatteen, selviää voittajana. Ja jos ja kun – kuten tutkimus kertoo – tekoälyn avulla todella saadaan merkittävästi edistettyä suurinta osaa kestävän kehityksen tavoitteista, olemme kaikki voittajia.

Tapio Salakoski

Kirjoittaja on matemaattis-luonnontieteellisen tiedekunnan dekaani, tekoälytutkija ja opettaja sekä monialaisen sivistysyliopiston vankkumaton kannattaja.