kuvitukuva puhekupla

Tekoälyä ja tekototuuksia, osa 2

Marraskuussa 2020 kirjoitin tällä palstalla hiljaisen tekoälyvallankumouksen virstanpylväästä: kalifornialaisen OpenAI:n toukokuussa 2020 julkaisema GPT-3 -tekoäly kirjoitti brittilehti The Guardianin syyskuun kahdeksannen päivän 2020 päämielipidekirjoituksen. Tarkoitukseni oli levittää tietoisuutta tekoälyn nopeasti kasvavien kyvykkyyksien merkittävistä vaikutuksista kaikkialla yhteiskunnassa.

Kaksi vuotta myöhemmin, marraskuussa 2022 hiljaisuus käynnissä olevan tekoälyvallankumouksen yltä poistui, kun GPT-3:n kehitysversion GPT-3.5 pohjalle rakennettu ChatGPT-palvelu avattiin. Avoin palvelu on saanut lyhyessä ajassa yli sata miljoonaa käyttäjää, ja sen sanotaan olevan maailman nopeimmin levinnyt teknologinen innovaatio. Vaikka sovelluksesta on helppo osoittaa vikoja ja puutteita, se on aidosti hämmästyttänyt kyvyillään ja monipuolisuudellaan, tuoden (vihdoinkin!) tekoälyn vallankumoukselliset mahdollisuudet – ja uhat – suuren yleisön tietoisuuteen.

Myös yliopistoissa on havahduttu uuteen tilanteeseen. Maailmalla innokkaimmat eliittiyliopistot, kuten Cambridge ja Oxford, ehättivät jo kieltää ChatGPT:n käytön opiskelussa vedoten plagiarismiin. Suomessa julkisuuteen ehti ensimmäisenä Jyväskylän yliopisto verrattain sallivalla linjauksellaan. Tilanne onkin kieltämättä uusi ja toimenpiteisiin on syytä, mutta paniikkiin ei ole aihetta.

Tekoäly Turun yliopistossa

Turun yliopistossa laadimme oman linjauksemme maltillisesti ja harkiten, tulevaisuuden osaamistarpeita ja opetuksen luonnetta arvioiden. Järjestämme yliopistossa kaksi keskustelutilaisuutta 29.3. ja 17.4. Näistä ensimmäisessä käsitellään etenkin suurten kielimallien käyttöä opetuksessa ja toisessa tarkastellaan tekoälyn mahdollisuuksia ja uhkia yliopiston perustehtävissä laajemmin.

Meillä onkin poikkeuksellisen hyvät valmiudet toimia uudessa tilanteessa syvällisen ymmärryksen pohjalta ”oikein”, olemmehan maailmalla tunnettuja ja Suomen johtavia yliopistollisia kieliteknologiatoimijoita. TurkuNLP-tutkimusryhmämme on tutkinut aihetta menestyksekkäästi jo yli 20 vuotta. Olemme kehittäneet myös alan opetusta ja ottaneet osaa yhteiskunnalliseen keskusteluun ja päätöksentekoon. Nykyään tutkimuksemme ylittää tiedekuntarajat, sillä ovathan teknillisen tiedekunnan ohella myös humanistinen ja matemaattis-luonnontieteellinen tiedekunta mukana TurkuNLP-ryhmässä.

Tekoälyosaamisemme on vahvaa myös laajemmin mainituissa tiedekunnissa sekä lääketieteellisessä tiedekunnassa ja biotiedekeskuksessa. Tekoälyn tietoteknisen ja matemaattistilastotieteellisen tutkimuksen ohella keskeisiä sovellusaloja meillä ovat bio- ja terveystieteiden, muiden tekniikan ja luonnontieteiden alojen, kielten, historian ja kulttuurin sekä oppimisen ja oppimisanalytiikan tutkimus, unohtamatta tärkeitä eettisiä, sosiaalisia, kaupallisia ja oikeudellisia näkökulmia. Monitieteisessä yliopistossa tekoäly on ja sen tulee olla läsnä kaikkialla.

Tekoälyakatemia yhdistää alan toimijoita yliopiston kaikissa tiedekunnissa. Tutkimuksen ja erikoisosaamisen ohella kannamme vastuuta myös yleissivistyksestä jatkuvan oppimisen tontilla. Vain osaava kansakunta voi ottaa käyttöön innovatiivisia tekoälysovelluksia vastuullisesti ja menestyksekkäästi.

Tekoälyteema on myös tärkeänä osana kaikkia kolmea uutta profi7-osahanketta: immunologian, ihmisen diversiteetin ja kestävien materiaalien tutkimuksessa. Itse asiassa se toimii hankkeiden välillä yhdistävänä tekijänä, jonka varaan voisi rakentaa synergiaa luovaa ja hyödyntävää tieteidenvälistä tutkimusalustaa ja infrastruktuuria.

Tekoäly disruptoi

Tekoälyn kehitys vaikuttaa tutkimuksen tekemiseen vääjäämättä, välillä hitaammin, toisinaan hyppäyksellisesti. Tekoälyn itsensä tutkimuksessa disruptiivinen hyppäys tapahtui viime vuosikymmenellä niin kutsutun syväoppimisen myötä, kun monikerroksisten hermoverkkojen jopa miljardien parametrien opettaminen massiivisella datalla tuli mahdolliseksi laskentatehon kasvaessa.

Myös ChatGPT:n pohjana olevat laajat kielimallit ovat tällaisia, ja viimeaikaisissa kehitysaskelissa merkittävintä onkin ollut mallin koon kasvu: GPT-3:ssa on 175 miljardia parametria, ja seuraavassa versiossa määrän odotetaan taas kasvavan. Kiinalaiset väittävät kehittävänsä malleja, joiden kompleksisuus on kertaluokkaa suurempi.

Kuluvan maaliskuun puolivälissä OpenAi julkisti uuden mallinsa GPT4:n, jossa on jo hyödynnetty suuren käyttäjäjoukon kokemuksia ChatGPT:stä. Sen syväoppimisarkkitehtuurin sanotaan olevan täysin uudelleen rakennettu ja mallia kutsutaan multimodaaliseksi, koska se hyväksyy syötteekseen myös kuvia, vaikka tulos edelleen onkin tekstiä. GPT-4 tulee aluksi käyttöön ChatGPT:n maksullisessa Plus-versiossa sekä erillisen sovellusrajapinnan avulla. Kuvien käsittelyyn lanseerataan myöhemmin oma käyttöliittymä. On mielenkiintoista seurata näiden palveluiden liiketoimintamallien kehittymistä. Palvelun edistyneemmille versioille sekä kokeilua laajamittaisemmalle käytölle on jo asetettu käytön mukaan määräytyvä maksu.

Aiemmasta poiketen OpenAI ei julkistuksessaan hehkuta uuden mallinsa monimutkaisuuden kasvua, vaan vaikuttaa keskittyneen enemmän ChatGPT:n havaittujen puutteiden korjailemiseen. Uuden mallin väitetään parantuneen erityisesti faktuaalisuudessa, ohjattavuudessa ja paimennettavuudessa, saavuttaen nyt jopa ihmistason useissa eri osaalueiden suorituskykyä mittaavissa testeissä, edelleen kuitenkin häviten ihmiselle monissa käytännön tilanteissa. GPT-4:n opetusdata rajoittuu syyskuuhun 2021, mitä vanhempia tapahtumia se ei tunne – eikä myöskään käytössä opi.

Faktuaalisuuden puutetta on pidetty yhtenä vakavimmista ChatGPT:n ongelmista. Tekoälyn tuottamat vastaukset eivät välttämättä ole totta, vaan ne on luotu yhdistelemällä maailman kaikkea tietoa rajoittamattoman luovalla tavalla – puhutaan tekoälyn hallusinoinnista. Kun ChatGPT:n faktuaalisuus on käytettyjen mittareiden mukaan ollut keskimäärin noin 50% luokkaa, niin GPT-4 parantaa suoritusta lähes 80%:n tasolle. Täydellisyyteen on siis vielä matkaa, mutta etenkin vaikeimmiksi osoittautuneiden, eksakteimpien tehtävien kohdalla raportoitu parannus on vaikuttava ja kehityksen vauhti suorastaan häkellyttävä.

Ohjattavuudella tarkoitetaan käyttäjän mahdollisuuksia vaikuttaa tekoälyn tuottamiin vastauksiin tarkentamalla sille annettavaa tehtävää sekä vastaukselta odotettavaa tyyliä. Nykyisen ChatGPT:n toimintatapaan ja vastaustyyliin voidaan jatkossa vaikuttaa yhä paremmin sovelluskehittäjien (ja vastaisuudessa suuren yleisönkin) käyttöön tulevilla systeemikomennoilla. Tämä helpottaa räätälöityjen sovellusten ja palveluiden kehittämistä useille aloille. Valitettavasti deep fake -tuotanto haastaa immateriaalisten arvojen tunnustamisen ja suojaamisen käytännöt sekä yhteiskunnan resilienssin väärinkäytöksiä vastaan.

 Paimennettavuudeksi kutsun paremman termin puutteessa mallin ominaisuutta pysytellä annetuissa rajoissa (guardrails). Tällaisia rajoja on asetettu ei-sallitulle, säädyttömälle tai sensitiiviselle sisällölle. Mallin ei haluta esimerkiksi antavan ohjeita laittomaan toimintaan, neuvovan terveydelle haitallisiin tekoihin tai toisintavan ihmisiä eriarvoistavia (vääriä) käsityksiä.

Tällainen paimentaminen on mallien yleisen hyväksyttävyyden kannalta tärkeätä, mutta eettisesti mutkikasta. Hyvää tarkoittava sensuuri aiheuttaa kielteisiä sivuvaikutuksia, kuten vähemmistöjen yhdenvertaisuuden heikkenemistä. Se on myös teknisesti haastavaa: paimentaminen heikentää mallin kykyä arvioida esittämiensä ennusteiden luotettavuutta. Kun GPT-4 ohjaamattoman perusopetuksensa jälkeen kykeni ilahduttavan luotettavaan itsearvioon esittämiensä väitteiden todenmukaisuudesta, kyky heikkeni merkittävästi paimentamiselle välttämättömän jälkiopetuksen ja siinä käytettävän ihmispalautteen myötä.

Tieteellinen, taiteellinen ja muu luova työ

Massiiviset kielimallit ovat luonteeltaan generatiivisia: ne eivät pelkästään analysoi dataa, vaan kykenevät myös luomaan uutta. Tekstin ohella tällaista tekoluovaa toimintaa on jo nähty kuvan- ja äänenkäsittelyyn rakennetuissa tekoälyissä. Teknistieteellisten sovellusten ohella tekoälyä käytetään myös taiteessa.

Taiteilijat suhtautuvat tekoälyyn vaihtelevasti, ja eräät kieltävät kategorisesti tekoälyltä mahdollisuuden luovuuteen. Kieltämisen argumentit eivät välttämättä kestä tarkempaa analyysiä, vaan pakenevat filosofis-uskonnollisiin sfääreihin. Eräs mittari ovat viihteen kuluttajamarkkinat: jos kuluttajat eivät näe oleellista eroa ihmistaiteilijan ja tekoälyn tuottamassa viihteessä, tekotaide saattaa saada jalansijaa nopeastikin. Odotan jännityksellä joulun uutuuskirjamarkkinoita!

Tekoälyn nopea kehitys on jo nyt vaatinut tieteen ja koulutuksen toimijoilta sopeuttavia toimenpiteitä. Tieteelliset julkaisutalot laativat linjauksiaan siitä, miten ChatGPT:n kaltaisia apuvälineitä tulisi kohdella. Joissain tieteellisissä julkaisuissa ChatGPT on peräti hyväksytty kanssakirjoittajaksi, toisissa sarjoissa sen käyttö on tyystin kielletty. Yliopistojen opiskelua koskevien linjausten tavoin reaktiot ovat aluksi epäyhtenäisiä, mutta harmonisoitunevat vähitellen kokemusten karttuessa.

On oleellista ymmärtää, että hämmästyttävistä kyvyistään huolimatta ChatGPT ei ymmärrä mistä puhuu, vaikka sujuvasti puhuukin. Ehkä se onkin parhaimmillaan tuotettaessa tekstiä, jota kenenkään ei varsinaisesti ole tarkoituskaan lukea, ainakaan syvällisesti? Ironiseen näkemykseen sisältyy totuuden siemen: nyky-yhteiskunnassa tuotamme paljon tekstiä, joka on regulaation tai vakiintuneiden käytäntöjen vuoksi pakollista, mutta ei kulloisenkin pääasian kannalta keskeistä. Esimerkiksi lukuisissa raporteissa, suunnitelmissa ja hakemuksissa on tällaisia osioita, ja vaikuttaa  ilmeiseltä, että ChatGPT löytää nopeasti paikkansa tässä kontekstissa.

Myös ohjelmistokehityksessä uudet työkalut voivat tehostaa työn tuottavuutta merkittävästi. Avointen koodikokoelmien mukaiset hyvät ja koetellut ratkaisut löydetään helposti, nopeasti ja kohtuullisen luotettavasti – kunhan tekoälyn ohjaksissa on ohjelmointia itse osaava henkilö, joka kykenee tarkistamaan tekoälyn ehdottamat vastaukset. Koska ohjelmointikin sisältää yleensä myös rutiininomaista työtehtäviä, ohjelmistotyön tuottavuuden arvellaan voivan parantua jopa moninkertaisesti.

Kehityksen yhteiskunnalliset vaikutukset ovat suuria. Luovassa työssä ihmisten autonomia ja itseohjautuvuus kasvavat nopeasti, ja digitaaliset alustat valtaavat tilaa korporaatioilta. Työnantajattoman työnteon malli leviää, ja julkisen vallan tehtävä on vaikea: miten pitää koko yhteiskunta mukana kehityksessä sitä samalla estämättä? Kysymys osaamisen jakautumisesta nousee vaurauden ja terveyden jakautumisesta huolehtimisen rinnalle.

Tekoäly opetuksessa

ChatGPT ei myöskään osaa laskea tai ohjelmoida, vaikka runoja kirjoittaakin. Runojen laatuun en ota kantaa, mutta matemaattis-luonnontieteellisessä tiedekunnassa tekemiemme kokeilujen valossa ChatGPT saa useiden oppiaineiden tenteissä perusasioita koskevissa esseekysymyksissä korkeat pisteet, keskimäärin kolmesta neljään pistettä viidestä. Soveltavissa, loogista päättelyä tai laskemista vaativissa tehtävissä sen sijaan se ei pärjää, vaan suoltaa pahimmillaan täyttä puppua, vaikkakin uskottavan oloisesti. Tekoälyn nopea kehitys kuitenkin haastaa tämänhetkisen näkemyksen.

Tekoluovuuden aiheuttamaa haastetta on tutkittu ohjelmoinnin opetuksessa. Tuoreessa oppimisanalytiikan väitöstilaisuudessa ja sen jälkeisessä karonkassa kävimme vilkasta keskustelua aiheesta amerikkalais-irlantilaisen vastaväittäjän kanssa. Hänen vertaisarvioitujen kansainvälisten tutkimustensa mukaan tietojenkäsittelytieteen perusoppimäärien CS1- ja CS2-tenteissä jo nykyinen ChatGPT pärjäsi paremmin kuin ¾ aidoista opiskelijoista. Uskon GPT-4:n yltävän monilla aloilla ylimpään desiiliin. Haaste on todellinen, ja asia on otettava vakavasti.

Opetuksen osalta plagiarismi ei ole relevantein tarkastelukulma. Plagioinnin paljastaminen voi olla vaikeaa, mutta kopiointiväite on helpohkosti todennettavissa alkuperäiseen lähteeseen vertaamalla. Generatiiviset kielimallit tuottavat uniikkeja tuotoksia, jotka eivät ole kopioita mistään – ne ovat pikemminkin kopioita kaikesta. Tekoälyn tuottama teksti voidaan (tekoälyn avulla) osoittaa tekoälyn tuottamaksi kohtuullisen luotettavasti, mutta lopullisen näytön, ”alkuperäisen”, puutteen takia oikeuskäytäntöjä pitää miettiä.

Plagiarismin sijasta uudet oppimisen ja arvioinnin tavat rinnastuvat ennemminkin ryhmätyöhön ja sen tuomiin haasteisiin opettamisessa ja osaamisen arvioinnissa. Opiskelijan ja tekoälyn yhdessä tuottama tulos on hyvinkin relevantti arvioinnin kohde siinä mielessä, että yhteistyössä määräytyy myös tuotetun tuotteen tai palvelun laatu. Yksilöllisen osaamisen ja sen arvioinnin tarve ei poistu, mutta opiskelijan osaaminen piiloutuu tukiälyn taakse.

Opetuksen uudistamisen ohjenuoraksi on syytä ottaa vanha kunnon constructive alignment: osaamistavoitteiden, opetustapojen ja arvioinnin on oltava keskenään linjassa ja tuettava toisiaan. Perustavanlaatuisin kysymys kuuluukin: miten oppimistavoitteita pitää tarkistaa tekoälyn kehityksen myötä? Lisäksi pitää miettiä, miten tekoäly otetaan parhaiten opetuksen osaksi. Ja kyllä, myös osaamisen arvioinnin käytäntöjä pitää muuttaa, mutta kiellot eivät ole ratkaisu.

Strategiamme mukaan rakennamme rohkeasti kestävää tulevaisuutta. ChatGPT ja sen seuraajat ovat tulleet jäädäkseen, joten meidän tulee rohkeasti ja viipymättä uudistaa omaa toimintaamme niin tutkimuksessa, opetuksessa kuin yhteiskunnallisessa vuorovaikutuksessa, oman organisaatiomme tiedolla johtamista unohtamatta. Opettajien, tutkijoiden ja muiden asiantuntijoidemme oma tekoälytietoisuus ja osaaminen on tärkeätä.

Ihminen ja kone on ollut voittoisa yhdistelmä teollisen vallankumouksen alusta alkaen, ja yhteistyön ylivoima vain kasvaa koneen älykkyyden kasvaessa. ”Vain muutos on pysyvää”, sanoi kreikkalainen filosofi Herakleitos jo vuonna 500 eaa. Muutoksen vauhti sen sijaan ei ole pysyvää, vaan yllättää meidät kaikki, ellemme varaudu parhaamme mukaan.

""

Tapio Salakoski

 Kirjoittaja on matemaattis-luonnontieteellisen tiedekunnan dekaani, tekoälytutkija ja opettaja sekä monialaisen sivistysyliopiston vankkumaton kannattaja.

 

Photo by Volodymyr Hryshchenko on Unsplash

Categories: Koulutus, Opiskelu, Tutkimus, Yliopisto

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *