Vaikuttavuustieto ei synny vain mittaamalla lisää
Juuso Repo; Elina Kilpi-Jakonen
Koulutuspolitiikassa vallitsee laaja yksimielisyys siitä, että päätösten tulisi perustua parempaan tietoon. Vähemmän selvää on, millaista tämän tiedon tulisi olla.
Tätä kysymystä konkretisoi Eduskunnan tarkastusvaliokunnalle tehty raportti “Perusopetuksen oppimistulokset ja mahdollisuuksien tasa-arvo”, joka on virittänyt kiivaan koulutuspoliittisen keskustelun Suomessa (Karhunen ym., 2026; Kansallinen koulutuksen arviointikeskus, 2026). Samaan aikaan Opetus- ja kulttuuriministeriö valmistelee koulutuksen arviointijärjestelmän uudistamista (OKM, 2026).
Raportin keskeinen viesti on selvä: Suomen koulutusjärjestelmä kärsii tiedon puutteesta, ja ratkaisu löytyy vahvemmasta oppimisen mittaamisesta, kansallisesta datainfrastruktuurista ja vaikuttavuustutkimuksen menetelmistä.
Ajatus on houkutteleva, mutta se pelkistää ongelmaa.
Perusopetuksen tavoitteet eivät rajoitu oppimistuloksiin, vaan kattavat myös hyvinvoinnin ja laajemmat yhteiskunnalliset vaikutukset. Siksi kysymys ei ole vain mittaamisesta, vaan siitä, millaista tietoa vaikuttavuuden arviointi edellyttää.
Vaikuttavuustutkimuksen vaatimus on perusteltu
Siirtymä panoksista kohti vaikutuksia on linjassa laajemman hyvinvointivaltiokehityksen kanssa ja korostunut myös INVEST-tutkimuskeskuksen työssä. Koulutuspolitiikassakaan ei enää riitä tieto siitä, kuinka paljon resursseja käytetään, vaan olennaista on, mitä niillä saadaan aikaan. Ilman selkeitä vaikuttavuuskriteerejä resurssit voivat kohdentua tehottomasti. (Erola, Moisio & Peltoniemi 2026).
Tässä mielessä raportin painotus rekisteriaineistoihin ja kausaalipäättelyn menetelmiin on perusteltu. Ne ovat keskeisiä välineitä, kun pyritään tunnistamaan, mitkä toimenpiteet vaikuttavat oppimiseen ja hyvinvointiin. Ongelma syntyy kuitenkin seuraavassa askeleessa: keskeiseksi ratkaisuksi ehdotetaan kattavaa kansallista datainfrastruktuuria, joka perustuisi oppimis-, hyvinvointi- ja rekisteritiedon laajaan yhdistämiseen yksilö- ja koulutasolla.
Tässä kohdin ongelma pelkistyy liikaa datakysymykseksi. Olennaista ei ole vain datan määrä, vaan se, millaisilla aineistoilla ja analyyseilla voidaan ymmärtää, miten oppiminen ja hyvinvointi rakentuvat eri tilanteissa ja eri ryhmissä.
Mittaaminen ei ole neutraali toimenpide
Yksi keskeinen kysymys liittyy siihen, mitä mittaaminen itse asiassa tekee. Arviointi ei ole vain neutraalia tiedonkeruuta, vaan se muokkaa järjestelmää, jota se pyrkii kuvaamaan. Taloustieteestä tuttu Goodhartin laki muistuttaa, että kun mittarista tulee tavoite, se lakkaa olemasta hyvä mittari. Ns. matalan panoksen arvioinneissa tuloksiin vaikuttavat erot oppilaiden motivaatiossa: muutokset voivat heijastaa yhtä hyvin ponnistelun tasoa kuin osaamista (ks. esim. Zamarro et al. 2019). Korkean panoksen testauksessa puolestaan syntyy kannusteita kohdistaa opetus mitattaviin sisältöihin, mikä voi kaventaa opetusta.
Arviointia tulee tarkastella osana koulutusjärjestelmän ohjausta, koska sen vaikutukset ulottuvat opetukseen, oppimiseen ja koulun toimintakulttuuriin. On keskeistä erottaa toisistaan yksilön oppimista tukeva arviointi ja järjestelmätason seuranta: yhteen tarkoitukseen soveltuva mittaustapa voi olla toimimaton toisessa.
Kausaalipäättelyn reunaehdot
Toinen keskeinen kysymys koskee sitä, mitä datalla voidaan tehdä. Kausaalinen päättely perustuu tutkimusasetelmiin – vertailuryhmiin, pitkittäisrakenteisiin ja suunniteltuihin koeasetelmiin – ei pelkästään aineiston kokoon (Angrist & Pischke 2009). Ilman tällaisia asetelmia laajatkin rekisteriaineistot kuvaavat muutoksia, mutta eivät kerro, mikä toimii.
Lisäksi sekä kokeelliset että kvasikokeelliset asetelmat nojaavat vahvoihin oletuksiin, ja niiden tulokset ovat usein kontekstisidonnaisia (Deaton & Cartwright 2018; Rutkowski et al. 2024). Koulutuspolitiikassa keskeistä ei ole vain keskimääräinen vaikutus vaan se, kenelle ja missä olosuhteissa vaikutukset syntyvät – ja keiden kohdalla vaikutukset ovat kielteisiä.
Tähän liittyy myös kysymys siitä, missä määrin tietopohjan tulisi perustua koko ikäluokan kattaviin aineistoihin. Laaja kattavuus helpottaa ryhmien välisten erojen tarkastelua, mutta ei poista mittaamiseen tai kausaaliseen tulkintaan liittyviä perusongelmia ja lisää mittauskuormaa.
Myös mittarin rakenne vaikuttaa johtopäätöksiin: yksittäiset tehtävät tai osiot voivat reagoida interventioon eri tavoin, jolloin summapistemäärä peittää alleen olennaista heterogeenisuutta (Gilbert ym., 2025).
Vaikuttavuustutkimus voi lisäksi kaventaa sitä, mitä pidetään merkityksellisenä tietona. Oppiminen ja hyvinvointi jäsentyvät helposti mitattaviksi “outputeiksi”, jolloin pedagoginen ja kokemuksellinen tieto jää sivuun. Siksi määrällinen tutkimus tarvitsee rinnalleen laadullista analyysia myös vaikuttavuustutkimuksessa (Warren et al., 2020).
Tätä ei ratkaista pelkästään menetelmiä kehittämällä, vaan rakentamalla tietopohja, joka yhdistää useita toisiaan täydentäviä näkökulmia.
Puuttuvat muuttujat: hyvinvoinnin ja oppimisen yhteys
Suomalaisen koulutuksen tietopohjan keskeinen ongelma ei ole mittaamisen vähäisyys, vaan aineistojen rakenteellinen hajanaisuus. Tietoa syntyy runsaasti esimerkiksi kuntien tietojärjestelmissä, mutta sitä ei tallenneta tai säilytetä tavalla, joka mahdollistaisi systemaattisen yhdistämisen. Keskeinen ongelma on, että oppimista ja hyvinvointia koskeva tieto tuotetaan pääosin erillään, eikä niitä voida yhdistää yksilötasolla yli ajan.
Laajasti päätöksenteossa hyödynnetty Kouluterveyskysely perustuu anonyymeihin poikkileikkausaineistoihin, jotka eivät mahdollista luotettavaa kausaalianalyysiä. Oppimistuloksia koskevat arvioinnit puolestaan keskittyvät pääasiassa osaamiseen, eikä niitä systemaattisesti yhdistetä hyvinvointitietoon tai rekistereihin.
Tämän seurauksena emme pysty analysoimaan, miten oppiminen ja hyvinvointi kytkeytyvät toisiinsa tai miten tasa-arvoisesti vaikutukset kohdentuvat eri oppilasryhmiin. Ilman rekisterilinkityksiä on myös vaikea arvioida aineistoihin liittyvää vastaajavinoumaa, mikä voi vääristää tuloksia.
Samankaltaiset yhdistettävyyden puutteet koskevat laajemminkin perusopetuksen tietopohjaa. Esimerkiksi oppilaiden poissaoloja koskeva tieto ei ole systemaattisesti yhdistettävissä muihin aineistoihin, vaikka se on keskeinen osa sekä oppimisen että hyvinvoinnin kokonaisuutta.
Hyvinvointitiedon puute ei rajoita vain hyvinvoinnin tarkastelua, vaan heikentää myös oppimistuloksiin liittyvien analyysien tulkintaa. Ilman tietoa oppilaiden kuormituksesta, motivaatiosta ja kouluun kiinnittymisestä on vaikea erottaa, liittyvätkö muutokset opetukseen ja oppilaiden tilanteeseen. Tulkinta jää helposti riippumaan siitä, mitä tietoa on saatavilla.
Vaikuttavuutta tukeva tietopohja edellyttää edustavaa, yksilötason pitkittäistä tietoa, joka yhdistää oppimisen ja hyvinvoinnin ja on yhdistettävissä rekisteriaineistoihin.
Esimerkki: mitä parempi data mahdollistaa
Kansainväliset esimerkit havainnollistavat, mitä tällainen tietopohja käytännössä mahdollistaa. Omissa tutkimuksissamme olemme hyödyntäneet mm. Tanskan ja Etelä-Australian opetushallinnon keräämiä aineistoja, joissa oppilaiden hyvinvointia seurataan yksilötasolla yli ajan ja tieto yhdistetään oppimis- ja taustatietorekistereihin (Repo ym., 2025a; Repo ym., 2025b).
Ikäkohorttien kehityksen vertailu mahdollistaa pitkän aikavälin trendien, tiettyyn ikävaiheeseen liittyvien muutosten ja lyhytaikaisten muutosten erottamisen toisistaan sekä vaikutusten tarkastelun eri oppilasryhmissä. Tuloksemme osoittavat, että ilman tämänkaltaista aineistorakennetta toimenpiteiden vaikutuksia voidaan tulkita systemaattisesti väärin. Suomessa vastaavaa analyysia mahdollistavaa datainfrastruktuuria ei toistaiseksi ole.
Kohti moninäkökulmaista ja integroitua tietopohjaa
Vaikuttavuustutkimus ja rekisteriaineistot ovat välttämätön osa modernia koulutuspolitiikkaa, mutta ne eivät yksin riitä. Tarvitaan tietopohja, joka yhdistää eri aineistoja, menetelmiä ja näkökulmia. Kysymys ei ole siitä, tarvitaanko enemmän mittaamista tai parempaa dataa, vaan siitä, miten tietopohja rakennetaan niin, että se tekee näkyväksi oppimisen ja hyvinvoinnin keskeiset yhteydet. Keskeistä on jäsentää tietoja niiden käyttötarkoituksen mukaan:
- Opetuksen ja oppimisen tuki (kehittämisdata): Paikallista ja formatiivista tietoa, jonka ensisijainen tehtävä on tukea opettajien työtä, koulun hyvinvointityötä ja oppilaiden yksilöllisiä oppimispolkuja ilman hallinnollisia seuraamuksia.
- Järjestelmätason seuranta ja kansallinen arviointi (seurantadata): Pitkittäistä ja edustavaa monimenetelmällistä arviointitietoa, joka yhdistää oppimisen, poissaolot ja hyvinvoinnin indikaattoreita sekä tukee koulutusjärjestelmän tilan ja tasa-arvon seurantaa sekä resurssien kohdentamista kansallisella ja alueellisella tasolla.
- Vaikuttavuustutkimus (tutkimusdata): Huolellisiin tutkimusasetelmiin perustuva tutkimus, joka mahdollistaa kausaalipäättelyn siitä, mitkä toimenpiteet toimivat, kenelle ja missä olosuhteissa. Rekisterilinkitykset tukevat tätä mahdollistamalla pitkän aikavälin seurannan sekä taustatekijöiden analyysin ja vastaajavinouman korjaamisen.
Nämä eivät ole hierarkkisia tasoja, vaan toisiaan täydentäviä tiedon muotoja. Suomessa tietopohjan vahvistamiseen liittyy parhaillaan useita kehittämishankkeita. Keskeistä on varmistaa, että niissä huomioidaan eri tiedon käyttötarkoitukset sekä se, miten eri tasot tukevat toisiaan. Esimerkiksi Karvin Valssi-järjestelmässä yhdistetään opetuksen kehittämistä tukeva formatiivinen tieto ja kansallinen seuranta.
Koulutuspolitiikan kannalta keskeisten vaikutusmekanismien tunnistaminen edellyttää vaikuttavuustutkimuksen ja kansallisen arvioinnin rinnalla opetuksen arkea kuvaavaa laadullista ymmärrystä. Laadullinen analyysi ei tällöin ole vain määrällisen täydennys, vaan olennainen väline sen ymmärtämisessä, miten politiikkatoimet ja interventiot toimivat eri konteksteissa ja millaisia prosesseja ne käynnistävät (Warren et al., 2020).
Tietopohjan kehittämisessä keskeistä ei ole vain tiedon määrä, vaan sen rakenne ja käyttöehdot. On varmistettava, että arviointi tukee kouluyhteisöjen kehittämistä, tunnistettavuus on rajattu tarkoituksenmukaisesti, eikä arviointi ohjaa toimintaa ei-toivottuun suuntaan, kuten ranking-listoihin.
Perusopetuksen tavoitteet ulottuvat oppimistuloksia laajemmalle, myös hyvinvointiin ja ylisukupolviseen tasa-arvoon. Tämän vuoksi vaikuttavuus ei ole vain mittaus- tai datakysymys, vaan kysymys siitä, millaista tietoa pidämme riittävänä – ja mitä koulutuspolitiikassa pidämme tavoittelemisen arvoisena.
Kirjoittajat
Juuso Repo on vaikuttavuuden arviointiin ja yhteiskuntatieteellisiin tutkimusmenetelmiin erikoistunut tutkija (FT). INVEST-tutkimuskeskuksessa hänen tutkimuksensa keskittyy nuorten hyvinvointiin, oppimiseen ja koulutukselliseen eriarvoisuuteen.
Elina Kilpi-Jakonen on sosiologian professori INVEST-tutkimuskeskuksessa. Hänen tutkimuksensa keskittyy sosiaaliseen eriarvoisuuteen, erityisesti koulutuksessa ja ylisukupolvisesti, sekä maahanmuuttotaustaisten lasten ja nuorten koulutukseen ja hyvinvointiin.
Lähteet
Angrist, J. D., & Pischke, J.-S. (2009). Mostly harmless econometrics: An empiricist’s companion. Princeton University Press. https://doi.org/10.2307/j.ctvcm4j72
Erola, J., Moisio, P., & Peltoniemi, J. (2026). Beyond the Nordic Welfare State. Extending Social Investments with Interventions. Edward Elgar Publishing. https://doi.org/10.4337/9781035375448.00006
Deaton, A., & Cartwright, N. (2018). Understanding and misunderstanding randomized controlled trials. Social science & medicine, 210, 2-21. https://doi.org/10.1016/j.socscimed.2017.12.005
Gilbert, J. B., Himmelsbach, Z., Soland, J., Joshi, M., & Domingue, B. W. (2025). Estimating heterogeneous treatment effects with item‐level outcome data: Insights from Item Response Theory. Journal of Policy Analysis and Management, 44(4), 1417-1449. https://doi.org/10.1002/pam.70025
Karhunen, H. K., Kuuppelomäki, T., Sarvimäki, M., Suhonen, T., & Uusitalo, R. (2026). Perusopetuksen oppimistulokset ja mahdollisuuksien tasa-arvo. Eduskunnan tarkastusvaliokunnan julkaisu 1/2026. https://labore.fi/julkaisu/perusopetuksen-oppimistulokset-ja-mahdollisuuksien-tasa-arvo/
Kansallinen koulutuksen arviointikeskus (Karvi). (2026). Kansallisen koulutuksen arviointikeskuksen asiantuntijalausunto sivistysvaliokunnalle: Perusopetuksen oppimistulokset, mahdollisuuksien tasa-arvo ja rahoitus (O 20/2024 vp). https://www.karvi.fi/fi/ajankohtaista/kannanotot-ja-lausunnot/kansallisen-koulutuksen-arviointikeskuksen-asiantuntijalausunto-sivistysvaliokunnalle-perusopetuksen-oppimistulokset-mahdollisuuksien-tasa-arvo-ja
Opetus- ja kulttuuriministeriö. (2026). Koulutuksen arviointijärjestelmä -työryhmä. https://okm.fi/hanke?tunnus=OKM073:00/2024
Repo, J., Herkama, S., & Salmivalli, C. (2025). Equitable shifts in youth resilience? Distinguishing normative changes and pandemic effects on academic self-efficacy and cognitive reappraisal. Developmental Psychology. https://doi.org/10.1037/dev0001913
Repo, J., Smith, E., Reimer, D., & Kilpi-Jakonen, E. (2025). Persistent Trends or Pandemic Effects? A Multi-Cohort Longitudinal Study on Student Well-being, Inequality, and Educational Transitions. Social Indicators Research. https://doi.org/10.1007/s11205-025-03617-7
Rutkowski, D., Rutkowski, L., Thompson, G., & Canbolat, Y. (2024). The limits of inference: reassessing causality in international assessments. Large-Scale Assessments in Education, 12(1), 9. https://doi.org/10.1186/s40536-024-00197-9
Warren, E., Melendez-Torres, G. J., Viner, R., & Bonell, C. (2020). Using qualitative research within a realist trial to build theory about how context and mechanisms interact to generate outcomes: findings from the INCLUSIVE trial of a whole-school health intervention. Trials, 21(1), 774. https://doi.org/10.1186/s13063-020-04688-2
Zamarro, G., Hitt, C., & Mendez, I. (2019). When students don’t care: Reexamining international differences in achievement and student effort. Journal of Human Capital, 13(4), 519-552. https://doi.org/10.1086/705799
