Jukka Rantasaari

Turun yliopiston monialainen työryhmä on rakentanut Turun yliopiston tutkijakouluun (UTUGS) Tutkimusdatan hallinnan perusteet -kurssin, joka sisältää kolme tutkimuslinjaa: terveystieteellisen, luonnontieteellisen sekä kysely- ja haastattelututkimuksen. Eri alojen tutkijoiden haastattelujen pohjalta työryhmä suunnitteli koulutuksen, joka on saanut jo nyt sekä kansallista että kansainvälistä huomiota.

 

Tutkijoiden haastattelut datan hallinnan koulutuksen perustana

Turun yliopistossa kirjaston johdolla haastateltiin tohtorikoulutettavia, ohjaajia, post doc -tutkijoita ja biostatistikkoja. Tavoitteena oli selvittää tohtorikoulutettavien datanhallinnan käytäntöjä, tarpeita, tärkeyttä ja taitoja. Haastatteluissa haastateltavat arvioivat datanhallinnan eri vaiheiden tärkeyden sekä tohtorikoulutettavien tämänhetkisen, keskimääräisen osaamisen.

Valitsimme kolmekymmentä haastateltavaa eri tiedekunnista. Haastattelijat tulivat kirjastosta ja IT-palveluista. Haastatteluissa kävimme läpi seuraavat tutkimusprojektien datanhallinnan vaiheet:

  • datan keruu ja elinkaari projektin aikana,
  • tarvittavat sopimukset, luvat ja lisenssit,
  • versionhallinta, varmuuskopiointi ja tutkimuksenaikainen datan tallennus,
  • datan käsittely, analysointi ja visualisointi,
  • datan järjestäminen, dokumentointi, kuvailu ja metadatoitus, laadunhallinta,
  • ulkoisen (jonkun muun tuottaman) datan hankinta ja käyttäminen,
  • immateriaalioikeuksien hallinta ja tietoturva,
  • tieteen- ja oppiainekohtaiset datanhallinnan kulttuurit ja käytännöt,
  • datan pitkäaikaissäilytys, uudelleenkäyttö ja jakaminen.

Datanhallinnan koetun tärkeyden ja osaamisen välillä osoittautui olevan selkeä ero. Haastateltujen tutkijoiden keskimääräinen arvio datan elinkaaren eri vaiheiden hallinnan tärkeydestä oli 4,1 (1 = ei lainkaan tärkeä, 5 = välttämätön). Haastateltujen keskimääräinen arvio tohtorikoulutettavien nykyisistä taidoista oli 2,5.

Haastatteluja ja niiden tuloksia hyödynnettiin Tutkimusdatan hallinnan perusteet -kurssin suunnittelussa ja rakentamisessa. Kurssi on suunnattu paitsi tohtorikoulutettaville myös post doc -tutkijoille.

Datanhallinnan tavoitteet tulevat useilta tahoilta

Haastateltavat toivat esiin, että korkealaatuinen tutkimus ja luotettavat tutkimustulokset edellyttävät korkealaatuista tutkimusdataa. Korkealaatuista dataa luodaan hyvillä käytännöillä, toimintatavoilla ja taidoilla. Tällä hetkellä vallitseva tilanne on usein se, että käytäntöjä, toimintatapoja ja taitoja opitaan yrityksen ja erehdyksen kautta, sitä mukaa kuin asiat tulevat projekteissa vastaan. Koska datanhallintaan ei ole järjestetty varsinaista formaalia koulutusta, tohtorikoulutettavien osaaminen ja taidot vaihtelevat paljon. Tämä havainto oli yhdenmukainen tutkimuskirjallisuudessa esitettyjen aikaisempien tutkimustulosten kanssa (ks. esim. Jahnke, Asher & Keralis: The Problem of Data).

Laadukkaalle datanhallinnalle asettavat tavoitteita myös EU:n ja kansalliset avoimen tieteen linjaukset ja tavoitteenasettelut. Esimerkiksi Euroopan komission alainen ”Open Science Skills Working Group” suosittelee vuoden 2017 loppuraportissaan, että avoimen tieteen taidot (mukaan lukien tutkimusdatan hallinnan taidot) huomioidaan jatkossa EU:n puiteohjelmissa sekä muiden rahoittajien rahoitusehdoissa. Raportissa todetaan, että avoimen tieteen taitojen koulutusten tulisi olla pakollisia eri tutkijanuravaiheen koulutuksissa ja että korkeakoulujen ja tutkimuslaitosten tulee huolehtia siitä, että tutkijoiden avoimen tieteen taidot ovat tasolla, joka mahdollistaa avoimen tieteen tavoitteiden saavuttamisen (esim. datan pitkäaikaissäilytyksen, jakamisen ja uudelleenkäyttämisen). Korkealaatuinen data, jota tuotetaan ja ylläpidetään laadukkailla toimintatavoilla, mahdollistaa datan jakamisen ja uudelleenkäyttämisen.

Hyvät datanhallintataidot ovat kuitenkin tärkeitä myös yliopiston ulkopuolisessa työelämässä. Laadukkaan datan tuottaminen, tietoturva- ja suoja-asioiden ymmärtäminen mahdollistavat datan käytön esimerkiksi erilaisissa tekoälysovelluksissa, jotka ovat tärkeitä uusien palvelujen luomisen ja päätöksenteon välineitä.

Tutkimusdatan hallinnan perusteet -kurssi

Haastatellessamme biostatistikkotiimin vetäjää, Eliisa Löyttyniemeä, kävi selville, että hän on runsaan vuoden ajan opettanut lääketieteellisen tiedekunnan opiskelijoille ja tutkijoille, kuinka rakennetaan helppokäyttöinen tietokanta datan keruuta ja ylläpitoa varten. Näillä kursseilla oli ilmennyt selkeä tarve myös laajemmalle kurssille, jossa käsiteltäisiin koko datan elinkaari suunnittelusta arkistointiin tai jakamiseen asti.

Teimme yhteisen havainnon: tässä meillä on hyvä pohja, jolle voimme alkaa rakentaa laajempaa datanhallinnan kurssia. Muodostimme työryhmän, joka koostui opettajista ja tutkijoista sekä tutkimuksen eri tukipalvelujen asiantuntijoista lakiasioista (ml. tietosuojavastaava), Clinical Research Centeristä (CRC), kirjastosta, IT-palveluista ja tutkimusedellytyksistä.

Kurssilla kirjoitetaan tutkimussuunnitelman datanhallinnan osuus ja datanhallintasuunnitelma, joissa huomioidaan datanhallinnan eri osa-alueet kuten

  • missä ja miten keräät, tallennat, suojaat, prosessoit, dokumentoit, säilytät ja jaat datasi,
  • kuinka luot tietokannan datan hallintaan,
  • miten huomioit immateriaalioikeudet, luvat ja lisenssit,
  • kuinka laadit tietosuojailmoituksen ja riskianalyysin,

Kurssin ensimmäinen toteutus alkaa maaliskuussa ja kestää toukokuun lopulle 2019.

Mitä tämän jälkeen?

Kurssilta ja sen moduuleista kerätään ja koostetaan palautteet ja niitä hyödynnetään koulutuksen sisältöä ja työtapoja kehitettäessä vuoden 2020 englanninkieliseen toteutukseen. Selvitämme myös mahdollisuuden tehdä yhteistyötä Åbo Akademin kanssa.

Lopuksi

Kiitämme kaikkia haastattelemiamme tohtorikoulutettavia, ohjaajia, post doc -tutkijoita ja biostatistikkoja heidän arvokkaasta ajastaan ja panoksestaan, joka on korvaamattoman tärkeä ja tekee tästä kurssista aidosti tutkimukseen perustuvan koulutuksen. Kiitokset myös työryhmälle, ja ennen muuta biostatistikkotiimin vetäjälle Eliisa Löyttyniemelle, joka toimii myös kurssin vastuuopettajana.

Yhdessä suunniteltu koulutus on saanut kansallista huomiota  mm. avoimen tieteen syyspäivillä. Kurssin suunnittelua ja rakennetta sekä haastattelujen tuloksia esitellään ensi kesänä kahdessa kansainvälisessä konferenssissa.

Linkkejä

Eliisa Löyttyniemi: Tervetuloa tiedonhankinnan perusteet -kurssille

Jukka Rantasaari: Miksi kurssi datanhallinnasta: taustaa

 

Jukka Rantasaari

Kirjoittaja toimii kirjaston tutkimuksen palveluista vastaavana palvelupäällikkönä Turun yliopiston kirjastossa.