Konehuone-kolumni: Tutkimusrahoittajat, tutkijat ja tutkimusaineistot – tasapainoa etsimässä

Miten paljon rahoittajan tulisi puuttua siihen, miten tutkijat käsittelevät tutkimusaineistojaan? Entä miten paljon tutkijan pitäisi suunnitella omien tutkimusaineistojensa hallintaa? Tutkimusrahoittajan kannalta kyse on myös tasapainosta tutkimuksen keskeisen sisällön ja muiden elementtien välillä, kirjoittaa Koneen Säätiön tiedejohtaja Kalle Korhonen.
Kuva: Nathan Dumlao / Unsplash

Tieteellinen työ perustuu yleensä tutkimusaineistoon, jota muodostetaan, käsitellään ja analysoidaan. Ennen internetiä tutkimusaineistojen tallentaminen, säilyttäminen ja kierrätys riippui tieteenalojen käytännöistä, tutkimusryhmistä ja yksittäisistä tutkijoista, mutta tilanne on sittemmin muuttunut. Koneen Säätiö alkoi v. 2013 suositella säätiön rahoittamille tutkijoille tutkimusaineistojen arkistointia jatkokäyttöä varten. Viime aikoina tutkimusaineistoista on tullut melkein julkaisuihin verrattavia tuotoksia. Tutkimusaineistoja varten on maailmalla perustettu digitaalisia arkistoja ja omia tieteellisiä lehtiä.

Kun suomeksi puhutaan tutkimusdatasta ja tutkimusaineistosta, täytyy täsmentää, mitä tarkoitetaan. Raakadata on aineistoa, joka päivittyy jatkuvasti aineistonkeruun tai esim. ohjelmiston tuottaman prosessin myötä. Työdataan voi jo viitata, ja jotta näin voisi olla, se on jäsennetty versioiksi. Jäsentynein datan muoto on datatuotos, muuttumaton aineisto joka voi toki muuttua osaksi laajempaa tutkimusaineistoa. (Tämä jäsennys perustuu CSC:n Heidi Laineen esitykseen Säätiöt ja rahastot ry:n tilaisuudessa toukokuussa 2021.)

Nykyisin tutkijoille painotetaan hyvää datanhallintaa, jonka pitäisi lisätä datan arvoa tekemällä siitä yhteentoimivaa, helpommin löydettävää ja vaikeammin hukattavaa, ymmärrettävää sekä paremmin uudelleen käytettävää. Englanniksi käytetään lyhennettä FAIR (findable, accessible, interoperable, reusable). Euroopan unionin neuvosto ja Euroopan komissio kannustavat hyvän datanhallinnan periaatteiden käyttämiseen kaikessa tutkimuksessa. Euroopan tiedeakatemiat julkaisivat helmikuussa 2020 erityisen suosituksen tutkimusaineistojen hallinnasta humanistisissa tieteissä.

Suunnitelmat siitä, miten tutkimusaineistoa käsitellään, ovat löytäneet tiensä myös rahoitushakemuksiin. Esim. Suomen Akatemia edellyttää hakemuksilta aineistonhallintasuunnitelmaa, ja perustelee tätä sillä, että ”julkisin varoin rahoitetun tutkimuksen tärkeimpiä tuotoksia ovat tutkimusaineistot ja tutkimusjulkaisut”. On huomionarvoista, että aineistot mainitaan ennen julkaisuja. Suomessa DMPTuuli-verkkopalvelun on tarkoitus tukea tutkijoita aineistonhallintasuunnitelmien laatimisessa.

Voitaisiinko datanhallintasuunnitelmien avulla välttää se, ettei käy kuten yhdelle omalle tutkimusaineistolleni? Väitöskirjani julkaisuversio ilmestyi paperikirjana Suomen tiedeseuran julkaisusarjassa v. 2004. Tutkimusaineiston – valokuvien – osalta päätin, että en julkaissut kuvia kirjassa, vaan yliopiston verkkosivuilla, koska koin sen hyödyllisemmäksi muun tutkijayhteisön kannalta. Kirjan jaoin verkossa vasta muutamaa vuotta myöhemmin. Kuvat taas katosivat netistä joskus 2010-luvun lopulla, mahdollisesti verkkosivu-uudistuksen myötä. Onneksi tilanteen korjasi hanke, jossa sama aineisto kuvattiin uudestaan ja tallennettiin paremmin avoimen tieteen periaatteita noudattaen Italian kansallisen tutkimusneuvoston verkkoon.

Koneen Säätiö ei ainakaan toistaiseksi vaadi tutkimusrahoituksen hakijoilta aineistonhallintasuunnitelmaa. Ennen kaikkea hakemusten arvioijista riippuu, miten datanhallinta vaikuttaa rahoitushakemuksen menestymiseen. Suosittelemme edelleen säätiörahoitteisille tutkijoille tutkimusaineistojen avoimuutta, mutta emme anna siitä tarkempia ohjeita. Rahoittajankin intressissä kuitenkin on, että tutkimusaineistot eivät joudu hukkaan. Nähdäkseni tutkijoiden täytyy oppia kiinnittämään huomiota datanhallintaan, ja koulutus on ensisijaisesti tutkijakoulutuksen tehtävä. Se, että tutkimustyötä ihan oikeasti tehdään yhä enemmän ryhmissä, voi helpottaa tätä kehitystä myös humanistisissa tieteissä, jos joku ryhmän jäsen voi ottaa isomman roolin datanhallinnassa, ja saada siitä myös tutkimusmeriittiä.

Kun tutkimusrahoittajat määrittelevät elementtejä, joita rahoitushakemuksissa täytyy olla, on pakko kysyä sekä itseltämme että tiedeyhteisöltä, mitkä kaikki elementit ovat tarpeellisia. Miten voisimme säilyttää tasapainon siinä, että tilaa jää myös tutkimuksen keskeisten sisältöjen esittelylle? Tämä on se iso haaste, jota tieteen rahoittaja joutuu jatkuvasti pohtimaan, koska kukaan ei halua tehdä rahoituksen hakemista ja arvioimista työläämmäksi kuin mitä se jo nyt on. Jos taas alkaa näyttää siltä, että tutkijat eivät saa riittävästi datanhallinnan ymmärrystä tutkimusorganisaatiostaan, niin täytyy miettiä, miten tilannetta voisi parantaa yhdessä.

Kirjoittaja

Kalle Korhonen

Kirjoittaja on Koneen Säätiön tiedejohtaja.
Aiheeseen liittyvää