Applying supervised deep transfer learning convolutional neural networks to the classification of palaeoenvironmental remains

Application summary

This doctoral thesis is an interdisciplinary investigation of the subjectivity inherent in the analysts’ classifications of palaeoenvironmental remains, namely pollen grains and faunal osseous remains. The significant research contributions span from improvements in the post-hoc interpretation of convolutional neural networks, state-of-the-art classification models in pollen classification, and the first application of convolutional neural networks in the classification of bones to species from images.

Tämän rahoituksen tarkoitus oli saattaa loppuun väitöskirjatutkimukseni “Applying supervised deep convolutional neural network to identify bones from archaeological assemblages” ja pyrkiä kahteen tieteellisen julkaisun lähettämiseen. Väitöskirja tulikin valmiiksi Koneen Säätiön rahoituksen avulla. Yksi valmistettavista artikkeleista lähetettiin lopulta Archaeological and Anthropological Sciences-julkaisuun, ja se odottaa tällä hetkellä viimeistelyä ennen lopullista julkaisua. Rahoituksen avulla pidin myös esitelmän CAA Oxford 2022-konferenssissa.

Yleisesti ottaen väitöskirjaprojektini oli onnistunut, mutta muutti muotoaan useampaan kertaan. Väitöskirjan viralliseksi otsikoksi tuli “Addressing subjectivity in the classification of palaeoenvironmental remains with supervised deep learning convolutional neural networks”, mikä kuvastaa paremmin väitöskirjan sisältöä. Tämä muutos tehtiin, jotta pilotointivaiheen siitepölyhiukkasten tunnistus tutkimukseni sopisi paremmin väitöskirjaan. Siitepölyjen tutkiminen oli tarpeellinen vaihe, sillä kuvamateriaalin kerääminen ei ollut mahdollista ensimmäisten kuukausien aikana byrokraattisista syistä ja UCL:n väitöstutkimus-prosessiin kuuluu, että ensimmäisenä vuonna on jo osa tutkimuksesta valmiina. Siitepölyhiukkaset valikoitui tämän pilotointivaiheen aiheeksi myös siksi, että siitepölyhiukkasten tunnistaminen kuvista on huomattavasti pidemmälle kehittynyt tieteen alue kuin arkeologisten objektien tunnistus, joten tätä ongelmaa varten on jo olemassa olevia kuvatietojoukkoja ja siitepölyhiukkaset ovat tärkeitä myös arkeologiassa. Pilotointivaiheen jälkeen oli vuorossa itse pääaihe, eli eläinten luiden tunnistus. Vaikka alunperin olin uumoillut luovani mallin useiden eläinlajien ja eri luuelementtien tunnistamiseksi, oli jälleen pakko muuttaa suunnitelmia. Syy tähän muutokseen on se, että kuvamateriaalin kerääminen ei ollut kovin nopeaa eikä tarvittavaa luuaineistoa ollut käytettävissä. Yksi suuri ongelma luuaineiston saatavuudessa on se, että usein museot pitävät kokoelmissaan vain rajattua määrää yksilöitä, joten kuva-aineiston kokoamiseksi on tarpeellista käyttää hyväksi usean museon kokoelmia, mikä tuottaa logistisia ongelmia. Tulevaisuuden tutkimusten tulisikin pyrkiä löytämään neuroverkkomalleja, jotka toimivat pienemmillä määrillä dataa.

Väitöskirjatutkimukseni onnistumisiin lukeutuu mallieni erittäin hyvä tarkkuus (myös verrattaessa asiantuntijoihin), mahdollisuus tarkistaa lämpökarttojen avulla mihin kuvan alueeseen konvoluutio neuroverkkomallit keskittyvät, sekä Grad-CAM-menetelmän parantaminen. Väitöskirjani pääteesi onkin, että paleoympäristön tutkimuksessa tulisi siirtyä asiantuntijoihin tukeutuvasta näytteiden tunnistamisesta kohti kuvan tunnistusta ja neuroverkkomalleja, mikä lisäisi tutkimusten tilastotieteellistä tehoa.