MA Konovalova Aleksandra

94000 €

Tietämyksen tornia rakentamassa: kertovan proosan konekäännösohjelmien kehittäminen hahmojen verkostojen avulla

Tieteellinen tutkimus / siihen pohjautuva työ | Kolmivuotinen

Konekääntämisen laatu ja käytettävyys ovat viime vuosina parantuneet merkittävästi. Kaunokirjalliset tekstit ovat kuitenkin edelleen suuri haaste useimmille nykyisille konekäännösohjelmille ja väitöskirjani päämääränä on kehittää konekäännösmalli juuri proosateksteille ja yksi tavoitteista on tutkia, miten hahmojen verkostojen lisääminen voisi parantaa proosatekstien konekäännoksen laatua. Yleensä kontekstina toimii vain yksi tai muutama lause, mutta tällaisten verkostojen avulla käännettävän tekstinkohdan kontekstia voidaan laajentaa, mikä parantaisi konekäännoksen laatua. Tutkimuksen päämenetelmät ovat syväoppimisen ja koneoppimisen menetelmiä. Käytän neuroverkot, esimerkiksi Transformers-neuroverkot, englanti-suomi-konekääntämiseen. Hahmojen verkostojen rakentamiseen on käytetty erilaisia menetelmiä tietopohjaisista menetelmistä koneoppimismenetelmiin. Aion testata niitä tutkimuksessani ja mahdollisesti yhdistää niitä verkkojen luotettavuuden lisäämiseksi. Pääaineisto on englanti-suomi-rinnakkaiskorpus, johon sisältyy suomennoksia ja englanninkielisiä alkuperäisiä tekstejä, nimenomaan kaksi romaania ja yksi novelli. Se on saatavilla Kielipankissa CEAL-nimellä. Väitöstutkimukseni tulee olemaan osa Kertova teksti, kääntäjä ja kone -hanketta, jossa työskentelen tutkimusryhmän jäsenenä. Tehtävänäni on luoda algoritmeja hahmojen verkostojen muodostamista varten ja auttaa rakentamaan prototyyppi konekääntimelle, jonka tavoitteena on avustaa ammattimaisia kääntäjiä kaunokirjallisuuden kääntämisessä englannista suomeen. Tutkimukseni on uraauurtava sekä menetelmiensä (hahmojen verkostojen ja neuroverkkojen yhdistäminen), kieliparinsa (englanti-suomi) että tekstilajinsa (proosa) osalta. Konekääntämisen hyödyntämistä proosan kääntämisessä on toistaiseksi tutkittu vähän ja erityisen vähän sitä on tutkittu Suomessa.