Grants and residencies Research Keramiikan palasista avoimeen egyptologiseen dataan Main applicant FT Jauhiainen Heidi Amount of funding 108000 € Type of funding General grant call Fields Cultural sciencesHistoryLinguistics Grant year 2021 Duration Three years If you are this project's responsible person, you can sign in and add more information. Log in Share: Back to Grants listing Application summary Tutkimusprojektin tavoitteena on edistää muinaisegyptiläisten hieroglyfitekstien digitaalista tutkimusta. Egyptiläiset itse kirjoittivat jokapäiväiset tekstinsä papyruksille tai, vielä yleisemmin, keramiikan- tai kalkkikivenpalasille. Tällaiset tekstit julkaistaan yleensä painetuissa kirjoissa, eikä alalla ole perinteenä julkaista niitä koneluettavassa muodossa. Egyptologeilla ei myöskään ole ollut tapana julkaista Egyptin ilmiöitä tutkiessaan keräämiään tutkimusaineistoja muiden käyttöön lisätutkimuksia varten. Tässä projektissa rakennetaan työnkulku koneluettavien tekstien tuottamiseksi projektissa kehitettävää automaattista translitteraatiomenetelmää käyttäen ja työnkulun avulla tuotetut tekstit julkaistaan avoimella lisenssillä. Lisäksi aiemmin keräämäni tutkimusaineisto Deir el-Medinan kylän juhlista tarjotaan avoimesti ladattavaksi ja se, yhdessä koneluettavien tekstien kanssa, tulee toimimaan juhlista kirjoitettavan kirjan digitaalisena liitteenä. Hankkeessa tuotetaan työkaluja ja malleja hieroglyfitekstien muuntamiseksi koneluettavaan muotoon ja se toimii esimerkkinä tutkimusaineistojen avoimesta julkaisemisesta egyptologian alalla. Project report summary Tutkimusprojektin tavoitteena oli edistää muinaisegyptiläisten hieroglyfitekstien digitaalista tutkimusta. Se miten tavoitteet toteutettiin, muuttui hieman hankkeen edetessä, kun kävi ilmi, että egyptologiassa on tarve työkaluille, joilla koneluettavia tekstejä voi käsitellä, eikä ensi sijassa sellaiselle, joka translitteroi tekstejä automaattisesti. Egyptologit käyttävät hieroglyfitekstieditoreita tuottaakseen teksteistä kuvia julkaisuihin. Tekstit kirjoitetaan käyttäen kullekin merkille ns. Manuel de Codage (mdc) koodia, joka tallennetaan gly-päätteisiin tiedostoihin. Nämä tiedostot ovat koneluettavia mutta ne on usein tuhottu tai haudattu tietokoneen syövereihin, koska niitä pystyy lukemaan vain hieroglyfitekstieditoreilla. Hankkeessa rakennettiin työkaluja, joita käyttäen egyptologit voivat julkaista tekstit myös koneluettavassa muodossa. Gly2mdc muuntaa binäärimuotoisen gly-tiedoston sisältämän koodin ihmisen luettavaan tekstimuotoon. Työkalun toinen versio Gly2mdc v.2 muuntaa koodatun tekstin erilaisiin versioihin kuten Unicode ja merkkikohtainen JSON esitys, ja siinä on kaksoisnapautuksella aukeava käyttöliittymä, jossa käyttäjä näkee eri versiot ja voi valita mitkä niistä haluaa tallentaa itselleen. Hankkeessa kehitettiin myös menetelmiä hieroglyfitekstien käsittelyyn. Automaattinen koodattujen ja translitteroitujen lauseiden kohdentamismenetelmä käyttää hyväkseen Needleman-Wunsch algoritmia. Kohdentamismenetelmän avulla saatiin julkaistua translitteraatio-kielimallit olemassa olevista hieroglyfitekstikorpuksista. Automaattinen koodatun hieroglyfitekstin segmentointi sanoiksi käyttää puolestaan n-grammi- ja sana-kielimalleja. Segmentoinnin apuna on työkalu Mdc2words, jossa sanoiksi jaoteltua tekstiä voi tutkia sekä koodatussa muodossa että Unicode hieroglyfeinä ja tarpeen vaatiessa korjata. Hankkeen aikana esitelmissä ja artikkeleissa painotettiin sekä koneluettavien tekstien tärkeyttä että tutkimusaineiston julkaisemista vapaalla lisenssillä. Back to Grants listing