Gå direkte til innhold

Database med norske middelaldertekster

Norske middelaldertekster blir tilgjengelige i en egen database som vil få stor betydning for norske forskningsmiljøer innenfor språkhistorie, middelalderhistorie, grammatikk, leksikografi og komparativ syntaksforskning.

Prosjekt:
Menotec - Medieval Norwegian Text Corpus

Status: UNDER ETABLERING

 
Norske tekster fra tidsrommet 1150–1550 har inntil nå bare vært tilgjengelige i begrenset grad i elektronisk form, i motsetning til hva som er tilfellet i mange andre land. Med Menotec faller de siste bitene av norske middelaldertekster på plass i en egnet database. Databasen skal være en utvidelse av Arkiv for nordiske middelaldertekster (Menota), og vil i tillegg til denne tilby et vesentlig større tekstmateriale som for en stor del også vil være språklig oppmerket.

Felles format

Utsnitt fra Gammelnorsk homiliebok, den eldste bevarte norske middelalderbok (ca. 1200). Gjennom Menotec blir boken gjort elektronisk tilgjengelig for alle. Utsnitt fra Gammelnorsk homiliebok, den eldste bevarte norske middelalderbok (ca. 1200). Gjennom Menotec blir boken gjort elektronisk tilgjengelig for alle. Arbeidet med å utvikle databasen innebærer transkripsjon av 1.5 millioner ord, der 1 million ord hovedsakelig kommer fra lovtekster og diplomer. Dette materialet vil bli morfologisk merket med oppslagsform og grammatisk form. 0,5 millioner ord vil være syntaktisk merket. Etter hvert som tekstene ferdigstilles, blir de lagt ut i Menota. Syntaktisk merking er nytt i Menota, og denne merkingen vil følge maler for merking av eldre indoeuropeiske språk utviklet gjennom tidligere prosjekter.

De morfologiske dataene vil lagres i en metaordbok i samme format som den Norsk Ordbok 2014 bruker. Det blir dermed mulig å lage en felles nordisk metaordbok for norske, svenske, islandske og danske middelaldertekster med kopling mot de nasjonale ordboksverkene. Denne ordboken vil inneholde informasjon om semantikk, morfologi og komparativ lingvistikk på tvers av språkene.

Tilrettelegger for internasjonalisering

Databasen vil bygge på eksisterende teknologi og vil bruke internasjonale standarder, slik at den kan brukes av relevante forskningsmiljøer i både inn- og utland. Et nytt søkergrensesnitt for tekster som er syntaktisk merket, skal utvikles.

Infrastrukturen vil ha stor betydning for sentrale og sterke forskningsmiljøer i Norge innenfor språkhistorie, grammatikk, leksikografi og komparativ syntaksforskning og prosjektet vil åpne for internasjonalt samarbeid, særlig innenfor historisk språkvitenskap. Også ordboksarbeid i Norge og Norden vil kunne få stor nytte av databasen.

Menotec vil også kunne inngå som en del av CLARIN-prosjektet, som er et av ESFRI-prosjektene som har fått støtteerklæring fra Forskningsrådet. Resultatene fra prosjektet vil derfor kunne sees i en europeisk sammenheng og få betydning også utenfor Nordens grenser.

Partnere

Menotec skal utvikles i et samarbeid mellom Universitetet i Bergen og Universitetet i Oslo.

Finansiering

Infrastrukturen har fått innvilget 7 millioner kroner som skal gå til å etablere databasen. I tillegg bidrar partnerne med ca. 3 millioner kroner i egenfinansiering.

Tidsplan

Databasen planlegges ferdigstilt i løpet av 2012. Drift og vedlikehold av infrastrukturen vil ligge under Menotas ansvar. Menota er et nettverk som består av til sammen 18 nordiske arkiver, biblioteker og institutter som arbeider med middelaldertekster og håndskriftsfaksimiler.

Publisert:
 16.06.2010