Hjem
Nye doktorgrader
Ny doktorgrad

Spanske oversettelser av tyske sammensatte ord

Carla Teresa Parra Escartín disputerer fredag 27. mars 2015 for ph.d.-graden ved Universitetet i Bergen med avhandlingen: “German Nominal Compounds and their Translations into Spanish: A Natural Language Processing Approach”.

Hovedinnhold

Språk som tysk og norsk danner mange nye ord gjennom sammensetning av eksisterende ord. Andre språk, som spansk, bruker derimot fraser istedenfor å lage nye ord. En norsk sammensetning som f.eks. “varmtvannsberedning” oversettes til spansk som “preparación de agua caliente” (beredning av varmt vann).

Ved maskinoversettelse og andre språkteknologiske anvendelser er det derfor viktig å identifisere og analysere nye sammensetninger, og finne mulige oversettelser. Denne avhandlingen fokuserer på tyske sammensatte substantiver og deres oversettelse til spansk.

En oversettelse til engelsk hadde vært mindre problematisk, siden man ofte bare kan dele opp sammensetningen, f.eks. “warm water preparation”. På spansk, derimot, må man endre på ordenes rekkefølge og bruke riktige preposisjoner eller artikler der nødvendig.

For å kunne gjennomføre eksperimenter ble et stort tospråklig korpus av tekniske tekster konstruert og annotert. Dette korpuset ble brukt på maskinoversettelseseksperimenter som testet hvorvidt ulike metoder for å takle sammensatte ord får bedre resultater enn den vanlige metoden som er i bruk i dag.

Resultatene viser at det finnes teknikker for preprosessering av sammensetninger som kan resultere i bedre maskinoversettelser. Én teknikk går ut på å ekstrahere en liste med sammensatte ord og deres oversettelser fra et treningsmateriale.

Siden det ikke finnes noen fritt tilgjengelig digital tysk-spansk ordbok, er det  ønskelig å ekstrahere slike tospråklige ordlister automatisk. Til dette formålet ble nye metoder som stiller minimale krav til ressursbruk undersøkt. Disse eksperimentene er også inkludert i avhandlingen. Resultatene fra de ulike eksperimentene kan bidra til forskning på andre språkpar, som for eksempel norsk til fransk. Dessuten er det nye tospråklige korpuset også tilgjengelig for videre forskning og utvikling.

 

Personalia:

Carla Teresa Parra Escartín ble født i Spania og tok en mastergrad i engelsk filologi ved Universitetet i Zaragoza, hjembyen hennes. Hun tok også en dobbel mastergrad i oversettelse og anvendt lingvistikk ved Pompeu Fabra Universitetet i Barcelona. Før hun begynte på sitt PhD-prosjekt jobbet hun som oversetter, forsker i datalingvistikk og lektor i oversettelse. Hun kom til Norge i mai 2011 gjennom et Marie Curie Early Stage Researcher stipend i et Initial Training Network, CLARA, koordinert fra Bergen. Hun skrev sin avhandling ved Universitetet i Bergen med Prof. Dr. Koenraad De Smedt som veileder.