Hjem
data, språk, lingvistikk

Datalingvistikk og språkteknologi

Datalingvistikk er vitenskapen om menneskelig språk og språkbruk, utforsket ved hjelp av datamaskinelle metoder. Innen datalingvistikk undersøker man prosesser som f.eks. språkforståelse og språkproduksjon, oversettelse og språklæring, og forsøker å beskrive disse prosessene i form av datalingvistiske modeller. Formålet er dels å vinne innsikt i språkprosesser hos mennesket, og dels å utvikle et grunnlag for praktiske språkteknologiske anvendelser.

Hovedinnhold

Språkteknologi er bruk av datateknologi for behandling av naturlige språk. Eksempler på språkteknologiske anvendelser er maskinoversettelse, korrekturlesning, informasjonssøking og språklige hjelpemidler i skolen og for funksjonshemmede. Taleteknologi er et eget felt innen språkteknologien, og omfatter applikasjoner som talegjenkjenning og talesyntese. Taleteknologien forutsetter spesialiserte teknikker for behandling av akustiske signaler.

Datalingvistikk og språkteknologi har på den ene siden et teoretisk grunnlag, basert på formelle matematiske metoder og statistisk modellering, på den andre siden en empirisk tilnærming, basert på analyse av autentiske språkytringer (ofte i form av store tekst- og talekorpora) og resultater fra eksperimenter.

Mange aspekter av datalingvistikk og språkteknologi er også av flerfaglig interesse, spesielt for studenter på kognitiv vitenskap, språkfagene, informatikk og informasjonsvitenskap. Fagene har yrkesmuligheter innenfor bl.a. forskning, språkteknologi- og informasjonsteknologibedrifter.