Språk og data

Lågaregradsemne

Emnebeskrivelse

Mål og innhald

Emnet tek føre seg det formelle grunnlaget for beskriving av språk og datamaskinelle metodar for behandling av språk. Målet er å sette studentar i stand til å tenke på ein matematisk presis måte når dei karakteriserer eit språk, og å bruke dataverktøy og programmering for å prosessere tekst.

Emnet gjev ei innføring i formelle metodar i lingvistikken. Emnet gjev også ei innføring i digital koding av tekst, i elektroniske språkressursar (spesielt korpus), programmering (i t.d. Python som programmeringsspråk), språkprosessering og språkteknologiske bruksområde. Dette emnet eignar seg for studentar i lingvistikk, språkstudier, informatikk, informasjonsvitenskap, kunstig intelligens og kognisjonsvitskap.

Læringsutbyte

Kunnskapar

Kandidaten kan...

  • dele opp ein komputasjonell prosess i mindre deler gjennom algoritmisk tenkning;
  • forklare algoritmer og dataprogram for grunnleggjande behandling av digitale språkdata, t.d. tokenisering, n-gram, frekvensar og anna manipulering av tekst og tabellar;
  • attgje og gjere greie for viktige eigenskapar av formelle språk, automatar og grammatikkar;

Ferdigheiter

Kandidaten kan...

  • skrive og teste enkle dataprogram for grunnleggjande behandling av digitale språkdata, t.d. tokenisering, n-gram, frekvensar og anna manipulering og visualisering av tekst og tabellar;
  • skrive og forklare regulære uttrykk for søk og erstatning i tekst;
  • innhente tekst og annan informasjon fra verdsveven inn i dataprogram;
  • gjennomføre viktige resonnement om formelle språk, automatar og grammatikkar.

Generell kompetanse

Kandidaten kan...

  • kritisk vurdere bruk av digitale data og dataverktøy i lingvistikken;
  • bruke tekstkorpus som empirisk materiale i lingvistiske problemstillingar;
  • bruke korrekte matematiske formuleringar.

Fulltid/deltid

-

Studiepoeng, omfang

15

Studienivå (studiesyklus)

Bachelor

Undervisningssemester

Vår

Undervisningsstad

Bergen
Krav til forkunnskapar
Ingen
Tilrådde forkunnskapar
EXFAC00SK eller tilsvarande.
Studiepoengsreduksjon
INFO132 (5 stp.), DATA110 (5 stp.), INF100 (5 stp.), INF620 (5 stp.), DIGI111 (2,5 stp.).
Krav til studierett
Emnet er ope for alle med studierett ved Universitetet i Bergen.
Arbeids- og undervisningsformer

Forelesingar (omkring 26 timar pr semester), sjølvstudium og øving, inkl. programmering på datamaskin.

Om det melder seg færre enn fem studentar til eit emne kan instituttet innføre redusert undervisning, jamfør instituttet sine retningsliner for dette på Mitt UiB. På emne der dette kan verte aktuelt vil studentane få informasjon om dette ved semesterstart, og før fristen for semesterregistrering 1. februar / 1. september.

Obligatorisk undervisningsaktivitet
Studenten skal levere to obligatoriske oppgåver, som må gjerast og godkjennast i undervisningssemesteret. Obligatorisk undervisningsaktivitet må vere godkjent før ein kan ta eksamen i emnet.
Vurderingsformer
Digital skriftleg skuleeksamen på 3 timar.
Karakterskala
A-F
Vurderingssemester
Vår.
Litteraturliste
Pensum består hovudsakleg av beskrivingar av formelle og datamaskinelle metodar, bl.a. instrukser og eksempler på programmering, ca. 400 sider.
Emneevaluering
Evaluering av tilbodet vert gjennomført i tråd med UiBs kvalitetssikringssystem.
Hjelpemiddel til eksamen
Ingen hjelpemiddel er tillatne.
Programansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium
Emneansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium
Administrativt ansvarleg
Programstyret for språkvitskap, Institutt for lingvistiske, litterære og estetiske studium