Hjem
Forskergruppa Sosiolingvistikk og språkendring

Om Talebanken

Talebanken er eit digitalt arkiv (korpus) for transkriberte lydfiler som skal brukast i talemålsforsking. Her blir lyd og transkripsjon kopla saman. Talebanken er utvikla teknisk av Uni Research Computing med med tanke på å effektivisere analysar og å gjere analysane sikrare. Materialet kjem inn i Talebanken ved at det går inn i konkrete sosiolingvistiske talemålsstudiar. Det eit mål å ta vare på alt materialet inklusiv kodingar for at det skal kunne gjenbrukast i andre og seinare prosjekt

Arkivet er etablert med tanke på forskingsformål, og derfor er tilgangen avgrensa til forskarar med løyve. 

Årsmelding 2018

Talebanken ligg no i den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpus-list?collection=Talebanken).

Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frå år til år. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 3,8 millionar ord, Industristadprosjektet (Språkutvikling på industristader) som har om lag 1,8 millionar ord og Talesøk på om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki. Det blir ved utgangen av året på sirka 1 mill. ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I år er det kome til eit nytt materiale frå Laksevåg-bydel i Bergen, og ein masterstudent har levert avhandling (Lista) basert på innlagt materiale i banken. Neste år ventar me inn nytt materiale frå Karmøy (master), Sogndal (forskar) og Lindås (phd). Det er no to phd-kandidatar og tre masterstudentar ved LLE som bruker banken i arbeidet sitt. I tillegg kjem andre forskarar.   

Me fekk i år Ida Torkildsen til å teikna ein ny og fin logo til oss.

I samband med ein søknad om eit tverrfagleg forskingsprosjekt der Talebanken ville inngå, fekk me i 2018 tildelt 50 000 kroner til HF-forsk. Noko av denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar.  

Den 25. og 26. januar 2019 vil det bli skipa til eit seminar her ved LLE  der me vil utveksla røynsler saman med Føroyskur talumálsbanki, og me skal demonstrera korleis Talebanken verkar, kan utnyttast og vidareutviklast.

21.12.2018
Ragnhild Lie Anderson

Årsmelding 2019


Talebanken ligg på den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpuslist?collection=Talebanken).
Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frå år til år. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 4,2 millionar ord, Industristadprosjektet (Språkutvikling på industristader) som har om lag 1,8 millionar ord og Talesøk på om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki på sirka 470 000 ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I år er det kome til eit nytt materiale frå Laksevåg, eit frå Karmøy (master) og eit materiale med to ungdomskull frå Sogndal (forskar). Det er no to phd-kandidatar og to nye masterstudentar ved LLE som vil bruka banken i arbeidet sitt. I tillegg er det kome til nokre nye interne og eksterne forskarar. I år begynte også staben ved Norsk Ordbok å bruka Talebanken i søka sine. 

Me fekk i 2019 tildelt 50 000 kroner frå småforsk. Denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar. Det var også meininga at Clarino ved Paul Meurer skulle gjera arbeid for å vidareutvikla banken, men det ser ut til at dei har gløymt å senda faktura for dette arbeidet til instituttet.

Den 25. og 26. januar 2019 var det eit seminar ved LLE der me utveksla røynsler saman med Føroyskur talumálsbanki. Fleire hadde innlegg og demonstrerte korleis Talebanken verkar, og det vart diskutert korleis denne banken kan utnyttast og vidareutviklast. Hausten 2020 planlegg me eit internt seminar for å demonstrera korleis Talebanken har blitt og kan bli nytta.


02.03.2020
Ragnhild Lie Anderson