Hjem
Forskergruppa Sosiolingvistikk og språkendring

Hovedinnhold

Om Talebanken

Talebanken er eit arkiv for lydfiler frå (i hovudsak) norsk talemål og eit korpus av lydfiler kopla med transkripsjon. Katalog over lydarkivet finn du her.

Korpuset Talebanken er utvikla teknisk av Uni Research Computing med med tanke på å effektivisere analysar og å gjera analysane sikrare. Materialet i korpuset er lagt inn i samband med tidlegare sosiolingvistiske talemålsstudiar. Det er tanken at materialet inklusiv kodingar skal kunna gjenbrukast i nye prosjekt.

Både lydarkivet og korpuset er etablerte med tanke på forskingsformål, og derfor er tilgangen avgrensa til forskarar med løyve.  Interesserte kan kontakta Ragnhild Lie Anderson.

Årsmelding 2018

Talebanken ligg no i den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpus-list?collection=Talebanken).

Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frå år til år. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 3,8 millionar ord, Industristadprosjektet (Språkutvikling på industristader) som har om lag 1,8 millionar ord og Talesøk på om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki. Det blir ved utgangen av året på sirka 1 mill. ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I år er det kome til eit nytt materiale frå Laksevåg-bydel i Bergen, og ein masterstudent har levert avhandling (Lista) basert på innlagt materiale i banken. Neste år ventar me inn nytt materiale frå Karmøy (master), Sogndal (forskar) og Lindås (phd). Det er no to phd-kandidatar og tre masterstudentar ved LLE som bruker banken i arbeidet sitt. I tillegg kjem andre forskarar.   

Me fekk i år Ida Torkildsen til å teikna ein ny og fin logo til oss.

I samband med ein søknad om eit tverrfagleg forskingsprosjekt der Talebanken ville inngå, fekk me i 2018 tildelt 50 000 kroner til HF-forsk. Noko av denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar.  

Den 25. og 26. januar 2019 vil det bli skipa til eit seminar her ved LLE  der me vil utveksla røynsler saman med Føroyskur talumálsbanki, og me skal demonstrera korleis Talebanken verkar, kan utnyttast og vidareutviklast.

21.12.2018
Ragnhild Lie Anderson

Årsmelding 2019


Talebanken ligg på den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpuslist?collection=Talebanken).
Sjølve Talebanken er eit digitalt forskingsarkiv (korpus) som veks frå år til år. Det er no tre delprosjekt som har kvar sine korpus liggjande i Talebanken: Dialektendringsprosessar med sirka 4,2 millionar ord, Industristadprosjektet (Språkutvikling på industristader) som har om lag 1,8 millionar ord og Talesøk på om lag 1,6 millionar ord. Dessutan er det no bygd opp eit heilt parallelt korpus for færøysk i samarbeid med Fróðskaparsetur Føroya: Føroyskur talumálsbanki på sirka 470 000 ord.

Talebanken er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, og her er talemålstranskripsjonar kopla saman med lydfiler og ei metafil med bakgrunnsopplysningar om dei ulike informantane. Det er vidare lagt til rette for at ein kan gjera sosiolingvistiske søk ut frå leksikalske, morfologiske eller fonologiske annotasjonar. Både masterstudentar og doktorstipendiatar som arbeider innafor sosiolingvistikk, legg materialet sitt inn i dette korpuset for å kunna gjera sosiolingvistiske annotasjonar og få ut statistisk distribusjonsanalyse av materialet. Også andre forskarar kan få tilgang gjennom søknad.

I år er det kome til eit nytt materiale frå Laksevåg, eit frå Karmøy (master) og eit materiale med to ungdomskull frå Sogndal (forskar). Det er no to phd-kandidatar og to nye masterstudentar ved LLE som vil bruka banken i arbeidet sitt. I tillegg er det kome til nokre nye interne og eksterne forskarar. I år begynte også staben ved Norsk Ordbok å bruka Talebanken i søka sine. 

Me fekk i 2019 tildelt 50 000 kroner frå småforsk. Denne potten har blitt brukt til transkripsjon, korrekturlesing og tilrettelegging av nytt materiale i Talebanken for masterstudentar. Det var også meininga at Clarino ved Paul Meurer skulle gjera arbeid for å vidareutvikla banken, men det ser ut til at dei har gløymt å senda faktura for dette arbeidet til instituttet.

Den 25. og 26. januar 2019 var det eit seminar ved LLE der me utveksla røynsler saman med Føroyskur talumálsbanki. Fleire hadde innlegg og demonstrerte korleis Talebanken verkar, og det vart diskutert korleis denne banken kan utnyttast og vidareutviklast. Hausten 2020 planlegg me eit internt seminar for å demonstrera korleis Talebanken har blitt og kan bli nytta.


02.03.2020
Ragnhild Lie Anderson

Årsmelding 2020

Talebanken er eit digitalt forskingsarkiv (korpus) av talemål som ligg på den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpus-list?collection=Talebanken).

Det er tre norske delkorpus og eitt parallelt korpus for færøysk. Det største delkorpuset,Dialektendringsprosessar, er no kome opp i nesten 4,5 millionar ord. Det siste som kom inn her i2020, var stipendiat Per Sigmund Sævik Bøe sitt materiale på 163 449 ord frå Lindås. I tillegg ligg detinne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i Talesøk, som kansjåast på som eit depot frå tidlegare granskingar før ein begynte med desse digitale korpusa. Tankener at materiale frå Talesøk på sikt også kan leggjast inn i eitt av dei to andre delkorpusa og bli likebrukarvenleg.

Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, bliri dag brukt aktivt av forskarar. Materiala frå desse korpusa kjem også andre aktørar til gode. I hausthar t.d. Marta Gjernes fått lesetilgang til materiale frå Industristadprosjektet når ho skal skriva bokom Odda kommune.

Dessutan nyttar revisjonsprosjektet dette materialet i søka sine for Nynorskordboka ogBokmålsordboka. Det vil også bli inngått ein avtale om bruk av Talebanken med Norsk Ordbok våren2021. Det er då blant anna meininga at redaktørane skal få tilgang til transkripsjonar, lydopptak,årstal for opptak og dialekt/subdialekt for å kunna laga koplingar mellom ord og bakgrunn påordseddelen.

Me fekk i 2020 tildelt 19 500 kr frå instituttet i driftsmidlar, og desse kronene blei brukte tillønsutgifter til to studentar og ein forskar for å tilretteleggja og transkribera ein del opptak fråBrattvågen som vart samla inn i 2005.Det vart halde eit møte 27. november hausten 2020 mellom professor emeritus Helge Sandøy,postdoktor Randi Neteland, stipendiat Per Sigmund Sævik Bøe og førsteamanuensis Ragnhild LieAnderson og senioringeniør Paul Meurer der ein planla vidare utvikling av Talebanken. Ein konkretplan er å få i stand eit nasjonalt seminar der forskarar vert inviterte til å demonstrera bruk avTalebanken.

Postdoktor Randi Neteland har nyleg fått laga ei oppdatert brukarrettleiing til Talebanken.

06.02.2021Ragnhild Lie Anderson

Årsmelding 2021

Talebanken er eit digitalt forskingsarkiv (korpus) av talemål som ligg på den felles plattforma under Clarino (http://clarino.uib.no/korpuskel/corpus-list?collection=Talebanken). 

Det er tre norske delkorpus og eitt parallelt korpus for færøysk. Det største delkorpuset, Dialektendringsprosessar, er på ca. 4,5 millionar ord. I tillegg ligg det inne om lag 1,8 millionar ord i Industristadprosjektet og om lag 1,6 millionar ord i Talesøk, som kan sjåast på
som eit depot frå tidlegare granskingar før ein begynte med desse digitale korpusa. Talebanken, som er utvikla av Paul Meurer i samarbeid med det sosiolingvistiske miljøet ved LLE, er også i 2021 blitt brukt aktivt av forskarar. Materiala frå desse korpusa kjem også
andre aktørar til gode. I 2021 er det blant anna kome til både ein ekstern og ein intern masterstudent som nyttar seg av denne ressursen i tillegg til stipendiatar og fast tilsette.

Revisjonsprosjektet nyttar dette materialet i søka sine for Nynorskordboka og Bokmålsordboka. Norsk Ordbok signerte i år ein avtale om å nytta dette talemålskorpuset som ei verdifull digital tekstsamling for å gje dei talemålsgrunnlag for søka sine. Me fekk i 2021 tildelt
33 034 kr for at Bente Selback skulle leggja til rette for at lydfiler som tidlegare høyrde til i Språksamlingane, kan leggjast inn i Talebanken og for utføring av teknisk arbeid med banken av Paul Meurer. Det er såleis blitt jobba med metafiler i 90 nye filer (Åmli, Austevoll, Stord, Aukra, Fræna, Molde, Rauma, Sandøy, Midsund, Haugesund og Førde), og 221 nye postar (knytte til informantar og intervjuarar) er gjort klare.

Me vil også i 2022 søkja om midlar for å halda fram dette arbeidet og ønskjer å få lagt inn nye lydfiler i Talebanken slik at han vert eit endå meir verdifullt talemålskorpus. Når dette materialet er innlagt, tek me sikte på å invitera forskarar til å bruka Talebanken og koma saman til eit forskarseminar som kan visa fram Talebanken som nasjonal forskingsresurs.

23.01.2022

Ragnhild Lie Anderson