LIA-trebanken

LIA-trebanken inneheld talemålssegment frå LIA norsk - korpus av eldre dialektopptak. Segmenta er annoterte med morfologisk og syntaktisk informasjon.

Logo LIA-prosjektet

LIA-trebanken inneheld 7536 talemålssegment med 77 701 ord/token. Segmenta er henta frå 19 transkriberte intervju frå 17 stader i Noreg. Transkripsjonane er på nynorsk. Annoteringa i trebanken er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av minst ein person.

Les meir om trebanken.

LIA-trebanken er nedlastbar på CC-lisens i både conllx og conllu-format.

Last trebanken ned frå Github i conllx-format her.

Last trebanken ned frå Github i conllu-format her.

LIA-trebanken er også søkbar i Glossa der transkripsjonane er kopla til lyd og bilete. Logg inn med Feide, CLARIN eller kontakt tekstlab-post@iln.uio.no.

 

Søk i LIA-trebanken

 

Publisert 22. juni 2023 14:12 - Sist endret 26. jan. 2024 13:55