LIA-trebanken inneheld 7536 talemålssegment med 77 701 ord/token. Segmenta er henta frå 19 transkriberte intervju frå 17 stader i Noreg. Transkripsjonane er på nynorsk. Annoteringa i trebanken er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av minst ein person.
Les meir om trebanken.
LIA-trebanken er nedlastbar på CC-lisens i både conllx og conllu-format.
Last trebanken ned frå Github i conllx-format her.
Last trebanken ned frå Github i conllu-format her.
LIA-trebanken er også søkbar i Glossa der transkripsjonane er kopla til lyd og bilete. Logg inn med Feide, CLARIN eller kontakt tekstlab-post@iln.uio.no.