NDC-trebanken

NDC-trebanken inneholder talemålssegmenter fra den norske delen av Nordisk dialektkorpus. Segmentene er annotert med morfologisk og syntaktisk informasjon.

Nordic Dialect Corpus. Logo.

NDC-trebanken inneholder 4637 segmenter og 66 042 ord/token. Segmentene er hentet fra 30 transkriberte intervjuer fra 17 steder i Norge. Transkripsjonen er på bokmål. Annoteringen i trebanken er gjort maskinelt, men er kvalitetssjekket og manuelt korrigert av minst en person.

Les mer om trebanken.

NDC-trebanken er nedlastbar i conllx-format. Last ned trebanken fra Github her.

NDC-trebanken er også søkbar i Glossa der transkripsjonene er koplet til lyd og bilde.

 

Søk i NDC-trebanken

 

 

 

Publisert 22. juni 2023 14:12 - Sist endret 26. jan. 2024 10:34