NDC-trebanken inneholder 4637 segmenter og 66 042 ord/token. Segmentene er hentet fra 30 transkriberte intervjuer fra 17 steder i Norge. Transkripsjonen er på bokmål. Annoteringen i trebanken er gjort maskinelt, men er kvalitetssjekket og manuelt korrigert av minst en person.
Les mer om trebanken.
NDC-trebanken er nedlastbar i conllx-format. Last ned trebanken fra Github her.
NDC-trebanken er også søkbar i Glossa der transkripsjonene er koplet til lyd og bilde.