Taggeren består av tre hovedmoduler:
- en preprosessor med sammensetningsanalysator og multitagger
- en grammatikk-modul for morfologisk disambiguering (Constraint Grammar)
- en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (bare for bokmål)
Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense.
Multitaggeren benytter fullformsleksikonet Norsk ordbank.
Oslo-Bergen-taggeren er videreutviklet og modernisert gjennom infrastrukturprosjektet Clarino+.
Les mer om Oslo-Bergen-taggeren
Analyser bokmålstekst med OBT på nett