Oslo-Bergen-taggeren

Oslo-Bergen-taggeren er en robust morfologisk tagger for bokmål og nynorsk som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen gjennom mange år.

Oslo-Bergen-taggerens logo

Taggeren består av tre hovedmoduler:

  • en preprosessor med sammensetningsanalysator og multitagger
  • en grammatikk-modul for morfologisk disambiguering (Constraint Grammar)
  • en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (bare for bokmål)

Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense.

Multitaggeren benytter fullformsleksikonet Norsk ordbank.

Oslo-Bergen-taggeren er videreutviklet og modernisert gjennom infrastrukturprosjektet Clarino+.

Les mer om Oslo-Bergen-taggeren

 

Analyser bokmålstekst med OBT på nett

Last ned Oslo-Bergen-taggeren


 

Publisert 22. juni 2023 15:41 - Sist endret 26. jan. 2024 10:52