Correction post ocr
Objectif : faire une première passe de correction pour corriger les erreurs de transcription dans le texte.
- en cas de doute on ne corrige pas (éviter de créer un bruit)
- voir comment articuler cette correction post-ocr avec la NER (logiquement elles s'améliorent mutuellement)
- aller plus loin qu'un système basé sur une distance de levenshtein (PySpellChecker) et prendre le contexte en compte pour pouvoir corriger les mots courts