[Métriques] Création d'un programme de calcul autonome WER et CER (CER-WER_Tool) et documentation sur métriques
CER-WER_Tool devra intégrer :
- tokenisation des lettres et des mots (module re)
- calcul pour la distance d'édition sous la forme optimisée (numpy) Cf. script Wer-in-python
- calcul du WER Cf. script Wer-in-python
- calcul du CER sur la base du script Wer-in-python et de werpp
- Régler l'affichage de l'output sur Phrase de référence, Phrase modèle (hypothétique), longueurs des tokens dans ref et hyp, listes des dels/subs/Ins successives, résultats du CER (avec et sans %), résultats du WER (avec et sans %)
- Documentation
A verser :
- Documentation notebook sur la décomposition du script et les visualisations (graph) possibles à partir des métriques
- proposition de script CER-WER_Tool.py
Edited by Lucas Terriel