Tokenisation des heures
Dans tout le corpus les heures sont découpées en 2 pour "17h" en 3 pour "20h30" sauf pour la phrase Europar.550_00508 où "12h30" est un seul token.
Rem: si on modifie, cela change la tokenisation de la phrase.
Dans tout le corpus les heures sont découpées en 2 pour "17h" en 3 pour "20h30" sauf pour la phrase Europar.550_00508 où "12h30" est un seul token.
Rem: si on modifie, cela change la tokenisation de la phrase.