Tokenisation des heures
Dans tout le corpus les heures sont découpées en 2 pour "17h" en 3 pour "20h30" sauf pour la phrase Europar.550_00508 où "12h30" est un seul token.
Rem: si on modifie, cela change la tokenisation de la phrase.
Prochaines maintenances programmées: mardi 02/04, lundi 06/05, lundi 03/06
Pour plus d'informations: https://doc-si.inria.fr/display/SU/Gitlab
Dans tout le corpus les heures sont découpées en 2 pour "17h" en 3 pour "20h30" sauf pour la phrase Europar.550_00508 où "12h30" est un seul token.
Rem: si on modifie, cela change la tokenisation de la phrase.