[Set] Etablir le set de données de référence
Afin de composer le dataset de référence de 10 images issus des répertoires de notaires, celles ci devront être :
- variées
- entièrement segmentées et transcrites
Afin d'obtenir cette variété d'images (1.), certains critères de choix sont à définir en amont et pourront se baser sur des :
-
Aspects techniques de la numérisation (résolutions, contrastes et lumonisité, qualité du support, inclinaison de l'image)
-
Aspects graphologiques différents (pression d'écriture, inclinaison des traits d'écriture, alignement des lignes de base, taille et hauteur des lettres, espace entre les lettres et les mots, liaisons entre les lettres et les mots, formes de lettres similaires)
-
aspects structurels (si la structure des répétoires de notaire ne varie pas, 7 colonnes + 2 colonnes de marge, on peut prendre en compte les écritures marginales)