Affinage Modèle Mixte sur Gold Ground Truth (CM/SD)
On affine à nouveau un modèle mixte sur les Contrats de Mariage et Séparations et Divorces, mais cette fois-ci avec des données dont la qualité a été finement contrôlée.
Les données sont rassemblées dans le doc 603 ("Nathalie - correction 44 CM - CM_ftGL26_13").
-
affiner lectaurep_generic_26 -
via eScriptorium -
via CLI
-
-
affiner mixte_rs_15 -
via eScriptorium -
via CLI
-
Le but est de voir si la qualité des données de vérité de terrain permet de mieux stabiliser l'efficacité du modèle. Au passage, je veux vérifier si l'entrainement du modèle via eScriptorium peut suffir et bénéficier des paramétrages des modèles mixtes (architecture et learning rate).
Relevé des particularismes ( (c) Aurélia Rostaing)
Détail de l'échantillonnage chrononologique :
(Elément, réf. image, année de l'image, cote, nombre de cellules de la double page)
Les dates correspondent à celles majoritaires sur la page, par hypothèse celle de la rédaction du registre, en tout cas terminus post quem.
CM
- 01 FRAN_0056_00004_L.jpg 1829 CM/1 199 (CM dont 30 pages ont servi pour ce modèle)
- 02 FRAN_0056_00199_L.jpg 1832-1833 CM/1 187 bug : image non HTRisée initialement, que j'ai finalement pu HTRiser (CM dont 30 pages ont servi pour ce modèle)
- 03 FRAN_0056_00200_L.jpg 1832 CM/1 185 (CM dont 30 pages ont servi pour ce modèle)
- 04 FRAN_0056_00403_L.jpg 1836 CM/2 201
- 05 FRAN_0056_00410_L.jpg 1836 CM/3 201 (CM dont 30 pages ont servi pour ce modèle)
- 06 FRAN_0056_00607_L.jpg 1838 CM/3 189 (CM dont 30 pages ont servi pour ce modèle)
- 07 FRAN_0056_00608_L.jpg 1839 CM/3 186 (CM dont 30 pages ont servi pour ce modèle)
- 08 FRAN_0056_00809_L.jpg 1841 CM/4 203
- 09 FRAN_0056_01028_L.jpg 1844 CM/5 202
- 10 FRAN_0056_01239_L.jpg 1846 CM/6 204
- 11 FRAN_0056_01438_L.jpg 1850 CM/7 186
- 12 FRAN_0056_01639_L.jpg 1852 CM/8 196 (à partir de cette page augmentation des erreurs d'HTR)
- 13 FRAN_0056_01832_L.jpg 1855 CM/9 180
- 14 FRAN_0056_01884_L.jpg 1855 CM/10 195 (particularisme : ajout de papillon)
- 15 FRAN_0056_01895_L.jpg 1855 CM/10 201
- 16 FRAN_0056_02225_L.jpg 1862 CM/11 197
- 17 FRAN_0056_02424_L.jpg 1864 CM/12 199
- 18 FRAN_0056_02633_L.jpg 1866 CM/13 193
- 19 FRAN_0056_02842_L.jpg 1868 CM/14 203
- 20 FRAN_0056_03049_L.jpg 1870 CM/15 201
- 21 FRAN_0056_03252_L.jpg 1872 CM/16 193
- 22 FRAN_0056_03453_L.jpg 1874 CM/17 197 (particularisme : bout de corde)
- 23 FRAN_0056_03654_L.jpg 1875 CM/18 191
- 24 FRAN_0056_03857_L.jpg 1877 CM/19 199
- 25 FRAN_0056_04064_L.jpg 1879 CM/20 197
- 26 FRAN_0056_04267_L.jpg 1881 CM/21 197
- 27 FRAN_0056_04470_L.jpg 1883 CM/22 192
- 28 FRAN_0056_04669_L.jpg 1885 CM/23 199
- 29 FRAN_0056_04868_L.jpg 1887 CM/24 199
- 30 FRAN_0056_05067_L.jpg 1889 CM/25 186
- 31 FRAN_0056_05266_L.jpg 1891 CM/26 187
- 32 FRAN_0056_05465_L.jpg 1893 CM/27 191 exclure du lot de réentraînement : bug : image partiellement HTRisée (jusqu'à 87984 - bulle 111, persistant : comportement identique après 2 tests)
- 33 FRAN_0056_05666_L.jpg 1895 CM/28 183
- 34 FRAN_0056_05867_L.jpg 1897 CM/29 186
- 35 FRAN_0056_06068_L.jpg 1900 CM/30 199
SD
- 36 FRAN_0187_49713_L.jpg 1890-1893 SD/1 165
- 37 FRAN_0187_49914_L.jpg 1895 SD/2 161
- 38 FRAN_0187_50115_L.jpg 1896 SD/3 161
- 39 FRAN_0187_50318_L.jpg 1898 SD/4 170
- 40 FRAN_0187_50521_L.jpg 1899 SD/5 166
- 41 FRAN_0187_50722_L.jpg 1902-1903 SD/6 166
- 42 FRAN_0187_51019_L.jpg 1926-1927 SD/7 154
- 43 FRAN_0187_51221_L.jpg 1909 SD/8 151
- 44 FRAN_0187_51328_L.jpg 1928 SD/9 136