Un modèles basé sur les données du Random Set (LECTAUREP)
Plusieurs centaines de pages issues du Random Set ont été transcrites, mais pas forcément relues.
Il faudrait :
-
tester un entraînement à partir des 621 pages de transcription centralisées dans le doc 705 -
avec les params de base d'eScriptorium ⚠ a lancer avant un week-end pour limiter l'impact pour les utilisateurs de la plateforme -
avec paramétrages de l'architecture et du learning rate avec Kraken en cours
-
-
tester un entraînement à partir des 621 pages de transcription issues des Random Set + les 502 pages du modèle générique (pas d'overlap), soit un total de 1 123 pages. ⚠ prévoir de lancer avant un week-end car l'entrainement pourrait prendre jusqu'à 2 jours.
Retrouver tous les lots "RS" :
- 1 : https://traces6.paris.inria.fr/document/145/images/
- 2 : https://traces6.paris.inria.fr/document/156/images/
- 3 : https://traces6.paris.inria.fr/document/169/images/
- 4 : https://traces6.paris.inria.fr/document/177/images/
- 5 : https://traces6.paris.inria.fr/document/181/images/
- 6 : https://traces6.paris.inria.fr/document/183/images/
- 7 : https://traces6.paris.inria.fr/document/186/images/
- 8 : https://traces6.paris.inria.fr/document/272/images/
- 9 : https://traces6.paris.inria.fr/document/273/images/
- 10 : https://traces6.paris.inria.fr/document/276/images/
Edited by Alix Chagué