Un modèles basé sur les données du Random Set (LECTAUREP)

Plusieurs centaines de pages issues du Random Set ont été transcrites, mais pas forcément relues.

Il faudrait :

tester un entraînement à partir des 621 pages de transcription centralisées dans le doc 705
- avec les params de base d'eScriptorium ⚠ a lancer avant un week-end pour limiter l'impact pour les utilisateurs de la plateforme
- avec paramétrages de l'architecture et du learning rate avec Kraken en cours

tester un entraînement à partir des 621 pages de transcription issues des Random Set + les 502 pages du modèle générique (pas d'overlap), soit un total de 1 123 pages. ⚠ prévoir de lancer avant un week-end car l'entrainement pourrait prendre jusqu'à 2 jours.

Retrouver tous les lots "RS" :

Edited Aug 27, 2021 by Alix Chagué

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information

Admin message