Commit 3ead0cc2 authored by Lucas Terriel's avatar Lucas Terriel 🐍
parents 1582ad70 7c143502
......@@ -50,6 +50,12 @@ $ conda activate jupyter-env-ner
## Sommaire
### Traitement des données (*data pre-processing*)
### Traitement des données
- [Parseur de contenu XML et récupération dans des fichiers texte brut](https://gitlab.inria.fr/almanach/ner4archives/-/blob/master/InriaAlmanach/notebooks/Pipeline_XMLEAD2Text.ipynb)
- [Sérialisation en un corpus d'entrainement et un corpus de test](https://gitlab.inria.fr/almanach/ner4archives/-/blob/master/InriaAlmanach/notebooks/Serialisation_train_test.ipynb)
- [Transformation de TSV ou CSV en format IOB](https://gitlab.inria.fr/almanach/ner4archives/-/blob/master/InriaAlmanach/notebooks/Pipeline_TSVorCSV2IOB.ipynb)
### Entrainement de modèles NER et NED
- [Entrainer un modèle avec Spacy](https://gitlab.inria.fr/almanach/ner4archives/-/blob/master/InriaAlmanach/notebooks/Train_ner_model_spacy.ipynb) (in progress...)
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment