Commit 08df770d authored by Lucas Terriel's avatar Lucas Terriel 🐍

correct general readme #1 and update Doc softwares #2

parent 45683eb5
......@@ -92,7 +92,7 @@ supprimer l'archive (optionnel) via :
$ rm -r 0.6.1.zip
```
renommer votre dossier "grobid-0.6.1" en "grobid" via :
renommer votre dossier `grobid-0.6.1/` en `grobid/` via :
```
$ mv 0.6.1/ grobid-0.6.1/
......@@ -100,7 +100,7 @@ $ mv 0.6.1/ grobid-0.6.1/
**B. Monter GROBID avec l'outil de build Gradle**
Se déplacer dans le répertoire `grobid` comme suit :
Se déplacer dans le répertoire `grobid/` comme suit :
```
$ cd grobid/
......@@ -223,7 +223,7 @@ Une fois décompresser, différents dossiers de type `db-code_langue` seront cr
Vous pouvez ensuite choisir de supprimer les archives avec la méthode vue plus haut.
:exclamation: NOTE : L'ensemble des données à télécharger proposés dans la [documentation d'entity-fishing](https://nerd.readthedocs.io/en/latest/build.html#) correspond à un *dump* de Wikidata et Wikipedia du 20/05/2020. L'ensemble des données dans toutes les langues représente un total de 36GB (compréssées) et de 119GB (décompréssées).
:exclamation: NOTE : L'ensemble des données à télécharger proposés dans la [documentation d'entity-fishing](https://bit.ly/2XfmwsN) correspond à un *dump* de Wikidata et Wikipedia du 20/05/2020. L'ensemble des données dans toutes les langues représente un total de 36GB (compréssées) et de 119GB (décompréssées).
#### Étape 4 : Monter le projet *Entity-fishing*
......@@ -260,10 +260,10 @@ Si le service s'affiche, l'installation est réussie. :tada:
utiliser des liens bit
- [Dépôt *Entity-fishing*]()
- [Dépôt *Entity-fishing*](https://bit.ly/2LaRRdD)
- [Documentation *Entity-fishing*](https://bit.ly/3hOFOOZ)
- [Dépôt GROBID]()
- [Dépôt GROBID](https://bit.ly/3bfkwZB)
- [Documentation GROBID](https://bit.ly/3blncoy)
- [Dépôt GROBID-NER]()
- [Dépôt GROBID-NER](https://bit.ly/2L0oivw)
- [Documentation GROBID-NER](https://bit.ly/2Xc9213)
......@@ -16,14 +16,15 @@ NER4Archives/
├── InriaAlmanach/
| |
│ ├── dataset/ : contient les données d'origine (IR XML EAD) reprise du dossier ArchivesNationales/
│ ├── dataset/ : contient les données d'origine (IR XML EAD) reprise du dossier ArchivesNationales/
| | et les données préparés à partir des données d'origine (Rawtext, TSV, CSV...)
| |
│ ├── content_xml_to_text/ : contient les fichiers textes issues de la récupération du contenu des IR XML EAD réalisés à partir de la chaîne de traitement exposé dans Notebook_1_Pipeline_XMLEAD2Text.ipynb. Ces fichiers textes permettent de réaliser des imports dans les plateformes d'annotation manuelle (TagTog ou INCEpTION)
│ ├── sofware_sources/ : documentation sur l'installation et le fonctionnement des programmes utilis dans Ner4archives (entity-fishing, GROBID, GROBID-NER etc.) ainsi que des prototypes
| |
│ ├── Golden_Corpus/ : export en differrents formats des annotations manuelles (en cours...)
│ ├── notebooks/ : Contient des notebooks Jupyter présentant des essais et expérimentations sur les données d'origine
| |
│ ├── Notebook_1_Pipeline_XMLEAD2Text.ipynb : notebook présentant une chaine de traitement pour extraire du contenu des IR XML EAD et réalisés des export en fichiers textes. Les sorties sont visualisables dans le dossier content_xml_to_text/ (Un CLI est également en cours d'écriture)
| |
| ├── scripts/ : divers scripts de traitements de données
```
## :wrench: :hammer: Outils et ressources :
......@@ -36,8 +37,7 @@ NER4Archives/
### Reconnaissance d'entités nommées et désambiguïsation
- :computer: [Entity-Fishing Demo](http://nerd.huma-num.fr/nerd/)
- 🐱 [Entity-Fishing Github Source Code](https://github.com/kermitt2/entity-fishing)
- 🐱 [Entity-Fishing documentation générale et API](https://github.com/kermitt2/entity-fishing)
- 🐱 [Entity-Fishing Github Source Code](https://github.com/kermitt2/entity-fishing)
- 🐱 [Entity-Fishing - Client Python](https://github.com/Hirmeos/entity-fishing-client-python)
- :newspaper: [Article : Luca Foppiano, Laurent Romary. *Entity-fishing: a DARIAH entity recognition and disambiguation service*. Journal of the Japanese Association for Digital Humanities, Japanase Association for DigitalHumanities, 2020, 5 (1), pp.22-60.](https://hal.inria.fr/hal-01812100/file/5_3.pdf)
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment