Commit dc3066eb authored by Marie Candito's avatar Marie Candito

Merge branch 'master' of gitlab.inria.fr:sequoia/deep-sequoia

parents 0b404b47 84a7aae5
......@@ -36,7 +36,7 @@
# sent_id = annodis.er_00219
# text = Ce sont déjà plus de trente personnes qui se sont inscrites pour la prochaine séance, avec pour objectif de former deux groupes qui se retrouveront les mercredis ou les vendredis.
1 Ce ce PRON _ Number=Sing|Person=3 7 nsubj _ _
2 sont être VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 7 cop _ _
2 sont être AUX _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 7 cop _ _
3 déjà déjà ADV _ _ 7 advmod _ _
4 plus plus ADV _ _ 7 advmod _ _
5 de de ADP _ _ 7 dep _ _
......@@ -98,9 +98,9 @@
24 oeuvre oeuvre NOUN _ Number=Sing 22 nmod _ _
25 devra devoir VERB _ Mood=Ind|Number=Sing|Person=3|Tense=Fut|VerbForm=Fin 19 ccomp _ _
26 probablement probablement ADV _ _ 25 advmod _ _
27 être être AUX _ VerbForm=Inf 29 aux:pass _ _
28 déclaré déclarer VERB _ Gender=Masc|Number=Sing|Tense=Past|VerbForm=Part|Voice=Pass 29 cop _ _
29 infructueux infructueux ADJ _ Gender=Masc 25 xcomp _ _
27 être être AUX _ VerbForm=Inf 28 aux:pass _ _
28 déclaré déclarer VERB _ Gender=Masc|Number=Sing|Tense=Past|VerbForm=Part|Voice=Pass 25 xcomp _ _
29 infructueux infructueux ADJ _ Gender=Masc 28 xcomp _ _
30 . . PUNCT _ _ 2 punct _ _
# sent_id = emea-fr-dev_00361
......@@ -161,23 +161,23 @@
# sent_id = emea-fr-test_00025
# text = Les os deviennent progressivement plus minces et plus fragiles et se cassent plus facilement (fracture).
1 Les le DET _ Definite=Def|Number=Plur|PronType=Art 2 det _ _
2 os os NOUN _ Gender=Masc|Number=Plur 6 nsubj _ _
3 deviennent devenir VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 6 cop _ _
4 progressivement progressivement ADV _ _ 6 advmod _ _
2 os os NOUN _ Gender=Masc|Number=Plur 3 nsubj _ _
3 deviennent devenir VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 0 root _ _
4 progressivement progressivement ADV _ _ 3 advmod _ _
5 plus plus ADV _ _ 6 advmod _ _
6 minces mince ADJ _ Number=Plur 0 root _ _
6 minces mince ADJ _ Number=Plur 3 xcomp _ _
7 et et CCONJ _ _ 9 cc _ _
8 plus plus ADV _ _ 9 advmod _ _
9 fragiles fragile ADJ _ Number=Plur 6 conj _ _
10 et et CCONJ _ _ 12 cc _ _
11 se le/lui PRON _ Person=3|Reflex=Yes 12 expl _ _
12 cassent casser VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 6 conj _ _
12 cassent casser VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 3 conj _ _
13 plus plus ADV _ _ 14 advmod _ _
14 facilement facilement ADV _ _ 12 advmod _ _
15 ( ( PUNCT _ _ 12 punct _ _
16 fracture fracture NOUN _ Gender=Fem|Number=Sing 12 obl _ _
17 ) ) PUNCT _ _ 12 punct _ _
18 . . PUNCT _ _ 6 punct _ _
18 . . PUNCT _ _ 3 punct _ _
# sent_id = Europar.550_00037
# text = Pour l'instant, il semble que l'opposition des gouvernements étrangers favorise plus que ne handicape le parti de Haider.
......@@ -223,7 +223,7 @@
13 terrible terrible ADJ _ Number=Sing 10 acl _ _
14 en en ADP _ _ 15 case _ _
15 Serbie Serbie PROPN _ Gender=Fem|Number=Sing 8 obl _ _
16 . . PUNCT _ _ 4 punct _ _
16 . . PUNCT _ _ 2 punct _ _
# sent_id = Europar.550_00475
# text = Si la Commission n'agit pas de la sorte, les saisies illégales de terres pourraient s'étendre au reste de l'Afrique australe et entraîner une catastrophe, non seulement pour cette région, mais aussi pour tout le reste de l'Afrique.
......@@ -231,12 +231,12 @@
2 la le DET _ Definite=Def|Gender=Fem|Number=Sing|PronType=Art 3 det _ _
3 Commission commission PROPN _ Gender=Fem|Number=Sing 5 nsubj _ _
4 n' ne ADV _ Polarity=Neg 5 advmod _ _
5 agit agir VERB _ Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin 18 advcl _ _
5 agit agir VERB _ Mood=Ind|Number=Sing|Person=3|Tense=Past|VerbForm=Fin 16 advcl _ _
6 pas pas ADV _ Polarity=Neg 5 advmod _ _
7 de de ADP _ _ 9 case _ _
8 la le DET _ Definite=Def|Gender=Fem|Number=Sing|PronType=Art 9 det _ _
9 sorte sorte NOUN _ Gender=Fem|Number=Sing 5 obl _ _
10 , , PUNCT _ _ 18 punct _ _
10 , , PUNCT _ _ 16 punct _ _
11 les le DET _ Definite=Def|Number=Plur|PronType=Art 12 det _ _
12 saisies saisie NOUN _ Gender=Fem|Number=Plur 16 nsubj _ _
13 illégales illégal ADJ _ Gender=Fem|Number=Plur 12 amod _ _
......@@ -273,7 +273,7 @@
43 de de ADP _ _ 45 case _ _
44 l' le DET _ Definite=Def|Number=Sing|PronType=Art 45 det _ _
45 Afrique Afrique PROPN _ Gender=Fem|Number=Sing 42 nmod _ _
46 . . PUNCT _ _ 18 punct _ _
46 . . PUNCT _ _ 16 punct _ _
# sent_id = Europar.550_00520
# text = Ce trafic est très étroitement lié à la drogue et au blanchiment d'argent, et il est vraisemblable que ce sont différents types de mafias qui l'organisent.
......@@ -296,11 +296,11 @@
16 , , PUNCT _ _ 6 punct _ _
17 et et CCONJ _ _ 20 cc _ _
18 il il PRON _ Gender=Masc|Number=Sing|Person=3 20 expl _ _
19 est être VERB _ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin 20 cop _ _
19 est être AUX _ Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin 20 cop _ _
20 vraisemblable vraisemblable ADJ _ Number=Sing 6 conj _ _
21 que que SCONJ _ _ 25 mark _ _
22 ce ce PRON _ Number=Sing|Person=3 25 nsubj _ _
23 sont être VERB _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 25 cop _ _
23 sont être AUX _ Mood=Ind|Number=Plur|Person=3|Tense=Pres|VerbForm=Fin 25 cop _ _
24 différents différent ADJ _ Gender=Masc|Number=Plur 25 amod _ _
25 types type NOUN _ Gender=Masc|Number=Plur 20 ccomp _ _
26 de de ADP _ _ 27 case _ _
......@@ -327,7 +327,7 @@
13 de de ADP _ _ 15 case _ _
14 son son DET _ Number=Sing|Poss=Yes 15 nmod:poss _ _
15 corps corps NOUN _ Gender=Masc|Number=Sing 11 nmod _ _
16 . . PUNCT _ _ 5 punct _ _
16 . . PUNCT _ _ 4 punct _ _
# sent_id = frwiki_50.1000_00207
# text = Le juge Desmure se déclare alors incompétent pour instruire des faits visant le chef de l'État.
......
......@@ -6,3 +6,14 @@ run:
extract:
conll_tool split ../tags/sequoia-8.0/sequoia.surf.conll miniref.ids miniref.surf-8.0.conll
conll_tool split ../tags/sequoia-8.0/sequoia.deep_and_surf.conll miniref.ids miniref.deep_and_surf-8.0.conll
one:
grew -grs Seq2UD/rewriting_rules/main.grs -seq sequoia_to_ud -gr one.conll
talc2:
scp miniref.ud-trunk.conll guillaum@talc2.loria.fr:/data/semagramme/resources/
normalize:
grew -det -grs ud.dom -i miniref.ud-trunk.conll -f xxx.conll
mv xxx.conll miniref.ud-trunk.conll
\ No newline at end of file
This source diff could not be displayed because it is too large. You can view the blob instead.
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment