grew_match issueshttps://gitlab.inria.fr/grew/grew_match/-/issues2018-01-24T11:33:03+01:00https://gitlab.inria.fr/grew/grew_match/-/issues/1truncated printing of the sentence2018-01-24T11:33:03+01:00GUILLAUME Brunotruncated printing of the sentence![Screen_Shot_2017-10-10_at_15.21.30](/uploads/dea30317f4158ce0390a54c2d5ef1ec1/Screen_Shot_2017-10-10_at_15.21.30.png)![Screen_Shot_2017-10-10_at_15.21.30](/uploads/dea30317f4158ce0390a54c2d5ef1ec1/Screen_Shot_2017-10-10_at_15.21.30.png)GUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/2Give the full number of solutions for connected patterns2022-10-03T17:23:22+02:00GUILLAUME BrunoGive the full number of solutions for connected patternsGUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/3Usage instructions2018-11-19T17:18:50+01:00Ghost UserUsage instructionsDear Bruno Guillaume,
Thank you for your work on Grew.
I was able to set up the grew_daemon, but I am having problems on using this repository. How should I use this in order to use my data and make it communicate to the daemon?
Thank...Dear Bruno Guillaume,
Thank you for your work on Grew.
I was able to set up the grew_daemon, but I am having problems on using this repository. How should I use this in order to use my data and make it communicate to the daemon?
Thank you!https://gitlab.inria.fr/grew/grew_match/-/issues/4Add an export mechanism2023-02-27T21:29:03+01:00GUILLAUME BrunoAdd an export mechanismGUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/5Add a proper error when Export is used after Timeout2019-10-10T15:56:51+02:00GUILLAUME BrunoAdd a proper error when Export is used after Timeout![PastedGraphic-7](/uploads/c1ba7323ed2e4cee7d0ff6f867f39468/PastedGraphic-7.png)![PastedGraphic-7](/uploads/c1ba7323ed2e4cee7d0ff6f867f39468/PastedGraphic-7.png)GUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/6Download the conll code for the current graph2020-06-03T06:48:53+02:00GUILLAUME BrunoDownload the conll code for the current graphGUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/7Tutoriel clustering2019-11-14T10:41:19+01:00Sylvain KahaneTutoriel clusteringIl faudrait ajouter le clustering dans le tutoriel. C’est vraiment bien et c’est dommage que ça n’y soit pas.
Notamment le clustering sur les relations qu’on peut pas deviner.Il faudrait ajouter le clustering dans le tutoriel. C’est vraiment bien et c’est dommage que ça n’y soit pas.
Notamment le clustering sur les relations qu’on peut pas deviner.https://gitlab.inria.fr/grew/grew_match/-/issues/8Double clustering2022-04-19T17:24:18+02:00Sylvain KahaneDouble clusteringC’est déjà ce que tu fais avec tes tables :
on cherche par exemple les X -[subj]-> Y
et clusterise sur X.upos et Y.upos
et tu produis une table en 2D.
On pourrait déjà modifier la table en donnant aussi les valeurs et liens pour X.upos ...C’est déjà ce que tu fais avec tes tables :
on cherche par exemple les X -[subj]-> Y
et clusterise sur X.upos et Y.upos
et tu produis une table en 2D.
On pourrait déjà modifier la table en donnant aussi les valeurs et liens pour X.upos seul et Y.upos seul.
Et ensuite dans la table, les X.upos et les Y.upos pourraient être classés par ordre décroissant, on verrait encore mieux ce qui cloche je pense.
Ca serait bien de proposer une table 2D pour n’importe quelle requête avec deux clusterisations.https://gitlab.inria.fr/grew/grew_match/-/issues/9Voute, ordre de concomitance et overlap2019-11-14T15:17:02+01:00Sylvain KahaneVoute, ordre de concomitance et overlapUn graphe linéairement ordonné induit des relations de concomitance entre les arêtes et aussi entre un nœud et des arètes.
Chaque arête e:A->B définit un span(e) = ]A,B[.
span(root) = toute la phrase sauf le nœud racine
Ca serait bien d...Un graphe linéairement ordonné induit des relations de concomitance entre les arêtes et aussi entre un nœud et des arètes.
Chaque arête e:A->B définit un span(e) = ]A,B[.
span(root) = toute la phrase sauf le nœud racine
Ca serait bien d'introduire des relations entre arêtes en fonction de leur span :
1) b couvre a : a << b si span(a) in span(b)
2) non projectivité : a overlap b si les spans ne sont pas disjoints et pas inclus l'un dans l'autre
3) e couvre N : N << a si N appartient à span(a)
4) e est la voute de N : N < a si a est la voute (ceiling) de N, cad N << a et si N << b alors a << b.
5) b est la voute de a : idem
Avec ça on pourrait facilement remettre les punct et les discourse.
Le gouverneur d'un PUNCT est le pied de la voute.
Et aussi rechercher les configurations non-projectives plus simplement.https://gitlab.inria.fr/grew/grew_match/-/issues/10noeud vs arêtes2023-02-27T21:33:35+01:00Sylvain Kahanenoeud vs arêtesJe suis pas sur de comprendre pourquoi les noeuds et les arêtes sont traités si différemment dans le langage de requête Grew.
Le langage ne fait pas de distinction entre l'arête et la relation qui l'étiquette. Par ex., quand on clusteri...Je suis pas sur de comprendre pourquoi les noeuds et les arêtes sont traités si différemment dans le langage de requête Grew.
Le langage ne fait pas de distinction entre l'arête et la relation qui l'étiquette. Par ex., quand on clusterise sur les relations possibles d'une arête `e:X->Y`, on demande juste les clusters sur `e` et pas `e.rel` ou `e.label`.
Ca serait peut-être mieux de distinguer les deux et d'autoriser d'attacher d'autres infos à une arête (voir post suivant). Par ailleurs, ça permettrait d'écrire plus facilement une règle de renommage d'une arête. On ne détruirait pas l'arête mais simplement on changerait `e.rel`.
Et on pourrait aussi écrire des équations du genre `a.rel = b.rel` ou `a.rel <> b.rel`.
Enfin, le langage permet d'écrire des expressions régulières pour les étiquettes d'arêtes, mais pas pour d'autres traits.https://gitlab.inria.fr/grew/grew_match/-/issues/11Dependency length et autres traits structuraux2020-01-25T10:15:20+01:00Sylvain KahaneDependency length et autres traits structurauxCa pourrait être intéressant de précalculer certains traits structuraux, comme la longueur pour une arête (avec valeur négative quand le dépendant est à droite), et de pouvoir clusteriser ensuite sur `e.length`.
Dans le même genre, je p...Ca pourrait être intéressant de précalculer certains traits structuraux, comme la longueur pour une arête (avec valeur négative quand le dépendant est à droite), et de pouvoir clusteriser ensuite sur `e.length`.
Dans le même genre, je pense à l'arité (`N.arity`) pour un nœud, çad le nombre d'arètes sortantes.
On pourrait aussi vouloir clustériser sur le nombre d'arêtes d'un certain type :
* `e: N-[re"comp.*"]->X`
* cluster sur `N.e.arity` (pas sur que ce soit la meilleure façon d'encoder la requête)
Sinon, moi, j'ai mon petit dada : le flux. Donc j'aimerais pouvoir aussi clustériser sur le flux en un point de la chaîne : `N.fluxsize` me donnerait le nombre d'arêtes concomitantes avec `N`. Et comme précédemment je pourrais m'intéresser qu'à certains types d'arêtes `e` et clustériser sur `N.e.fluxsize`.
Encore une info qui peut être intéressante : tout arbre de dépendance induit une structure constituants. A chaque noeud `N`, on peut associer sa projection et notamment la taille de sa projection (`N.span`). Ca serait par exemple intéressant d'interroger sur les tailles des sujets.
On peut imaginer d'autres traits comme `N.leftspan` et `N.rightspan` Ou encore `N.depth` pour la hauteur de l'arbre (pas sur que ce soit intéressant.
Tu proposes également de classer par les résultats par longueur de phrase, mais ça serait bien du coup de pouvoir clustériser par `sentence.length` ou `root.span`.https://gitlab.inria.fr/grew/grew_match/-/issues/12Domination2019-11-14T11:44:58+01:00Sylvain KahaneDominationDe même qu’on a la relation de succession (`X<Y`) et la relation de précédence (`X<<Y`), il serait utile d’avoir à la fois la relation de dépendance (`X->Y`) et la relation de domination (`X->>Y`). Notamment pour le calcul de la projecti...De même qu’on a la relation de succession (`X<Y`) et la relation de précédence (`X<<Y`), il serait utile d’avoir à la fois la relation de dépendance (`X->Y`) et la relation de domination (`X->>Y`). Notamment pour le calcul de la projection d'un nœud et du span de cette projection.https://gitlab.inria.fr/grew/grew_match/-/issues/13Position inter-mot2019-11-14T15:15:38+01:00Sylvain KahanePosition inter-motDe la même façon qu’on nomme une arête (`e:X->Y`), on pourrait nommer une position linéaire inter-mot (`p:X<Y`) (qui, après tout, est une arête de la relation de succession).
C’est utile si on a déjà la relation de concomitance. Du coup...De la même façon qu’on nomme une arête (`e:X->Y`), on pourrait nommer une position linéaire inter-mot (`p:X<Y`) (qui, après tout, est une arête de la relation de succession).
C’est utile si on a déjà la relation de concomitance. Du coup, on pourrait étendre la relation aux positions inter-mots : `p<e` et `p<<e` pour calculer le flux inter-mot (`p.e.card`).
C’est aussi satisfaisant intellectuellement ;) puisque ça sature l’ensemble des “objets" qu’on peut raisonnablement considérer dans un graphe ordonné.
A l’oral, les positions inter-mots sont vraiment des objets, qui ont notamment une durée et peuvent être typés (pause, type de coupure prosodique, chgt de locuteur). A l’écrit, ça peut être un blanc, un no space ou un chgt de paragraphe. Donc on peut même imaginer leur donner vraiment une existence dans l’encodage.https://gitlab.inria.fr/grew/grew_match/-/issues/14Métadonnées2021-11-29T15:08:35+01:00Sylvain KahaneMétadonnéesComment gérer les métadonnées en GREW ?
On veut pouvoir attacher des informations au niveau d'un échantillon, d'un locuteur ou d'une phrase.
On peut imaginer que chacun de ces objets (échantillon, locuteur, phrase) est un nœud du graphe,...Comment gérer les métadonnées en GREW ?
On veut pouvoir attacher des informations au niveau d'un échantillon, d'un locuteur ou d'une phrase.
On peut imaginer que chacun de ces objets (échantillon, locuteur, phrase) est un nœud du graphe, lui-même attaché à ses métadonnées propres (par ex. lieu et date d'enregistrement pour un échantillon; age, sexe, langues parlées pour un locuteur; locuteur, échantillon ou traduction pour une phrase).
Pour le projet Naija, ces métadonnées sont disponibles et on aimerait pouvoir les intégrer et les requêter.https://gitlab.inria.fr/grew/grew_match/-/issues/15cluster et whether2022-04-19T17:25:00+02:00Sylvain Kahanecluster et whetherDeux remarques :
1) ca serait peut-être plus simple d'intégrer cluster au langage de requête, plutôt que d'avoir un truc à cocher. Et donc d'écrire des requêtes telles que pattern { N[upos=AUX] } cluster{ N.form }.
Ca deviendra notammen...Deux remarques :
1) ca serait peut-être plus simple d'intégrer cluster au langage de requête, plutôt que d'avoir un truc à cocher. Et donc d'écrire des requêtes telles que pattern { N[upos=AUX] } cluster{ N.form }.
Ca deviendra notamment utile lorsqu'on aura un compte utilisateur et qu'on mémorisera nos requêtes.
2) on aurait des fois envie de clusteriser sur la présence ou non d'un pattern. C'est-à-dire au lieu de faire successivement les requêtes :
* pattern { blabla ; glop }
* pattern { blabla } without { glop }
on aimerait faire une requête :
* pattern { blabla } whether { glop }
et obtenir le nombre de Yes and No, pour avoir tout de suite une vision de la proportion de pattern { glop } parmi les pattern { blabla }.
3) quand on pourra faire des doubles clusterisations, on voudra évidemment faire aussi des cluster + whether. Ca sera plus facile à écrire si c'est dans le langage et on pourra facilement changer une vue cluster + whether en whether + cluster.https://gitlab.inria.fr/grew/grew_match/-/issues/16la limite à 1000 occurrences2022-10-03T17:24:37+02:00Sylvain Kahanela limite à 1000 occurrencesDes fois on aimerait utiliser Grew pour faire des décomptes (nombre de verbes, noms, etc.) et on est bloqué par la limitation à 1000 occurrences.
Est-ce qu'on pourrait la contourner exceptionnellement ?Des fois on aimerait utiliser Grew pour faire des décomptes (nombre de verbes, noms, etc.) et on est bloqué par la limitation à 1000 occurrences.
Est-ce qu'on pourrait la contourner exceptionnellement ?https://gitlab.inria.fr/grew/grew_match/-/issues/17Clustering on edge feature2020-07-01T14:14:53+02:00GUILLAUME BrunoClustering on edge feature![edge_feature](/uploads/621cb3d99132402d51711d711fd26e77/edge_feature.png)![edge_feature](/uploads/621cb3d99132402d51711d711fd26e77/edge_feature.png)GUILLAUME BrunoGUILLAUME Brunohttps://gitlab.inria.fr/grew/grew_match/-/issues/18Accès au CONLL ou aux traits cachés2020-05-19T12:21:34+02:00Sylvain KahaneAccès au CONLL ou aux traits cachésLorsqu'on travaille sur un treebank (et notamment lorsqu'on aborde un nouveau treebank), on a besoin de savoir quels sont les traits présents dans le CONLL et donc requêtable, en particulier les traits globaux comme la traduction si elle...Lorsqu'on travaille sur un treebank (et notamment lorsqu'on aborde un nouveau treebank), on a besoin de savoir quels sont les traits présents dans le CONLL et donc requêtable, en particulier les traits globaux comme la traduction si elle est présente.
Une solution serait de permettre l'accès au CONLL.
Une autre, peut-être plus élégante, serait l'accès à tous les traits présents dans un exemple et la possibilité de paramétrer la liste des traits à afficher ou non.https://gitlab.inria.fr/grew/grew_match/-/issues/19conll export bug2020-06-08T08:24:53+02:00kim gerdesconll export bughttp://match.grew.fr/?corpus=UD_English-PUD@2.6&custom=5eda549018a63&eud=yes
gives a
```
XML Parsing Error: syntax error
Location: http://match.grew.fr/corpora/snippets_n-grams/2-gram-form.pat
Line Number 1, Column 1:
TypeError: this ...http://match.grew.fr/?corpus=UD_English-PUD@2.6&custom=5eda549018a63&eud=yes
gives a
```
XML Parsing Error: syntax error
Location: http://match.grew.fr/corpora/snippets_n-grams/2-gram-form.pat
Line Number 1, Column 1:
TypeError: this is undefined sweetalert2.all.min.js:1:40469
en http://match.grew.fr/vendor/sweetalert2.all.min.js:1
success http://match.grew.fr/js/main.js:709
jQuery 4
j
fireWith
x
b
```
and conll export failshttps://gitlab.inria.fr/grew/grew_match/-/issues/20SUD_English-GUMReddit@2.62020-06-09T08:31:06+02:00kim gerdesSUD_English-GUMReddit@2.6does not have tokens, but it's not indicated in the interface.does not have tokens, but it's not indicated in the interface.