Causatives in French and Italian are known to exhibit complex properties, with two competing analyses, none of which accounts for all the data
(a) one with "faire" taking a regular xcomp complement
(b) one in which "faire" + infinitive verb form a complex predicate
The main motivation for (b) is the placement of complement clitics on the "faire" verb
(there are about 100 such cases in French UD, half of it with a reflexive clitic)
(1a) Paul fait parler Pierre de sa jeunesse
(1b) Paul le fait parler de sa jeunesse
(2a) Paul fait tourner un film à Jean / par Jean
(2b) Paul lui fait tourner un film
(2c) Paul en fait tourner un à Jean / par Jean
(2d) Paul lui en a fait tourner un
Paul fait rembourser le plaignant par l'assurance
Paul se fait rembourser par l'assurance
But some clitics go on the infinitive:
(3) Paul le fait en parler
Interaction with reflexive clitic is very complex...
(4) Paul fait s'évanouir Jean
(5) Paul fait se rencontrer les gens
For a given transitive verb like "X lave Y"
the causative introduces a causer argument : C fait laver Y (à/par) X
The reflexivization can semantically equate X with Y, or C with Y:
(6) Paul le fait se laver
(7) Paul se fait laver (par un infirmier)
(8) Paul s'est fait escroquer
(9) Paul s'est fait voler son portable
There seem to be three possible representations:
(A) Current representation (in French UD and Italian UD):
the infinitive is an xcomp of "faire" / "fare"
The complements attach either to the infinitive or to the causative verb, depending on word order:
the clitics appearing before the causative verb are attached to it:
"Jean" attaches to "tourner" in (2a), but "lui" attached to "fait" in (2b)
(B) Non projective version:
One option could be to attach only the subject of "faire" to it,
and maybe the reflexive clitic if on "faire" (7, 8, 9)
and all other complements to the infinitive
leading to non projectivity in case of clitics on "faire" (2bcd, 3)
(NB: the selectional restrictions of the complements are defined by the infinitive)
(C) Complex causative version (current representation in French Treebank / Sequoia)
the combination "faire"+ Vinf is viewed as a complex predicate
"faire" can be treated as an auxiliary,
all other dependents attached to the infinitive (including the causer argument)
Pros and cons:
(A)
pros: allows to distinguish reflexive (6) and (7)
cons: problem to treat differently arguments filling the same valency slot (2a vs 2bcd)
(B)
pros: same valency slots treated uniformly independently of pronominalization
cons: non projectivity (problem for parsing, but cases are marginal??)
(C)
pro: same valency slots treated uniformly independently of pronominalization
Designs
Child items ...
Show closed items
Linked items 0
Link issues together to show that they're related.
Learn more.
Solution (B) does not decide between auxiliary and full verb for causatives and I don't understand why to deal with reflexive in a specific way.
In my opinion, the only possible choice is between solution (C) and solution (D).
Solution (D): the causative is a full verb: there is dependency XCOMP to the infinitive and all complements generated by the causative construction depend on the causative.
Examples for solution (D) :
(1a) : fait - OBJ -> Pierre
(1b) : fait - OBJ -> le
(2a) : fait - OBL -> Jean
(2b) : fait - IOBJ -> lui
(2c) : un - NMOD -> en
(6) : fait - OBJ -> le, laver -OBJ -> se
(7): laver - OBJ -> se
Je copie la réponse de Marie-Catherine:
On avait pas mal parlé des “light verb constructions” à Gothenburg il y a deux ans (pas tout à fait semblable aux causatives mais similaires dans un certain sens). Là on avait décidé que le plus simple c’était de garder la structure syntaxique. (Je ne retrouve plus la page là-dessus maintenant que toute la documentation a changé pour v2 mais je vais encore chercher). Et dans la version enhanced, on peut indiquer que c’est un prédicat complexe. Donc je ne sais pas si multiplier les auxiliaires est la meilleure solution.
A mon avis la version (A) n’est pas top. Il vaudrait mieux tjs avoir le même attachement. Donc peut-être la version (B) ?
Est-ce que Sylvain et Kim proposent qqch pour ces structures causatives qui vous va ? (Je n’ai pas encore regardé).
(Dans le document de Sylvain et Kim, il n'y a rien sur les causatives)
Pour répondre à Guy sur (D):
Quel est l'avantage de (D) par rapport à (C) ??
Cela crée des cadres de sous-catégorisation très bizarres,
et comme les restrictions de sélection de sélection sont définies par l'infinitif,
je préfère (C) à (D)
Concernant le traitement du réfléchi: la différence tient au placement du "se": on peut trouver effectivement dans les corpus des cas où le "se" est sur le "faire"
A noter qu'autant (C) que (D) ne permet pas de distinguer (6) et (7) (à part avec l'ordre des mots).
Bref, je serais pour la solution (C), ou si c'est vraiment un pb d'ajouter un auxiliaire, la solution (B)
(mais pourquoi est-ce un pb d'ajouter un auxiliaire si c'est justifié ?)
L'avantage du (D) par rapport au (C) est qu'il distingue les arguments propres de l'infinitif des arguments liés à la construction causative et évite certaines ambiguités.
Ainsi dans l'exemple "il lui fait présenter l'exposition", il y aura deux analyses syntaxiques :
fait - IOBJ -> lui (lui est sujet profond de présenter)
présenter - IOBJ -> lui (lui est objet indirect profond de présenter)
Bonjour,
désolée je n'avais pas bien compris la (D)
si j'ai bien compris pour (1a),
(1a) Paul fait parler Pierre de sa jeunesse
tu aurais "Pierre" dépendant de "fait",
et "de sa jeunesse" dépendant de "parler" ?
Si oui, ça me paraît trop compliqué pour la syntaxe de base, non?
Je suis d'accord avec le dernier inconvénient soulevé par Marie. Entre (C) et (D), il n'y a pas vraiment de solution qui n'ait pas d'inconvénient donc je je ne ferai pas une maladie de choisir la (C).
Un des problèmes est l'ambiguité d'exemples comme :
(10) Pierre fait manger le veau
où le veau pour être X ou Y (X mange Y).
Si on considère que UD est purement syntaxique, pas de problème, une même analyse.
Mais par ailleurs, UD distingue les nsubj des nsubj:pass, donc on pourrait se demander si ici on veut distinguer un vrai obj d'un obj:caus, càd d'un obj résultant de la démotion d'un sujet.
Par ailleurs, il y a le problème du réfléchi dont je ne sais pas bien comment le résoudre pour l'instant.
(a) Pierre se lave
(b) Marie fait se laver Pierre
(c) Pierre se fait laver
On est tenté de traiter "se" comme obj en (a), mais cela est justement un peu contredit par les constructions causatives comme (b), car X devient normalement obj quand le verbe n'a pas d'obj !
En tout cas, si on maintient l'analyse de "se" comme obj, l'introduction de la fonction obj:caus permettrait d'avoir une analyse acceptable de (b) et (c) avec l'analyse (C) (qui me semble la plus proche de l'esprit de l'analyse du passif en UD) :
(b) se obj:caus Pierre
(c) se <obj:caus laver
A noter que le obj:caus ne résoud pas tous les problèmes d'ambiguïté de rôle des dépendants: il y aussi ambiguité sur le dépendant en "à"
Paul fait envoyer des fleurs à Pierre / au nouveau coursier
Paul fait balayer la cour aux recrues
Plus généralement, pour les changements de diathèse,
à noter que le nsubj:pass est incomplet (il faudrait un csubj:pass)
on veut ds notre article défendre l'idée de l'explicitation de fonctions canoniques
ça donne pour l'exemple (10) selon le sens,
"veau" est sujet canonique ou objet canonique de manger
A propos de l'exemple (b), effectivement c'est un pb de traiter le "se" réfléchi avec un label "obj", cf. le causatif montre bien que le "se" réfléchi est intransitivant
J'ai pas de solution pour la représentation de surface
Oui je suis complètement d'accord avec le fait que ca serait mieux d'indiquer la fonction initiale plutot que la voix (nsubj:obj plutôt que nsubj:pass). On avait d'ailleurs déjà fait cette proposition à Joakim en septembre 2016 avant la réunion pour UD v2. On y discutait d'ailleurs déjà le causatif. Voir document joint :
Propositions.UD.odt
C'était aussi dans notre article à LAW 2016.
Donc on en revient souvent à la même question : jusqu'à quel point on accepte de se plier à UD, notamment quand on a la certitude que UD fait un mauvais choix et qu'un meilleur choix (à tout point de vue) est possible.
Et pour la question de "se" qui est un peu orthogonale, on peut décider de le traiter comme un pur marqueur de voix et pas comme un argument. Autrement dit se n'aurait pas une fonction argumentale comme obj ou iobj, mais une autre fonction (la meilleur étant aux, puisque la fonction aux est utilisée pour ça dans les langues où il y a des particules qui marquent les changements de voix). Ca peut paraitre un peu iconoclaste, mais ca résoudrait énormément de problème d'annotation des "se" où on se pose des questions sans intérêt pour décider si "se" est obj, iobj ou expl.
Il y a plusieurs arguments pour ne pas traiter "se" comme argument :
le causatif : il fait se laver Pierre
l'impersonnel : il se lavent beaucoup de gens
l'auxiliaire du passé : il s'est lavé vs il l'a lavé
Je suis partisan de faire évoluer l'annotation en restant dans le cadre d'UD. Pour les causatifs qui sont spécifiques à certaines langues, je pense que nous avons la liberté de faire certains choix pour le français. Pour les pronoms réfléchis, ce que propose Sylvain est une remise en cause du choix d'UD, donc je pense qu'il vaudrait mieux le mettre en débat au niveau général d'UD.
Pour les causatifs, je suis partisan de la proposition de Sylvain : le verbe causatif est considéré comme un auxiliaire et les compléments propres à la construction causative ont l'étiquette suivie du suffixe caus (obj:caus, iobj:caus, obl:caus).
Petite remarque pour Marie : l'étiquette csubj:pass existe dans UD.
Pour répondre à Guy, ce que je propose pour "se" est du UD pur sucre :
"An aux (auxiliary) of a clause is a function word associated with a verbal predicate that expresses categories such as tense, mood, aspect, voice or evidentiality. It is often a verb (which may have non-auxiliary uses as well) but many languages have nonverbal TAME markers and these are also treated as instances of aux." (universaldependencies.org/u/dep/aux_.html)
La question se situe vraiment au niveau théorique : veut-on traiter "se" comme un argument du verbe ou comme un simple marqueur de voix ? Si on choisit la 2e solution, aucun problème pour le faire en UD. Et ca simplifie tout : plus la peine de se demander si dans "Pierre se donne à fond, Pierre se donne une heure", c'est un obj, un iobj ou expl parce que lexicalisé.
C'est vrai que lexicaliser les pronoms réfléchis ne semble pas contraire aux choix d'UD. C'est vrai aussi que je n'ai pas trouvé grand'chose sur le site web d'UD concernant ces pronoms.
En lexicalisant les pronoms réfléchis, on évite certes le problème de savoir où fixer la frontière entre verbes esssentiellement pronominaux et verbes admettant une construction pronominale, mais pour les seconds, on perd le lien avec le verbe dans une construction non pronominale. Entre "je me lave" et "je le lave", on aimerait bien dire que c'est le même verbe avec un objet direct qui est "me" dans le premier cas et "le" dans le second.
Salut,
oui on sait bien que le vrai réfléchi est une opération intransitivante, donc plutôt à traiter comme un changement de diathèse,
et oui ça règlerait le pb de choisir son statut
(à noter que ça ne fait que déplacer le pb pour des phases ultérieures)
Mais d'un point de vue pratique, pour UD de base,
je trouverais dommage de représenter pareil "je me lave" et "je m'aperçois (que P)"
à moins de jouer sur le label de dépendance entre "je" et "laver" (genre suj+obj, mais c'est vraiment moche, cf. syntaxiquement, ce n'est pas du tout un obj)
Dans le sequoia profond, on a reporté 2 dep (suj, obj) sur le sujet syntaxique
En UD de base je serais comme Guy pour garder tel quel
et tant pis pour les incohérences donnant un double objet
causatif : je fais se regarder les participants
admis pas certains locuteurs: impersonnel : "Il se lavait encore trois personnes dans la fontaine de Trevi quand la police est intervenue"
=> ça va être très rare en corpus
Même le vrai réfléchi est en fait rare par rapport à ses autres statuts
On décide donc que faire est un auxiliaire (avec la relation aux:caus). Les arguments du verbe principal peuvent alors avoir, en plus des relations usuelles, les relations obj:caus ou obl:caus.
J'ai modifié UD_French-Sequoia avec cette nouvelle annotation des causatifs. Pour voir les exemples dans le corpus:
Hi,
il me semble qu'il devrait y avoir des iobj:caus
cf. d'après ce que j'ai compris,
les compléments (sous-catégorisés) en à sont notés iobj dans ta conversion
Pour les obl:caus, ca n'a de sens que si on marque aussi les obl:pass. Est-ce le cas ?
De manière général, obl est très sous-spécifié, puisqu'on indique même pas si on a affaire à coi (parler à qqn), des arguments obliques (compter sur qqn), des ajouts (dormir à midi), ou même des compléments de phrases (à mon avis, il dort). Du coup ca parait un peu dérisoire d'indiquer quand c'est le sujet retrogradé, non ?
Mes remarques sur "se" vont dans le même sens : pourquoi être si fin sur les "se" alors qu'on ne l'est pas sur les obl. Du strict point de vue syntaxique, "je me lave" et "je m'aperçois" ont exactement la même structure. Vouloir encoder que "se" dans "s'apercevoir" est expl, c'est encoder que c'est lexicalisé, mais ça c'est encodé à un autre niveau (cf. Parseme, FrameNet, etc.). Dans la mesure où l'analyse en UD n'indique pas la structure argumentale (cf. obl), pourquoi devrait-on l'indiquer pour "se" ?
Par contre, la structure syntaxique de "il se lave" et "il le lave" est différente, puisqu'on a des propriétés syntaxiques différentes pour le passé composé, le causatif et l'impersonnel. Donc ca fait sens de les distinguer.
@Sy : on est complètement d'accord sur le fond, ça fait sens de les distinguer, on argumente pas là-dessus
mais UD comprend déjà certains choix qui sont des entorses plus ou moins heureuses au principe de représenter la structure syntaxique.
Par exemple, l'impersonnel noté il=expl, avec le complément noté nsubj ou le traitement de la copule.
On est tous d'accord que c'est moche,
et que distinguer des niveaux (cf. MTT ou bien la syntaxe profonde qu'on a ajoutée pour sequoia) serait plus propre
Pour le réfléchi en l'occurrence, c'est juste un changement de label, qui permet à pas cher d'être un peu plus expressif dès l'arbre UD
(à ce compte-là, obj:caus n'a pas de réalité syntaxique, cf. c'est un obj...)
Eventuellement on pourrait mettre un obj:refl ou plutôt, pour garder que le label syntaxique de base est la première partie, un expl:obj / expl:iobj ?
Tout à fait d'accord avec la proposition de Sylvain. Ma seule réserve est de considérer que dans les constructions (verbe de perception + objet + infinitif) le verbe de perception est un auxiliaire causatif. Est-ce que "Il a entendu Jean parler" doit avoir une construction totalement différente de "Il a entendu Jean" ? Et dans "elle en a entendu parler par Pierre" "Pierre" constitue un intermédiaire et par forcément celui qui a parlé.
Je suis d'accord pour "asseoir nsubj:caus > je" (qu'on avait ajouté sans le dire!)
et pour obj/iobj/obl:agent au lieu de *:caus, c'est plus cohérent effectivement
Pour "entendre" :
j'ai l'impression que l'analyse de type "complexe causatif" (avec un sens perceptif et pas causatif, pb de terminologie) n'est valable que pour "entendre" + "parler" ou "entendre" + "dire",
et de toutes façons en concurrence avec une analyse "non complexe", cf. on a le placement des clitiques possible sur le vinf:
(1) Pierre a entendu/vu les enfants (le dire/ le crier/ le faire / en parler)...
(2) Pierre les a entendus/vu (le dire/ le crier/ le faire / en parler)...
Donc l'analyse que tu proposes @Syl est restreinte aux cas particuliers où le v de perception est "entendre" (pas d'autre a priori?), le Vinf est "dire" ou "parler" (autre??), et où on a un complément en "par" et/ou un placement du clitique complément du Vinf sur "entendre" et pas sur le Vinf:
(3) Pierre a entendu parler de ça par ses profs
Pierre en a entendu parler par ses profsPierre en a entendu parler*??Pierre a entendu en parler par ses profs
(4) Pierre a entendu/*vu dire/*crier/*faire ça par ses profs
Pierre l' a entendu dire par ses profsPierre l' a entendu dire*Pierre a entendu le dire par ses profs
Du coup c'est peut-être bizarre de faire de "entendre" ds ces cas très particuliers un auxiliaire, il y a peut-être la piste de faire de "entendre parler" "entendre dire" un expression polylexicale (dans les cas précis 3 et 4) ??
Aussi, avec C on tombe à côté de la définition de UD sur les auxiliaires qui dit "An auxiliary is a function word that accompanies the lexical verb of a verb phrase and expresses grammatical distinctions not carried by the lexical verb, such as person, number, tense, mood, aspect, voice or evidentiality". Le "faire" causatif n'est donc pas un auxiliaire selon UD
Enfin, si on se limite plus aux auxiliaires "être" et "avoir" et qu'on en inclue d'autres, il me semble difficile ensuite de déterminer où est la limite, comme en atteste d'ailleurs le post qui précède celui-ci
Je trouve que la définition D était très bien, on récupère les arguments du verbe lexicale d'un côté, et puis ceux qui font partie de la construction factitive de l'autre.