vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2024-01-31T17:35:08+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/5235Problème de limite du JK et productivité2024-01-31T17:35:08+01:00Anne de SeptenvilleProblème de limite du JK et productivitéSur les analyses IGK, Vidjil semble continuer à considérer le JK après la fin de celui-ci (région non codante) et donne par conséquent certaines séquences comme non productives parce qu'il doit y voir des codons stop.
Par exemple : ...Sur les analyses IGK, Vidjil semble continuer à considérer le JK après la fin de celui-ci (région non codante) et donne par conséquent certaines séquences comme non productives parce qu'il doit y voir des codons stop.
Par exemple :
https://app.vidjil.org/62056-46?
ou
https://app.vidjil.org/62057-46?clone=70
Nous avons aussi analysé des séquences de cDNA KAPPA et dans ce cas Vidjil s'arrête bien à la fin du J.https://gitlab.inria.fr/vidjil/vidjil/-/issues/5129Provide information when marked_pos (CDR3) is not found2024-02-01T06:04:02+01:00Mikaël SalsonProvide information when marked_pos (CDR3) is not foundIt may happen that we don't find the CDR3 because there are too many deletions either in the V or the J genes that go beyond the marked_pos.
In such a case the CDR3 will not be found and no reason will be provided for that.
More generall...It may happen that we don't find the CDR3 because there are too many deletions either in the V or the J genes that go beyond the marked_pos.
In such a case the CDR3 will not be found and no reason will be provided for that.
More generally if the marked_pos is not set in the germline, the user doesn't have that information. The user can only see that no CDR3 was found with no reason given for that (which is not the case for productivity).
We should give some information about it.
Here is an example where the marked_pos is deleted (appears in position 277/290 of the V gene but we have 16 deletions in the V).
```
GCTGTCATCTCTCAAAAGCCAAGCAGGGATATCTGTCAACGTGGAACCTCCCTGACGATCCAGTGTCAAGTCGATAGCCAAGTCACCATGATGTTCTGGTACCGTCAGCAACCTGGACAGAGCCTGACACTGATCGCAACTGCAAATCAGGGCTCTGAGGCCACATATGAGAGTGGATTTGTCATTGACAAGTTTCCCATCAGCCGCCCAAACCTAACATTCTCAACTCTGACTGTGAGCAACATGAGCCCTGAAGACAGCAGCATAAATCCCCTTGGGGGTCCCTATAATTCACCCCTCCACTTTGGGAACGGGACCAGGCTCACTGTGACAGGTATGGGGGCTCCACTCTTGACTCGGGGGTGCCTGGGTTTGACTG
```Algo 2024.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/4795Avoir plusieurs nuances de pink pour la non-productivité2023-03-28T16:24:46+02:00Mathieu GiraudAvoir plusieurs nuances de pink pour la non-productivitéPermettrait de voir d'un coup d'oeil certaines choses type non-pattern.Permettrait de voir d'un coup d'oeil certaines choses type non-pattern.Web 2023.10Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4756Axes dans un ordre arbitraire ?2021-09-02T16:14:45+02:00Mathieu GiraudAxes dans un ordre arbitraire ?Depuis https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/940#note_505134:
@flothoni : "L'ordre est alphabétique. Je n'ai pas vu d'options possible pour fixer un ordre prédéfini."
cc @duezDepuis https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/940#note_505134:
@flothoni : "L'ordre est alphabétique. Je n'ai pas vu d'options possible pour fixer un ordre prédéfini."
cc @duezThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4702Productivité et pseudo-gènes2024-02-23T10:32:17+01:00Mathieu GiraudProductivité et pseudo-gènes
ERIC #2443 mentionne explicitement **functional** IGHV gene. Mais il y a un certain nombre de pseudo-gènes dans nos germlines (et il y en aura encore plus après !885). Est-ce que ces séquences sont gappées ? A-t-on eu déjà des cas ou d...
ERIC #2443 mentionne explicitement **functional** IGHV gene. Mais il y a un certain nombre de pseudo-gènes dans nos germlines (et il y en aura encore plus après !885). Est-ce que ces séquences sont gappées ? A-t-on eu déjà des cas ou des discordances avec des pseudo-gènes ?
On devrait probablement vérifier cela, ce qui impliquer de parser un peu plus les headers... et/ou, dans `split-germlines.py`, extraire deux fichiers différents, les gènes et les pseudos ?
Y a-t-il un lien avec #3654 ?Algo 2024.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/4701Non-productif + warning quand le motif {WP}GxG n'est pas présent2021-04-14T17:49:49+02:00Mathieu GiraudNon-productif + warning quand le motif {WP}GxG n'est pas présentTrès lié à la discussion de #4006.
Warning qui aiderait à comprendre les différences d'évaluation #4651.Très lié à la discussion de #4006.
Warning qui aiderait à comprendre les différences d'évaluation #4651.Algo 2021.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/4700Pouvoir accéder à la "Detailed view" de IMGT/V-QUEST2021-02-17T11:13:11+01:00Mathieu GiraudPouvoir accéder à la "Detailed view" de IMGT/V-QUESTcc @flothonicc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4675Afficher les raisons de non-productivité dans le client2021-04-14T19:04:45+02:00Mathieu GiraudAfficher les raisons de non-productivité dans le clientSuite à #4599 et #4674.
Déjà ~"!-reflexion" : comment veut-on l'afficher ?
cc @flothoniSuite à #4599 et #4674.
Déjà ~"!-reflexion" : comment veut-on l'afficher ?
cc @flothoniWeb 2021.05Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4658Les germlines J+down ne sont pas gappées2021-01-20T21:09:19+01:00Mathieu GiraudLes germlines J+down ne sont pas gappées
Est-ce volontaire ou un bug qui pourrait avoir des conséquences sur les calculs de ~"bio-productivity" ?
En tout cas on pourrait peut-être le changer en inversant les deux blocs:
```
for key in key_downstream:
downstream_data[key][...
Est-ce volontaire ou un bug qui pourrait avoir des conséquences sur les calculs de ~"bio-productivity" ?
En tout cas on pourrait peut-être le changer en inversant les deux blocs:
```
for key in key_downstream:
downstream_data[key][-1][1]['seq'] += l
(...)
if '>' not in l and current_files and feature == FEATURE_J_REGION:
l = gap_j(l)
```https://gitlab.inria.fr/vidjil/vidjil/-/issues/4652Warning et/ou confirmation quand merge de séquences productives + non-product...2021-01-19T10:41:05+01:00Mathieu GiraudWarning et/ou confirmation quand merge de séquences productives + non-productivesÉvoqué hier avec ~"LIL-Lille" le merge de séquences, discuté avec @flothoni aujourd'hui.
- un ~"client-warning" habituel: jouable
- voire même... une confirmation "do you want really to merge?"Évoqué hier avec ~"LIL-Lille" le merge de séquences, discuté avec @flothoni aujourd'hui.
- un ~"client-warning" habituel: jouable
- voire même... une confirmation "do you want really to merge?"https://gitlab.inria.fr/vidjil/vidjil/-/issues/4651Warning quand des programmes différents donnent des estimations différentes d...2022-01-05T16:20:03+01:00Mathieu GiraudWarning quand des programmes différents donnent des estimations différentes de productivitéDisucté avec @flothoni : pour contourner ou au moins prendre en compte #2526, on pourrait avoir un warning quand on a deux estimations de productivité différentes.Disucté avec @flothoni : pour contourner ou au moins prendre en compte #2526, on pourrait avoir un warning quand on a deux estimations de productivité différentes.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4599Algo, indiquer la raison de non-productivité2021-02-03T10:01:50+01:00Thonier FlorianAlgo, indiquer la raison de non-productivitéOn pourrait afficher la raison lorsque c'est disponible. Igblast indique par exemple `out-of-frame`, `codon-stop`.
Il fuadrait pouvoir le calculer, et je pense que c'est possible puisque déjà utiliser pour le définir.
il faut dans un ...On pourrait afficher la raison lorsque c'est disponible. Igblast indique par exemple `out-of-frame`, `codon-stop`.
Il fuadrait pouvoir le calculer, et je pense que c'est possible puisque déjà utiliser pour le définir.
il faut dans un second temps le mettre dans le format vidjil, puis l'exploiter dans le client.Algo 2021.02Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4578Warnings, avoir un nouveau warning si un clone a plusieurs productivité sur d...2021-02-23T10:33:35+01:00Thonier FlorianWarnings, avoir un nouveau warning si un clone a plusieurs productivité sur différents samplesEn lien avec #4566. Nous avons d'autre cas pour lequel c'est la productivité qui varie.
D'une manière générale, quels sont les champs pour lesquels nous devons lever une alerte ? Quel niveau ? Pour l'instant j'ai mis `warn/jaune`, mais...En lien avec #4566. Nous avons d'autre cas pour lequel c'est la productivité qui varie.
D'une manière générale, quels sont les champs pour lesquels nous devons lever une alerte ? Quel niveau ? Pour l'instant j'ai mis `warn/jaune`, mais il faudrait possiblement mettre un niveau plus élevé pour le faire ressortir (en attendant une meilleur gestion du bruit des warnings).
De plus, comment faire ressortir que c'est le sample 3 qui présente la divergence sur les XXX présent ? E tque c'est les samples 3 et 5 sur les YYY présent ?
Il faudrait faire des fusions des warning pour permettre d'extraire l'information et la fusionner au besoin au sein d'une seule entrée plus lisible.
cc @magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4292Erreur productivité - séquence commençant loin avant le début du V2022-05-12T10:27:36+02:00Anne de SeptenvilleErreur productivité - séquence commençant loin avant le début du VJ'ai fait un test avec d'autres primers plus en amont que ceux utilisés habituellement. Les clones de ces patients, avec une assez grande partie avant le début du V sont notés par Vidjil "non productifs" alors que IMGT les trouve bien pr...J'ai fait un test avec d'autres primers plus en amont que ceux utilisés habituellement. Les clones de ces patients, avec une assez grande partie avant le début du V sont notés par Vidjil "non productifs" alors que IMGT les trouve bien productifs.
https://app.vidjil.org/index.html?set=37915&config=2&clone=90
https://app.vidjil.org/index.html?set=37917&config=2&clone=76https://gitlab.inria.fr/vidjil/vidjil/-/issues/4214Avoir l'information in frame/out of frame depuis l'algo2021-11-22T12:38:28+01:00Thonier FlorianAvoir l'information in frame/out of frame depuis l'algoUne demande de Necker qui nécessite un ajout dans l'algo.
C'est simple selon vous ? Nous devons déjà avoir de quoi le calculer non ?
Cc @magiraud @mikael-sUne demande de Necker qui nécessite un ajout dans l'algo.
C'est simple selon vous ? Nous devons déjà avoir de quoi le calculer non ?
Cc @magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4006Motif {WF}GxG et productivité2021-02-19T12:51:36+01:00Thonier FlorianMotif {WF}GxG et productivitéEn regardant des séquences discordantes (#2526), on est tombé sur une séquence pour laquelle le motif {WP}GxG était en cause.
Nous devrions vérifier le comportement de vidjil sur ce point, voir ajouter des séquences de tests et un point...En regardant des séquences discordantes (#2526), on est tombé sur une séquence pour laquelle le motif {WP}GxG était en cause.
Nous devrions vérifier le comportement de vidjil sur ce point, voir ajouter des séquences de tests et un point de documentation la dessus.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2526Discordance de productivité2024-02-06T16:46:02+01:00Mathieu GiraudDiscordance de productivitéAurélie ~"LIL-Lille" (par mail, réévoqué ce matin en direct) :
> Le clone majoritaire (...) est dit non productif par Vidjil alors que IMGT et IgBlast disent qu’il est productif.
>
> http://app.vidjil.org/?sample_set_id=23871&config=3...Aurélie ~"LIL-Lille" (par mail, réévoqué ce matin en direct) :
> Le clone majoritaire (...) est dit non productif par Vidjil alors que IMGT et IgBlast disent qu’il est productif.
>
> http://app.vidjil.org/?sample_set_id=23871&config=35
>
> Let's look on the following clones:
> >IGHV3-7*01 1/GGAAGCCC/21 IGHJ6*01 338 nt, 607 958 reads (89.48%)
> AGGAGTCGGGGGGAGGCTTGGTCCAGGCCGGGGGGTCCCTGAGACTCTCATGCGTCGGCCACGGATTGAGTTTGAAGAAGGATTGGATGAGTTGGGTCCGCCAGGCTCCAGGGGAGGGGCTGGAGTGGGTGGCCTACATAAAGGAAGATGGAAATGGGAAACACTATGTGGACTCTGTGAAGGGCCGATTCATCATCTTCAGAGACGACGCCAAGAACTCACTATATCTGGAAATGAACAGCCTGAGAGTCGAGGACACGGCTATGTATTATTGTGTGAGA
>
> GGGAAGCC
> CTGGGCGTTTGGGGGCCAAGGGACATCGGTCACCGTCTCCTCAGGTAAG
cc @flothoniLille-LAL-nexthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2443Updated ERIC recommendations2023-03-28T16:20:07+02:00Mathieu GiraudUpdated ERIC recommendationsTransmis par Stéphanie ~"LIL-Lille" :
Rosenquist et al., [Immunoglobulin gene sequence analysis in chronic lymphocytic leukemia: updated ERIC recommendations](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5508071/), doi:10.1038/leu.2017.1...Transmis par Stéphanie ~"LIL-Lille" :
Rosenquist et al., [Immunoglobulin gene sequence analysis in chronic lymphocytic leukemia: updated ERIC recommendations](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5508071/), doi:10.1038/leu.2017.125
Quelles sont les recommandations ? A-t-on des choses à implémenter/corriger dans le ~"client-segmenter" ?
cc @flothoniWeb 2023.10https://gitlab.inria.fr/vidjil/vidjil/-/issues/1824Séquences productives : frameshifts menant à des séquences non productives2021-02-17T11:13:38+01:00Vidjil TeamSéquences productives : frameshifts menant à des séquences non productivesSéparé de tâche CDR3, et séparé de codons stops (#2220).
Florian:
- Le dernier point, c'est de savoir si vidjil doit chercher ou non les codons stop aussi en amont/aval. Certes, le CDR3 est fonctionnel, mais la séquence ne le sera peut...Séparé de tâche CDR3, et séparé de codons stops (#2220).
Florian:
- Le dernier point, c'est de savoir si vidjil doit chercher ou non les codons stop aussi en amont/aval. Certes, le CDR3 est fonctionnel, mais la séquence ne le sera peut-être pas. Soit il faut une double feature stop-cdr3 et stop-sequence, soit une seule qui prenne en compte les deux possibilités. Toutes les séquences que j'ai trouvées non conformes le sont à cause de ce point. En amont, ce serait relativement simple; en aval, je ne sais pas quelle est la limite avant qu'un codon stop soit handicapant lors de la traduction. (-> traité par #2220).
Mathieu:
3Disons que, pour l'instant, on ne dit que si le CDR3 est productif, pas plus. Le problème pour s'étendre "plus loin" est tout le problème du calcul de la séquence représentative. On peut avoir des reads d'un clone qui sont productifs, d'autre non. Bref, on mettra une tâche pour cela, mais on verra ultérieurement, à une prochaine release. Merci de garder tes séquences discordantes quelque part, on en aura bientôt besoin.
***
Mentionné aujourd'hui par Aurélie et Stéphanie
→ regarder aussi STOP dans le V ou le J, regarder aussi pseudo-gène ?
Demander séquences à Aurélie ?
***
Sur l'exemple donné ensuite par Aurélie (mail 31/08, 09h40), la séquence non productive selon IMGT est :
>IGHV4-31*03 1/CAATCGGCCGTGG/6 IGHD2-15*01 1/G/2 IGHJ5*02 373 nt, 12 803 reads (16.46%)
AGTCGGGCCCAGGACTGGTGAAGCCTTCACAGACCCTGTCCCTCACCTGCATTGTCTCTGGTGGCTCCATCAGCAGTACTTCTTACTTCTGGACTTGGATCCGCCAACACCCCGGGAAGGACCTGGAGTGGATTGGCTACATCTATTACAGTGGGAGCACCTACTACAACCCGTCCCTCAAGAGTCGAGTCACCATGTCAATAGACACCTCTGCGAACCAGTTCTTCCTGCAGTTGAGCTCTGTGACTGCCGCGGACACGGCCGTGTATTACTGTGCGAGA
GCAATCGGCCGTGGTTGTAGTGGTGGTATTTGTTACTC
GAACTGGTTCGACCCCTGGGGCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAG
La différence a lieu à la fin du CDR3 où Vidjil sort WFDPW et où IMGT sort WF#PL.
Il y a un autre clone, très semblable qui est vu productif par les deux :
>IGHV4-31*03 1/CAATCGGCCGTGG/6 IGHD2-15*01 1/G/2 IGHJ5*02 369 nt, 16 457 reads (21.16%)
GGAGTCGGGCCCAGGACTGGTGAAGCCTTCACAGACCCTGTCCCTCACCTGCATTGTCTCTGGTGGCTCCATCAGCAGTACTTCTTACTTCTGGACTTGGATCCGCCAACACCCCGGGAAGGACCTGGAGTGGATTGGCTACATCTATTACAGTGGGAGCACCTACTACAACCCGTCCCTCAAGAGTCGAGTCACCATGTCAATAGACACCTCTGCGAACCAGTTCTTCCTGCAGTTGAGCTCTGTGACTGCCGCGGACACGGCCGTGTATTACTGTGCGAGA
GCAATCGGCCGTGGTTGTAGTGGTGGTATTTGTTACTC
GAACTGGTTCGACCCCTGGGGCCAGGGAACCCTGGTCACCGTCTCCTC
La différence avec le précédent ? Un C en plus au milieu du J (après le CDR3). Il est donc assez logique que les deux séquences ne puissent pas être productives à la fois puisque ce qui les différencie est un indel après le CDR3 induisant un décalage de phase. IMGT prend bien compte cela, pas nous.
***
@nobody