vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2022-05-12T11:42:47+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/2233Avoir un rapport plus générique2022-05-12T11:42:47+02:00Mathieu GiraudAvoir un rapport plus génériqueÉvoqué avec ~"Paris-Pitié"
En particulier pour mettre des informations de qualité
cc @flothoni @RyanHerb @mikael-sÉvoqué avec ~"Paris-Pitié"
En particulier pour mettre des informations de qualité
cc @flothoni @RyanHerb @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2002Configuration trop stringeante sur la recherche du D2022-05-12T11:42:47+02:00Vidjil TeamConfiguration trop stringeante sur la recherche du DExemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutati...Exemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutation.
***
Alors il y a bien un problème mais il n'a rien à voir. Voir « Le résultat de la segmentation change selon le contexte » #2003
***
Notons que toutes les séquences ici ont normalement le même "multiplier" de E-value (nb de clones analysés).
... et effectivement, il y a bien un problème (de calcul de p-valeur) : cela semble gros qu'une seule mutation sur 22pb fasse tout louper.
***
Surtout qu'il y a une séquence avec une mutation dans le D, où le D est bien trouvé...
***
Seuil de e-valeur pour le D : .05
J'imagine qu'il y a une raison pour cette faible valeur, mais les D sont courts et atteindre de très faibles e-valeur est compliqué (à l'inverse de ce qu'on a avec le kmer segmenteur). Pourquoi le seuil est-il à 0,05 ?
***
@magiraud @mikael-sThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4137Avoir plus d'information sur des UNSEG V : quel V ?2022-05-12T11:42:47+02:00Mathieu GiraudAvoir plus d'information sur des UNSEG V : quel V ?~"CRE-Créteil" aimerait savoir quels sont les V dans les `UNSEG V` (en particulier, compter les TRBV23 (?) pour normalisation ~"bio-capture" ?). Cela va dépendre des longueurs des séquences, sur certaines probablement c'est ambigu...
Av...~"CRE-Créteil" aimerait savoir quels sont les V dans les `UNSEG V` (en particulier, compter les TRBV23 (?) pour normalisation ~"bio-capture" ?). Cela va dépendre des longueurs des séquences, sur certaines probablement c'est ambigu...
Avant de réfléchir à un éventuel truc en ~cpp, on a évoqué avec Guillaume qu'il faudrait déjà étudier cela avec post-process en utilisant le `UNSEG_V.fa`. Guillaume pourrait peut-être regarder cela.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3128Point caché (dans l'épingle) qui apparaît malgré tout dans le graphique2022-05-12T11:12:09+02:00Mikaël SalsonPoint caché (dans l'épingle) qui apparaît malgré tout dans le graphiqueSignalé par ~"LIL-Lille".
Il y a 3 points pour un patient mais 1 a été caché manuellement. Après avoir fait un compare patients, en retournant voir les résultats de ce patient, le 3è apparait comme fantôme (ou une copie du 1er ?) à la 2è...Signalé par ~"LIL-Lille".
Il y a 3 points pour un patient mais 1 a été caché manuellement. Après avoir fait un compare patients, en retournant voir les résultats de ce patient, le 3è apparait comme fantôme (ou une copie du 1er ?) à la 2è position.
@Aurelie va nous envoyer le lien.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3156Plot submenu: une icône .svg disparaît après utilisation2022-05-12T11:10:25+02:00Mathieu GiraudPlot submenu: une icône .svg disparaît après utilisationRapporté par Michael ~"Paris-Pitié" : l'icône "bulles" disparaît de temps en temps après qu'on ait échangé de vue.
Lien avec #2474 ?Rapporté par Michael ~"Paris-Pitié" : l'icône "bulles" disparaît de temps en temps après qu'on ait échangé de vue.
Lien avec #2474 ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2743Passer avec la souris sur les séquences du segmenteur supprime la vue des mut...2022-05-12T11:06:47+02:00Mathieu GiraudPasser avec la souris sur les séquences du segmenteur supprime la vue des mutationsRapporté par Aurélie ~"LIL-Lille" ce matin: lors d'un certain `:hover`, la couleur rouge s'enlève.
Je ne suis pas sûr d'avoir bien compris, je n'ai pas réussi à reproduire de mon côté.
@RyanHerb avait des idées à ce propos (update du se...Rapporté par Aurélie ~"LIL-Lille" ce matin: lors d'un certain `:hover`, la couleur rouge s'enlève.
Je ne suis pas sûr d'avoir bien compris, je n'ai pas réussi à reproduire de mon côté.
@RyanHerb avait des idées à ce propos (update du segmenteur et highlights ?)https://gitlab.inria.fr/vidjil/vidjil/-/issues/3868Avoir les noms des patients dans la timeline lorsque l'on ouvre un run2022-05-12T11:06:36+02:00Thonier FlorianAvoir les noms des patients dans la timeline lorsque l'on ouvre un runPar défaut, on affiche le nombre de jours ou le nom du fichier. Or, lorsque l'on ouvre un run, on serait plus intéressé par avoir les liens patients si ceux-ci sont disponibles.
Rajouter une entrée dans le setting ? Ramener l'informatio...Par défaut, on affiche le nombre de jours ou le nom du fichier. Or, lorsque l'on ouvre un run, on serait plus intéressé par avoir les liens patients si ceux-ci sont disponibles.
Rajouter une entrée dans le setting ? Ramener l'information de quel endroit dans ce cas ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4292Erreur productivité - séquence commençant loin avant le début du V2022-05-12T10:27:36+02:00Anne de SeptenvilleErreur productivité - séquence commençant loin avant le début du VJ'ai fait un test avec d'autres primers plus en amont que ceux utilisés habituellement. Les clones de ces patients, avec une assez grande partie avant le début du V sont notés par Vidjil "non productifs" alors que IMGT les trouve bien pr...J'ai fait un test avec d'autres primers plus en amont que ceux utilisés habituellement. Les clones de ces patients, avec une assez grande partie avant le début du V sont notés par Vidjil "non productifs" alors que IMGT les trouve bien productifs.
https://app.vidjil.org/index.html?set=37915&config=2&clone=90
https://app.vidjil.org/index.html?set=37917&config=2&clone=76https://gitlab.inria.fr/vidjil/vidjil/-/issues/4066Couleur par nombre de samples2022-05-12T10:25:04+02:00Mikaël SalsonCouleur par nombre de samplesL'information du nombre de samples dans lesquel est présent un clone est calculée : #1974 (et commits 3c3ee70, 11f0afa05).
On peut donc en faire facilement une couleur ([voir la documentation](https://gitlab.inria.fr/vidjil/vidjil/blob/...L'information du nombre de samples dans lesquel est présent un clone est calculée : #1974 (et commits 3c3ee70, 11f0afa05).
On peut donc en faire facilement une couleur ([voir la documentation](https://gitlab.inria.fr/vidjil/vidjil/blob/dev/doc/dev-client.md#how-to-add-something-to-be-plotted)).
@pduroux nous a montré une coloration discrète pour les clones présents dans tous les samples et pour les clones présents dans un seul sample.
Parmi ce que nous demandent les utilisateurs il y a le contrôle de la contamination (#1744) et même si un clone n'est pas présent dans tous les échantillons, ça les intéresse.
L'intérêt d'une coloration discrète c'est qu'on peut facilement filtrer en cliquant sur la couleur qu'on ne veut pas voir. On pourrait donc avoir une coloration discrète :
* tous les samples
* plusieurs samples (mais pas tous)
* un seul sample
Si je m'intéresse à la contamination, je clique sur la couleur qui correspond à un seul sample et je vois directement tous les clones qui sont partagés par plusieurs samples.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4778User question2022-05-12T09:58:55+02:00Mathieu GiraudUser question... from 2017, not sure it's still applicable (https://github.com/vidjil/vidjil/issues/6)
Thanks for your time and help.
I have spent some time to try to follow your advice but I still have some questions.
I have tried to use tools...... from 2017, not sure it's still applicable (https://github.com/vidjil/vidjil/issues/6)
Thanks for your time and help.
I have spent some time to try to follow your advice but I still have some questions.
I have tried to use tools/fuse.py with the command,
python tools/fuse.py --output mrd.vidjil --top 100 out/BCR01-01.fq.vidjil out/BCR23-01.fq.vidjil
it gives me an error code :
File "", line 1
python tools/fuse.py --output mrd.vidjil --top 100 out/BCR01-01.fq.vidjil out/BCR23-01.fq.vidjil
^
SyntaxError: invalid syntax
BUT besides the error code, the more important concern to me is, fuse.py is a merge process of 2 vidjil files with top 100 clones, maybe we can make it to top 10,000 or even more(what if the target clone we are tracking is at very low concentration, maybe, let's say, number 10,000). After I got the mrd.vidjil file and I feed it to the web client, I still can only see the first 200, right? If the target clone is at number 30,000 in the after-treatment sample, I still can not see it in the web app. I didn't get the merged vidjil file due the above error, so I was just thinking in this way.
1. For a full repertoire analysis, you have introduced me an -A option and this will process all the clones. I guess I could use the command like,
```
./vidjil -A -r 1 -g germline/homo-sapiens.g:IGH,IGH+,IGK data1/BCR01-01.fq.gz
```
I still could not use this vidjil output with the web client, right? Because it only can analysis top 200. So I have to use vdjtools by converting the vidjil file into vdjtools format and analysis from there. Because VDJtools will only use top clonotypes which have V/D/J detalization in the output, some clones lacking of V/D/J detalization will be dropped. So if our target clone is in this range, we can not see it, right?
2. VDJtools supports parsing output Json files, what's Json file produced by vidjil, I only have .fa, .vidjil and a .windows.fa files.
I have tried
```
Convert \ -S Vidjil BCR01-01.fq.vidjil output
```
the error messeges are,
```
Executing com.antigenomics.vdjtools.misc.Convert -S Vidjil BCR01-01.fq.vidjil output
[Wed May 10 00:33:25 CDT 2017 Convert] Reading sample(s)
[Wed May 10 00:33:25 CDT 2017 Convert] 1 sample(s) loaded
[Wed May 10 00:33:25 CDT 2017 SampleStreamConnection] Loading sample BCR01-01.fq
[ERROR] java.lang.NullPointerException, see _vdjtools_error.log for details
```
Thank you so much!https://gitlab.inria.fr/vidjil/vidjil/-/issues/4805Le lien assign subset n'a pas d'event lié2022-05-12T09:58:29+02:00Thonier FlorianLe lien assign subset n'a pas d'event liéLe bouton "assign subset" n'aspas d'action associée, donc on n'a aucun effet.Le bouton "assign subset" n'aspas d'action associée, donc on n'a aucun effet.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3130Informations pour la LLC dans le rapport2022-04-19T17:14:54+02:00Mikaël SalsonInformations pour la LLC dans le rapportDans le rapport on ne sort pas des informations comme la productivité (calculée par Vidjil) ou sur le % d'homologie avec le V (récupéré d'IMGT (cf. #2819) ou si on le calcule en interne (#3131)) qui sont pertinentes pour la LLC.Dans le rapport on ne sort pas des informations comme la productivité (calculée par Vidjil) ou sur le % d'homologie avec le V (récupéré d'IMGT (cf. #2819) ou si on le calcule en interne (#3131)) qui sont pertinentes pour la LLC.Web 2022.05https://gitlab.inria.fr/vidjil/vidjil/-/issues/4992Aligneur: par défaut, centrer sur le CDR32022-04-12T15:46:02+02:00Mathieu GiraudAligneur: par défaut, centrer sur le CDR3évoqué la semaine dernière avec des usagères et @duezévoqué la semaine dernière avec des usagères et @duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4986Plus de séquence dans les (anciens) rapports2022-04-07T17:29:52+02:00Mathieu GiraudPlus de séquence dans les (anciens) rapportsDeux utilisatrices nous font remonter des soucis.
> il y manque les séquence des réarrangements sélectionnés (ex en PJ). Je sais qu'un souci de génération de rapport s'était déjà posé il y a peu de temps, et avait été résolu (on avait...Deux utilisatrices nous font remonter des soucis.
> il y manque les séquence des réarrangements sélectionnés (ex en PJ). Je sais qu'un souci de génération de rapport s'était déjà posé il y a peu de temps, et avait été résolu (on avait alors toutes les séquences en vrac au bout du report, sans possibilité apparente de les ordonner, ce qui nous a paru peu pratique mais utilisable)
cc @duez @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2818Pouvoir effectuer des analyses de translocations sur des séquences arbitraires2022-04-07T11:38:16+02:00Ryan HerbertPouvoir effectuer des analyses de translocations sur des séquences arbitrairesDebré voudraient pouvoir saisir des séquences pour les passer comme des germlines au logiciel afin d'analyser les translocations.Debré voudraient pouvoir saisir des séquences pour les passer comme des germlines au logiciel afin d'analyser les translocations.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4561Avoir le numéro de l'échantillon lors de l'envoi d'un clone vers un service t...2022-03-30T17:54:54+02:00Thonier FlorianAvoir le numéro de l'échantillon lors de l'envoi d'un clone vers un service tiersUn utilisateur souhaite avoir le nom de l'échantillon lorsqu'un clone est envoyé vers un service tiers.
Pour le moment ce n'est pas le cas. Ce pourrait être simple, mais il y aurait des questions a trancher.
* les données sont transmis...Un utilisateur souhaite avoir le nom de l'échantillon lorsqu'un clone est envoyé vers un service tiers.
Pour le moment ce n'est pas le cas. Ce pourrait être simple, mais il y aurait des questions a trancher.
* les données sont transmissent en clair vers les service tiers, or le nom peut contenir des informations importantes
* un clone peut être présent dans plusieurs échantillon chez un même individus.
cc @magiraud @mikael-sWeb 2022.05marc duezmarc duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4929Diversity by locus, fuse+client2022-03-23T13:34:19+01:00Mathieu GiraudDiversity by locus, fuse+clientSuite à #1781/!1111, voir donc pour fuse+clientSuite à #1781/!1111, voir donc pour fuse+clientThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4072Clones de distribution : le filtrage par locus ne fonctionne pas2022-03-08T11:42:14+01:00Mikaël SalsonClones de distribution : le filtrage par locus ne fonctionne pasSe rendre ici : http://app.vidjil.org/?set=25736&config=56&plot=averageLength,size,bar et choisir le 3è sample. Dans la distribution on a 2 jolies bosses : une due aux TRG et une aux IGH. En désactivant un des locus, la distribution ne s...Se rendre ici : http://app.vidjil.org/?set=25736&config=56&plot=averageLength,size,bar et choisir le 3è sample. Dans la distribution on a 2 jolies bosses : une due aux TRG et une aux IGH. En désactivant un des locus, la distribution ne se modifie pas : les clones de distribution sont rassemblées à partir d'une longueur partagée, mais sans égard pour leur locus.
Mais quand on filtre par locus, le nombre de reads change et, du coup, les pourcentages affichés pour les clones de distribution ne sont plus corrects (par exemple n'afficher que les TRG et tous les sélectionner), j'arrive à 167%.
/cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4944Analyse chaîne légère et mutation R1102022-03-04T13:00:26+01:00Anne de SeptenvilleAnalyse chaîne légère et mutation R110Il a été montré que dans la LLC, (Maity et al, PNAS 2020 ; Nadeu et al, Blood 2020), la présence d'une mutation R110 sur la chaine légère lambda VL3-21 était associée à une sévérité accrue de la maladie. Cette mutation (G>C) se trouve à ...Il a été montré que dans la LLC, (Maity et al, PNAS 2020 ; Nadeu et al, Blood 2020), la présence d'une mutation R110 sur la chaine légère lambda VL3-21 était associée à une sévérité accrue de la maladie. Cette mutation (G>C) se trouve à la jonction entre le J et la partie constante.
Par conséquent, nous aimerions analyser des séquences de chaînes légères sur vidjil, pour détecter la présence de cette mutation. dans un premier temps, avec des fastq ne contenant que des chaînes légères (au moins lambda, ou kappa + lambda), et dans l'idéal à terme, à partir de fastq contenant les IGH + les IGL.
Après un premier test, je vois qu'il y a un problème d'analyse de la productivité sur les clones lambda que j'ai importés.
Je voudrais aussi pouvoir analyser des fastq IGH + IGL, mais il me semble qu'avec les paramètres actuels de Vidjil, les clones IGH vont représenter la très grande majorité des 100 premiers clones et que je ne pourrai pas visualiser mes clones lambda, srutotu que pour l'instant ma PCR est peu efficace. Est-ce possible de remédier à cela d'une manière ou d'une autre ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/1724SEG_METHOD_ONE : séquences non recombinées, usages2022-02-25T18:21:15+01:00Vidjil TeamSEG_METHOD_ONE : séquences non recombinées, usages
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ......
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ... #1801
- détecter des adaptateurs mal enlevés #1669
- standards / spikes ? ~"user-request"
(Anciens commentaires ci-dessous, implémenté depuis... 2018 !)
> Cela me tente très fort d'avoir une méthode expérimentale pour retrouver des reads matchant *une* séquence dans une germline de référence, non recombinée.
>
> Implémentation proposée (temps estimé : moins qu'un chapitre d'HdR :)
> - en KmerSegmenter, récupérer simplement le k-mer maximum + test e-valeur + extraction d'une fenêtre *centrée* les k-mers détectés. Selon ce qu'on prend comme taille de fenêtre, on fera plus ou moins n'importe quoi. (edit: mieux, minimizers, voir #2643)
> - éventuellement continuer en FineSegmenter avec une DP standard pour identifier la séquence.
>
> On s'éloigne du dogme, "Vidjil analyse les recombinaisons"... mais on reste focus sur choses immuno. Mais il ne faut pas recoder Blast/Yass :-)Algo 2022.01Mathieu GiraudMathieu Giraud