vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2020-12-11T12:55:06+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1007Uploader un fichier FASTA avec des séquences d'intérêt, les nommer, identifie...2020-12-11T12:55:06+01:00Vidjil TeamUploader un fichier FASTA avec des séquences d'intérêt, les nommer, identifier les manquantesPlutôt que d'avoir un fichier .analysis contenant des fenêtres à mettre en valeur, on pourrait avoir des séquences complètes à mettre en valeur. À l'interface de chercher si elle trouve des fenêtres connues dans les séquences d'intérêt. ...Plutôt que d'avoir un fichier .analysis contenant des fenêtres à mettre en valeur, on pourrait avoir des séquences complètes à mettre en valeur. À l'interface de chercher si elle trouve des fenêtres connues dans les séquences d'intérêt. Ça éviterait de devoir rentrer les fenêtres dans les fichiers .analysis (qui peuvent changer avec des modifs dans l'algo) et ça permet de traîter directement les séquences d'intérêt que nous donnent nos amis bios.
***
scénario : on a un fichier fasta donnant des clones connus pour des patients, pour des standards, et on veut le visualiser rapidement
voir déjà vdj/progs/utils/generate-analysis.py fait par Mikaël (ece856d)
il faudrait faire cela directement dans l'interface, et voir les séquences manquantes par rapport au fichier fourni
***
être aussi capable d'afficher complètement cette séquence dans l'aligneur
***
ces séquences doivent passer au fuse.py, malgré le top
***
À discuter ensemble.
Solution 1:
- server : transformer le .fa en fichier de labels
- c++ : prend ce fichier (-l, existe déjà), marque les séquences ("top: 0" marcherait out-of-the box, mais crade, disons "label")
- fuse.py : traite spécialement les clones "label"
Solution 2:
- server: transformer ce fichier en .analysis (certains
- pas de modif c++
- fuse.py : prend un .analysis en plus, et tient compte de ce qu'il y a dedans
La solution 1 est la plus simple, mais la 2 permettrait de renforcer le rôle central d'un fichier ".analysis" (et on pourrait presque avoir un fuse.py qui fusionnerait deux .analysis).
Dans les deux cas :
- browser : afficher les séquences manquantes
***
Il y avait une tâche doublon "Conserver les séquences d'intérêt dans le fuse" :
- Soit avoir un tag dans le fichier clntab ou data disant qu'on veut conserver la séquence
- Soit avoir un fichier FASTA contenant les séquences d'intérêt à conserver
***
Les deux solutions demandent de toute façon de lancer le c++ sur le .fa pour récupérer les fenêtres. Autant le faire comme pour les autres fichiers.
Solution mixte proposée :
- server : pouvoir rentrer un fichier .fa spécial (soit faire une boite dédiée à cela, soit rajouter un champ aux fichiers .fasta pour qu'ils soient tous soit "reads" soit "known clones")
- c++ : lancé sur le .fa spécial, avec -y all -z all + un flag faisant qu'il prend le nom des fichiers fasta comme "name" dans le .vidjil (et sort "top: 0", ou, mieux, un nouveau flag ?)
- c++ : lancé sur les n fichiers de reads, comme d'habitude
- fuse : prend tous ces .vidjil (mais différencie les "known clones" des "reads")
- browser :devra aussi indiquer les manquantes
***
remarque de Mikaël : il peut y avoir des N dans séquences données.
Bref, la prédiction de fenêtre ne sera peut-être pas la bonne méthode, plutôt une recherche a posteriori comme dans vdj/progs/utils/generate-analysis.py
À rediscuter encore.
***
évoqué aussi hier avec Rennes... Alice a des séquences identifiées comme à enlever, on ne veut pas le faire manuellement...
Déjà si cela taggait automatiquement, ce serait bon.
N'est-ce pas proche de charger un fichier .analysis ?
***
Rando 2016: Marc voit comment faire cela simplement en transformant (côté client ? serveur ?) le fichier FASTA en fichier .analysis.
***
Limite : si la séquence d'intérêt n'est pas dans le top 100 on ne la verra pas (cf. mail de Jona 21/09/2016)
***
#1008, #1009
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/996k-mers interdits, distance 12021-04-06T14:59:34+02:00Vidjil Teamk-mers interdits, distance 1Ping. Une des plus anciennes tâches ouvertes (2014).
***
@nobodyPing. Une des plus anciennes tâches ouvertes (2014).
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1727Export csv de la liste des clones en sortie de l'algo2020-06-19T10:28:20+02:00Vidjil TeamExport csv de la liste des clones en sortie de l'algoVoir aussi "export csv bar grid"
Marleen et Hélène veulent récupérer un fichier tableur avec autant de clones que possible, et leurs V/D/J... pour s'amuser de leur côté.
Ah oui, on l'a déjà, "export csv"... mais est-ce que cela fon...Voir aussi "export csv bar grid"
Marleen et Hélène veulent récupérer un fichier tableur avec autant de clones que possible, et leurs V/D/J... pour s'amuser de leur côté.
Ah oui, on l'a déjà, "export csv"... mais est-ce que cela fonctionne ?
Qui l'utilise ?
***
Discuté lors du VW16.
***
Je viens de regarder ça deux minutes.
Je ne sais pas tout ce qu'il a été dit au VW, mais voici ce que j'ai vu.
Il vous faut une sortie complète pour faire des analyses bioinfo un peu comme j'ai pu en faire sur mes TCRD ?
Déjà, il faut susurrement mettre à jour avec la détection possible des 4a et 4b si ça devient courant.
De plus, tel quel, la dénomination de sortie est V, D ou J. Or, on peut avoir des D en V ou en J (recombo DJ ou DD par exemple). J'ai résolu pour ma part ce souci par une système de jonglage récursif (si DDx en 5, déplacer en 4, si déjà D en 4, déplacer en 4a, si déjà D en 4a ,...). La détection de l’appartenance aux V,D ou J se faisant uniquement sur la lecture des char en pos 3 du segment (pas idéal).
De plus, avoir une string avec le ratio inclut dedans n'est pas pratique. Soit le bioinfo derrière le recalcul, soit il faut qu'il soit inclut dans une colonne tierce. De même, le ratio n'est pas inclue à chaque fois car il y a une valeur seuil (5reads, suffisant pour les MRD, pas pour les répertoires). C'est compréhensible mais un peu embrouillant quand on a beaucoup de clones et que 90% ne passe pas le filtre.
Dernier point : pour le moment, on a "ratio_$i" en nom de colonne, mais ce n'est pas parlant, surtout si archivé. On gagne peut-être en compréhension si on avait le nom du point ? Bioinformatiquement, ce n'est peut-être pas non plus le plus pratique. Un mix "ratio_0 (prélèvement XXX)" ?
En bonus, possible d'inclure un outil de sélection des colonnes voulues, un peu comme l'obtention des refseq sur le table browser de ucsc ?
***
Rando 2016: Marc peut s'y coller, merci!
***
@RyanHerb @Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1664Colinéaire génome : test sur tout le génome ?2023-10-26T15:49:32+02:00Vidjil TeamColinéaire génome : test sur tout le génome ?On pourrait lancer vidjil par fenêtre sur tout le génome, voir ce qu'on récupère (même avec une e-valeur mauvaise et -t 0).
Cela fournirait des séquences fort intéressantes pour le test / pour améliorer l'algo...
***
@magiraud @mikael-sOn pourrait lancer vidjil par fenêtre sur tout le génome, voir ce qu'on récupère (même avec une e-valeur mauvaise et -t 0).
Cela fournirait des séquences fort intéressantes pour le test / pour améliorer l'algo...
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1641Avoir plus d'infos sur le « other »2019-10-29T14:41:44+01:00Vidjil TeamAvoir plus d'infos sur le « other »On n'en sait pas assez, il faut un meilleur contrôle pour savoir ce qui peut se cacher. D'autres le font (miXCR, IMSeq)…
***
Voir une gaussienne serait rassurant (distrib longeur, CDR3, clone/reads) ? Les longueurs, on a tout ou presque....On n'en sait pas assez, il faut un meilleur contrôle pour savoir ce qui peut se cacher. D'autres le font (miXCR, IMSeq)…
***
Voir une gaussienne serait rassurant (distrib longeur, CDR3, clone/reads) ? Les longueurs, on a tout ou presque...
La question pourrait devenir : "que peut-on analyser facilement et se souvenir dans le BinReadStorage et/ou réanalyser à la fin ?"
***
La longueur n'a pas de sens sur MiSeq
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1634TRB incomplet2017-12-04T14:55:54+01:00Vidjil TeamTRB incomplet- une entrée TRB+ dans germlines.data (regarde par exemple IGH+)
- un ou deux tests dans tests/should-vdj-tests/ sous la forme d'un fichier *.should-vdj.fa (il peut y avoir plusieurs séquences dans le même fichier)
***
Cela a l'a...- une entrée TRB+ dans germlines.data (regarde par exemple IGH+)
- un ou deux tests dans tests/should-vdj-tests/ sous la forme d'un fichier *.should-vdj.fa (il peut y avoir plusieurs séquences dans le même fichier)
***
Cela a l'air bon, il manque plus qu'à mettre le test en should-vdj au lieu de should-get
***
j’attends de récupérer des séquences tests additionnels avant.
***
Florian, ce serait bien de boucler ce point, quitte à ne prendre que la séquence que tu as maintenant.
D'ici fin juillet on fera la release 2015.07, et normalement il faut un certain temps de "freeze" avant qu'on le fasse.
merci !
***
j'ai modifié le should-get en should-vdj en attendant d'voir le jeu de séquences plus important de Necker que Patrick doit me fournir prochainement.
***
merci !
a35c301: rajouté des "_", sinon il n y'avait que la première chaine qui était testée + le N détaillé + l'info sur le locus
python should-vdj-to-tap.py should-vdj-tests/trb+.bd2-bj2-3.should-vdj.fa
# Teste uniquement le locus (-2q), et aussi le reverse (-r)
python should-vdj-to-tap.py -2q -r should-vdj-tests/trb+.bd2-bj2-3.should-vdj.fa
***
Vielle tâche bien faite, je ferme
***
@flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1600Versions longues des gènes2020-11-13T19:27:40+01:00Vidjil TeamVersions longues des gènesRegarder en détail le ESG_Guidelines.pdf (Yann, 26 mars)
- pour TRD, avoir plus de 40
- et en général ?
***
@mikael-sRegarder en détail le ESG_Guidelines.pdf (Yann, 26 mars)
- pour TRD, avoir plus de 40
- et en général ?
***
@mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5161Analysis with long reads (thousands of pb)2023-08-30T10:24:56+02:00THONIER FlorianAnalysis with long reads (thousands of pb)We have a user that load data with long reads (thousands of pb).
Results are here and are not very usefull : https://app.vidjil.org/59029-25?
We saw 20% of VDJ. Majority of "Possibly XXX".We have a user that load data with long reads (thousands of pb).
Results are here and are not very usefull : https://app.vidjil.org/59029-25?
We saw 20% of VDJ. Majority of "Possibly XXX".https://gitlab.inria.fr/vidjil/vidjil/-/issues/5158Non-recombined sequences beyond D7-27/J12023-10-06T11:09:00+02:00Mathieu GiraudNon-recombined sequences beyond D7-27/J1
As the sequencing lengths increase, some user reported us the following sequences that may be non-recombined as "IGHD7-27 - IGHJ1" (see #2232/!242)
- IGLV4-60 - IGLJ5
- TRBV6-9 - TRBJ2-2P
- TRBV6-1 - TRBJ2-2P
Todo !1345:
- [x] extend ...
As the sequencing lengths increase, some user reported us the following sequences that may be non-recombined as "IGHD7-27 - IGHJ1" (see #2232/!242)
- IGLV4-60 - IGLJ5
- TRBV6-9 - TRBJ2-2P
- TRBV6-1 - TRBJ2-2P
Todo !1345:
- [x] extend segment.cpp to handle other cases
- [ ] check these three cases, make tests such as `data/D7-27--J1.fa`
- [ ] fill the cases in segment.hhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5153Envoyer les données vers vdj.online2023-07-13T09:22:10+02:00Mikaël SalsonEnvoyer les données vers vdj.onlinehttps://vdj.online/
Service de MiXCR.
À discuter, peut-être pas très pratique à intégrer, car il faut renseigner pas mal d'info sur le protocole expérimental.https://vdj.online/
Service de MiXCR.
À discuter, peut-être pas très pratique à intégrer, car il faut renseigner pas mal d'info sur le protocole expérimental.https://gitlab.inria.fr/vidjil/vidjil/-/issues/5116Vidjil-algo see a VDJ with very poor quality instead of 100% germline2023-01-25T19:13:57+01:00THONIER FlorianVidjil-algo see a VDJ with very poor quality instead of 100% germlineThis [clone](https://health.vidjil.org/9389-2?clone=8) is seen as `IGK V2D-29 /78/ J4` instead of `IGLV2`with 242 nt of match (100%).
In this case, we got from vidjil poor affect values :
"_________________________KKK?KKK____________K...This [clone](https://health.vidjil.org/9389-2?clone=8) is seen as `IGK V2D-29 /78/ J4` instead of `IGLV2`with 242 nt of match (100%).
In this case, we got from vidjil poor affect values :
"_________________________KKK?KKK____________K__________________K__K_____________K____________________________________________________kkkkkkkk_kk______________________________K___________________________________________________________________"
In this case, locus IGL is search too.
Algo should be stopped if their is a better evalue for any other locus ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/5115Problème merge de séquences de tailles très différentes2023-04-03T12:32:09+02:00Anne de SeptenvilleProblème merge de séquences de tailles très différentesLors de l'analyse de données réalisées sur des cDNA (et non des ADN comme la plupart du temps), je me suis aperçue que mes résultats sont plus ou moins parasités par des produits d'épissage aberrants plus courts que la séquence complète ...Lors de l'analyse de données réalisées sur des cDNA (et non des ADN comme la plupart du temps), je me suis aperçue que mes résultats sont plus ou moins parasités par des produits d'épissage aberrants plus courts que la séquence complète attendue. Vidjil regroupe toutes ces séquences en une seule car le CDR3 (quand il est identifié) est identique. La taille moyenne des reads sur l'image type "genescan" ne reflète pas la taille effective des reads et dans certains cas, la séquence consensus choisie par Vidjil est une version "courte" ce qui fausse le résultat.
Serait-il possible de faire en sorte que des reads avec de trop grandes différences de tailles ne soient pas regroupés ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4910Retirer automatiquement des clonotypes "faux"2021-11-19T18:13:47+01:00Thonier FlorianRetirer automatiquement des clonotypes "faux"Je pense que l'on devrait retirer les clonotypes non spécifique (D7-27//J1, dimers, aspécifique) d'une simple action.
Pour certains, il faudrait pouvoir mieux les catégoriser. Mais pour le premier cas, on le signale déjà. Comment ne pa...Je pense que l'on devrait retirer les clonotypes non spécifique (D7-27//J1, dimers, aspécifique) d'une simple action.
Pour certains, il faudrait pouvoir mieux les catégoriser. Mais pour le premier cas, on le signale déjà. Comment ne pas en tenir compte dans l'analyse, du nombre de reads... Le mettre automatiquement en hide ? Autre ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4723Identifier le V dans les séquences non mergées2021-04-01T15:56:33+02:00Anne de SeptenvilleIdentifier le V dans les séquences non mergéesPour certains samples particuliers, j'ai un faible % de reads mergés. J'en connais la raison : des produits PCR trop grand mais néanmoins séquencés. Généralement il s'agit bien de mon clone de LLC mais amplifié avec le J suivant dans l'A...Pour certains samples particuliers, j'ai un faible % de reads mergés. J'en connais la raison : des produits PCR trop grand mais néanmoins séquencés. Généralement il s'agit bien de mon clone de LLC mais amplifié avec le J suivant dans l'ADN, probablement à cause d'une mutation empêchant une amplification correct par le J utilisé dans le réarrangement VDJ.
J'aimerais pour ces samples identifier le V dans les séquences non mergées. Est-ce que cela serait possible avec Vidjil ? Avec un autre outil ? Cela me permettrait d'être sûre que je me trouve dans le cas ci dessus : de grands produits PCR tous issus d'un même réarrangement VDJ dont j'identifie la séquence sur 15-30% des reads.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4624Séquences avec du V-INTRON ou avant2021-01-05T10:53:04+01:00Mathieu GiraudSéquences avec du V-INTRON ou avantDiscussion ensemble à partir de #4621, @mikael-s et @flothoni : a-t-on déjà V-INTRON ?
- http://www.imgt.org/download/LIGM-DB/ftable_doc.html (on n'a que les V-REGION)
- https://mixcr.readthedocs.io/en/master/geneFeatures.html#v-gene-st...Discussion ensemble à partir de #4621, @mikael-s et @flothoni : a-t-on déjà V-INTRON ?
- http://www.imgt.org/download/LIGM-DB/ftable_doc.html (on n'a que les V-REGION)
- https://mixcr.readthedocs.io/en/master/geneFeatures.html#v-gene-structure
- Voir aussi http://www.imgt.org/FAQ/#question57 IGKV1-39*02
Avoir pour certains cas des ~"bio-germlines" plus grandes, avec up ?
Problèmes pouvant arriver:
- génomique, calcul productivité ?
- ARN (sans le V-INTRON), bon alignement ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4606IMGt, update paramètres de la requête (V_REGIONsearchIndel, subset)2021-02-26T10:34:24+01:00Thonier FlorianIMGt, update paramètres de la requête (V_REGIONsearchIndel, subset)IMGt semble avoir changer le comportement pour la recherche d'indel. De plus, il est maintenant possible d'avoir les valeurs de subset.IMGt semble avoir changer le comportement pour la recherche d'indel. De plus, il est maintenant possible d'avoir les valeurs de subset.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4548Pouvoir modifier par le client des features de séqueces / des recombinaisons ...2020-11-03T09:37:59+01:00Mathieu GiraudPouvoir modifier par le client des features de séqueces / des recombinaisons particulières
Avec #2135 / !836 @duez, nous serons bientôt en mesure d'afficher de manière générique n'importe quelle "feature de séquence", dont en particulier des recombinaisons "spéciales".
Donnerait-on la possibilité à l'utilisateur (ou au bioin...
Avec #2135 / !836 @duez, nous serons bientôt en mesure d'afficher de manière générique n'importe quelle "feature de séquence", dont en particulier des recombinaisons "spéciales".
Donnerait-on la possibilité à l'utilisateur (ou au bioinformaticien en lien avec un utilisateur) d'éditer (de manière générique) ces choses ? Et donc de les stocker dans le `.vidjil` / les exporter dans le 'get support' ? En marquant d'une certaine manière (warning ?) que la séquence a été éditée manuellement ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4540Récupérer les positions FR1/2/3/4 et CDR1/2/3 via IMGT2021-04-08T08:25:51+02:00Mathieu GiraudRécupérer les positions FR1/2/3/4 et CDR1/2/3 via IMGTDepuis #2135, dans le cadre de !836 :
> (...) mettre cela dans le `.vidjil` (type `"FR1": {"start": 48, "stop": xxx}`
Le faire donc déjà via `imgtPost...()`, en prenant les champs `{FR,CDR}{1,2,3,4?}-IMGT {start,stop}`, et créer donc d...Depuis #2135, dans le cadre de !836 :
> (...) mettre cela dans le `.vidjil` (type `"FR1": {"start": 48, "stop": xxx}`
Le faire donc déjà via `imgtPost...()`, en prenant les champs `{FR,CDR}{1,2,3,4?}-IMGT {start,stop}`, et créer donc des highlights type `"FR1-IMGT": {"start": 48, "stop": xxx}`
Normalement tous ces highlights seront non-chevauchants et pourront être affichés sur une même "ligne"marc duezmarc duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4437Axes: proposer de nouveaux axes2021-09-22T10:59:06+02:00Mathieu GiraudAxes: proposer de nouveaux axes
Réfléchir en septembre sur ce qui est rendu possible par le nouveau système et aiderait à des analyses bio.
Mais aussi #4436 (supprimer éventuellement des presets ?).
cc @flothoni @duez
Réfléchir en septembre sur ce qui est rendu possible par le nouveau système et aiderait à des analyses bio.
Mais aussi #4436 (supprimer éventuellement des presets ?).
cc @flothoni @duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4406avoir un filtre supprimer les clones partagés2020-07-10T15:51:25+02:00Thonier Florianavoir un filtre supprimer les clones partagésTout comme nous avons maintenant un bouton `focus on clone of samples`, nous pourrions avoir un bouton qui fait l'effet inverse et permettre de cacher les clones qui sont présent dans ce sample. On aurait ainsi une vision facile des nouv...Tout comme nous avons maintenant un bouton `focus on clone of samples`, nous pourrions avoir un bouton qui fait l'effet inverse et permettre de cacher les clones qui sont présent dans ce sample. On aurait ainsi une vision facile des nouveaux clones qui sont apparut ensuite.
Je ne sais pas si il faudrait imaginer d'autres modalités, comme laissé les clones avec un tag par exemple.
L'une des idées pratiques est de faire ressortir les clones qui apparaissent après vaccination, sans le bruit de fond. Faut-il dans ce cas utiliser le premier sample comme support pour ce filtre ?
Encore de la réflexion nécessaire...