vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2023-06-29T16:43:00+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4990Pouvoir afficher plus de clone top par locus2023-06-29T16:43:00+02:00Thonier FlorianPouvoir afficher plus de clone top par locusUn example : https://app.vidjil.org/50163-56?
Si on cache les locus TRB pour voir le TRG, nous ne voyons plus aucuns clones dans le graph timeline.
@duez pointe le faite que nous avons une limite dans le client, mais que celle-ci ne p...Un example : https://app.vidjil.org/50163-56?
Si on cache les locus TRB pour voir le TRG, nous ne voyons plus aucuns clones dans le graph timeline.
@duez pointe le faite que nous avons une limite dans le client, mais que celle-ci ne prend pas en compte le locus mais juste le top du clone.
En relation avec le top par système de l'algo.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3216Utilisation des séquences "cibles"2023-06-28T16:58:04+02:00Thonier FlorianUtilisation des séquences "cibles"Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra...Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra d’avoir des critères d’acceptation du run.
Pour ce faire, il faut faire une recherche de cette cible sur l’ensemble des samples sélectionnées:
* Premier point : il faut déjà pouvoir spécifier la cible.
* Pouvons-nous nous contenter de le faire sur la liste des clones disponible dans les fichiers vidjil ? Nous pourrions alors passer à côté d'une séquence qui ne correspond pas à un clone du top 100, mais qui pourrait avoir son intérêt quand même.
* Rechercher sur le fichier source de séquençage ? Certainement plus long d'un point de vue informatique, mais cela reste-t-il de l'ordre du raisonnable ?
* Faudra-t-il utiliser des séquences dégénérées ?
Autre solution: passer par cloneDB. Serait-ce plus simple d'un point de vue technique ? Cela permettrai-t-il la même granulométrie dans la recherche pour l'inclusion des divers échantillons ?
@Patrick : Aurais-tu un exemple de cible que tu cherches , les samples associés, et ce que tu as (ou t'attends) a retrouver stp ?
@magiraud @mikael\-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2716Plusieurs tubes / index / fichiers pour un seul sample2023-02-08T12:21:43+01:00Mathieu GiraudPlusieurs tubes / index / fichiers pour un seul sampleMichael ~"PRA-Prague", comme ~"KIE-Kiel", uploade plusieurs fichiers pour un seul sample venant de chaque tube.
Connait-on d'autres utilisateurs qui font de même ?
C'est une manière vraiment détournée de se servir du client. Cela va enc...Michael ~"PRA-Prague", comme ~"KIE-Kiel", uploade plusieurs fichiers pour un seul sample venant de chaque tube.
Connait-on d'autres utilisateurs qui font de même ?
C'est une manière vraiment détournée de se servir du client. Cela va encore pour un échantillon de diagnostic (et encore), mais, dès qu'on a deux samples, et bien on ne voit plus rien du tout.
- Tagger ces "samples" d'une manière particulière ? Équivaudrait à changer la db pour avoir un truc plus fin que samples. Argh, trop complexe.
- Avoir un pre-process pour combiner `n` samples ?
- Le plus simple serait un `cat`, mais on perd l'info originale. Mais c'est peut-être pas grave ?
- Un pre-process qui ferait un `cat` en ajoutant l'info, et ensuite l'algo tiendrait compte de cela ?
- Et c'est encore plus complexe quand tout peut être R1/R2
(Dans l'autre sens, #1684)
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1744Contrôle de la contamination sur un run2022-07-26T12:08:26+02:00Vidjil TeamContrôle de la contamination sur un runDemandé par Nathalie vendredi dernier au CHR.
"Ce serait bien d'avoir, d'un coup d'oeil, des trucs pour voir tout un run, s'il y a des contaminations en particulier".
Cela rentre dans les réflexions en cours sur "run" / "tags" / ...
...Demandé par Nathalie vendredi dernier au CHR.
"Ce serait bien d'avoir, d'un coup d'oeil, des trucs pour voir tout un run, s'il y a des contaminations en particulier".
Cela rentre dans les réflexions en cours sur "run" / "tags" / ...
***
Marc, tu devrais nous expliquer un jour ce que tu fais en interne pour les contaminations.
Y a-t-il une manière de le visualiser ?
Si par exemple on va sur http://rbx.vidjil.org/browser/?custom=10946&custom=10947&custom=10948&custom=10949&custom=10950&, comment peut-on voir s'il y a des clones communs ?
Entre deux points contigus c'est simple, sinon c'est plus dur;
Un "color by number of samples" ?
***
Tiens, si "nb of samples" était une dimension d'affichage, on pourrait faire des trucs rigolos.
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2002Configuration trop stringeante sur la recherche du D2022-05-12T11:42:47+02:00Vidjil TeamConfiguration trop stringeante sur la recherche du DExemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutati...Exemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutation.
***
Alors il y a bien un problème mais il n'a rien à voir. Voir « Le résultat de la segmentation change selon le contexte » #2003
***
Notons que toutes les séquences ici ont normalement le même "multiplier" de E-value (nb de clones analysés).
... et effectivement, il y a bien un problème (de calcul de p-valeur) : cela semble gros qu'une seule mutation sur 22pb fasse tout louper.
***
Surtout qu'il y a une séquence avec une mutation dans le D, où le D est bien trouvé...
***
Seuil de e-valeur pour le D : .05
J'imagine qu'il y a une raison pour cette faible valeur, mais les D sont courts et atteindre de très faibles e-valeur est compliqué (à l'inverse de ce qu'on a avec le kmer segmenteur). Pourquoi le seuil est-il à 0,05 ?
***
@magiraud @mikael-sThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1995Export Krona pour la visualisation du répertoire2021-11-19T11:06:56+01:00Vidjil TeamExport Krona pour la visualisation du répertoireun exemple de visualisation pratique (et dynamique) pour le répertoire.
Les krona permettent de zoomer et d'approfondir la visualisation.
Possibilité de la proposé en export à partir de vidjil.
PS: inclut depuis peu par arrest (contin...un exemple de visualisation pratique (et dynamique) pour le répertoire.
Les krona permettent de zoomer et d'approfondir la visualisation.
Possibilité de la proposé en export à partir de vidjil.
PS: inclut depuis peu par arrest (continuité utilisateur ? ).
***
@flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2072Recherche des recombinaisons DDH2021-09-08T17:15:26+02:00Mikaël SalsonRecherche des recombinaisons DDHMail de @flothoni du 01/12 : le germlines.data actuel ne recherche pas de D dans le cas d'une recombinaison DJ. C'est effectivement le cas :
```
"recombinations": [ {
"5": ["IGHD_upstream.fa"],
"3": ["IGHJ...Mail de @flothoni du 01/12 : le germlines.data actuel ne recherche pas de D dans le cas d'une recombinaison DJ. C'est effectivement le cas :
```
"recombinations": [ {
"5": ["IGHD_upstream.fa"],
"3": ["IGHJ.fa"]
}],
```
Est-on d'accord qu'on voudrait le rajouter ? Ou alors seulement si l'option `-d` (recherche de D multiples) est passée ? Mais dans ce cas c'est difficile car impose d'avoir un germline qui dépend d'une option.
@magiraudThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4144segmenter broken apres le chargement d'un second fichier2020-10-14T11:29:53+02:00marc duezsegmenter broken apres le chargement d'un second fichier
CA ~"PAN-Necker"
> Lorsque je me connecte sur un premier dossier, j'ai la main sur les séquences et la fonction align.
> Ensuite je charge un second dossier, quand je clique sur un clone, la séquence ne s'affiche pas en bas et je n'ai ...
CA ~"PAN-Necker"
> Lorsque je me connecte sur un premier dossier, j'ai la main sur les séquences et la fonction align.
> Ensuite je charge un second dossier, quand je clique sur un clone, la séquence ne s'affiche pas en bas et je n'ai pas la main sur "align" qui apparaît grisé. Ceci se corrige quand j'actualise la page
la fonction reset() du segmenter ne fonctionne plus avec les derniers merges
https://gitlab.inria.fr/vidjil/vidjil/-/issues/3897Cas particulier d'un clone retrouvé dans une analyse2019-04-04T18:03:31+02:00Thonier FlorianCas particulier d'un clone retrouvé dans une analyseDésolé pour le nom, il n'est pas très parlant.
@Patrick a remonté une information sur un clone qui avait un problème de dénomination, et qui pouvait l’intéressé car il apparaissait/disparaissait/réapparaissait: https://app.vidjil.org/?...Désolé pour le nom, il n'est pas très parlant.
@Patrick a remonté une information sur un clone qui avait un problème de dénomination, et qui pouvait l’intéressé car il apparaissait/disparaissait/réapparaissait: https://app.vidjil.org/?set=30814&config=25&clone=94
Le souci c'est que ce clone à une séquence consensus très courte, environ 50% de la longueur moyenne. Point positif, on lève bien une alerte.
J'ai voulu regarder de plus près ce clone. J'ai exploité la nouvelle fonction `get_reads` pour obtenir un fichier se concentrant sur ses reads.
En regardant de plus près, on voit que toutes les séquences ont une première partie commune, sur les 60nt en 5', mais complètement différentes sur le reste, avec énormément de stretch de A. (voici le [fichier extrait](/uploads/0c8581c5f6ecd879c49270bffee86876/seq_patrick.fastq)).
J'ai alors voulu jouer avec pour comprendre les affectations, rallonger les fenêtres, ...
```
>seq1
ATCGATTTTCTGCAGAGAGGCTGACAGTGCTCGGTAAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACTCCGGAGAATCTCGTATGCCGTCTTCTGCTTGAAAAAAAAAAAAAAACAACAATAAAGAACATAAAACTATTCTGAATGTTAAAGAGACAAAAAAACAAATAATATAGAAGATAATATTACGAGGATACAGTAGAGTAATCTAGACATAGCAAAGTAAAACAGGACCAAGAAGGTTGGG
# 18 + VJ 1 18 23 251 seed TRB SEG_+ 1.972121e-08 5.559703e-16/1.972121e-08+B+B+B+B+B+B+B+B+B+B _ _ _ _ _ _ _ _+b+b+b+b+b+b+b+b _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
#>seq1 + VJ 1 18 23 251 w55/10 seed TRB SEG_+ 1.972121e-08 5.559703e-16/1.972121e-08
```
On peut donc voir que l'on n'a que quelques nt vus comme V et J, sur 251nt. Je pense donc qu'il s'agit d'un artefact.
Si j'essaye de rallonger la fenêtre, je n'ai pas le résultat escompté car il m'indique qu'il shift la fenêtre, probablement trop proche en 5'. Je me retrouve donc quoi qu'il arrive avec la même fenêtre.
Quoi qu'il en soit, je ne sais pas quoi faire de cette séquence. Je peux l'ajouter dans un test, mais que devrait-on y mettre ? On ne devrait pas la ressortir comme un clone avec si peu d'affectations de kmer ?
cc @magiraud @mikael\-s @Patrickhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2893Erreur serveur à la suppression de sample sets2018-09-24T15:53:02+02:00Mikaël SalsonErreur serveur à la suppression de sample setsRennes vient d'avoir des erreurs serveurs en supprimant un sample set : https://db.vidjil.org/admin/default/ticket/vidjil/93.93.153.226.2017-11-23.18-15-53.7611c430-63a0-429b-aeba-5a03cb7e9d51
C'était aussi le cas de [Monza](https://db....Rennes vient d'avoir des erreurs serveurs en supprimant un sample set : https://db.vidjil.org/admin/default/ticket/vidjil/93.93.153.226.2017-11-23.18-15-53.7611c430-63a0-429b-aeba-5a03cb7e9d51
C'était aussi le cas de [Monza](https://db.vidjil.org/admin/default/ticket/vidjil/149.132.237.26.2017-11-22.14-58-43.1e393560-8065-4d7f-9485-b3deb6e57993) et de [Necker](https://db.vidjil.org/admin/default/ticket/vidjil/164.2.255.244.2017-11-22.09-26-23.aef4127b-ec25-4be1-a641-45bdf3c6e5dc) il y a quelques jours.Ryan HerbertRyan Herberthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1400Heuristique i.0 : être capable d'inférer des germlines "inconnus"2017-07-05T09:15:56+02:00Vidjil TeamHeuristique i.0 : être capable d'inférer des germlines "inconnus"Suite à la discussion en janvier à Necker.
On voudrait segmenter des séquences... à la découverte de ce qu'on ne connaît pas. But : 100% des reads ont une explication, TOO_SHORT, ou sinon on dit ce qu'il y a dedans.
1) Cas relativement ...Suite à la discussion en janvier à Necker.
On voudrait segmenter des séquences... à la découverte de ce qu'on ne connaît pas. But : 100% des reads ont une explication, TOO_SHORT, ou sinon on dit ce qu'il y a dedans.
1) Cas relativement simple :
+V+V+V+V+V+V+V__________________________
À distinguer du cas TOO_FEW_J / trop court. Ici, c'est probablement autre chose, et on pourrait extraire une fenêtre centrée sur la fin du V
2) Et cas plus dur : idem... sans les +V. Bref, être capable de deviner le point de jonction... on se souvient de ce qui avait été fait avec David. On pourrait tout à fait rentrer cela dans le Vidjil actuel : avoir un CountSegmenter qui prédit un point de cassure... (Question subsidiaire : que donne CRAC si on lui donne un jeu de reads V(D)J ?)
***
Séquences de Prague, sur rbx, collegues/pragues/IGH-UNSEG.affects
Il y a des trop petits... mais il y a aussi d'autres choses...
***
Si on infère des choses bizarres, il faudra mettre des checks sur la representative et/ou de gros warnings partout (on est pas sûr que la fenêtre est pertinente, qu'autour c'est pareil...)
***
b9994d1 et 196acbc
Sur Pee (217, Rennes)
- -g -i : 48% (110s)
- après max12: 85%
- après sortLeftRight : 99.1% (42s, car pas de -i)
Attention, est-on sûr de ce qu'on trouve ? Les longueurs des représentatives ont l'air plutôt bonnes, mais il faudrait quelque chose pour en être plus sûr et vérifier qu'on ne clustérise pas des bouts de V.
***
http://rbx.vidjil.org/browser/?custom=1442&custom=1443&custom=1568&custom=1569&
À gauche, multi+inc, à droite, multi+xxx.
***
Changements légers ce matin, marche avec -i, pas segmenté si < 5 kmers (DETECT_THRESHOLD)
http://rbx.vidjil.org/browser/?custom=1442&custom=1585&custom=1443&custom=1586&
***
ok pour "xxx"... mais il faudrait pouvoir avoir des choses plus méchantes, en devinant des germlines (à la David ?)
***
12bcb3c: MAX1U, -4. Modèle de proba à discuter ensemble, pour l'instant c'est trop méchant.
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1793VDDJ et overlap2016-11-29T14:40:41+01:00Vidjil TeamVDDJ et overlap56016dc a pas mal solutionné, mais il faudra un jour reprendre plus finement la question des overlaps des D sur le V et J, peut-être avec plus de séquences de test. Rien d'urgent.
***
@nobody56016dc a pas mal solutionné, mais il faudra un jour reprendre plus finement la question des overlaps des D sur le V et J, peut-être avec plus de séquences de test. Rien d'urgent.
***
@nobody