vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2016-11-29T14:36:38+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1463IMGT : regarder ce qu'on va prendre dans les .csv2016-11-29T14:36:38+01:00Vidjil TeamIMGT : regarder ce qu'on va prendre dans les .csvPour la fin du mois.
Regarder les .csv de V-QUEST, voir ce qui nous intéresse.
Définir ce qu'on veut pour segmenter.js.
***
mail envoyé à IMGT
***
@magiraud @mikael-s @DuezPour la fin du mois.
Regarder les .csv de V-QUEST, voir ce qui nous intéresse.
Définir ce qu'on veut pour segmenter.js.
***
mail envoyé à IMGT
***
@magiraud @mikael-s @Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1467Le fichier de conf du browser est devenu obligatoire. Vraiment ?2016-11-29T14:36:41+01:00Vidjil TeamLe fichier de conf du browser est devenu obligatoire. Vraiment ?Les tests fonctionnels browser ne passent plus parce que le fichier browser/js/conf.js est attendu par requirejs. Y a-t-il moyen de le rendre optionnel ? (avant le browser fonctionnait très bien sans fichier de conf). Le résoudre devrai...Les tests fonctionnels browser ne passent plus parce que le fichier browser/js/conf.js est attendu par requirejs. Y a-t-il moyen de le rendre optionnel ? (avant le browser fonctionnait très bien sans fichier de conf). Le résoudre devrait solutionner le problème sur les tests fonctionnels (à part un test qui devrait être en échec à cause d'une régression ;) )
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1468Représentative : mesure de qualité2016-11-29T14:36:42+01:00Vidjil TeamReprésentative : mesure de qualité(voir aussi "Représentative : trop courte ?")
Il faudrait avoir une mesure de qualité *globale* de la représentative (.fastq, autre tâche, voir ailleurs). Vu les expériences rapportées dans "Représentative : trop courte ?", dans de nomb...(voir aussi "Représentative : trop courte ?")
Il faudrait avoir une mesure de qualité *globale* de la représentative (.fastq, autre tâche, voir ailleurs). Vu les expériences rapportées dans "Représentative : trop courte ?", dans de nombreux cas cela fonctionne très bien et on aurait quelque chose qui s'approche de 1.0. Mais cela serait un bon outil pour détecter s'il y a eu des problèmes, notamment si on se met à segmenter olé-olé.
- ratio de la longueur de la représentative / des reads (maximum, moyen, médiane ?)
- ratio de kmers ?
Dans les deux cas, ce ne serait pas grave si on considère uniquement le dernier BinReadStorage (et si vraiment on voudrait avoir une mesure exacte, on pourrait stocker des choses en plus dans le BinReadStorage).
Au final, c'est presque plus important d'avoir une mesure de confiance que d'améliorer le calcul :-)
***
"coverage", c'est bon
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1472Axes : tag, locus ?2016-11-29T14:36:46+01:00Vidjil TeamAxes : tag, locus ?On pourrait voir les "tags" comme les "locus" comme des axes génériques (discrets).
Attention, cela ne signifie pas qu'on va tout reprogrammer, les tags et surtout les locus ont des rôles bien particulier. Mais on pourrait simplement ajo...On pourrait voir les "tags" comme les "locus" comme des axes génériques (discrets).
Attention, cela ne signifie pas qu'on va tout reprogrammer, les tags et surtout les locus ont des rôles bien particulier. Mais on pourrait simplement ajouter un axe d'analyse qui permettrait de faire des plots comparant les locus, ou de voir le %GC selon les locus...
***
68b4349
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1474align colore parfois les mauvaises bases comme étant des mutations2016-11-29T14:36:47+01:00Vidjil Teamalign colore parfois les mauvaises bases comme étant des mutationsAller sur http://rbx.vidjil.org/browser/?patient=291&config=11, monter le nombre de clones au max et sélectionner tous les clones TRGV8/TRGJ1. Faire un align dessus. Constater qu'un A est allumé dans toutes les séquences (sauf une qui a ...Aller sur http://rbx.vidjil.org/browser/?patient=291&config=11, monter le nombre de clones au max et sélectionner tous les clones TRGV8/TRGJ1. Faire un align dessus. Constater qu'un A est allumé dans toutes les séquences (sauf une qui a un G), à l'intérieur du J. Est-ce que ce n'est pas censé être la première séquence qui détermine la référence ? Colorer le A partout ajoute du bruit. Normalement seul le G devrait être coloré.
***
J'ai essayé... et j'ai abandonné.
segmenter.js : 614 .diff(json.seq[0]), il ne faut pas qu'il y ait 0 mais autre chose.
Mais pas first_clone.
Mais je ne suis pas sûr de comprendre l'interaction entre le diff() (qui décore la séquence) et le .toString() (qui repart de la séquence).
Est-ce que cette décoration avec des <span class='substitution'> ne devrait pas plutôt avoir lieu dans le .toString(), vers la ligne 890 ?
***
e0820ff..c9ba91d
Au passage, l'exemple que tu as donné a changé... un utilisateur a fait du merge depuis ce matin :-)
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1477Voir les séquences germlines2016-11-29T14:36:50+01:00Vidjil TeamVoir les séquences germlinesDemande de Yann
- au minimum, lui envoyer une fois pour toute les séquences
- peut-être trouver un meilleur mécanisme pour exporter cela à la demande (type sortie de ./vidjil -A dans export)
***
Mail envoyé avec les séquences
***
Dans l...Demande de Yann
- au minimum, lui envoyer une fois pour toute les séquences
- peut-être trouver un meilleur mécanisme pour exporter cela à la demande (type sortie de ./vidjil -A dans export)
***
Mail envoyé avec les séquences
***
Dans le menu "import/export", on aimerait avoir une entrée "export Fasta (selected clones, with germline)" qui sort en plus les V et J des clones sélectionnés. Tatiana, pourrais-tu regarder cela ?
***
Ce serait toujours une fonctionnalité très intéressante...
***
Je confirme que ce serait très utile.
Ce matin, pour répondre à Jona, j'ai du repasser par un terminal faire ./vidjil -A :-)
***
Super, c'est quasi bon !
// y a-t-il une raison de tester qu'ils ne soient pas "undefined" ?
Et oui : http://rbx.vidjil.org/browser/?patient=850&config=26
sélectionner la séquence ?/?, export > bug
Plus généralament, germline[germName][listGene[i]] peut louper pour d'autres raisons (un germline non présent dans germline.js)
***
http://rbx.vidjil.org/browser/?patient=845&config=25
***
@Cyanaelhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1479Dans le c++, sortir cette info en nombre2016-11-29T14:36:54+01:00Vidjil TeamDans le c++, sortir cette info en nombre
***
#1478
***
#1478https://gitlab.inria.fr/vidjil/vidjil/-/issues/1480Vérifier qu'elle passe au fuse2016-11-29T14:36:54+01:00Vidjil TeamVérifier qu'elle passe au fuse
***
#1478
***
#1478https://gitlab.inria.fr/vidjil/vidjil/-/issues/1481L'afficher dans le browser2016-11-29T14:36:54+01:00Vidjil TeamL'afficher dans le browser
***
#1478
***
#1478https://gitlab.inria.fr/vidjil/vidjil/-/issues/1478Afficher le "% coverage" comme axe d'analyse2016-11-29T14:36:54+01:00Vidjil TeamAfficher le "% coverage" comme axe d'analyseOn aimerait pouvoir visualiser le % coverage (longueur du consensus / longueur du paquet des reads les plus longues) et éventuellement mettre des warnings s'il est trop bas.
***
ca9935b
(et 323dac7 pour calculer la moyenne des coverages ...On aimerait pouvoir visualiser le % coverage (longueur du consensus / longueur du paquet des reads les plus longues) et éventuellement mettre des warnings s'il est trop bas.
***
ca9935b
(et 323dac7 pour calculer la moyenne des coverages non nuls)
***
#1479, #1480, #1481
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1483Export fasta : meilleurs pourcentages, par système2016-11-29T14:36:55+01:00Vidjil TeamExport fasta : meilleurs pourcentages, par systèmeC'est déjà le cas : si on est sur une conf multi(+inc), l'export fasta est détaillé comme dans le rapport :
>IGKV3-20*02 -0/0/-17 KDE 267 reads (0.808%, 1.863% of IGK+/IGK, 2.179% of IGK+)
CCAGACGCATGTCACCATTCACCTTGGACAGTGGGGCAGATTGG...C'est déjà le cas : si on est sur une conf multi(+inc), l'export fasta est détaillé comme dans le rapport :
>IGKV3-20*02 -0/0/-17 KDE 267 reads (0.808%, 1.863% of IGK+/IGK, 2.179% of IGK+)
CCAGACGCATGTCACCATTCACCTTGGACAGTGGGGCAGATTGGTTCCAATTGGGTTTCTCATCCTTGTCCACCGAAGATCCCTTTG
***
@magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1484Export fasta : une idée de la segmentation avec des retours à la ligne2016-11-29T14:36:56+01:00Vidjil TeamExport fasta : une idée de la segmentation avec des retours à la ligne27a99f6
***
@magiraud27a99f6
***
@magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1487Le nombre de fichiers affiché sur le serveur est un multiple de 3342016-11-29T14:36:58+01:00Vidjil TeamLe nombre de fichiers affiché sur le serveur est un multiple de 334Sur la page patient par défaut, tous les nombres de fichiers sont des multiples de 334.
***
>>bfa129f46
***
@DuezSur la page patient par défaut, tous les nombres de fichiers sont des multiples de 334.
***
>>bfa129f46
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1488Mettre en prod les tests server2016-11-29T14:36:59+01:00Vidjil TeamMettre en prod les tests serverPar ma faute (d12f33b), l'upload de fichiers a été down durant une quinzaine d'heures. Oui, c'était le week-end, pas très grave.
mais... on n'a pas été prevenu autre que par mail d'une utilisatrice quelques heures plus tard.
J'imagine q...Par ma faute (d12f33b), l'upload de fichiers a été down durant une quinzaine d'heures. Oui, c'était le week-end, pas très grave.
mais... on n'a pas été prevenu autre que par mail d'une utilisatrice quelques heures plus tard.
J'imagine qu'on l'aurait su plus tôt si les tests server que Marc a mis en place étaient en prod :)
***
Je suis tout ému, j'ai réussi à lancer pour la première fois les tests server sur ma machine :-) merci à vous deux !
***
@mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1489Les propriétaires des patients ne voient plus le nom complet dans la liste de...2016-11-29T14:37:00+01:00Vidjil TeamLes propriétaires des patients ne voient plus le nom complet dans la liste des patientsOk… le terme « propriétaire de patient » est maladroit. En revanche la fiche du patient indique bien le nom complet
***
revenu à 789edec pour la prod
***
@DuezOk… le terme « propriétaire de patient » est maladroit. En revanche la fiche du patient indique bien le nom complet
***
revenu à 789edec pour la prod
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1490P-value / E-value du segmenter (nb de k-mers)2016-11-29T14:37:01+01:00Vidjil TeamP-value / E-value du segmenter (nb de k-mers)merci Mikaël !
***
Comparaison entre multi+inc et multi+inc+e-val (1e-6) :
http://rbx.vidjil.org/browser/?custom=1846&custom=2065&
Il n'y a que 67 reads segmentés en moins
***
Sur le jeu de Patrick : http://rbx.vidjil.org/browser/?custo...merci Mikaël !
***
Comparaison entre multi+inc et multi+inc+e-val (1e-6) :
http://rbx.vidjil.org/browser/?custom=1846&custom=2065&
Il n'y a que 67 reads segmentés en moins
***
Sur le jeu de Patrick : http://rbx.vidjil.org/browser/?custom=2063&custom=1988&custom=2064&custom=1989&
Les séquences qui disparaissent avec le 1e-6 s'alignent toutes de manière contigue sur le génome sur toute la longueur de la représentative, d'après Ensembl.
En faisant la même chose avec les séquences communes aux deux configs, on a quelques surprises. Il y a encore des alignements contigus sur le génome. La raison : des gènes J non recombinés. On a plein de J à droite et juste un V à gauche (par hasard). Ça passe haut la main la e-valeur (et c'est normal).
Donc il faut bien faire une e-valeur à droite et à gauche, mais pour être plus strict en fait (une e-valeur juste sur le nombre d'affectations dans la partie gauche (sans distinguer V et J) et même chose sur la partie droite ?).
***
La probabilité est calculée sur toute la longueur de la séquence (sauf les derniers nucléotides) mais on ne peut pas avoir de k-mers non plus au niveau de la jonction… Faut-il corriger cela ? (facile : en supposant que le nombre d'insertions est nul, dur : en ayant un modèle sur le nombre d'insertions, qui dépend du locus…)
***
J'ai lancé le jeu de données de Larisa en multi+inc et multi+inc+e-val → seule différence un clone TRG (le seul, le reste est du TRB) mis de côté par la e-value. Plutôt positif donc.
***
On va dire que cette tâche est terminée, merci !
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1493P-value / E-value du segmenter (nb de k-mers gauche + droite)2016-11-29T14:37:03+01:00Vidjil TeamP-value / E-value du segmenter (nb de k-mers gauche + droite)C'est clairement ce qu'il nous faut.
Cela permettrait d'aller essayer de nouvelles germlines bizarres, des translocations, le MAX12...
Pour simplifier, supposons que le point de segmentation est fixé.
Version simple : e-valeur d'avoir ...C'est clairement ce qu'il nous faut.
Cela permettrait d'aller essayer de nouvelles germlines bizarres, des translocations, le MAX12...
Pour simplifier, supposons que le point de segmentation est fixé.
Version simple : e-valeur d'avoir le nb de V à gauche, et le nb de J à droite. Juste deux appels à ce qui existe déjà. Cela permettra déjà d'enlever les cas où il y a un pauvre V tout seul qui traîne.
Version mieux : On se rapproche de la e-valeur d'une recombinaison. A gauche, on regarde aussi le nb de J, et il ne doit pas être gros. (mais finalement, notre heuristique pour trouver le point de seg garantit déjà qu'il n'y a pas trop de J à gauche).
Dans les deux cas, on pourrait avoir le index_load pour V et J différents, mais, bon, on peut prendre le même dans un premier temps. (et dans les deux cas, on pourrait itérer sur le point de seg pour avoir une formule exacte ? euh, pas sûr)
***
34068e0, version simple. À un moment, j'ai pensé combiner gauche et droite, mais cela ne marche tout simplement pas (on peut avoir 1e-60 à droite, et du bruit à gauche).
***
+ e17174a
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1495avoir une version plus heuristique de nb_sequences_in_fasta2016-11-29T14:37:05+01:00Vidjil Teamavoir une version plus heuristique de nb_sequences_in_fasta
***
#1494
***
#1494https://gitlab.inria.fr/vidjil/vidjil/-/issues/1494E-value, multiplier par le nombre de reads2016-11-29T14:37:05+01:00Vidjil TeamE-value, multiplier par le nombre de readsOn multiplie déjà par le nombre de germlines... je suis très tenté de multiplier par le nombre de reads.
L'effet du paramètre dépendra alors de la taille, mais on pourra fixer quelque chose comme -e 1 ou -e 0.01 par défaut. C'est plus ou...On multiplie déjà par le nombre de germlines... je suis très tenté de multiplier par le nombre de reads.
L'effet du paramètre dépendra alors de la taille, mais on pourra fixer quelque chose comme -e 1 ou -e 0.01 par défaut. C'est plus ou moins ce qui se passe pour BLAST.
(Cela permettra aussi de faire passer des tests limites sur une séquence, mais c'est une autre histoire, et on pourra très bien tester à très faible e-valeur si c'est notre souhait.)
***
ok, à faire en appelant nb_sequences_in_fasta (ou une meilleure version)
***
#1495
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1497Valgrind: lancer sur meccano avant de lancer sur tout le monde2016-11-29T14:37:06+01:00Vidjil TeamValgrind: lancer sur meccano avant de lancer sur tout le mondeNe suffirait-il pas de rajouter Valgrind à vidjil-coverage ?
(Si le build plante pour d'autres raisons, j'imagine qu'il ne lancera pas Valgrind...)
***
ah... mais je viens de voir qu'il y a déjà Vidjil-valgrind.
Ne faut-il pas alors plut...Ne suffirait-il pas de rajouter Valgrind à vidjil-coverage ?
(Si le build plante pour d'autres raisons, j'imagine qu'il ne lancera pas Valgrind...)
***
ah... mais je viens de voir qu'il y a déjà Vidjil-valgrind.
Ne faut-il pas alors plutôt mettre Vidjil (all slaves) après valgrind ?
***
ah non, je me mêle les pinceaux, valgrind c'est plus gros.
***
C'est déjà le cas. C'est valgrind-unit. Ce sont « juste » les seuils auxquels les builds râlent qui n'étaient pas uniformisés.
***
ok, merci
***
@mikael-s