vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2017-03-29T19:45:07+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/2239`-y all`: on devrait avoir les séquences consensus dans `.vdj.fa`2017-03-29T19:45:07+02:00Mathieu Giraud`-y all`: on devrait avoir les séquences consensus dans `.vdj.fa`Vu à l'occasion d'une démo ce matin avec ~"Paris-Pitié".
Sur Stanford S22, ajouter `-y all -z 5`. On s'attend à avoir les représentatives pour toutes les séquences dans `out/xxxxx.vdj.fa`.
Il semblerait que ce ne soit pas le cas, qu'il...Vu à l'occasion d'une démo ce matin avec ~"Paris-Pitié".
Sur Stanford S22, ajouter `-y all -z 5`. On s'attend à avoir les représentatives pour toutes les séquences dans `out/xxxxx.vdj.fa`.
Il semblerait que ce ne soit pas le cas, qu'il s'arrête au `-z 5` et qu'on a ensuite uniquement les fenêtres. À vérifier.
cc @mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2217Algo: trimSequence ne fait pas ce qu'on attend d'elle2017-03-08T12:19:06+01:00Mikaël SalsonAlgo: trimSequence ne fait pas ce qu'on attend d'elleLe bug #2214 a mis un coup de projecteur sur la fonction `trimSequence`, qui ne fonctionne pas comme elle devrait. Son but : obtenir le plus long facteur dont chaque préfixe et suffixe contient moins de RATIO_TOO_MANY_N % de N. Les (nouv...Le bug #2214 a mis un coup de projecteur sur la fonction `trimSequence`, qui ne fonctionne pas comme elle devrait. Son but : obtenir le plus long facteur dont chaque préfixe et suffixe contient moins de RATIO_TOO_MANY_N % de N. Les (nouveaux) tests montrent que ce n'est pas le cas. Il faut revoir l'algo complètement.
cc @magiraudAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2214Boucle infinie dans le calcul de la représentative2017-03-08T12:19:06+01:00Mikaël SalsonBoucle infinie dans le calcul de la représentativeQuatre Vidjil tournent depuis plus d'un jour (cf. #2213). Il s'agit du même fichier de séquences dans les quatre cas. Le processus boucle sur le 91è clone à segmenter. Ce clone est composé de trois reads (de toute beauté), en voici un :
...Quatre Vidjil tournent depuis plus d'un jour (cf. #2213). Il s'agit du même fichier de séquences dans les quatre cas. Le processus boucle sur le 91è clone à segmenter. Ce clone est composé de trois reads (de toute beauté), en voici un :
```
>M02707:35:000000000-AYHTM:1:1118:11403:1189
CCCNNNNNNNCTCCTGTNNNNNNNCTGGATTNNNNNNNAGTAGCTNNNNNNNGAACTGGNNNNNNNAGGCTCCNNNNNNNGGGCTGGNNNNNNNCTCATCCNTTNNNNGTAGTAGNNNNNNNATATACTNNNNNGACTCAGTGANNNNNNGATTCACCATCTCCNNAGACNACGCCAAGNNCTCACTGTATCNNNNNNNGAACAGCCTGAGAGCCGAGCCACGGGGCTGAGAATACTATTACGATTTTTGGAGTGGTTATCAACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGT
```
C'est bien le calcul de la représentative qui pose problème car le problème est toujours présent avec un `-z 0 -y 100`.
Un test suit dans un commit.
cc @magiraudAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2230Seuil provisoire pour les D, e-valeur2017-03-14T09:41:45+01:00Mathieu GiraudSeuil provisoire pour les D, e-valeurSolution temporaire pour #1879, pour %"Algo 2017.03"Solution temporaire pour #1879, pour %"Algo 2017.03"Algo 2017.03Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2252Algo 2017.032017-03-16T17:10:00+01:00Mathieu GiraudAlgo 2017.03Je vise db78197. Je me suis permis de protéger `dev` le temps que les tests tournent (si on pousse, on repart au début, et on a plus de 2 heures de valgrind...). Peut-être faudra-t-il un jour lancer `release` (voire `valgrind`) sur maste...Je vise db78197. Je me suis permis de protéger `dev` le temps que les tests tournent (si on pousse, on repart au début, et on a plus de 2 heures de valgrind...). Peut-être faudra-t-il un jour lancer `release` (voire `valgrind`) sur master ou sur une branche plus protégée que `dev`.
cc @mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2220Séquences productives : codon stop2017-03-07T13:53:34+01:00Mathieu GiraudSéquences productives : codon stopLe but initial de #1824 était de réfléchir sur les codons stops.
C'est fait : closed by 5d910513e par @mikael-s
Voir aussi #2142.
Le but initial de #1824 était de réfléchir sur les codons stops.
C'est fait : closed by 5d910513e par @mikael-s
Voir aussi #2142.
Algo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2180Faire au moins un test avec souris et rat2017-02-15T20:00:10+01:00Mathieu GiraudFaire au moins un test avec souris et ratcc @mikael-scc @mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2179Mettre à jour l'aide2017-02-14T22:56:53+01:00Mathieu GiraudMettre à jour l'aideEn particulier suite à #2134.
cc @mikael-sEn particulier suite à #2134.
cc @mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2157Test should-get-tests/vidjil-error-w-small.should-get2017-03-08T12:19:06+01:00Mathieu GiraudTest should-get-tests/vidjil-error-w-small.should-getVoir d4d6e18f0.
Voir d4d6e18f0.
Algo 2017.03Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2155Tracer la version de germlines utilisée dans l'algo2018-09-07T08:06:04+02:00Mathieu GiraudTracer la version de germlines utilisée dans l'algoSuite à #2154 :
De la même manière qu'on fait attention à la version de l'algo, ne faudrait-il pas stocker le `germline_id` dans le `.vidjil` ?
Je pinaille, mais bon...
@mikael-sSuite à #2154 :
De la même manière qu'on fait attention à la version de l'algo, ne faudrait-il pas stocker le `germline_id` dans le `.vidjil` ?
Je pinaille, mais bon...
@mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2134Permettre de ne lancer que certains germlines d'un fichier .germlines2017-12-04T14:55:54+01:00Mikaël SalsonPermettre de ne lancer que certains germlines d'un fichier .germlinesActuellement on a la possibilité de préciser soit un fichier `.germlines` dont tous les locus spécifiés seront analysés (sauf les incomplets si on n'a pas l'option `-i`), soit l'ensemble des fichiers « V » et l'ensemble des fichiers « J ...Actuellement on a la possibilité de préciser soit un fichier `.germlines` dont tous les locus spécifiés seront analysés (sauf les incomplets si on n'a pas l'option `-i`), soit l'ensemble des fichiers « V » et l'ensemble des fichiers « J » (et éventuellement D) sur la ligne de commande. Dans ce dernier cas, il s'agit d'un germline « custom » qui n'est donc pas assimilé à un germline reconnu et n'a pas d'espèces.
Il serait pratique de ne pouvoir sélectionner que quelques germlines au sein d'un fichier `.germlines`. Par exemple si je veux analyser les kappa avec les incomplets je pourrais faire `-g germline/homo-sapiens.germlines -? IGK,IGK+` (où le `?` est à remplacer par une lettre adéquate). Si je voulais préciser les fichiers V et J sur la ligne de commande, je perdrais la possibilité de séparer les complets des « inhabituels »
@magiraudAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2132Ranger les germlines par espèces (algo)2017-02-02T12:39:25+01:00Mathieu GiraudRanger les germlines par espèces (algo)Suite à #1987, pourrait-on faire un répertoire `germline/homo-sapiens` ?
J'ai l'impression que ce n'est pas si facile, plusieurs implications.
@mikael-sSuite à #1987, pourrait-on faire un répertoire `germline/homo-sapiens` ?
J'ai l'impression que ce n'est pas si facile, plusieurs implications.
@mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/2107Indication onlyV trompeuse sur anayse de capture2021-03-22T09:31:46+01:00Thonier FlorianIndication onlyV trompeuse sur anayse de captureSur un set issu d'analyses de Necker :
Sur 4 millions de séquences issus de capture, avec de nombreuses sondes autre que les J, on a une forte proportion de séquences faussement anotées "only V" suite à quelques Kmer éparses trouvés da...Sur un set issu d'analyses de Necker :
Sur 4 millions de séquences issus de capture, avec de nombreuses sondes autre que les J, on a une forte proportion de séquences faussement anotées "only V" suite à quelques Kmer éparses trouvés dans la séquence ( ~25% des reads sont concernés).
En détails, ceux-ci ne sont composés que de 5 ou 6 kmer répartis sur toute la longueur du read.
@magiraud @mikael-s Algo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/1642-w all, pour une autre configuration 'clonality' très stricte, sur toute la s...2020-04-15T09:18:24+02:00Vidjil Team-w all, pour une autre configuration 'clonality' très stricte, sur toute la séquencePeut-être pas tout le read.
***
Si, si, tout le read ! Je veux au moins essayer un `-w all`.
Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
***
Discuté à ~"PAN-Necker" :
> Si les ...Peut-être pas tout le read.
***
Si, si, tout le read ! Je veux au moins essayer un `-w all`.
Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
***
Discuté à ~"PAN-Necker" :
> Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
"C'est peu probable, si 1% d'erreur et > 100 bp, et bien rien ne va se ressembler"
"Sauf si le 1% est biaisé vers toujours les même erreurs"
***
@magiraud @mikael-sAlgo 2017.03