vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2017-07-07T15:46:09+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/2016Charger des fichiers BAM2017-07-07T15:46:09+02:00Vidjil TeamCharger des fichiers BAMLes fichiers BAM sont directement générés par les séquenceurs Ion apparemment, cela éviterait de passer par le FASTQ. Le fichier BAM est une version compressée du fichier SAM. Il vaut mieux passer par une bibliothèque externe pour les li...Les fichiers BAM sont directement générés par les séquenceurs Ion apparemment, cela éviterait de passer par le FASTQ. Le fichier BAM est une version compressée du fichier SAM. Il vaut mieux passer par une bibliothèque externe pour les lire… Il existe par exemple htslib mais elle fait plein d'autres choses https://github.com/samtools/htslib (il y en a probablement d'autres)
***
@magiraud @mikael-sAlgo 2017.07Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2006ECMAScript v6 ? Version du DOM ?2022-06-10T12:00:56+02:00Vidjil TeamECMAScript v6 ? Version du DOM ?83a112a, Mikael:
segmenter.js: includes() method is a bit new
(…) It is part of the ECMAScript 2016 standard while indexOf is part of the
ECMAScript 5.1 standard (2011).
De la même manière que notre code C++ est du C++11 (et pa...83a112a, Mikael:
segmenter.js: includes() method is a bit new
(…) It is part of the ECMAScript 2016 standard while indexOf is part of the
ECMAScript 5.1 standard (2011).
De la même manière que notre code C++ est du C++11 (et pas du C++14), nous devrions décider quelle version d’ECMAScript nous utilisons.
Et peut-on le forcer dans les tests unitaires / fonctionnels ?
Cela nous aiderait peut-être à répondre à #1077.
***
Le phantomjs sur Jenkins n'étant pas très à jour, du javascript 2016 ne passera pas dessus (c'est ce qui m'est arrivé)
Mais ça ne répond pas vraiment aux questions…
***
@magiraud @RyanHerb @mikael-s @DuezWeb 2018.01https://gitlab.inria.fr/vidjil/vidjil/-/issues/2003Le résultat de la segmentation change selon le contexte2019-11-23T05:29:48+01:00Vidjil TeamLe résultat de la segmentation change selon le contexteExemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutati...Exemple : http://rbx.vidjil.org/browser/index.html?patient=3837&config=2
On prend le gros clone et les petits clones autour. La moitié a un D trouvé, pas l'autre moitié. Le D fait 22bp il n'est pas trouvé dès qu'il y a une erreur/mutation. Or si on exporte ces séquences et qu'on fait tourner le -c segment ou, même, Vidjil avec les mêmes options que sur le serveur (et même avec le vidjil présent sur le serveur)... on ne trouve pas la même segmentation.
Voir le test 88c6e92
***
N'y aurait-il pas un test de e-valeur pour le D qui dépende du nombre de reads ? (dans le test on passe de 2D trouvés avec un seul read, contre 0 D trouvé avec 11 reads)
***
> N'y aurait-il pas un test de e-valeur pour le D qui dépende du nombre de reads ?
Oui... et je pense bien que ce n'est pas un bug, mais une feature (introduite par e6ffb91). C'est précisément pour cela qu'est fait la E-value, non ? On fait strictement la même chose pour la FineSegmentation V/J ("multiplier" dans FineSegmenter()).
Le multiplier est
- nb_reads_for_evalue pour -c segment (pour V/J comme pour D)
- sort_clones.size() pour -c clones (Aïe, je me rends compte qu'il n'y est pas pour V/J, vidjil.cpp:1413 !!!)
Ce multiplier dit bien le nombre de segmentation que l'on fait, bref ce qu'il faut pour transformer la p-valeur en e-valeur.
Après, peut-être que le calcul des p-valeurs du D est trop stringent (voir tâche réouverte).
***
Et on a même une dépendance encore plus vicieuse que celle au nombre de reads : passer de -z 100 à -z 1000 peut faire dé-segmenter une séquence... C'est la vie. Voir si IgBlast a aussi ce type de comportement.
***
Pourquoi le multiplier devrait-il être le nombre de clones plutôt que le nombre de séquences réellement segmentées ?
***
Qu'on n'ait pas les mêmes résultats entre 10M de reads (fine segmentés) et 10 reads, je comprends bien : on change de plusieurs ordres de grandeur. Mais qu'on n'ait pas les mêmes résultats entre 1 read, 6 reads et 11 reads, j'ai plus de mal. Peut-être est-ce juste un problème de seuil de E-valeur
***
> Mais qu'on n'ait pas les mêmes résultats entre 1 read, 6 reads et 11 reads, j'ai plus de mal
Tout à fait, il faut comprendre ce qu'il se passe, et il y a peut-être des bugs
> Pourquoi le multiplier devrait-il être le nombre de clones plutôt que le nombre de séquences réellement segmentées ?
Oui, l'estimation actuelle est trop stricte. Est-ce que cela devrait être un max entre sort_clones.size() et max_clones ?
***
>Oui, l'estimation actuelle est trop stricte. Est-ce que cela devrait être un max entre sort_clones.size() et max_clones ?
J'aurais dit un min ;) Ce qui importe c'est le nombre de séquences qu'on va réellement segmenter.
***
Oui, tout à fait, un min !
J'étais plus en forme hier soir (cela m'a étonné d'ailleurs, c'était après 3 verres, ce a quoi je ne suis pas habitué :-)
***
@magiraud @mikael-sAlgo -- Importanthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1992app/analyze: exposer/documenter une API2023-03-28T16:21:00+02:00Vidjil Teamapp/analyze: exposer/documenter une APIShugay et d'autres seraient contents de pouvoir utiliser cela.
(Mais attention, pour l'instant bloquant pour le reste du serveur ?)
***
@nobodyShugay et d'autres seraient contents de pouvoir utiliser cela.
(Mais attention, pour l'instant bloquant pour le reste du serveur ?)
***
@nobodyWeb 2022.12https://gitlab.inria.fr/vidjil/vidjil/-/issues/1987Ajouter l'organisme dans le fichier .vidjil2017-02-02T12:39:25+01:00Vidjil TeamAjouter l'organisme dans le fichier .vidjilUn fichier .vidjil donne le locus mais pas l'espèce. Impossible alors de savoir si un fichier avec un germline IGH provient d'un humain ou d'une souris.
***
@nobodyUn fichier .vidjil donne le locus mais pas l'espèce. Impossible alors de savoir si un fichier avec un germline IGH provient d'un humain ou d'une souris.
***
@nobodyAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/1979Titre du rapport exporté faux quand "compare patients" et runs2018-04-16T15:49:37+02:00Vidjil TeamTitre du rapport exporté faux quand "compare patients" et runsAurélie : On voit le titre du dernier patient.
***
Confirmé.
***
1. Ouvrir un patient
2. Faire « open patient list »
3. Compare patients
4. Sélectionner des patients (autres)
5. Export report (monitor). Le titre est celui du pati...Aurélie : On voit le titre du dernier patient.
***
Confirmé.
***
1. Ouvrir un patient
2. Faire « open patient list »
3. Compare patients
4. Sélectionner des patients (autres)
5. Export report (monitor). Le titre est celui du patient ouvert au 1.
***
Idem pour les runs : il n'affiche pas le nom du run mais le nom du dernier patient ouvert.
(this.m.patient_name dans export.js, rempli directement par ce que renvoie le serveur)
***
@Duez @magiraud @RyanHerb Web 2017.03Ryan HerbertRyan Herberthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1945Tooltips riches dans la webapp : implémentation2019-01-10T15:21:23+01:00Vidjil TeamTooltips riches dans la webapp : implémentationDescription un peu complète et lien vers la doc. Si la tooltip apparaît plus rapidement qu'un "title" c'est mieux aussi. Exemple, sans bibliothèque JS (à part JQuery) : https://codepen.io/jamilhijjawi/pen/lIwbK
***
Remarque de Marc duran...Description un peu complète et lien vers la doc. Si la tooltip apparaît plus rapidement qu'un "title" c'est mieux aussi. Exemple, sans bibliothèque JS (à part JQuery) : https://codepen.io/jamilhijjawi/pen/lIwbK
***
Remarque de Marc durant la rando : on crée beaucoup de contenu dynamiquement, bref cela impose de relancer le .js (soit sur tout, soit sur l'objet nouvellement créé).
Solution purement CSS dans features/tooltip (ce qu'avait fait François), simplification/re-travail en cours.
***
@magiraud @mikael-sWeb 2018.01https://gitlab.inria.fr/vidjil/vidjil/-/issues/1921Créer un nouveau clone artificiel / ajouter une séquence (modèle)2018-01-10T10:45:58+01:00Vidjil TeamCréer un nouveau clone artificiel / ajouter une séquence (modèle)Michaela voudrait parfois ajouter une séquence dans le browser, pour l'analyser VDJ/CDR3 (voir "Avoir une interface pour le FineSegmenter d'un petit nombre de clones"), mais aussi pour pouvoir l'aligner avec les séquences de Vidjil. Typi...Michaela voudrait parfois ajouter une séquence dans le browser, pour l'analyser VDJ/CDR3 (voir "Avoir une interface pour le FineSegmenter d'un petit nombre de clones"), mais aussi pour pouvoir l'aligner avec les séquences de Vidjil. Typiquement une vérification Sanger ou une séquence qui vient d'ailleurs.
On pourrait avoir quelque part dans le browser un truc "add virtual clones", qui lance Vidjil sur un petit nombre de clones... et rajoute le résultat au sample courant (avec un flag type "virtual"). À voir si cela ne perturbe pas trop le reste (et serait-ce sauvé dans le .analysis ?)
Autre solution (mais pas dans le même sample) : créer un sample à partir d'une séquence copiée/collée, sans avoir à uploader un fichier.
À discuter.
***
Aurélie et Nathalie seraient aussi très contentes si on pouvait faire cela.
***
→ sujet projet Armand
* [ ] isQuantifiable()
* [ ] éventuellement nettoyer isVirtual()
* [ ] modifier les différentes vues (pas de graphe, scatterplot différent)
***
@nobodyWeb 2018.012017-08-27https://gitlab.inria.fr/vidjil/vidjil/-/issues/1919Multi-threader web2py2017-03-22T17:36:24+01:00Vidjil TeamMulti-threader web2pyApparemment web2py par défaut devrait être multi-threadé, voir pourquoi il ne l'est pas. Cela pourrait résoudre pas mal de timeouts.
***
Tiens, on apprend des choses au redémarrage de web2py :
*** Python threads support is disabled. You...Apparemment web2py par défaut devrait être multi-threadé, voir pourquoi il ne l'est pas. Cela pourrait résoudre pas mal de timeouts.
***
Tiens, on apprend des choses au redémarrage de web2py :
*** Python threads support is disabled. You can enable it with --enable-threads ***
***
Après vérification, nous avons 4 processus web2py qui tournent. D'après ce post: https://groups.google.com/forum/#!topic/web2py/mPdn1ClxLTI c'est tout à fait ce qu'il faut avoir.
Les requêtes sont encore bloquantes.
Activer le flag enable-threads n'a rien changé sur mon environnement.
***
@RyanHerbWeb 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/1879Seuil pour les D, e-valeur2020-10-14T11:25:55+02:00Vidjil TeamSeuil pour les D, e-valeurVW16: deux écoles.
* 4nt (Hélène ~"PAR-Debré" ), pour éviter de faire un primer qui tombe dedans
* 8nt (c'est bien cela ?), (Frédéric ~"Paris-Pitié" , "vieux papiers")
Et nous, on a dit "euh, 5nt". Sommes-nous confiant dans notre c...VW16: deux écoles.
* 4nt (Hélène ~"PAR-Debré" ), pour éviter de faire un primer qui tombe dedans
* 8nt (c'est bien cela ?), (Frédéric ~"Paris-Pitié" , "vieux papiers")
Et nous, on a dit "euh, 5nt". Sommes-nous confiant dans notre calcul de e-valeur pour les D ?
***
Oui c'est bien cela. Le seuil de 8nt correspond à un seuil immuno pour avoir un D qui ait du sens.
***
segment.cpp, FineSegmenter::FineSegmentD
`float evalue_D = multiplier * (r-l) * germline->rep_4.totalSize() * segment_cost.toPValue(box_DD->score[0].first);`
Ouf, `(r-l) `est bien la taille de la zone considérée.
Calcul à priori correct... sauf qu'il dépend de` .toPValue`, donc de `K` et `lambda` qui sont fixés à la légère (mais qui ne devraient pas changer l'ordre de grandeur)
***
Depuis 2016.08, on peut jouer avec `-E`.
Avec e6ffb91, on a perdu 6 séquences de .should-vdj VDDJ.
Retravailler là-dessus, voir s'il faut des seuils différents pour premier D et D suivants, peut-être retravailler sur le score et/ou K/lambda.
***
ping, voir "Configuration trop stringeante sur la recherche du D" #2002
***
@magiraud @mikael-sAlgo -- ImportantThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1878Prise en compte de la central région pour la p-valeur : mauvaise idée pour ch...2020-12-04T12:07:46+01:00Vidjil TeamPrise en compte de la central région pour la p-valeur : mauvaise idée pour choix du meilleur locusSur l'exemple ci-dessous (IgJC/IgVC souris,), c'est le IgVC qui devrait moralement passer : le V est beaucoup plus beau (1e-110) que le J (1e-38). *Mais* le fait d'avoir pris la "central region" pour la e-valeur (2e23e720) donne finaleme...Sur l'exemple ci-dessous (IgJC/IgVC souris,), c'est le IgVC qui devrait moralement passer : le V est beaucoup plus beau (1e-110) que le J (1e-38). *Mais* le fait d'avoir pris la "central region" pour la e-valeur (2e23e720) donne finalement une plus mauvaise e-valeur pour le segment droit (C) et finalement pour IgVC.
Je suis prêt à parier qu'on retrouve la même chose sur certains DhJh / VDJ IGH humain.
```
>6
ACATTTGGGAAGGACTGACTCTCTGAGGAGACGGTGACCGTGGTCCCTGTGCCCCAGACATCGAAGTACCACCGTAATCCCCTCCTTCGAGCACAGTAGTATGTGGCAGTATCTGCAGTGTCCACACTGGTGATCTTGAGGAATACCTGGTTTCTGGAGGTATCCTTGGAGATTGTGAGCCGGCTCTTCAGGGATGGGTTATAGCGCTTGTCATCATCCCAGTAAATGTGTGCCAGCCACTCCAGACCCTTTCCTGAAGGCTGACGAATCCAGCTCACACCCATACCAGAAGTGCTCAGTGAAAACCCAGAGAAAGAACAAGTCAGACTGAGGGTCTGGGAGGACTGCAATATCCCAGGGCCAGACTCTTTCAGAGTAACCTGGGACAGGACATATGCAGGGACAATCAGCAGCAGGAATGAGGAAGTA
# 32 - VJ 0 405 407 428 seed IgJC SEG_- 9.531439e-38 7.491827e-38/2.039612e-38-c-c-c-c-c-c-c-c-c-c-c _ _ _ _ _ _ _ _ _ _ _-C-C-C-C _ _ _ _-C-C-C-C-C-C-C _ _ _ _ _ _-C _ _ _ _ _ _-C-C-C-C-C-C-C-C-C _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ (...)
# 81 - VJ 0 339 406 428 seed IgVC SEG_- 2.634030e-23 2.634030e-23/3.652017e-110-c-c-c-c-c-c-c-c-c-c-c _ _ _ _ _ _ _ _ _ _ _-Q-Q-Q-Q _ _ _ _-Q-Q-Q-Q-Q-Q-Q _ _ _ _ _ _-Q _ _ _ _ _ _-Q-Q-Q-Q-Q-Q-Q-Q-Q _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C _ _ _ _ _ _-C _ _ _ _ _ _-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C-C _ _ _ _ _ _ _ _ _ _ _ _ _ _-C-C-C-C-C-C-C-C-C-C _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ (...)
#>6 - VJ 0 405 407 428 seed IgJC SEG_- 9.531439e-38 7.491827e-38/2.039612e-38
```
***
Que faire ? Arrêter la central région si on rencontre un k-mer "4" ? plusieurs k-mers "4" ?
***
Pas sûr de comprendre le problème. N'est-il pas censé y avoir une région centrale aussi ? Pourquoi y a-t-il trois types d'affectation dans la séquence du bas (`-c`, `-Q`, `-C`) ?
***
En bas, c'est `5`=`V`=`-C`, `4`=`J`=`-Q`, `3`=`isotypes`=`-c`.
Ne pas oublier que les k-mers 4 sont dans l'index.
Mais bon, reformulation plus simple : le problème est le choix entre VDJ et DJ :
```
VVVVVV-------DDDDDD-------JJJJJJJ donc 33333(-----44444-----)5555
DDDDDD-------JJJJJJJ donc 33333(-----)5555
```
La zone centrale, entre parenthèses, est plus grande en haut qu'en bas, d'où une moins bonne e-valeur pour la région J en haut par rapport à en bas.
***
test 69ea8e6
***
ping
***
Choses en cours dans hotfix_evalue_incomplete_germline
Voir aussi aho et xxx (pénalité qui était implicite avant) ?
***
À voir d'ici 2016.09
***
Il y a eu le hack pour 2016.09.
À revoir tranquillement pour la prochaine releaseAlgo -- Importanthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1781Indice/index de clonalité, diversité : par locus ?2022-02-17T09:53:37+01:00Vidjil TeamIndice/index de clonalité, diversité : par locus ?Ce serait intéressant d'avoir aussi les mesures de diversité par locus.
- avec un Stats étendu ? (bof, va stocker bcp de choses redondantes)
- avec BinReadStorage ? (et supprimer définitivement Stats ?)
- ou bien, peut-être plus simp...Ce serait intéressant d'avoir aussi les mesures de diversité par locus.
- avec un Stats étendu ? (bof, va stocker bcp de choses redondantes)
- avec BinReadStorage ? (et supprimer définitivement Stats ?)
- ou bien, peut-être plus simple, tout laisser tel quel et faire des boucles dans windowStorage au moment de computeDiversity()
***
Évoqué lors du VW16.
***
@nobodyAlgo 2022.01Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1766Mettre à jour les germlines depuis IMGT2018-03-14T11:03:48+01:00Vidjil TeamMettre à jour les germlines depuis IMGTLa dernière mise à jour date de mai 2015 (-> 2015.06).
Il faudra le faire pour la 2016.02 :-)
***
Tiens, depuis novembre 2015 IMGT fait un CHANGELOG: http://www.imgt.org/IMGTgenedbdoc/dataupdates.html
***
D'ailleurs, cela vaudra le coup ...La dernière mise à jour date de mai 2015 (-> 2015.06).
Il faudra le faire pour la 2016.02 :-)
***
Tiens, depuis novembre 2015 IMGT fait un CHANGELOG: http://www.imgt.org/IMGTgenedbdoc/dataupdates.html
***
D'ailleurs, cela vaudra le coup de faire les pseudo-gènes en même temps (ou juste après). Et "make get-all-data" ne fonctionne pas en ce moment
***
@mikael-sAlgo 2017.03Mikaël SalsonMikaël Salson2017-01-16https://gitlab.inria.fr/vidjil/vidjil/-/issues/1740Responsive design pour le browser2020-11-13T19:36:21+01:00Vidjil TeamResponsive design pour le browserSerait utile aussi bien pour présentation que sur mobile/tablette
***
2016: PJI en cours, voir le résultat en mai…
***
http://www.vidjil.org//projet-mobile.html
***
@magiraud @mikael-sSerait utile aussi bien pour présentation que sur mobile/tablette
***
2016: PJI en cours, voir le résultat en mai…
***
http://www.vidjil.org//projet-mobile.html
***
@magiraud @mikael-sWeb 2018.03Ryan HerbertRyan Herberthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1724SEG_METHOD_ONE : séquences non recombinées, usages2022-02-25T18:21:15+01:00Vidjil TeamSEG_METHOD_ONE : séquences non recombinées, usages
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ......
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ... #1801
- détecter des adaptateurs mal enlevés #1669
- standards / spikes ? ~"user-request"
(Anciens commentaires ci-dessous, implémenté depuis... 2018 !)
> Cela me tente très fort d'avoir une méthode expérimentale pour retrouver des reads matchant *une* séquence dans une germline de référence, non recombinée.
>
> Implémentation proposée (temps estimé : moins qu'un chapitre d'HdR :)
> - en KmerSegmenter, récupérer simplement le k-mer maximum + test e-valeur + extraction d'une fenêtre *centrée* les k-mers détectés. Selon ce qu'on prend comme taille de fenêtre, on fera plus ou moins n'importe quoi. (edit: mieux, minimizers, voir #2643)
> - éventuellement continuer en FineSegmenter avec une DP standard pour identifier la séquence.
>
> On s'éloigne du dogme, "Vidjil analyse les recombinaisons"... mais on reste focus sur choses immuno. Mais il ne faut pas recoder Blast/Yass :-)Algo 2022.01Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1696Avoir des tests de couverture algo, coveralls ou autre2018-11-20T08:47:01+01:00Vidjil TeamAvoir des tests de couverture algo, coveralls ou autremake should-coveralls segfaulte sur Travis depuis juin
***
ping. Voir si c'est réparable, sinon virer le badge sur github.
***
Depuis 07ea431, ne segmente faute plus.
Mais l'upload ne fonctionne pas. Badge sur github enlevé en attendant....make should-coveralls segfaulte sur Travis depuis juin
***
ping. Voir si c'est réparable, sinon virer le badge sur github.
***
Depuis 07ea431, ne segmente faute plus.
Mais l'upload ne fonctionne pas. Badge sur github enlevé en attendant.
***
@magiraudAlgo 2018.08Mikaël SalsonMikaël Salson2018-06-05https://gitlab.inria.fr/vidjil/vidjil/-/issues/1674FineSegmenter donne UNSEG < delta_min sur des belles séquences -> supprimer d...2017-11-24T10:04:37+01:00Vidjil TeamFineSegmenter donne UNSEG < delta_min sur des belles séquences -> supprimer delta_min
@flothoni : J'ai quelques séquences qui sont retrouvées dasn vidjil mais qui n'ont pas de noms définis.
En investigants un peu sur celles-ci (via imgt-quest), il semblerait que vidjil n'ai pas assez d'informations pour discriminer les ...
@flothoni : J'ai quelques séquences qui sont retrouvées dasn vidjil mais qui n'ont pas de noms définis.
En investigants un peu sur celles-ci (via imgt-quest), il semblerait que vidjil n'ai pas assez d'informations pour discriminer les segments, en general entre les alleles.
J'ai essayé de jouer sur la eval pour discriminer grossièrement, mais ça ne marche pas non plus.
Je ne sais aps si vous avez déjà eu le cas ou non.
Du coup, il faudrait que vidjil retourne au moins le nom du seg, même si il ne peut pas discriminer l'allele quand ceux qu'il identifie son similaires.
Vous voyez une autre raison ou méthode pour "recupérer" ces séquences ?
Ps , les fichiers vidjil sont en pj.
@magiraud : L'algo parfois segmente certaines séquences par l'heuristique des k-mers (`SEG_+`/`SEG_-`) mais n'arrive pas à faire la désignation V(D)J (ce qu'on appelle le "FineSegmenter"), par exemple si les séquences sont vraiment bizarres (et dans ce cas on garde quand même la séquence dans le .vidjil, un clone est identifié, mais on ne sait pas le désigner)
... mais ici c'est clairement un bug, ce sont des beaux réarrangements.
`algo/tests/bugs/bug20150909.fa`
@magiraud : c5c781e. On enlève le test, tout se passe bien.
(Les séquences ont d'autres bugs, autre tâche)
@magiraud @mikael-s @flothoniAlgo 2017.07https://gitlab.inria.fr/vidjil/vidjil/-/issues/1673Valeur de -m par défaut pas très claire2017-12-04T14:55:59+01:00Vidjil TeamValeur de -m par défaut pas très claireDoc: "Note that it is even possible to set `-m -10`
(meaning that V and J could overlap 10 bp). This is the default for VJ recombinations."
En fait c'est le cas... sauf en cas de `-g germline`, ou c'est 0 pour tous.
On retrouve l...Doc: "Note that it is even possible to set `-m -10`
(meaning that V and J could overlap 10 bp). This is the default for VJ recombinations."
En fait c'est le cas... sauf en cas de `-g germline`, ou c'est 0 pour tous.
On retrouve la même ambiguité que ce qu'on avait pour les fenêtres.
Solution : si on a envie de conserver des réglages différents, les mettre dans "parameters" de germline.data.
***
@magiraud @mikael-sAlgo 2017.07https://gitlab.inria.fr/vidjil/vidjil/-/issues/1642-w all, pour une autre configuration 'clonality' très stricte, sur toute la s...2020-04-15T09:18:24+02:00Vidjil Team-w all, pour une autre configuration 'clonality' très stricte, sur toute la séquencePeut-être pas tout le read.
***
Si, si, tout le read ! Je veux au moins essayer un `-w all`.
Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
***
Discuté à ~"PAN-Necker" :
> Si les ...Peut-être pas tout le read.
***
Si, si, tout le read ! Je veux au moins essayer un `-w all`.
Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
***
Discuté à ~"PAN-Necker" :
> Si les données viennent de PCR, on peut avoir des reads débutant / finissant au nucléotide près.
"C'est peu probable, si 1% d'erreur et > 100 bp, et bien rien ne va se ressembler"
"Sauf si le 1% est biaisé vers toujours les même erreurs"
***
@magiraud @mikael-sAlgo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/1588Récupérer des données par FTP/HTTP/NFS ou autre2017-11-22T12:48:32+01:00Vidjil TeamRécupérer des données par FTP/HTTP/NFS ou autreLe serveur doit pouvoir récupérer des fichiers à distance (par FTP/HTTP). La première étape est d'avoir un contrôleur qui permet ça (pour que des scripts puissent y accéder au moins). Ensuite on pourrait l'exposer dans l'interface (file/...Le serveur doit pouvoir récupérer des fichiers à distance (par FTP/HTTP). La première étape est d'avoir un contrôleur qui permet ça (pour que des scripts puissent y accéder au moins). Ensuite on pourrait l'exposer dans l'interface (file/edit_form).
***
Marc avait l'air motivé, merci :)
***
Et on peut avoir deux versions : une qui récupère le fichier à l'URL donnée et l'autre qui ne stocke que l'URL.
Ensuite Vidjil sera lancé directement avec l'URL : ça marche déjà en utilisant la puissance de bash (sh ?) :
./vidjil -e all -G germline/IGH <(wget -O - -q http://www.vidjil.org/seqs/Stanford_S22.fasta)
(le -e all est là pour éviter l'estimation du nombre de reads)
***
Discuté à l'instant : pour que l'e-value fonctionne, on pourrait
- soit wrapper dans un scipt shell pour vraiment avoir le fichier
- soit avoir un nb de reads par défaut (1 milllion)
- soit estimer ce nb de reads de l'extérieur (taille du fichier), et le passer en ligne de commande
L'estimation peut être à la louche, à un facteur 10 ou 100 près :)
***
@DuezWeb 2017.03Ryan HerbertRyan Herbert