vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2017-08-28T15:57:38+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1401algo/tools: réparer cut.cpp2017-08-28T15:57:38+02:00Vidjil Teamalgo/tools: réparer cut.cppcut.cpp peut être éventuellement intéressant, à réparer (+ tester / should)
***
@nobodycut.cpp peut être éventuellement intéressant, à réparer (+ tester / should)
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/929vidjil.cpp: .json doit avoir les même limites que stdout2017-09-12T18:28:05+02:00Vidjil Teamvidjil.cpp: .json doit avoir les même limites que stdoutactuellement, il faut mettre -% 0 -R 1 -z 9999, sinon on a plein de "unsegmented" dans l'interface, et les bios se demandent ce qu'il se passe
***
euh ?
***
@nobodyactuellement, il faut mettre -% 0 -R 1 -z 9999, sinon on a plein de "unsegmented" dans l'interface, et les bios se demandent ce qu'il se passe
***
euh ?
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/926Traitement des options : supprimer docopt, choisir autre solution2017-10-19T19:44:34+02:00Vidjil TeamTraitement des options : supprimer docopt, choisir autre solutionle traitement des options prend 1/3 du code de vidjil.cpp. Et c'est redondant.
Des expériences avaient été faites au début 2014, mais rien de concluant.
***
http://docopt.org
Leur format d'entrée est... bluffant, je ne l'avais pas compri...le traitement des options prend 1/3 du code de vidjil.cpp. Et c'est redondant.
Des expériences avaient été faites au début 2014, mais rien de concluant.
***
http://docopt.org
Leur format d'entrée est... bluffant, je ne l'avais pas compris ce matin.
https://github.com/docopt/docopt.c
L'implémentation c n'a pas l'air super complète, mais on pourrait y arriver peut-être.
Ou bien la C++11...
***
https://github.com/docopt/docopt.cpp
***
mvoui, attendre un peu avant de prendre décision docopt
***
> Mathieu : tools/align.cpp utilise docopt
> Mikaël : Euh… docopt ? « Note that GCC-4.8 will not work due to its missing the regex module. »
> On n'est pas en train de dire qu'il faut installer gcc 4.8 partout ?
Je ne m'en étais pas rendu compte, aïe, cela passait chez moi avec le clang par défaut.
Effectivement, gcc 4.8 ne passe pas, et 4.9 passe.
De plus, pour tools/align.cpp docopt m'avait presque convaincu, mais pour vidjil.cpp le traitement est plus complexe, je ne suis pas sûr que cela nous convienne. Bref, attendre beaucoup avant de changer cela pour vidjil.cpp et/ou trouver d'autres solutions.
***
Rediscuter de docopt, lui donner encore une chance...
Et si cela ne peut pas marcher, l'enlever.
***
Docopt, c'est toujours pour gcc 4.9 minimum (et on s'est déjà amusés à mettre à jour g++/clang sur un certain nombre de slaves l'année dernière)
***
@nobodyAlgo 2017.11https://gitlab.inria.fr/vidjil/vidjil/-/issues/1831Vidjil morning : le mettre dans les scripts d'install2017-10-27T12:25:34+02:00Vidjil TeamVidjil morning : le mettre dans les scripts d'install
***
@nobody
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1015Épaisseur de la police2017-11-15T08:32:46+01:00Vidjil TeamÉpaisseur de la policeok sur Chrome, légèrement trop gras sur Firefox / Safari ?
Tests à faire, à voir
***
@nobodyok sur Chrome, légèrement trop gras sur Firefox / Safari ?
Tests à faire, à voir
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2807URL: le plot preset devrait être correctement initialisé, ou au moins non ini...2017-11-19T22:15:41+01:00Mathieu GiraudURL: le plot preset devrait être correctement initialisé, ou au moins non initialisé à 0Obtenu avec le preset 5 : http://feature-c-url-params.ci.vidjil.org/?data=analysis-example.vidjil&p=v,size,bar
Mais le preset n'est pas initialisé (c'est normal, le preset est juste une manière de mettre des axes x et y), il est à `0 V/...Obtenu avec le preset 5 : http://feature-c-url-params.ci.vidjil.org/?data=analysis-example.vidjil&p=v,size,bar
Mais le preset n'est pas initialisé (c'est normal, le preset est juste une manière de mettre des axes x et y), il est à `0 V/J gene`, ce qui est trompeur.
Idéalement, on aimerait voir le bon preset 5, mais c'est difficile.
Déjà, quelque chose qui induirait moins en erreur serait, lors du chargement d'une URL avec `plot`, de ne pas mettre le preset 0.https://gitlab.inria.fr/vidjil/vidjil/-/issues/1448Séparation serveurs : app (html/js) // vda2017-11-22T12:48:32+01:00Vidjil TeamSéparation serveurs : app (html/js) // vdaFaudrait-il séparer (physiquement, virtuellement) les serveurs ?
- un qui ne fait que la db + browser
- un autre pour upload / vidjil, qui peut éventuellement ramer, mais qui ne bloque pas l'interaction des users avec la db et le b...Faudrait-il séparer (physiquement, virtuellement) les serveurs ?
- un qui ne fait que la db + browser
- un autre pour upload / vidjil, qui peut éventuellement ramer, mais qui ne bloque pas l'interaction des users avec la db et le browser
Juste une réflexion, on ne va pas se lancer là-dedans pour l'instant ! Et en plus, en production, ce n'est même pas dit que nos pb d'efficacité soient si importants, typiquement dans un hôpital il y aura 1 ou 2 utilisateurs, pas 100 simultanés :)
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1098Expiration des fichiers .fasta2017-11-22T12:48:32+01:00Vidjil TeamExpiration des fichiers .fastaAu bout d'un moment, on pourrait supprimer des fichiers.
(Cela ne choquait pas Martin qu'on ne garde pas tout)
Peut-être en prévenant par mail avant les utilisateurs.
***
6857522
***
@DuezAu bout d'un moment, on pourrait supprimer des fichiers.
(Cela ne choquait pas Martin qu'on ne garde pas tout)
Peut-être en prévenant par mail avant les utilisateurs.
***
6857522
***
@Duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1475Récupérer des données par FTP/HTTP ou autre2017-11-22T12:48:32+01:00Vidjil TeamRécupérer des données par FTP/HTTP ou autreOn en parlait il y a très longtemps : on pourrait, au lieu d'uploader, donner une URL à télécharger. Cela pourrait revenir au goût du jour avec ceux qui ont des très grosses données : une transmission directe de leur serveur au notre ser...On en parlait il y a très longtemps : on pourrait, au lieu d'uploader, donner une URL à télécharger. Cela pourrait revenir au goût du jour avec ceux qui ont des très grosses données : une transmission directe de leur serveur au notre serait plus efficace qu'un upload browser.
Mais... peut-être que finalement on ne souhaite pas faciliter tant que cela l'import de fichiers de 10 GB ! Le wont-fix me tente :-)
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1012germline/germlines.data: trouver un format utile, l'utiliser un peu partout2017-12-04T14:55:54+01:00Vidjil Teamgermline/germlines.data: trouver un format utile, l'utiliser un peu partoutPour l'instant, la définition de PSEUDO est dans pipeline.py.
Ce n'est pas générique, on devrait pouvoir lancer vidjil avec un -G KDE.
Où mettre cette liste ?
***
b7b1d34, branche "germline": draft très préliminaire, germline/germlines...Pour l'instant, la définition de PSEUDO est dans pipeline.py.
Ce n'est pas générique, on devrait pouvoir lancer vidjil avec un -G KDE.
Où mettre cette liste ?
***
b7b1d34, branche "germline": draft très préliminaire, germline/germlines.txt
***
En discuter ensemble fin août
***
mis dans master
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/973Automatiser création pseudo-germlines, en particulier Dd2-Dd3, get-germline i...2017-12-04T14:55:59+01:00Vidjil TeamAutomatiser création pseudo-germlines, en particulier Dd2-Dd3, get-germline incompletJe ne sais pas pourquoi la deadline est aujourd'hui.
Le but serait déjà d'avoir les fichiers suivants, une séquence par fichier :
- TRDD2.fa
- TRDD3.fa
- IGKKDE.fa
- IGKINTRON.fa
Pour la combinaison (TRDV + TRDD2), cela devrait s...Je ne sais pas pourquoi la deadline est aujourd'hui.
Le but serait déjà d'avoir les fichiers suivants, une séquence par fichier :
- TRDD2.fa
- TRDD3.fa
- IGKKDE.fa
- IGKINTRON.fa
Pour la combinaison (TRDV + TRDD2), cela devrait se faire directement par germlines.data / parser C++.
***
0818249 : Dd2 et Dd3
Il reste KDE et INTRON, on les récupère où ?
***
C'est Aurélie qui nous les avait envoyé. On les met sur vidjil.org ?
***
Ok, vidjil.org/germline (donc pour l'instant sur bioinfo...).
Avant de le fixer dans le marbre (peut-être en le rentrant en dur dans le git vidjil, dans germline), on refera des tests voir si les séquences sont bonnes / trop courtes / trop longues.
***
J'attends donc juste que vdj/web soit déployé sur bioinfo pour le mettre dans le script :)
***
Bon, je les ai mis à la main sur rbx.
0ad7c6b
***
à faire plus tard : vérifier les séquences, les mettre directement dans le git vidjil
***
c'est bon actuellement
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2919TEST_TAP_EQUAL pour les tests unitaires2018-01-18T00:35:54+01:00Mathieu GiraudTEST_TAP_EQUAL pour les tests unitairesMême remarque que #2823 pour les tests unitaires ~cpp .
Moins important, nos tests sont tout de même bien stables et c'est facile de débugger si besoin.Même remarque que #2823 pour les tests unitaires ~cpp .
Moins important, nos tests sont tout de même bien stables et c'est facile de débugger si besoin.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2989Réécrire les tests unitaires avec TEST_TAP_EQUAL2018-01-30T08:22:26+01:00Mathieu GiraudRéécrire les tests unitaires avec TEST_TAP_EQUALSuite à #2919.
Pas très urgent, cela sert surtout en cas de debug et/ou pour les nouveaux tests.Suite à #2919.
Pas très urgent, cela sert surtout en cas de debug et/ou pour les nouveaux tests.Algo 2017.11https://gitlab.inria.fr/vidjil/vidjil/-/issues/2221Faire un mock pour window pour les tests QUnit bidouillant l'url2018-02-23T10:04:52+01:00Mathieu GiraudFaire un mock pour window pour les tests QUnit bidouillant l'urlOn aimerait mieux tester `url_obs.js` fait par @aurelBZH, pour être plus robuste par rapport au comportement de QUnit vis-à-vis de l'url.
@RyanHerb propose de faire un "mock". Par exemple un mock de `window`, utilisé dans notre code com...On aimerait mieux tester `url_obs.js` fait par @aurelBZH, pour être plus robuste par rapport au comportement de QUnit vis-à-vis de l'url.
@RyanHerb propose de faire un "mock". Par exemple un mock de `window`, utilisé dans notre code comme `window.history.pushState('plop', 'plop', new_url);` et `window.location`.
Voir par exemple http://stackoverflow.com/questions/14627367/mock-window-location-reload-using-qunit
cc @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1604Le calcul de la e-valeur devrait prendre en compte le -t2018-04-10T12:28:09+02:00Vidjil TeamLe calcul de la e-valeur devrait prendre en compte le -tSi on ne garde que x nucléotides pour les germlines V ou J, le calcul de la e-valeur ne doit se faire que sur une longueur inférieure ou égale à x, même si la séquence est beaucoup plus longue : il est impossible d'avoir plus de x k-mers...Si on ne garde que x nucléotides pour les germlines V ou J, le calcul de la e-valeur ne doit se faire que sur une longueur inférieure ou égale à x, même si la séquence est beaucoup plus longue : il est impossible d'avoir plus de x k-mers V (et même x - s + 1) par exemple.
***
ok
***
Tout doit se faire dans kmerstore.h
- en entrée, les insert() reçoivent et utilisent keep_only : à stocker
- en sortie, getProbabilityAtLeastOrAbove()
***
68fef14. Quitte à prendre en compte le -t, autant être plus générique : si on n'a inséré que des choses de 200 ou moins, le calcul devrait prendre en compte ces 200.
Pour faire le changement souhaité, il faut maintenant faire quelque chose du type :
int n_max = atMostMaxSizeIndexing(length) - getS() + 1;
dans getProbabilityAtLeastOrAbove()
Mais j'ai maintenant des doutes : veut-on remplacer vraiment n par n_max dans toute cette fonction ? Est-ce que le index_load n'a pas déjà pris cela en compte ?
Bref, je te laisse voir :-)
***
Dans une séquence de longueur 200, même si on n'a inséré que des séquences de longueur 100 :
- la proba d'avoir exactement 18 k-mers est toujours la même ?
- et celle d'avoir 150 k-mers ? Elle est faible... mais pas nulle (et d'ailleurs, on trouvera des séquences chimériques avec cela). Est-ce que le but est de mettre cela à zéro ?
ou bien est-ce que cela doit être fait finalement dans affectanalyser.cpp:160 ? Qu'est-ce que cela signifie ?
***
La proba d'avoir 18 k-mers par hasard est plus élevée dans une séquence de longueur 200 que de longueur 100. De manière générale, il existe au moins une valeur t pour laquelle t k-mers dans 100nt est significatif mais pas t dans 200nt.
***
ok pour la longueur de la séquence observée, mais est-ce que cela dépend de la longueur de la séquence insérée ? (Cette dépendence ne serait-elle pas déjà dans le index_load ?)
En tout cas, si tu penses avoir la formule, vas-y :-)
***
Je pense que je ne comprends pas ce que tu veux dire :)
Par exemple pour l'instant on calcule la probabilité à gauche sur toute la longueur jusqu'à first_pos_max. Ce qui est très bien puisque cela évite de prendre en compte le N (dans lequel on ne s'attend pas à avoir de k-mers). Là c'est la même chose : on ne veut pas prendre en compte le début du V puisqu'on ne s'attend pas à avoir de k-mers dedans.
Autrement dit, entre un read qui contient 100nt de V et un read qui contient 300nt du même V, on ne devrait pas avoir une e-valeur différente (avec -t 100).
***
Après réflexion collective, un segment de 200, même avec -t 100, contient aussi un certain nb de kmers "aléatoires" dans les 100 premiers nt, qui fait que le calcul de la e-valeur serait tout de même bon (à peu près).
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1830Vidjil morning : /etc/update-motd.d/50-landscape-sysinfo2018-04-16T16:29:15+02:00Vidjil TeamVidjil morning : /etc/update-motd.d/50-landscape-sysinfoOn a perdu /etc/update-motd.d/50-landscape-sysinfo au passage
Voir si on peut changer des permissions / un sudo pour le récupérer.
***
@nobodyOn a perdu /etc/update-motd.d/50-landscape-sysinfo au passage
Voir si on peut changer des permissions / un sudo pour le récupérer.
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1776Génération de données simulées2018-04-16T16:54:14+02:00Vidjil TeamGénération de données simuléesIl y a notre programme Python maison mais aussi repgenHMM http://www.lps.ens.fr/~tmora/publi.html
***
@magiraud @mikael-sIl y a notre programme Python maison mais aussi repgenHMM http://www.lps.ens.fr/~tmora/publi.html
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2183should-to-tap: Ne pas faire la shell-expansion sur la ligne "Launching"2018-04-18T12:14:06+02:00Mathieu Giraudshould-to-tap: Ne pas faire la shell-expansion sur la ligne "Launching"```
sh should-to-tap.sh should-get-tests/10-md5-germline.should-get
Launching ' (cd ../../..//germline ; md5sum out/Stanford_S22.rc.vdj.fa out/Stanford_S22.rc.windows.fa out/Stanford_S22.vdj.fa ...
```
Or le test en question demande `(...```
sh should-to-tap.sh should-get-tests/10-md5-germline.should-get
Launching ' (cd ../../..//germline ; md5sum out/Stanford_S22.rc.vdj.fa out/Stanford_S22.rc.windows.fa out/Stanford_S22.vdj.fa ...
```
Or le test en question demande `(cd ../../..//germline ; md5sum */*.fa)`.
`*/*.fa` est mal interprété ici (mais bien lancé en vrai): le mieux serait de ne pas faire l'expansion sur la ligne "Launching".Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2789Short name et VDJ/VDDJ : réduire le seuil de 6 ?2018-08-07T09:13:28+02:00Thonier FlorianShort name et VDJ/VDDJ : réduire le seuil de 6 ?Je me suis aperçu que lors de l'affichage de clones avec des D en tandem, la transformation en short name ne ce fait pas sur l'insert `N-4b-3`, et peut-être aussi sur le `N-4a-4`.Je me suis aperçu que lors de l'affichage de clones avec des D en tandem, la transformation en short name ne ce fait pas sur l'insert `N-4b-3`, et peut-être aussi sur le `N-4a-4`.Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3395La génération du JSON peut allouer 1 GB de mémoire à la fin de vidjil-algo2018-10-17T16:49:01+02:00Mathieu GiraudLa génération du JSON peut allouer 1 GB de mémoire à la fin de vidjil-algoSuite à #2120.
> On y reviendra peut-être si l'export JSON redevient dominant, peut-être que ce sera le cas après #3393.
Non critique pour l'instant.Suite à #2120.
> On y reviendra peut-être si l'export JSON redevient dominant, peut-être que ce sera le cas après #3393.
Non critique pour l'instant.