vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2022-12-20T13:40:26+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/3280Les nouveaux samples sont ajoutés de multiple fois2022-12-20T13:40:26+01:00Thonier FlorianLes nouveaux samples sont ajoutés de multiple foisIl s'agit ici d'une régression mais je ne retrouve pas l'issue d'origine (avis aux amateurs).
En ouvrant le set 27682, on voit que les samples sont ajouté une fois de plus à chaque position (le premier fichier est affiché 2 fois, le 2 ...Il s'agit ici d'une régression mais je ne retrouve pas l'issue d'origine (avis aux amateurs).
En ouvrant le set 27682, on voit que les samples sont ajouté une fois de plus à chaque position (le premier fichier est affiché 2 fois, le 2 l'est 3 fois, ...).
Il me semble qu'il y avait déjà eu ce souci et que nous l'avions corrigé. Je ne me souviens pas si il s'agit d'une erreur dans l'entrée dans la base de données, ou bien d'une boucle dans le script d'affichage.
@RyanHerb @mikael\-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3276-Z 0 : prendre toutes les séquences qui matchent au moins un k-mer2018-06-13T15:45:33+02:00Mathieu Giraud-Z 0 : prendre toutes les séquences qui matchent au moins un k-merInitialement dans https://gitlab.inria.fr/vidjil/vidjil/issues/3268#note_96100 :
> Prendre tous les K-mers pour le filtrage. C'est ce qui arrive quand la fonction « filter » n'a pas de paramètre N.
(Ne pas prendre 0, mais définir une c...Initialement dans https://gitlab.inria.fr/vidjil/vidjil/issues/3268#note_96100 :
> Prendre tous les K-mers pour le filtrage. C'est ce qui arrive quand la fonction « filter » n'a pas de paramètre N.
(Ne pas prendre 0, mais définir une constante)Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3266-z et segment2018-06-11T14:28:51+02:00Mathieu Giraud-z et segment@mikael\-s, https://gitlab.inria.fr/vidjil/vidjil/issues/3260#note_94794 :
> le `-z 100` n'a aucun effet avec `-c segment`.
Est-ce que ce ne serait pas souhaitable que ce soit le cas ?
Ou sinon est-ce plutôt le `-x` qui fait déjà cela ...@mikael\-s, https://gitlab.inria.fr/vidjil/vidjil/issues/3260#note_94794 :
> le `-z 100` n'a aucun effet avec `-c segment`.
Est-ce que ce ne serait pas souhaitable que ce soit le cas ?
Ou sinon est-ce plutôt le `-x` qui fait déjà cela ?
cc @boreechttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3263Des analyses avec des BAM ne fonctionnent pas2020-01-22T15:48:29+01:00Thonier FlorianDes analyses avec des BAM ne fonctionnent pasJe tombe depuis quelques jours sur des bugs lors de lancement d'analyses de fichiers `BAM`.
Au début, comme il y avait des souci avec le missing id, je pensais à un lien. Il apparaît très clairement maintenant que le souci est ailleurs...Je tombe depuis quelques jours sur des bugs lors de lancement d'analyses de fichiers `BAM`.
Au début, comme il y avait des souci avec le missing id, je pensais à un lien. Il apparaît très clairement maintenant que le souci est ailleurs. En regardant le log complet de vidjil, je me rend compte qu'il est incapable de traiter le fichier :
```bash
vidjil-algo: bam.cpp:77: virtual void OnlineBAM::next(): Assertion `(bam_entry->core.flag & (1 | 64 | 128)) == 0' failed.
```
Je ne comprend pas vraiment l'erreur. Comme je n'ai pas d'autres fihciers bam en main, j'en ai téléchargé un depuis le serveur vidjil poru faire des tests. Il se trouve que sur celui-ci vidjil fonctionne parfaitement. J'ai alors pensé à des fichiers corrompus. J'ai alors voulu lancé une analyse via la commande suivante:
```bash
samtools quickcheck -v *.bam > bad_bams.fofn && echo 'all ok' || echo 'some files failed check, see bad_bams.fofn'
```
Le résultat montre que les deux fichiers (celui compatible vidjil et l'autre) sont à priori correctement formatés.
En soit, il ne semble donc pas être corrompus. Je vais quand même demander à l'utilisateur de me fournir un md5sum au cas ou. Le souci est que si l'erreur est en amont, a sa propore génération par le séquenceur, ca ne résoudra pas le souci.
en attendant, si ce n'est pas la source de l'erreur, je ne sais pas quoi faire d'autre.
@mikael\-s : Toi qui a dev la fonction pour les BAM, tu as une idée de la raison ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3258Modification d'un sample avec un pre-process2018-07-27T17:29:06+02:00Anne de SeptenvilleModification d'un sample avec un pre-processJ'ai ajouté de nouveaux samples, mais j'ai oublié de les inclure dans un set existant.
C'était avant tout à fait possible d'ajouter un set a posteriori.
J'ai donc ajouté le set dans la page d'édition du sample (sans toucher à rien d'aut...J'ai ajouté de nouveaux samples, mais j'ai oublié de les inclure dans un set existant.
C'était avant tout à fait possible d'ajouter un set a posteriori.
J'ai donc ajouté le set dans la page d'édition du sample (sans toucher à rien d'autre), mais là Vidjil semble vouloir à nouveau faire tourner le pre-process (qui reste affiché comme [queued]). C'est assez embêtant.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3250Décaler les valeurs ascii des K-mers AMBIGUOUS et UNKNOWN2018-07-02T13:36:43+02:00Cyprien BoréeDécaler les valeurs ascii des K-mers AMBIGUOUS et UNKNOWNMettre les caractères ascii des K-mers AMBIGUOUS et UNKNOWN à des valeurs supérieures à 127.Mettre les caractères ascii des K-mers AMBIGUOUS et UNKNOWN à des valeurs supérieures à 127.Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3248Deuxième barre dans le graphe pour "compare two samples"2018-05-31T17:24:18+02:00Mathieu GiraudDeuxième barre dans le graphe pour "compare two samples"8ed135b a réparé le `sp.otherVisibility`, qui était cassé depuis 5299801.
Mais je ne suis pas sûr que la deuxième barre soit réapparue...8ed135b a réparé le `sp.otherVisibility`, qui était cassé depuis 5299801.
Mais je ne suis pas sûr que la deuxième barre soit réapparue...https://gitlab.inria.fr/vidjil/vidjil/-/issues/3246Attribuer la même couleur à tous les clones sélectionnés2018-06-04T10:08:04+02:00Mikaël SalsonAttribuer la même couleur à tous les clones sélectionnésUne demande de ~"LIL\-Immuno" est de pouvoir mettre de côté les clones non productifs. Une manière un peu générique de faire cela est de tous les sélectionner (ce qui est simple, puisqu'on a un axe pour cela), ensuite de leur attribuer u...Une demande de ~"LIL\-Immuno" est de pouvoir mettre de côté les clones non productifs. Une manière un peu générique de faire cela est de tous les sélectionner (ce qui est simple, puisqu'on a un axe pour cela), ensuite de leur attribuer une couleur et de cacher cette couleur. Problème : on ne peut pas attribuer directement la même couleur à tous les clones sélectionnés.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3243Export des informations d'un clone2021-04-14T08:41:06+02:00Mikaël SalsonExport des informations d'un cloneLe tableau d'information d'un clone peut être affiché mais ne peut pas être exporté. Or beaucoup d'informations s'y trouvent (y compris provenant d'IMGT le cas échéant) et il serait intéressant de ne pas les perdre (cf. #3241).Le tableau d'information d'un clone peut être affiché mais ne peut pas être exporté. Or beaucoup d'informations s'y trouvent (y compris provenant d'IMGT le cas échéant) et il serait intéressant de ne pas les perdre (cf. #3241).https://gitlab.inria.fr/vidjil/vidjil/-/issues/3239Filtrage de l'automate : Ne pas fixer un nombre minimal de résultats mais un ...2018-06-13T15:45:32+02:00Mikaël SalsonFiltrage de l'automate : Ne pas fixer un nombre minimal de résultats mais un nombre minimal de k-mersDans la fonction de filtrage je vois un
```
if(result.size() <= 2){
return origin;
}
```
Or il n'est pas question d'imposer un nombre minimal de gènes pertinents dans le `BioReader` filtré. Si on a qu'un seul gène pertinent (a...Dans la fonction de filtrage je vois un
```
if(result.size() <= 2){
return origin;
}
```
Or il n'est pas question d'imposer un nombre minimal de gènes pertinents dans le `BioReader` filtré. Si on a qu'un seul gène pertinent (avec un seul allèle), c'est très bien ! C'est d'ailleurs pour cela que les tests échouent maintenant, suite à #3238
Ce qu'on souhaite, en revanche, c'est ne pas filtrer s'il y a trop peu de k-mers similaires. Est-ce bien fait quelque part ?Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3238Aho-Corasick : utiliser un set plutôt qu'une liste pour stocker les informati...2018-06-13T15:45:33+02:00Mikaël SalsonAho-Corasick : utiliser un set plutôt qu'une liste pour stocker les informations ?Les informations contenues dans chaque état sont stockées sous forme de liste ce qui permet facilement d'en ajouter de nouveaux. Le problème c'est que lorsqu'on ajoute la même information plusieurs fois, lorsqu'on requête on renvoie la m...Les informations contenues dans chaque état sont stockées sous forme de liste ce qui permet facilement d'en ajouter de nouveaux. Le problème c'est que lorsqu'on ajoute la même information plusieurs fois, lorsqu'on requête on renvoie la multiplicité de l'information.
Il serait plus pertinent d'avoir un set. À voir si cela pose des problèmes ou si cela passe.Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3224Lors du filtrage : décaler les valeurs des KmerAffect supérieures à AMBIGUOUS...2018-06-12T12:36:46+02:00Mikaël SalsonLors du filtrage : décaler les valeurs des KmerAffect supérieures à AMBIGUOUS ou UNKNOWNPour le filtrage, lors de la construction de l'automate d'AC, on prend soin à décaler les valeurs pour ne pas tomber sur les valeurs réservées à `AFFECT_AMBIGUOUS` et à `AFFECT_UNKNOWN`. Il faut bien penser à faire l'opération inverse lo...Pour le filtrage, lors de la construction de l'automate d'AC, on prend soin à décaler les valeurs pour ne pas tomber sur les valeurs réservées à `AFFECT_AMBIGUOUS` et à `AFFECT_UNKNOWN`. Il faut bien penser à faire l'opération inverse lorsqu'on récupère les résultats du filtrage.Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3221Valeurs triées en deux parties avec des histogrammes mélangeant entiers et fl...2018-08-14T23:32:08+02:00Mikaël SalsonValeurs triées en deux parties avec des histogrammes mélangeant entiers et flottants[Ici](https://dev.vidjil.org/browser/index.html?set=26836&config=49) (résultats de IgRec) nous avons un exemple où les longueurs moyennes des reads sont triées en deux blocs : les valeurs entières d'abord (les deux premiers labels) et le...[Ici](https://dev.vidjil.org/browser/index.html?set=26836&config=49) (résultats de IgRec) nous avons un exemple où les longueurs moyennes des reads sont triées en deux blocs : les valeurs entières d'abord (les deux premiers labels) et les valeurs flottantes de l'autre.
Il n'est pas absurde que le fichier donné en entrée mélange les deux valeurs : on peut très bien avoir une longueur toujours identique (par exemple 150) et dans d'autres cas un mélange de différentes longueurs qui donne une moyenne de 143.214321
Il n'y a pas de souci en mode grille (cf. #2700).
S'il y a un fix simple de ce problème, on ne va peut-être pas attendre que #2700 soit résolu (qui semble plus complexe).
Proche mais différent de #2905.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3219Fusion de reads : essayer Flash (et BBMerge ?)2020-03-20T12:51:41+01:00Mikaël SalsonFusion de reads : essayer Flash (et BBMerge ?)Dans la publi d'OAS (cf. vdj#677) ils disent utiliser FLASH pour fusionner les reads :
* Site d'origine : https://ccb.jhu.edu/software/FLASH/
* Github : https://github.com/dstreett/FLASH2
L'avantage c'est que c'est open source.
Un arti...Dans la publi d'OAS (cf. vdj#677) ils disent utiliser FLASH pour fusionner les reads :
* Site d'origine : https://ccb.jhu.edu/software/FLASH/
* Github : https://github.com/dstreett/FLASH2
L'avantage c'est que c'est open source.
Un article compare plusieurs logiciels de fusion (dont le leur, BBMerge, qui est évidemment le meilleur) : http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0185056
Flash semble faire moins d'erreur que PEAR et être plus rapide. Flash est aussi plus rapide que BBMerge sur 1 thread. Mais il semble moins correct que BBMerge (d'après leur évaluation…). C'est Flash 1 qui est testé et non Flash 2. BBMerge ne semble pas être distribué seul mais au sein d'un package regroupant d'autres logiciels ce qui risque de rendre la distribution moins pratique.Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3217Filtrage par automate: prendre les N meilleures séquences2018-06-13T15:45:33+02:00Mathieu GiraudFiltrage par automate: prendre les N meilleures séquences@mikael\-s :
> @boreec garde pour l'instant tous les gènes qui ont au moins 1 k-mer ayant matché. C'est plutôt ce critère (...) pur lequel on va jouer. Juste pour tester tu peux augmenter significativement ce critère (10 par exemple).
...@mikael\-s :
> @boreec garde pour l'instant tous les gènes qui ont au moins 1 k-mer ayant matché. C'est plutôt ce critère (...) pur lequel on va jouer. Juste pour tester tu peux augmenter significativement ce critère (10 par exemple).
Après avoir fait cela, on pourra aussi tester de ne garder que les 5, 10 ou 20 gènes aillant *le plus* de k-mers (donc avec un `sort` après le comptage par automate). Pour IGHV, cela garantira que tout ira bien plus vite... par contre il faudra vérifier la sensibilité.Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3213Éditer un sample qui possède un pre-process empêche de relancer une analyse d...2019-09-24T11:20:32+02:00Mikaël SalsonÉditer un sample qui possède un pre-process empêche de relancer une analyse dessusQuand on édite un fichier possédant un pre-process, le `sequence_file.pre_process_flag` passe à `WAIT` ce qui affiche le pre-process comme étant « `QUEUED` » (ce qui n'est d'ailleurs pas le cas). Cet état empêche ensuite de (re)lancer to...Quand on édite un fichier possédant un pre-process, le `sequence_file.pre_process_flag` passe à `WAIT` ce qui affiche le pre-process comme étant « `QUEUED` » (ce qui n'est d'ailleurs pas le cas). Cet état empêche ensuite de (re)lancer toute analyse sur ce fichier, puisque l'analyse se met en état « STOPPED » attendant que le pre-process se finisse (ce qui n'arrivera jamais… puisqu'aucun pre-process n'a été relancé).
Éditer un fichier avec un pre-process, ne devrait pas toucher à l'état du `pre_process_flag` (à moins qu'on ait vraiment changé des choses sur le pre-process utilisé).https://gitlab.inria.fr/vidjil/vidjil/-/issues/3212modifier la méthode insert de automaton pour mettre l'information dans les di...2018-05-15T07:33:15+02:00Cyprien Boréemodifier la méthode insert de automaton pour mettre l'information dans les différentes étapes de l'automateComme la méthode **getMultiResults** de l'automate peut renvoyer un résultat indésirable si la séquence à analyser est plus courte que celles constituant les k-mers, il est souhaitable d'avoir des informations sur chaque état de l'automa...Comme la méthode **getMultiResults** de l'automate peut renvoyer un résultat indésirable si la séquence à analyser est plus courte que celles constituant les k-mers, il est souhaitable d'avoir des informations sur chaque état de l'automate pour ensuite convenir du k-mer le plus ressemblant à la séquence à analyser.
/!\ Respecter la complexité de la boucle de la méthode insert.Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3209Créer un cas de test pour getMultiResults où la séquence à tester est plus co...2018-06-12T12:36:43+02:00Cyprien BoréeCréer un cas de test pour getMultiResults où la séquence à tester est plus courte que celles représentées par les K-mersLors du filtrage du **BioReader** par la fonction **filterBioReaderWithACAutomaton** dans **segment.cpp**, la méthode **getMultiResults** de l'automate ne retourne pas le bon nombre de gènes. Pour cela il faudrait tester créer un cas spé...Lors du filtrage du **BioReader** par la fonction **filterBioReaderWithACAutomaton** dans **segment.cpp**, la méthode **getMultiResults** de l'automate ne retourne pas le bon nombre de gènes. Pour cela il faudrait tester créer un cas spécifique dans les tests où la séquence qu'on applique à l'automate est plus courte que celles représentées par les K-mers utilisés lors de la construction de l'automate.
Après discussion avec @magiraud il semble nécessaire que chaque état de l'automate comporte le nom (de famille) du gène qu'il représente, même si l'état en question n'est pas un état final de l'automate, mais un état intermédiaire.
Il y a donc deux tests à créer:
- Un vérifiant que pour chaque état de l'automate il y a bien un K-mer avec le nom du gène.
- Un vérifiant que getMultiResults renvoie la bonne map lorsque la séquence est plus courte que celles associés aux K-mers.Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3208Compléter le test sur getMultiResults qui n'avait pas été terminé2018-06-12T12:36:43+02:00Cyprien BoréeCompléter le test sur getMultiResults qui n'avait pas été terminéDans **tests/unit-tests/testAutomaton.cpp**, compléter la méthode testGetMultiResults pour s'assurer que la méthode retourne bien la bonne map dans le cas général.
(Actuellement on ne teste pas, on se contente de faire des affichages)Dans **tests/unit-tests/testAutomaton.cpp**, compléter la méthode testGetMultiResults pour s'assurer que la méthode retourne bien la bonne map dans le cas général.
(Actuellement on ne teste pas, on se contente de faire des affichages)Cyprien BoréeCyprien Boréehttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3202Plus d'enregistrement du first login/last login2018-10-02T17:50:19+02:00Thonier FlorianPlus d'enregistrement du first login/last loginJe viens de créer un compte utilisateur; Celui-ci, très rapide, à déposé des données dans l'heure. Pourtant, lorsque l'on accède au tableau users, aucune trace de sa connexion, ni des quelques derniers utilisateurs.
Un point de rappel, ...Je viens de créer un compte utilisateur; Celui-ci, très rapide, à déposé des données dans l'heure. Pourtant, lorsque l'on accède au tableau users, aucune trace de sa connexion, ni des quelques derniers utilisateurs.
Un point de rappel, le bug semble être apparut en même temps que la modification des noms de groupes (numérotation sur 4 chiffres).