vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2018-12-04T12:33:28+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/3380Mettre un objet "Clone" dans le cpp2018-12-04T12:33:28+01:00Mathieu GiraudMettre un objet "Clone" dans le cpp@mikael\-s : "il manque un objet clone... c'est une fenêtre plus..." :
- representative
- infos de segmentation
- warnings
- méthodes d'affichage / d'export
But: diminuer la taille de `vidjil.cpp`@mikael\-s : "il manque un objet clone... c'est une fenêtre plus..." :
- representative
- infos de segmentation
- warnings
- méthodes d'affichage / d'export
But: diminuer la taille de `vidjil.cpp`https://gitlab.inria.fr/vidjil/vidjil/-/issues/3379identito-vigilance: protocole par le biais des SNP2018-07-13T16:21:52+02:00Thonier Florianidentito-vigilance: protocole par le biais des SNPIl s'agit d'une piste de réflexion sur ce que j'ai entendu cette semaine au labo.
Dnas le cadre des manips de séquençage de l'équipe de Rennes en oncologie ou somatique, ils passent des échantillons pour voir des SNP.
L'association d...Il s'agit d'une piste de réflexion sur ce que j'ai entendu cette semaine au labo.
Dnas le cadre des manips de séquençage de l'équipe de Rennes en oncologie ou somatique, ils passent des échantillons pour voir des SNP.
L'association de quelques SNP permet de discriminer des patients et par exemple de savoir le sexe, et aussi un code de quelques lettres qui pourra devenir unique.
Ces SNP sont répartits sur de nombreux gènes qui sont justement ceux qu'ils observent. Ils n'en ont que quelques un de dispo pour cette raison (8 ou 9). Ça ne fait pas forcement un très grande combinatoire, mais ils l'utilisent à l'échelle d'un run uniquement.
Vu le type de données que l'on a, ce n'est pas envisageable (mutation, recombo, locus différents suivant les samples,...). Mais c'est à garder dans un coin de notre esprit.
PS; ça fait prendre conscience qu'il en faut peu pour identifier quelque un.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3376SEG_METHOD_123: Détecter les recombinaisons à trois, même si elles sont vues ...2018-07-16T19:33:46+02:00Mathieu GiraudSEG_METHOD_123: Détecter les recombinaisons à trois, même si elles sont vues comme VJ normalEn généralisant #3370.
Les séquences avec trois affectations (suffisament présentes) ABC, où ABC n'est pas un VDJ attendu, devraient être affichées comme unexpected... même si le AB, le AC ou le BC peuvent faire qu'elles soient vues com...En généralisant #3370.
Les séquences avec trois affectations (suffisament présentes) ABC, où ABC n'est pas un VDJ attendu, devraient être affichées comme unexpected... même si le AB, le AC ou le BC peuvent faire qu'elles soient vues comme VJ "normal". Ce sont en effet des séquences très particulières (artefact ? bio ?) et on doit attirer l'attention dessus.
Une nouvelle `SEG_METHOD_123` ? Nécessite #2968 ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3375La page des logs est trop longue à charger : la paginer2019-02-28T12:39:28+01:00Mikaël SalsonLa page des logs est trop longue à charger : la paginer@RyanHerb le mécanisme utilisé pour la liste des sample sets est-il généralisable facilement ?
En lien avec #3374@RyanHerb le mécanisme utilisé pour la liste des sample sets est-il généralisable facilement ?
En lien avec #3374https://gitlab.inria.fr/vidjil/vidjil/-/issues/3374Stocker en base de données tous les accès2019-01-08T15:11:23+01:00Mikaël SalsonStocker en base de données tous les accès(on les a déjà dans les fichiers)
Que ce soit les accès à un sample set, mais aussi aux listes de samples ou aux listes d'utilisateurs, etc…
En lien avec vidjilnet#10(on les a déjà dans les fichiers)
Que ce soit les accès à un sample set, mais aussi aux listes de samples ou aux listes d'utilisateurs, etc…
En lien avec vidjilnet#10https://gitlab.inria.fr/vidjil/vidjil/-/issues/3373Des erreurs dans certains fichiers de germline2018-07-13T14:15:11+02:00Mikaël SalsonDes erreurs dans certains fichiers de germlineLors de la dernière release des germlines des erreurs ont été enregistrées dans les fichiers germlines `rattus-norvegicus/IGHD+up.fa` et `rattus-norvegicus/IGHJ+down.fa` :
```
Error: CEFetchPApplication::proxy_stream(): Failed to unders...Lors de la dernière release des germlines des erreurs ont été enregistrées dans les fichiers germlines `rattus-norvegicus/IGHD+up.fa` et `rattus-norvegicus/IGHJ+down.fa` :
```
Error: CEFetchPApplication::proxy_stream(): Failed to understand id: RatNor_6_chr6
```Algo 2018.08Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3372Différences entre les séquences d'IMGT et celles récupérées en utilisant leur...2018-07-13T14:15:10+02:00Mikaël SalsonDifférences entre les séquences d'IMGT et celles récupérées en utilisant leur accessionChaque gène provenant d'IMGT fait référence à un numéro d'accession et à des positions au sein de cette séquence.
Lorsqu'on récupère les germlines « classiques » on utilise directement les séquences en provenance d'IMGT alors que lorsqu...Chaque gène provenant d'IMGT fait référence à un numéro d'accession et à des positions au sein de cette séquence.
Lorsqu'on récupère les germlines « classiques » on utilise directement les séquences en provenance d'IMGT alors que lorsqu'on récupère les germlines up ou down on passe en fait par le numéro d'accession pour extraire la séquence correspondante.
Avec la mise en place de #3009 il fallait vérifier que cela correspond bien.
Seule différence `TRAJ13*02`.
D'après IMGT :
```
>AB258131|TRAJ13*02|Homo sapiens|F|J-REGION|101..163|63 nt|3| | || |63+0=63| | |
tgaattctgggggttaccagaaagttacctttggaactggaacaaagctccaagtcatcccaa
```
Le numéro d'accession est donc AB258131 et les positions sont 101 à 163. Mais quand on les extrait on obtient :
```
>AB258131.1:101-163|TRAJ13*02|Homo sapiens|F|J-REGION+down|Homo sapiens DNA, MLV integration site, partial sequence, clone: MLV-TPA-Mat-255
ttgggatgacttggagctttgttccagttccaaaggtaactttctggtaacccccagaattca
```
C'est en fait le reverse complement car IMGT n'indique pas dans son header que la séquence est reverse complémentée.
Je n'ai pas rencontré d'autres cas (pour les J).
Cela rend probablement nécessaire d'utiliser systématiquement les séquences d'IMGT pour ce qui est de la séquence du gène.Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3370Une séquence passe en unexpected au lieu d'IGH2018-07-13T16:08:46+02:00Mikaël SalsonUne séquence passe en unexpected au lieu d'IGHCe n'est pas extrêmement choquant vue la séquence.
Il s'agit de la séquence `#1347 vh2` de `gosh-igh.should-vdj.fa`. Elle contient un réarrangement VDJ normal mais à la fin elle a aussi du V dans le sens négatif.
Auparavant la séquence...Ce n'est pas extrêmement choquant vue la séquence.
Il s'agit de la séquence `#1347 vh2` de `gosh-igh.should-vdj.fa`. Elle contient un réarrangement VDJ normal mais à la fin elle a aussi du V dans le sens négatif.
Auparavant la séquence était vue comme une séquence VDJ normale mais avec la mise à jour des germlines, on a plus de k-mers reconnus comme V- à la fin de la séquence ce qui donne une meilleure e-valeur à la recombinaison inattendue par rapport à la VDJ classique.
Voici les affectations :
```
_ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _
_ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H _ _+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
_ _ _ _ _ _ _ _ _ _ _ _ _ _+h+h+h+h+h+h+h+h+h _ _ _ _ _ _+h _ _ _ _ _ _+h+h+h
+h+h+h+h _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H
-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H
-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H-H
```
Est-on choqué que ce soit unexpected ou non ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3369Tester tools/validate-links.py2020-05-20T18:47:09+02:00Mikaël SalsonTester tools/validate-links.pySuite à !202 il faudra tester ce script (doctests par exemple), ce qui pourra servir de documentation.Suite à !202 il faudra tester ce script (doctests par exemple), ce qui pourra servir de documentation.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3368Réparer Vidjil-deploy-doc2020-08-27T11:32:01+02:00Mikaël SalsonRéparer Vidjil-deploy-docSuite à !202. Il faut mettre à jour le job Jenkins `Vidjil-deploy-doc` et installer le nécessaire sur le slave.Suite à !202. Il faut mettre à jour le job Jenkins `Vidjil-deploy-doc` et installer le nécessaire sur le slave.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3367Authentification forte2021-11-05T09:11:55+01:00Mathieu GiraudAuthentification forteEn France, les recommandations sont généralement d'avoir une authentification basée sur la CPS (http://esante.gouv.fr/services/espace-cps/cartes-professionnelles-de-sante), mais ce n'est pas obligatoire.
Un minimum serait de mettre en p...En France, les recommandations sont généralement d'avoir une authentification basée sur la CPS (http://esante.gouv.fr/services/espace-cps/cartes-professionnelles-de-sante), mais ce n'est pas obligatoire.
Un minimum serait de mettre en place un 2FA ou quelque chose du genre.
cc @RyanHerbhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3366CI ne lance pas shouldlocus2018-07-12T19:01:19+02:00Mikaël SalsonCI ne lance pas shouldlocusLes tests sur les locus ne sont actuellement pas lancés.
Or des tests peuvent échouer en `shouldlocus` et pas en `shouldvdj`Les tests sur les locus ne sont actuellement pas lancés.
Or des tests peuvent échouer en `shouldlocus` et pas en `shouldvdj`Algo 2018.08https://gitlab.inria.fr/vidjil/vidjil/-/issues/3365should-vdj-to-tap ne vérifie pas correctement le locus2020-05-20T16:40:35+02:00Mikaël Salsonshould-vdj-to-tap ne vérifie pas correctement le locusDans `should-vdj-tests/igh-vdj.should-vdj.fa` le 3è test passe pour le locus alors qu'il n'est pas correct (IGH+ trouvé au lieu de IGH).
```
#(IGHV1-18*01, IGHV1-18*04) 0//0 IGHD3-16*01 0//0 (IGHJ4*01, IGHJ4*02) [IGH] BUG
>1 100 101 12...Dans `should-vdj-tests/igh-vdj.should-vdj.fa` le 3è test passe pour le locus alors qu'il n'est pas correct (IGH+ trouvé au lieu de IGH).
```
#(IGHV1-18*01, IGHV1-18*04) 0//0 IGHD3-16*01 0//0 (IGHJ4*01, IGHJ4*02) [IGH] BUG
>1 100 101 121 seed IGH+ SEG_+ 2.180678e-23 4.130931e-61/2.180678e-23
```Algo -- Importanthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3364Vérifier tous les liens de la doc, internes comme externe2020-01-22T10:42:10+01:00Mathieu GiraudVérifier tous les liens de la doc, internes comme externeVoir #3349... mais aussi les liens externes : on a encore des liens sur `rby` !
Faire un script et le mettre en CI.
Plus simple à faire sur le résultat (build *.html).
Il y a sûrement des outils qui existent, sinon quelques lignes de p...Voir #3349... mais aussi les liens externes : on a encore des liens sur `rby` !
Faire un script et le mettre en CI.
Plus simple à faire sur le résultat (build *.html).
Il y a sûrement des outils qui existent, sinon quelques lignes de python feront bien l'affaire.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3363Documenter le format utilisé dans les fichiers `.g`2018-09-07T08:06:36+02:00Mikaël SalsonDocumenter le format utilisé dans les fichiers `.g`https://gitlab.inria.fr/vidjil/vidjil/-/issues/3362À quoi sert le ref dans les fichiers .g / à quoi sert germline_id2018-09-07T09:43:25+02:00Mikaël SalsonÀ quoi sert le ref dans les fichiers .g / à quoi sert germline_idLors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version p...Lors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version précise des germlines. Pourquoi ? À quoi cela sert ? Je comprends qu'il soit nécessaire d'avoir une version minimale mais je ne vois pas l'utilité d'imposer une version (et de devoir la changer à chaque mise à jour des germlines).https://gitlab.inria.fr/vidjil/vidjil/-/issues/3361Erreur de compilation avec `g++-7`2018-07-11T19:27:29+02:00Mikaël SalsonErreur de compilation avec `g++-7`Suite à bc08111a02 j'ai une erreur de compilation avec g++-7 (et 8 aussi) :
```c++
filter.h:6:9: error: ‘function’ does not name a type; did you mean ‘union’?
typedef function<bool(pair<KmerAffect, int>, pair<KmerAffect, int>)> Comparat...Suite à bc08111a02 j'ai une erreur de compilation avec g++-7 (et 8 aussi) :
```c++
filter.h:6:9: error: ‘function’ does not name a type; did you mean ‘union’?
typedef function<bool(pair<KmerAffect, int>, pair<KmerAffect, int>)> Comparator;
^~~~~~~~
union
```
cc @magiraud @boreecAlgo 2018.08https://gitlab.inria.fr/vidjil/vidjil/-/issues/3360Gestion plus propre des warnings2021-02-03T09:09:32+01:00Mikaël SalsonGestion plus propre des warningsPour l'instant l'ajout d'un warning se fait dans le JSON. Si on veut afficher quelque chose sur la sortie standard c'est géré indépendamment, avec des messages qui peuvent diverger.
Ce n'est donc pas très générique.
De plus l'ajout d'un...Pour l'instant l'ajout d'un warning se fait dans le JSON. Si on veut afficher quelque chose sur la sortie standard c'est géré indépendamment, avec des messages qui peuvent diverger.
Ce n'est donc pas très générique.
De plus l'ajout d'un warning dans le JSON se fait par un code unique, sous forme de chaîne, suivie d'une description.
Plusieurs éléments :
* [ ] Ne pourrait-on pas avoir une constante pour chaque warning (toujours préférable aux chaînes pour lesquelles on risque une typo) ?
* [ ] Le message ne peut-il pas être mis automatiquement (tous définis dans un tableau commun) plutôt que d'avoir à le réécrire à chaque fois ?
* [x] Les warnings ne peuvent-ils pas exister indépendamment du JSON ? Ensuite c'est chaque type de sortie qui définit ce qu'elle fait du warning.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3359Le tri de la liste sample_set ne fonctionne pas correctement2018-07-13T12:07:39+02:00Ryan HerbertLe tri de la liste sample_set ne fonctionne pas correctementLe tri semble être buggé depuis la factorisation des sets (voir https://db.vidjil.org/admin/default/ticket/vidjil/194.94.189.58.2018-07-11.11-13-06.92e4f70f-229e-4e98-9cae-675cd152693b )Le tri semble être buggé depuis la factorisation des sets (voir https://db.vidjil.org/admin/default/ticket/vidjil/194.94.189.58.2018-07-11.11-13-06.92e4f70f-229e-4e98-9cae-675cd152693b )https://gitlab.inria.fr/vidjil/vidjil/-/issues/3358Objets 'Output', où mettre la préparation complète du json_clone ?2018-11-21T16:15:35+01:00Mathieu GiraudObjets 'Output', où mettre la préparation complète du json_clone ?@mikael\-s, à propos de cecaed9c01, dans https://gitlab.inria.fr/vidjil/vidjil/merge_requests/242#note_104775 :
> Ne pourrait-on pas le mettre ailleurs ? J'aimerais vraiment que le moins de traitement possible soit fait dans `vidjil.cp...@mikael\-s, à propos de cecaed9c01, dans https://gitlab.inria.fr/vidjil/vidjil/merge_requests/242#note_104775 :
> Ne pourrait-on pas le mettre ailleurs ? J'aimerais vraiment que le moins de traitement possible soit fait dans `vidjil.cpp`.
> Faisable dans `segment.cpp` ?
>
> On pourrait aussi avoir un tableau constant qui décrive la recombinaison (dans `segment.cpp` n'a-t-on pas accès à la valeur de N ?), ce qui permettrait aussi d'en ajouter facilement.
>
> Et si on pousse le truc un peu : ces séquences spéciales pourrait même être décrites dans le json du germline.
La même question pourrait se poser pour W51, W53... et d'autres choses qui sont faits sur `json_clone`. Idéalement
tout devrait être dans segment.cpp ou ailleurs, à voir si c'est faisable car beaucoup de choses dépendent de où on en est par rapport aux options `-x`/`-y`/`-z` et autres.Mathieu GiraudMathieu Giraud