vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2024-02-21T14:12:12+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/3171Statistiques multi-samples et contrôle de qualité run/sample, plan de bataille2024-02-21T14:12:12+01:00Mathieu GiraudStatistiques multi-samples et contrôle de qualité run/sample, plan de batailleDiscuté avec @flothoni et @mikael-s suite à ~"ec-ngs" à Lille. Le point le plus revenu dans les échanges, on s'y met en mai-juin de notre côté.
**Prérequis, pipeline de base**
- contrôleur préparant des métadonnées + ensemble de `.vid...Discuté avec @flothoni et @mikael-s suite à ~"ec-ngs" à Lille. Le point le plus revenu dans les échanges, on s'y met en mai-juin de notre côté.
**Prérequis, pipeline de base**
- contrôleur préparant des métadonnées + ensemble de `.vidjil` #3041
- qui récupère des infos des `.vidjil` #3172 (donc #2240)
- puis vue générique #2235 (app-stats: autre chose, plutôt explorer distributions V/J)
Premier but: commencer déjà par infos présentes dans `.vidjil`, typiquement *nombre de reads segmentées* et *clone principal avec son abondance*.
**Puis**
- (Jouable) Plus d'infos dans le `.vidjil`, mieux structurées, déjà depuis vidjil-algo
- les `UNSEG` triés #3049
- warnings par clone / sample #3086 #3060. Documenter, en faire de nouveaux
- (Jouable) vue spécifique #2875, spécialise #2235 pour QC, contrôles
- ~"!-hard" plus fort que #2875, profil par type de manipulation (sequenceur, données, ..) ou utilisateur #3168
- Présence des primers #3152 #1253
- ~"!-hard" (modification db) Pré-process #3154 (déjà PEAR #3054)Web 2024.04CHESNIN ClementCHESNIN Clementhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2875Qualité de chaque échantillon dans un run, contrôles (vue spécifique)2024-02-14T10:49:13+01:00Mikaël SalsonQualité de chaque échantillon dans un run, contrôles (vue spécifique)Avoir l'information pour chaque échantillon uploadé (% de reads mergés, % de reads analysés…).
En lien avec #1362 et #2235.
Avoir l'information pour chaque échantillon uploadé (% de reads mergés, % de reads analysés…).
En lien avec #1362 et #2235.
https://gitlab.inria.fr/vidjil/vidjil/-/issues/4069Afficher les index de diversité en statistiques patient/run/set2024-02-06T16:58:36+01:00Mathieu GiraudAfficher les index de diversité en statistiques patient/run/setDemande de @Anne, initialement dans #4038 :
> Est-ce que ça serait possible d'avoir un bouton sur la page du run ou du set ? Qui donnerait cette valeur pour tous les patients du run/set. Ce serait super d'avoir un tableau récapitulatif ...Demande de @Anne, initialement dans #4038 :
> Est-ce que ça serait possible d'avoir un bouton sur la page du run ou du set ? Qui donnerait cette valeur pour tous les patients du run/set. Ce serait super d'avoir un tableau récapitulatif avec ces infos, ainsi que le % de reads appariés et le % de reads abalysés.
Voir #3171, #3496... toute la partie sur les ~"server-qc-stats" fait partie d'un point qui va être traité par @RyanHerb, entre janvier et mars 2020.Web 2024.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/2526Discordance de productivité2024-02-06T16:46:02+01:00Mathieu GiraudDiscordance de productivitéAurélie ~"LIL-Lille" (par mail, réévoqué ce matin en direct) :
> Le clone majoritaire (...) est dit non productif par Vidjil alors que IMGT et IgBlast disent qu’il est productif.
>
> http://app.vidjil.org/?sample_set_id=23871&config=3...Aurélie ~"LIL-Lille" (par mail, réévoqué ce matin en direct) :
> Le clone majoritaire (...) est dit non productif par Vidjil alors que IMGT et IgBlast disent qu’il est productif.
>
> http://app.vidjil.org/?sample_set_id=23871&config=35
>
> Let's look on the following clones:
> >IGHV3-7*01 1/GGAAGCCC/21 IGHJ6*01 338 nt, 607 958 reads (89.48%)
> AGGAGTCGGGGGGAGGCTTGGTCCAGGCCGGGGGGTCCCTGAGACTCTCATGCGTCGGCCACGGATTGAGTTTGAAGAAGGATTGGATGAGTTGGGTCCGCCAGGCTCCAGGGGAGGGGCTGGAGTGGGTGGCCTACATAAAGGAAGATGGAAATGGGAAACACTATGTGGACTCTGTGAAGGGCCGATTCATCATCTTCAGAGACGACGCCAAGAACTCACTATATCTGGAAATGAACAGCCTGAGAGTCGAGGACACGGCTATGTATTATTGTGTGAGA
>
> GGGAAGCC
> CTGGGCGTTTGGGGGCCAAGGGACATCGGTCACCGTCTCCTCAGGTAAG
cc @flothoniLille-LAL-nexthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5237Don't take into account upstream or downstream regions for the start/end posi...2024-02-02T09:52:32+01:00Mikaël SalsonDon't take into account upstream or downstream regions for the start/end positions of the geneWe use upstream of downstream sequences to improve the sensitivity for small genes, however they are added to the reference as a normal sequence. They should be differentiated in order to provide the correct start/end positions of the ge...We use upstream of downstream sequences to improve the sensitivity for small genes, however they are added to the reference as a normal sequence. They should be differentiated in order to provide the correct start/end positions of the gene (that don't have to take into account upstream or downstream sequence).
See an example of such an issue here #5235Algo 2024.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/3539Export CSV de stats / qualité2024-01-18T15:28:01+01:00Mathieu GiraudExport CSV de stats / qualitéSuggestion de @Anne : pouvoir obtenir un export csv d'un run, sur tous les fihciers qui le compose
cc @RyanHerbSuggestion de @Anne : pouvoir obtenir un export csv d'un run, sur tous les fihciers qui le compose
cc @RyanHerbWeb 2024.04https://gitlab.inria.fr/vidjil/vidjil/-/issues/5164Non-recombined sequence leading to IGK false positive.2023-09-07T16:31:35+02:00Mikaël SalsonNon-recombined sequence leading to IGK false positive.See ~"NAN - Nantes" email on 2023-08-10 mentioning this issue:
He points this sequence:
```
ATGTGGACTCCCTCATGAGCAGATGCCACCAGGGCCACTGGCCCCAGCTTCCTCCTTCACAGCTGCAGTGGGGGCTGGGGCTGGGGCATCCCAGGGAGGGTTTTTGTATGAGCCTGTGTCACAGTGTGTGGTATTCGGCGGAG...See ~"NAN - Nantes" email on 2023-08-10 mentioning this issue:
He points this sequence:
```
ATGTGGACTCCCTCATGAGCAGATGCCACCAGGGCCACTGGCCCCAGCTTCCTCCTTCACAGCTGCAGTGGGGGCTGGGGCTGGGGCATCCCAGGGAGGGTTTTTGTATGAGCCTGTGTCACAGTGTGTGGTATTCGGCGGAGGGACCAAGCTGACCGTCCTAGGTGAGTCTCTTCTCCCCTCTCCTTCCCCGCTCTTGGGACAATTTCTGCTGTTTTTGTTTGTTTCTGTATCTTGTCTCA
```
where we find a `IGKV2D-29 0/78/7 J4`https://gitlab.inria.fr/vidjil/vidjil/-/issues/5151Exports tableur des patients/runs/sets2023-06-30T11:03:14+02:00Mathieu GiraudExports tableur des patients/runs/sets
Demande de @Aurelie : récupérer la liste des patients (nom/prénom/date), en particulier pour de temps en temps regarder les doublons. Plus généralement, pouvoir récupérer toute requête patient/run/set
@fthonier : "Pas de soucis de perf...
Demande de @Aurelie : récupérer la liste des patients (nom/prénom/date), en particulier pour de temps en temps regarder les doublons. Plus généralement, pouvoir récupérer toute requête patient/run/set
@fthonier : "Pas de soucis de performance s'il n'y pas de requêtes croisées"https://gitlab.inria.fr/vidjil/vidjil/-/issues/2820Détecter les primers dimers2023-06-28T18:28:32+02:00Mathieu GiraudDétecter les primers dimersMentionné par Aurélie ~"PAR-Debré" : les nouvelles amorces ~"ec-ngs" génèrent plus de dimers.
À controller.Mentionné par Aurélie ~"PAR-Debré" : les nouvelles amorces ~"ec-ngs" génèrent plus de dimers.
À controller.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3216Utilisation des séquences "cibles"2023-06-28T16:58:04+02:00Thonier FlorianUtilisation des séquences "cibles"Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra...Problème de Patrick :
> comparer le nombre de read d’un patient (pour une cible) à la moyenne des reads de cette cible sur l’ensemble des patients (ou sur une cohorte définie, par exemple 200 patients de notre site). Ceci nous permettra d’avoir des critères d’acceptation du run.
Pour ce faire, il faut faire une recherche de cette cible sur l’ensemble des samples sélectionnées:
* Premier point : il faut déjà pouvoir spécifier la cible.
* Pouvons-nous nous contenter de le faire sur la liste des clones disponible dans les fichiers vidjil ? Nous pourrions alors passer à côté d'une séquence qui ne correspond pas à un clone du top 100, mais qui pourrait avoir son intérêt quand même.
* Rechercher sur le fichier source de séquençage ? Certainement plus long d'un point de vue informatique, mais cela reste-t-il de l'ordre du raisonnable ?
* Faudra-t-il utiliser des séquences dégénérées ?
Autre solution: passer par cloneDB. Serait-ce plus simple d'un point de vue technique ? Cela permettrai-t-il la même granulométrie dans la recherche pour l'inclusion des divers échantillons ?
@Patrick : Aurais-tu un exemple de cible que tu cherches , les samples associés, et ce que tu as (ou t'attends) a retrouver stp ?
@magiraud @mikael\-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4993Pouvoir exporter un alignement dans le rapport2023-06-14T14:50:47+02:00Mathieu GiraudPouvoir exporter un alignement dans le rapportÉvoqué à ~"ec-ngs" avec des usagères. cc @duez
Pour la prochaine fois.
Et par défaut centré, #4992Évoqué à ~"ec-ngs" avec des usagères. cc @duez
Pour la prochaine fois.
Et par défaut centré, #4992Web 2023.10https://gitlab.inria.fr/vidjil/vidjil/-/issues/5143Add D primers in the set of primers2023-05-11T17:49:33+02:00Mikaël SalsonAdd D primers in the set of primersAs requested by ~"NAN - Nantes" during 2023 Vidjil day.
Beware to the prioritization of primers (V/J primers should have the priority over D).As requested by ~"NAN - Nantes" during 2023 Vidjil day.
Beware to the prioritization of primers (V/J primers should have the priority over D).Web 2023.10THONIER FlorianTHONIER Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5138Upload: Avertir dans le client quand les noms de fichiers ne respectent pas R...2023-05-04T15:44:06+02:00Mathieu GiraudUpload: Avertir dans le client quand les noms de fichiers ne respectent pas R1/R2
Normalement, on s'attend à exactement le même nom, avec juste R1 qui est changé en R2.
Si ce n'est pas le cas, avertir.
Soucis humains possibles qui seront diagnostiqués ainsi:
- deux fois le même fichier R1 (et ensuite flash fait des ...
Normalement, on s'attend à exactement le même nom, avec juste R1 qui est changé en R2.
Si ce n'est pas le cas, avertir.
Soucis humains possibles qui seront diagnostiqués ainsi:
- deux fois le même fichier R1 (et ensuite flash fait des choses, mais on ne détecte pas d'où vient le problème)
- ou on se plante de fichier R1/R2
- ou on inverse R1/R2https://gitlab.inria.fr/vidjil/vidjil/-/issues/1253Se souvenir des amorces/primers utilisées : comment ?2023-03-28T16:11:50+02:00Vidjil TeamSe souvenir des amorces/primers utilisées : comment ?On pourrait gérer plus proprement les amorces, avec
- des listes d'amorces (Biomed ? nouvelles EC ? d'autres ?)
- en fonction des amorces sélectionnées, les confisg (ou les stats) sont différents, ou d'autres features
- et certains...On pourrait gérer plus proprement les amorces, avec
- des listes d'amorces (Biomed ? nouvelles EC ? d'autres ?)
- en fonction des amorces sélectionnées, les confisg (ou les stats) sont différents, ou d'autres features
- et certains réglages permettraient de chosir directement un "kit" d'amorces
Ce n'est pas facile, que cela soit au niveau de la db, du browser derrière, et même de la conception / de ce qu'on veut. Vraiment pas la priorité pour l'instant.
***
mis dans la demande d'ADT, 2016Web 2023.10https://gitlab.inria.fr/vidjil/vidjil/-/issues/2836Profils pour divers maladies/usages / Presets for different pathologies/uses2023-03-28T16:11:14+02:00Thonier FlorianProfils pour divers maladies/usages / Presets for different pathologies/uses(Voir #878.)
L'idée general de cette tâche est d'enregistrer les paramètre du setting directement pour ne pas avoir a modifier cela si on doit oouvrir 20 patient d'ffiler.
De plus, cela permettrait de retrouver pour point commun entre ...(Voir #878.)
L'idée general de cette tâche est d'enregistrer les paramètre du setting directement pour ne pas avoir a modifier cela si on doit oouvrir 20 patient d'ffiler.
De plus, cela permettrait de retrouver pour point commun entre les differents utilisateur d'un même groupe ( ~"LIL-Lille" compte inclure ces paramètre dans la descrition de leur protocole ! )
La solution la plus simple serait peut-être d'avoir un cookie qui gère les setting pour les enregistrer.Web 2023.10https://gitlab.inria.fr/vidjil/vidjil/-/issues/2891Upload de plusieurs fichiers .fasta via un .zip / .csv2023-03-28T16:10:53+02:00Mathieu GiraudUpload de plusieurs fichiers .fasta via un .zip / .csvTâche originelle dans #1362
PAN a envoyé un .zip avec 4 fichiers dedans. Et ça on ne sait pas faire. Il faudrait « juste » décompresser l'archive et itérer sur tous les fichiers et les remplir tous avec les mêmes propriétés.
***
Oui, c...Tâche originelle dans #1362
PAN a envoyé un .zip avec 4 fichiers dedans. Et ça on ne sait pas faire. Il faudrait « juste » décompresser l'archive et itérer sur tous les fichiers et les remplir tous avec les mêmes propriétés.
***
Oui, cela simplifierait beaucoup certains usages... mais ce n'est pas si évident à faire :
- le "sampling date" peut ne pas être le même (mais on pourrait faire une passe manuelle ensuite)
- et surtout, si on décompresse, il faut le faire dans environnement sécurisé pour que cela ne mette pas le bazar dans nos fichiers
- et éduquer les utilisateurs pour que le .zip soit uniquement des fichier fasta (pas un fichier .txt ou je ne sais quoi en plus)...
En mode production MRD, ce n'est pas forcément nécessaire (un point à la fois).
***
Mentionné par nos amis du NHS.
Pour eux, ce serait même *différents patients* ? Au passage, c'est vrai que c'est plus réaliste. En production, on a le(s) run(s) de la semaine, avec du diag, et des MRDs de patients existants
***
Vraiment pas facile...
Début de réflexion : on uploade une archive, cela ajoute les fichiers, on arrive sur un tableau avec la liste des fichiers et des controles pour ajouter au patient qu'on veut ?
On suppose par contre que producer / sequencer sont le même pour tous...
Mais primers, non.
Pb: tant que le .zip n'est pas arrivé, on ne peut pas afficher le tableau.
Bof / bof...
Il faudrait expliciter le scénario avec nos users pour voir ce qu'ils veulent vraiment.
***
Est-ce vraiment un problème de ne pas voir le tableau ? De toute façon on voit l'upload en cours dans le widget.
***
Remis au goût du jour pour Lyon ?
***
Après le R1+R2, il faudra voir si on remet cela au goût du jour.
Heinrik a exactement le problème d'uploader régulièrement >20 fichiers, il faudrait un moyen de le faire plus rapidement.
À voir comment cela pourrait marcher avec le R1+R2.
***
Discuté lors de la Rando 2016.
Pas prioritaire. L'idée pour les prochains mois est déjà d'utiliser les "runs", de voir si nos utilisateurs aiment cela.
***
Ping.
Henrik est revenu à la charge. La solution la plus simple est un upload de plusieurs fichiers pour *un même* patient. À mon avis on peut bidouiller un truc côté Javascript, à voir si c'est souhaitable (récupère tous les fichiers et les envoie 1 par 1 ou 2 par 2 au contrôleur).
***
@nobody
cc @RyanHerbWeb 2023.10https://gitlab.inria.fr/vidjil/vidjil/-/issues/2306NextSeq et 4 lanes2023-02-08T12:24:22+01:00Mathieu GiraudNextSeq et 4 lanesIl semblerait que le NextSeq produise des fichiers pour 4 lanes, soit 8 fichiers au totel (`L00[1234]_R[12]`). David ~"BEL-Belfast" a eu du mal pour les concaténer.
cc @mikael-s @flothoniIl semblerait que le NextSeq produise des fichiers pour 4 lanes, soit 8 fichiers au totel (`L00[1234]_R[12]`). David ~"BEL-Belfast" a eu du mal pour les concaténer.
cc @mikael-s @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2716Plusieurs tubes / index / fichiers pour un seul sample2023-02-08T12:21:43+01:00Mathieu GiraudPlusieurs tubes / index / fichiers pour un seul sampleMichael ~"PRA-Prague", comme ~"KIE-Kiel", uploade plusieurs fichiers pour un seul sample venant de chaque tube.
Connait-on d'autres utilisateurs qui font de même ?
C'est une manière vraiment détournée de se servir du client. Cela va enc...Michael ~"PRA-Prague", comme ~"KIE-Kiel", uploade plusieurs fichiers pour un seul sample venant de chaque tube.
Connait-on d'autres utilisateurs qui font de même ?
C'est une manière vraiment détournée de se servir du client. Cela va encore pour un échantillon de diagnostic (et encore), mais, dès qu'on a deux samples, et bien on ne voit plus rien du tout.
- Tagger ces "samples" d'une manière particulière ? Équivaudrait à changer la db pour avoir un truc plus fin que samples. Argh, trop complexe.
- Avoir un pre-process pour combiner `n` samples ?
- Le plus simple serait un `cat`, mais on perd l'info originale. Mais c'est peut-être pas grave ?
- Un pre-process qui ferait un `cat` en ajoutant l'info, et ensuite l'algo tiendrait compte de cela ?
- Et c'est encore plus complexe quand tout peut être R1/R2
(Dans l'autre sens, #1684)
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5062Nouveau preset2022-10-03T11:59:09+02:00Mathieu GiraudNouveau preset![image](/uploads/efc2b3ece3d37466851fc96a986dcd34/image.png)![image](/uploads/efc2b3ece3d37466851fc96a986dcd34/image.png)Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/5060Rapport : ne pas afficher une section vide2022-09-21T14:51:13+02:00Mathieu GiraudRapport : ne pas afficher une section videmarc duezmarc duez