vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2021-11-23T16:53:31+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1644Stats sur les clones2021-11-23T16:53:31+01:00Vidjil TeamStats sur les clonesSur tous les fichiers sur rbx :
- distribution des locus
- quelles sont les clones trouvés en "xxx" ?
- quels sont les clones trouvés avec une insertion de plus de 10 ?
La BDD des clones pourrait répondre à cela... mais on pourrai...Sur tous les fichiers sur rbx :
- distribution des locus
- quelles sont les clones trouvés en "xxx" ?
- quels sont les clones trouvés avec une insertion de plus de 10 ?
La BDD des clones pourrait répondre à cela... mais on pourrait déjà avoir bcp de réponses relativement rapidement en scriptant sur les fichiers résultats `*.vidjil`.
***
(ou sur un sous-ensemble de clones, "filter")
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1975Nouvelle vue pour comparer beaucoup de samples2020-12-04T13:51:17+01:00Vidjil TeamNouvelle vue pour comparer beaucoup de samplesComment comparer 50 (ou déjà 10) samples, pour voir des contaminations ou d'autres choses ?
On pourrait avoir une nouvelle vue (et ne pas afficher le graphe) permettant d'un coup d'oeil de voir cela.
- matrice de comparaison / heatma...Comment comparer 50 (ou déjà 10) samples, pour voir des contaminations ou d'autres choses ?
On pourrait avoir une nouvelle vue (et ne pas afficher le graphe) permettant d'un coup d'oeil de voir cela.
- matrice de comparaison / heatmap : pratique, mais on n'a plus la vue clone
- autre solution qui respecterait la vue clone ? (mais quelle vue clone, tous, les clones d'un sample ?)
(Voir aussi #1974)
https://gitlab.inria.fr/vidjil/vidjil/-/issues/4422Afficher les index d'overlap2020-09-15T11:11:53+02:00Mathieu GiraudAfficher les index d'overlapFait partie de #3857.
Suite à #3830, un simple tableau dans `getHTML` ? Une nouvelle vue ?
voir aussi #4139Fait partie de #3857.
Suite à #3830, un simple tableau dans `getHTML` ? Une nouvelle vue ?
voir aussi #4139Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1641Avoir plus d'infos sur le « other »2019-10-29T14:41:44+01:00Vidjil TeamAvoir plus d'infos sur le « other »On n'en sait pas assez, il faut un meilleur contrôle pour savoir ce qui peut se cacher. D'autres le font (miXCR, IMSeq)…
***
Voir une gaussienne serait rassurant (distrib longeur, CDR3, clone/reads) ? Les longueurs, on a tout ou presque....On n'en sait pas assez, il faut un meilleur contrôle pour savoir ce qui peut se cacher. D'autres le font (miXCR, IMSeq)…
***
Voir une gaussienne serait rassurant (distrib longeur, CDR3, clone/reads) ? Les longueurs, on a tout ou presque...
La question pourrait devenir : "que peut-on analyser facilement et se souvenir dans le BinReadStorage et/ou réanalyser à la fin ?"
***
La longueur n'a pas de sens sur MiSeq
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3944Pouvoir calculer des distributions2019-09-10T09:03:26+02:00Thonier FlorianPouvoir calculer des distributionsCelles-ci doivent être compatibles avec `stats`. Le calcul se fait depuis `fuse.py`.
Ajout de 2 options:
* -d; calcul les distributions et les incluts dans le fichier vidjil sous l'entrée `distributions`
* -D; génère un fichier json ave...Celles-ci doivent être compatibles avec `stats`. Le calcul se fait depuis `fuse.py`.
Ajout de 2 options:
* -d; calcul les distributions et les incluts dans le fichier vidjil sous l'entrée `distributions`
* -D; génère un fichier json avec uniquement les distributions, compatible directement avec stats (lorsqu'il pourra ouvrir un fichier fournit par l'utilisateur)
Voici la liste actuelle, pour l'instant croisée pour faire toutes les combinaisons possibles. Il faudra, vu la taille et le temps de calcul, probablement évincer celles qui n'ont que peu d'intérêts.
```python
LIST_AXES = ["germline",
"seg5", "seg4", "seg3",
"lenSeqConsensus", "lenSeqAverage", "GCContent", "coverage",
"rearangment", "complete",
"lenSeq",
"seg5_delRight", "seg3_delLeft", "seg4_delRight", "seg3_delLeft",
"insert_53", "insert_54", "insert_43",
"lenCDR3",
"productive",
#"junction_start", "junction_stop",
# "evalue", l'arrondir ?
# "top", # "name"
#"seg5_stop", "seg3_start", "seg4_stop", "seg4_start",
# nbSamples,
# "cdr3_stop", "cdr3_start",
]
```
Testé sur un ensemble de 30 fichiers `--all` (env 30k clones en moyenne):
* génère un fichier de 2,3Go
* Dure 35 minutes
* chaque ajout dans la liste des axes multiplie par 2 le nombre de sortie calculées.