vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2021-09-17T10:19:56+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4846"not analyzed" depuis le cpp2021-09-17T10:19:56+02:00Mathieu Giraud"not analyzed" depuis le cppDans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ...Dans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ~client.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4724Se souvenir du nombre de reads initial avant filtrage2021-03-17T15:46:46+01:00Mathieu GiraudSe souvenir du nombre de reads initial avant filtrageSuite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre ...Suite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre est juste le fasta... mettre un commentaire type `# Filtered: XXXX` au début du fasta ? (Voire d'autres choses). (Hum, ne serait plus compatible avec autre chose que vidjil...).
Me fait penser aussi à !691 (mais là ce n'est pas le cas).https://gitlab.inria.fr/vidjil/vidjil/-/issues/4719Récupérer un clone ou quelques clones en .json2021-03-31T14:52:45+02:00Mathieu GiraudRécupérer un clone ou quelques clones en .jsonSuggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?Suggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4676vidjil-format.md : mieux tester / linter / verrouiller2021-02-03T19:43:49+01:00Mathieu Giraudvidjil-format.md : mieux tester / linter / verrouiller`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 pa...`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 passe encore.
Quelques réflexions en vrac:
- rajouter un tangle+test sur le gros bloc `clones` list
- faire un "linter" de fichier `.vidjil` ? Qui lève des warnings si un champ est inconnu ?
- quand cela est fait, ce sera plus simple de donner un nouveau "nom de format" ?
(voir aussi #4570)https://gitlab.inria.fr/vidjil/vidjil/-/issues/4570Documenter comment travailler sur un format .vidjil2021-02-03T18:52:47+01:00Mathieu GiraudDocumenter comment travailler sur un format .vidjilIl serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des cl...Il serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des clones d'un .vijdil multi-sample.
Voir également, côté API, #4207 et #1589.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4452Sample metadata: How could we specify in a .vidjil file that a sample is a di...2020-08-05T15:10:21+02:00Mathieu GiraudSample metadata: How could we specify in a .vidjil file that a sample is a diagnosis sample?Or that it has other tags/properties ?
@flothoni : "see also !654"Or that it has other tags/properties ?
@flothoni : "see also !654"https://gitlab.inria.fr/vidjil/vidjil/-/issues/4364Documenter `stock_order`2020-07-23T12:11:28+02:00Mikaël SalsonDocumenter `stock_order`Suite à !737Suite à !737Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/43270-based / 1-based2021-12-07T18:39:44+01:00Mathieu Giraud0-based / 1-basedSuite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)...Suite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)
Par contre, je pense qu'on est 0-based en *interne* du ~cpp. Mais est-ce systématique ? (Je vois par exemple "JUNCTIONstart is 1-based"). Faut-il progresser vers quelque chose de plus systématique ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4317Faire évoluer vidjil_format ?2020-06-11T22:18:16+02:00Mathieu GiraudFaire évoluer vidjil_format ?
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce norm...
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce normal qu'on n'ait pas changé le numéro de version ? Mais... si quelqu'un avait fait un script qui parsait tout `2016b` il y a quatre ans, désormais il ne parserait pas tout...
Rien de pressé, mais y-a-t-il des choses à faire évoluer ? #4316
Enfin notre ~doc là-dessus est peut-être moins complète que sur d'autres points. Rajouter des `tangle` ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4316evalue D et autres dans .vidjil2020-06-03T19:51:25+02:00Mathieu Giraudevalue D et autres dans .vidjilAcutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant ...Acutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant que la e-valeur sur D peut-être informative #2002https://gitlab.inria.fr/vidjil/vidjil/-/issues/4156Zone de commentaire par clone sur le rapport et/ou le panel info d'un clone2021-11-19T11:06:57+01:00Thonier FlorianZone de commentaire par clone sur le rapport et/ou le panel info d'un clone~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone...~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone de texte associée à chaque clone présent dans le rapport. Pour ne pas encombrer inutilement le rapport, nous pourrions imaginer un bouton"`+` ou autre à la fin de la ligne clone qui permettrai d'ajouter une zone de texte en dessous de chaque clone pour que les utilisateurs puissent y coller ce genre d'informations supplémentaires.
Point bonus; ces informations doivent-elles être sauvegardées dans le `.analysis` ? Dans ce cas quelle serait le meilleur endroit pour les rentrer ? Depuis le panel info d'un clone via une zone texte ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4099Virgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUEST2019-12-10T14:09:42+01:00Mathieu GiraudVirgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUESTHello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02...Hello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02 F or Homsap IGKV3D-11*01 F or Homsap IGKV3D-11*02 F
```
Est-ce voulu qu'il y ait une virgule `,` après le premier gène et pas ensuite ? Ou des virgules partout, sans `or`, seraient-elles plus prévisibles ?
(En interne, @flothoni garde `IGKV3-11*01` comme premier choix du V)https://gitlab.inria.fr/vidjil/vidjil/-/issues/4088Que renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?2019-12-10T10:56:36+01:00Mathieu GiraudQue renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```https://gitlab.inria.fr/vidjil/vidjil/-/issues/3852Grep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQ2019-03-21T09:04:50+01:00Mikaël SalsonGrep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQIl s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads ...Il s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads soit au format FASTQ (et donc dans ce cas les reads seront sortis en FASTQ).
Ce mélange de format empêche toute analyse par un autre logiciel sans manipulation manuelle.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3795Pertinence du format .vdj.fa et documentation2020-07-30T20:49:08+02:00Mathieu GiraudPertinence du format .vdj.fa et documentationLa ~doc du ~cpp a une grande partie, plutôt historique, sur `.vdj`. (Elle est certes après celle sur AIRR... mais par contre le `.vidjil` n'est pas décrit dans cette doc.)
Est-ce que ces infos sur `.vdj` sont toujours à jour ? Je doute ...La ~doc du ~cpp a une grande partie, plutôt historique, sur `.vdj`. (Elle est certes après celle sur AIRR... mais par contre le `.vidjil` n'est pas décrit dans cette doc.)
Est-ce que ces infos sur `.vdj` sont toujours à jour ? Je doute de leur pertinence vu, d'un côté, le `.vidjil`, et, de l'autre, le AIRR. Nous n'avons maintenant pas vraiment envie que des bioinfos construisent des pipelines en s'appuyant dessus, non ?
Supprimer cela ? Le réduire fortement ?Algo 2020.08https://gitlab.inria.fr/vidjil/vidjil/-/issues/3646Document normalize_reads in doc/vidjil-format.md2023-03-28T16:34:30+02:00Mathieu GiraudDocument normalize_reads in doc/vidjil-format.md#3645#3645Web 2021.05https://gitlab.inria.fr/vidjil/vidjil/-/issues/3645Extend normalization with custom normalized_reads2018-12-28T08:13:10+01:00Mathieu GiraudExtend normalization with custom normalized_readsAter #3644, implement `normalized_reads` handling in `normalize()`Ater #3644, implement `normalized_reads` handling in `normalize()`Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3591AIRR pour la plateforme web2021-01-15T09:19:20+01:00Mathieu GiraudAIRR pour la plateforme webPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothoniPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3590AIRR et nombre de reads : finalement duplicate_count ?2018-10-24T16:16:48+02:00Mathieu GiraudAIRR et nombre de reads : finalement duplicate_count ?J'allais envoyer le mail à AIRR quand je suis retonbé sur cette discussion par mail:
> > (Vidjil) Note that we focus on *clones* throughout all the Vidjil platform, not on individual reads. We plan to use the "consensus_count" key of th...J'allais envoyer le mail à AIRR quand je suis retonbé sur cette discussion par mail:
> > (Vidjil) Note that we focus on *clones* throughout all the Vidjil platform, not on individual reads. We plan to use the "consensus_count" key of the AIRR format to encode the number of reads belonging to a clone, is it the good way to go ?
> (JVH, AIRR) For counting clones, the `duplicate_count` field would be more appropriate; `consensus_count` is for UMI consensus read annotation. However, if you want a clonotype summary report (eg, count of unique CDR3s without V/J annotations), then the Rearrangement format isn't really suitable for that. This might be a format we have to consider designing, if there is enough demand for it. (This is a grey area though, because it's more of a custom analysis output than something we can standardize.)
Voir https://gitlab.inria.fr/vidjil/vidjil/issues/3457#note_125973 par @flothoni et autres commentaireshttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3585Labels should be stored in the fused file2018-12-04T18:41:45+01:00Mikaël SalsonLabels should be stored in the fused fileDiscussed with @meidanis: the labels that are stored in the .vidjil file appear to be discarded by the `fuse.py` file. This is a pity!Discussed with @meidanis: the labels that are stored in the .vidjil file appear to be discarded by the `fuse.py` file. This is a pity!Mathieu GiraudMathieu Giraud