vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2021-09-17T10:19:56+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4846"not analyzed" depuis le cpp2021-09-17T10:19:56+02:00Mathieu Giraud"not analyzed" depuis le cppDans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ...Dans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ~client.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4724Se souvenir du nombre de reads initial avant filtrage2021-03-17T15:46:46+01:00Mathieu GiraudSe souvenir du nombre de reads initial avant filtrageSuite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre ...Suite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre est juste le fasta... mettre un commentaire type `# Filtered: XXXX` au début du fasta ? (Voire d'autres choses). (Hum, ne serait plus compatible avec autre chose que vidjil...).
Me fait penser aussi à !691 (mais là ce n'est pas le cas).https://gitlab.inria.fr/vidjil/vidjil/-/issues/4719Récupérer un clone ou quelques clones en .json2021-03-31T14:52:45+02:00Mathieu GiraudRécupérer un clone ou quelques clones en .jsonSuggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?Suggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4676vidjil-format.md : mieux tester / linter / verrouiller2021-02-03T19:43:49+01:00Mathieu Giraudvidjil-format.md : mieux tester / linter / verrouiller`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 pa...`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 passe encore.
Quelques réflexions en vrac:
- rajouter un tangle+test sur le gros bloc `clones` list
- faire un "linter" de fichier `.vidjil` ? Qui lève des warnings si un champ est inconnu ?
- quand cela est fait, ce sera plus simple de donner un nouveau "nom de format" ?
(voir aussi #4570)https://gitlab.inria.fr/vidjil/vidjil/-/issues/4570Documenter comment travailler sur un format .vidjil2021-02-03T18:52:47+01:00Mathieu GiraudDocumenter comment travailler sur un format .vidjilIl serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des cl...Il serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des clones d'un .vijdil multi-sample.
Voir également, côté API, #4207 et #1589.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4452Sample metadata: How could we specify in a .vidjil file that a sample is a di...2020-08-05T15:10:21+02:00Mathieu GiraudSample metadata: How could we specify in a .vidjil file that a sample is a diagnosis sample?Or that it has other tags/properties ?
@flothoni : "see also !654"Or that it has other tags/properties ?
@flothoni : "see also !654"https://gitlab.inria.fr/vidjil/vidjil/-/issues/43270-based / 1-based2021-12-07T18:39:44+01:00Mathieu Giraud0-based / 1-basedSuite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)...Suite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)
Par contre, je pense qu'on est 0-based en *interne* du ~cpp. Mais est-ce systématique ? (Je vois par exemple "JUNCTIONstart is 1-based"). Faut-il progresser vers quelque chose de plus systématique ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4317Faire évoluer vidjil_format ?2020-06-11T22:18:16+02:00Mathieu GiraudFaire évoluer vidjil_format ?
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce norm...
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce normal qu'on n'ait pas changé le numéro de version ? Mais... si quelqu'un avait fait un script qui parsait tout `2016b` il y a quatre ans, désormais il ne parserait pas tout...
Rien de pressé, mais y-a-t-il des choses à faire évoluer ? #4316
Enfin notre ~doc là-dessus est peut-être moins complète que sur d'autres points. Rajouter des `tangle` ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4316evalue D et autres dans .vidjil2020-06-03T19:51:25+02:00Mathieu Giraudevalue D et autres dans .vidjilAcutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant ...Acutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant que la e-valeur sur D peut-être informative #2002https://gitlab.inria.fr/vidjil/vidjil/-/issues/4156Zone de commentaire par clone sur le rapport et/ou le panel info d'un clone2021-11-19T11:06:57+01:00Thonier FlorianZone de commentaire par clone sur le rapport et/ou le panel info d'un clone~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone...~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone de texte associée à chaque clone présent dans le rapport. Pour ne pas encombrer inutilement le rapport, nous pourrions imaginer un bouton"`+` ou autre à la fin de la ligne clone qui permettrai d'ajouter une zone de texte en dessous de chaque clone pour que les utilisateurs puissent y coller ce genre d'informations supplémentaires.
Point bonus; ces informations doivent-elles être sauvegardées dans le `.analysis` ? Dans ce cas quelle serait le meilleur endroit pour les rentrer ? Depuis le panel info d'un clone via une zone texte ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4099Virgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUEST2019-12-10T14:09:42+01:00Mathieu GiraudVirgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUESTHello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02...Hello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02 F or Homsap IGKV3D-11*01 F or Homsap IGKV3D-11*02 F
```
Est-ce voulu qu'il y ait une virgule `,` après le premier gène et pas ensuite ? Ou des virgules partout, sans `or`, seraient-elles plus prévisibles ?
(En interne, @flothoni garde `IGKV3-11*01` comme premier choix du V)https://gitlab.inria.fr/vidjil/vidjil/-/issues/4088Que renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?2019-12-10T10:56:36+01:00Mathieu GiraudQue renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```https://gitlab.inria.fr/vidjil/vidjil/-/issues/3852Grep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQ2019-03-21T09:04:50+01:00Mikaël SalsonGrep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQIl s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads ...Il s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads soit au format FASTQ (et donc dans ce cas les reads seront sortis en FASTQ).
Ce mélange de format empêche toute analyse par un autre logiciel sans manipulation manuelle.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3591AIRR pour la plateforme web2021-01-15T09:19:20+01:00Mathieu GiraudAIRR pour la plateforme webPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothoniPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3566Supprimer / rationaliser le format .vdj des headers ?2018-10-24T16:27:47+02:00Mathieu GiraudSupprimer / rationaliser le format .vdj des headers ?On l'a peut-être oublié, nous disons sur stdout et dans la ~doc que le `.vdj.fa` est (l'un des) "main output file"(s).
Voir aussi http://www.vidjil.org/doc/vidjil-algo/#main-output-files
```
>clone-001--IGH--0000008--0.0608%--lcl|FLN1FA...On l'a peut-être oublié, nous disons sur stdout et dans la ~doc que le `.vdj.fa` est (l'un des) "main output file"(s).
Voir aussi http://www.vidjil.org/doc/vidjil-algo/#main-output-files
```
>clone-001--IGH--0000008--0.0608%--lcl|FLN1FA001CPAUQ.1|-[106,232]-#2 - 127 bp (54% of 232.0 bp) + VDJ 1 54 73 84 85 127 IGHV3-23*05 6/ACCCGGGAGGAACAATAT/9 IGHD6-13*01 0//5 IGHJ4*02 IGH SEG_+ 1.952469e-18 1.644625e-18/3.078448e-19 {52(45)96 p CTREEQYSSWYFDFW}
CTGTACCTGCAAATGAACAGCCTG ...
```
Une fois que l'on a #2828, on peut se demander ce qu'on doit conserver.
Est-ce que ces headers sont utiles ? Oui pour ~"dev\-tests\-curated\-vdj", mais qui pourrait utiliser autre chose #3567.
On garde bien sûr la sortie `.vdj.fa`... mais :
- cas extrême : on vire ce header, ou tout ce qui est après l'espace
- ou, après la partie sans espace, on met directement le ` .tsv` AIRR #2828 (problème: trop long)
- ou au moins le *début* du .tsv, à supposer qu'on ait un ordre intelligent - (!xxx essaie de faire cela)
Dans tout les cas, au minimum, mettre la génération de tout cela dans une sous-classe de `CloneOutput` #3592.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3563Use a fasta file for -l ?2018-10-16T18:39:26+02:00Mathieu GiraudUse a fasta file for -l ?Do we have a reason to have a specific format for `-l` ?Do we have a reason to have a specific format for `-l` ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3363Documenter le format utilisé dans les fichiers `.g`2018-09-07T08:06:36+02:00Mikaël SalsonDocumenter le format utilisé dans les fichiers `.g`https://gitlab.inria.fr/vidjil/vidjil/-/issues/3362À quoi sert le ref dans les fichiers .g / à quoi sert germline_id2018-09-07T09:43:25+02:00Mikaël SalsonÀ quoi sert le ref dans les fichiers .g / à quoi sert germline_idLors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version p...Lors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version précise des germlines. Pourquoi ? À quoi cela sert ? Je comprends qu'il soit nécessaire d'avoir une version minimale mais je ne vois pas l'utilité d'imposer une version (et de devoir la changer à chaque mise à jour des germlines).https://gitlab.inria.fr/vidjil/vidjil/-/issues/3196.vidjil: better document `top` and/or make it optionnal2019-07-23T10:03:08+02:00Mathieu Giraud.vidjil: better document `top` and/or make it optionnalIn https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] =...In https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] = 0`).
It looks like that the actual `top` value used in the ~client is then computed by fuse.py. We should investigate and better document the value.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3161Vérifier le format d'IMGT2018-04-10T18:02:11+02:00Mathieu GiraudVérifier le format d'IMGTIMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.IMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.