vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2020-02-03T16:25:09+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/1773clones : null si pas de clones2020-02-03T16:25:09+01:00Vidjil Teamclones : null si pas de clonesVoir "Problème avec fuse ? Nombreux fuse failed"
Le C++ ne devrait pas sortir "null" de toute façon.
Mais bon, maintenant ce n'est plus urgent.
***
@magiraudVoir "Problème avec fuse ? Nombreux fuse failed"
Le C++ ne devrait pas sortir "null" de toute façon.
Mais bon, maintenant ce n'est plus urgent.
***
@magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4570Documenter comment travailler sur un format .vidjil2021-02-03T18:52:47+01:00Mathieu GiraudDocumenter comment travailler sur un format .vidjilIl serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des cl...Il serait intéressant d'encourager les bioinformaticiens à utiliser le format vidjil, plus riche que des exports comme l'export CSV du ~client.
Dans `doc/vidjil-format`, rajouter un script python simple d'exemple pour itérer sur des clones d'un .vijdil multi-sample.
Voir également, côté API, #4207 et #1589.Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1473Axes génériques, depuis .json (coverage, evalue...)2021-07-12T16:09:41+02:00Vidjil TeamAxes génériques, depuis .json (coverage, evalue...)Être capable d'afficher n'importe quelle donnée passée dans le .json.
Notons que l'auto-découverte (comme pour le segmenter) peut ne pas être toujours très robuste et faire du bruit dans certains cas. Une solution acceptable pourrait êt...Être capable d'afficher n'importe quelle donnée passée dans le .json.
Notons que l'auto-découverte (comme pour le segmenter) peut ne pas être toujours très robuste et faire du bruit dans certains cas. Une solution acceptable pourrait être de demander à l'utilisateur de fournir une liste "axis" indiquant les axes à considérer (et en profiter pour demander le type entier / flottant / ..., ce qui peut être difficile à deviner).
***
Après réflexion, oui, il faudrait vraiment un mécanisme générique pour qu'on puisse spécifier quels axes on veut et ce qu'ils signifient (et on peut en profiter pour passer une chaîne d'aide) :
En ce moment, on aimerait pouvoir afficher
_coverage, en float, entre 0 et 1, "Coverage of the representative"
seg._evalue, en float, en échelle log, "E-value (number of k-mers)"
***
ping
***
Revenu au goût du jour le mois dernier avec "productive".
"Axes" veut dire x, y, et aussi couleur.
***
@nobodyRyan HerbertRyan Herberthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4719Récupérer un clone ou quelques clones en .json2021-03-31T14:52:45+02:00Mathieu GiraudRécupérer un clone ou quelques clones en .jsonSuggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?Suggestion de @flothoni
En filtrant le `save` (mais on n'a pas de `save` sur tout le .vidjil ?) ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4676vidjil-format.md : mieux tester / linter / verrouiller2021-02-03T19:43:49+01:00Mathieu Giraudvidjil-format.md : mieux tester / linter / verrouiller`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 pa...`vidjil-format.md` est déjà partiellement testé, via `org-babel-tangle`
Au passage, le format s'appelle `2016b`... mais qu'est-ce que cela signifie ? On a rajouté des champs au fur et à mesure, et je ne suis pas sûr qu'un truc de 2016 passe encore.
Quelques réflexions en vrac:
- rajouter un tangle+test sur le gros bloc `clones` list
- faire un "linter" de fichier `.vidjil` ? Qui lève des warnings si un champ est inconnu ?
- quand cela est fait, ce sera plus simple de donner un nouveau "nom de format" ?
(voir aussi #4570)https://gitlab.inria.fr/vidjil/vidjil/-/issues/4452Sample metadata: How could we specify in a .vidjil file that a sample is a di...2020-08-05T15:10:21+02:00Mathieu GiraudSample metadata: How could we specify in a .vidjil file that a sample is a diagnosis sample?Or that it has other tags/properties ?
@flothoni : "see also !654"Or that it has other tags/properties ?
@flothoni : "see also !654"https://gitlab.inria.fr/vidjil/vidjil/-/issues/4317Faire évoluer vidjil_format ?2020-06-11T22:18:16+02:00Mathieu GiraudFaire évoluer vidjil_format ?
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce norm...
Actuellement `vidjil_format_version` est toujours `2016b`. Est-on vraiment compatible avec les champs que l'on sortait il y a quatre ans ?
On a ajouté des choses (normalisations, distributions, ...), comme on n'a rien cassé est-ce normal qu'on n'ait pas changé le numéro de version ? Mais... si quelqu'un avait fait un script qui parsait tout `2016b` il y a quatre ans, désormais il ne parserait pas tout...
Rien de pressé, mais y-a-t-il des choses à faire évoluer ? #4316
Enfin notre ~doc là-dessus est peut-être moins complète que sur d'autres points. Rajouter des `tangle` ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4156Zone de commentaire par clone sur le rapport et/ou le panel info d'un clone2021-11-19T11:06:57+01:00Thonier FlorianZone de commentaire par clone sur le rapport et/ou le panel info d'un clone~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone...~"REN-Rennes" n'utilise pour le moment pas la génération de rapport depuis l'interface. ils copient/collent les exports fasta, font leur design d'amorce dans un fichier texte.
Une solution serait d'avoir la possibilité d'ouvrir une zone de texte associée à chaque clone présent dans le rapport. Pour ne pas encombrer inutilement le rapport, nous pourrions imaginer un bouton"`+` ou autre à la fin de la ligne clone qui permettrai d'ajouter une zone de texte en dessous de chaque clone pour que les utilisateurs puissent y coller ce genre d'informations supplémentaires.
Point bonus; ces informations doivent-elles être sauvegardées dans le `.analysis` ? Dans ce cas quelle serait le meilleur endroit pour les rentrer ? Depuis le panel info d'un clone via une zone texte ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3591AIRR pour la plateforme web2021-01-15T09:19:20+01:00Mathieu GiraudAIRR pour la plateforme webPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothoniPrend la suite de #3457.
Conversion/entrée via fuse.py #3673, natif depuis le .js #3967 ?
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3566Supprimer / rationaliser le format .vdj des headers ?2018-10-24T16:27:47+02:00Mathieu GiraudSupprimer / rationaliser le format .vdj des headers ?On l'a peut-être oublié, nous disons sur stdout et dans la ~doc que le `.vdj.fa` est (l'un des) "main output file"(s).
Voir aussi http://www.vidjil.org/doc/vidjil-algo/#main-output-files
```
>clone-001--IGH--0000008--0.0608%--lcl|FLN1FA...On l'a peut-être oublié, nous disons sur stdout et dans la ~doc que le `.vdj.fa` est (l'un des) "main output file"(s).
Voir aussi http://www.vidjil.org/doc/vidjil-algo/#main-output-files
```
>clone-001--IGH--0000008--0.0608%--lcl|FLN1FA001CPAUQ.1|-[106,232]-#2 - 127 bp (54% of 232.0 bp) + VDJ 1 54 73 84 85 127 IGHV3-23*05 6/ACCCGGGAGGAACAATAT/9 IGHD6-13*01 0//5 IGHJ4*02 IGH SEG_+ 1.952469e-18 1.644625e-18/3.078448e-19 {52(45)96 p CTREEQYSSWYFDFW}
CTGTACCTGCAAATGAACAGCCTG ...
```
Une fois que l'on a #2828, on peut se demander ce qu'on doit conserver.
Est-ce que ces headers sont utiles ? Oui pour ~"dev\-tests\-curated\-vdj", mais qui pourrait utiliser autre chose #3567.
On garde bien sûr la sortie `.vdj.fa`... mais :
- cas extrême : on vire ce header, ou tout ce qui est après l'espace
- ou, après la partie sans espace, on met directement le ` .tsv` AIRR #2828 (problème: trop long)
- ou au moins le *début* du .tsv, à supposer qu'on ait un ordre intelligent - (!xxx essaie de faire cela)
Dans tout les cas, au minimum, mettre la génération de tout cela dans une sous-classe de `CloneOutput` #3592.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2906Afficher mieux les infos de longueur dans l'info, _clone_average_length ?2017-11-29T08:01:22+01:00Mathieu GiraudAfficher mieux les infos de longueur dans l'info, _clone_average_length ?Suite à #2704.
Quand on fait `getHTMLInfo`, le `clone average length` est planqué, alors que le `length`, désormais non utilisé par défaut, est très visible.
Voir aussi #2814.
Transformer d'ailleurs dans le `.vidjil` le `_clone_average_...Suite à #2704.
Quand on fait `getHTMLInfo`, le `clone average length` est planqué, alors que le `length`, désormais non utilisé par défaut, est très visible.
Voir aussi #2814.
Transformer d'ailleurs dans le `.vidjil` le `_clone_average_length` en quelque chose de plus simple / visible `average_length` ? (en conservant la compatibilité) c65f2445bhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2344Stocker les informations de pairage des chaînes / de single cell2019-12-13T12:23:51+01:00Mikaël SalsonStocker les informations de pairage des chaînes / de single cell#2318 parle de données avec des chaînes pairées mais nous n'avons pas de moyen de conserver le pairage dans le fichier (et ensuite dans l'affichage).
Il faut donc réfléchir à la manière d'adapter le format dans ce but.
cc @magiraud#2318 parle de données avec des chaînes pairées mais nous n'avons pas de moyen de conserver le pairage dans le fichier (et ensuite dans l'affichage).
Il faut donc réfléchir à la manière d'adapter le format dans ce but.
cc @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2195Inclure le .g dans le .vidjil2017-04-25T17:24:01+02:00Mathieu GiraudInclure le .g dans le .vidjilSuite à #2155 et en particulier ff70521, on pourrait se dire que plusieurs informations venant des `.g` sont à récupérer dans le `.vidjil`,
en particulier pour la tracabilité (qui est tout de même bien améliorée par #2155).
Ne pourra...Suite à #2155 et en particulier ff70521, on pourrait se dire que plusieurs informations venant des `.g` sont à récupérer dans le `.vidjil`,
en particulier pour la tracabilité (qui est tout de même bien améliorée par #2155).
Ne pourrait-on pas être plus général et embarquer le `.g`dans le `.vidjil` (et générer ce qu’il faut quand on vient de la ligne de commande) ? Mais cela ajouterait 5 Ko à chaque fichier `.vidjil`… Ou bien tout sauf `systems` (ce qui est dommage quand même).
cc @mikael-s @flothoni https://gitlab.inria.fr/vidjil/vidjil/-/issues/3154Récupérer des infos des pré-process : mécanisme2021-10-07T16:17:55+02:00Mathieu GiraudRécupérer des infos des pré-process : mécanismeVoir #2875 et #2247.
Chaque ~"server-pre-process" pourrait générer un `.json` comme le `.vidjil` (mais sans section `clones` ni ...).
Avec en particulier des warnings #2247 et des variables de qualité #2875.Voir #2875 et #2247.
Chaque ~"server-pre-process" pourrait générer un `.json` comme le `.vidjil` (mais sans section `clones` ni ...).
Avec en particulier des warnings #2247 et des variables de qualité #2875.https://gitlab.inria.fr/vidjil/vidjil/-/issues/1544Exploiter les qualités des .fastq ?2019-09-16T16:58:44+02:00Vidjil TeamExploiter les qualités des .fastq ?Difficile, pas de standard... et pour faire quoi ? Si c'est juste pour implémenter un filtre, il doit y avoir cela en sortie des séquenceurs.
Après, cela pourrait être mieux (calcul e-valeur en fonction, k-mots en fonction ?), mais bof...Difficile, pas de standard... et pour faire quoi ? Si c'est juste pour implémenter un filtre, il doit y avoir cela en sortie des séquenceurs.
Après, cela pourrait être mieux (calcul e-valeur en fonction, k-mots en fonction ?), mais bof.
***
Disons que ce qu'on a vu sur les problèmes de représentative (https://www.producteev.com/workspace/t/553e1de8b1fa09d063000007) montrent plutôt qu'on s'en sort déjà bien sans regarder la qualité.
***
@nobodyhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4846"not analyzed" depuis le cpp2021-09-17T10:19:56+02:00Mathieu Giraud"not analyzed" depuis le cppDans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ...Dans `germline.h`:
```
#define PSEUDO_NOT_ANALYZED "not analyzed"
```
J'ai été tenté de mettre `not designated`, mais rien fait pour l'instant, vérifier dans quels cas c'est utilisé dans l'algo et ensuite les implications sur le ~client.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4724Se souvenir du nombre de reads initial avant filtrage2021-03-17T15:46:46+01:00Mathieu GiraudSe souvenir du nombre de reads initial avant filtrageSuite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre ...Suite à !906/!915, pourrait-on avoir un moyen de se souvenir combien il y avait de reads avant l'application d'un `--filter-reads`.
En fait on a ces infos dans le .vidjil du filtrage, mais bon, on ne l'a pas quand le résultat du filtre est juste le fasta... mettre un commentaire type `# Filtered: XXXX` au début du fasta ? (Voire d'autres choses). (Hum, ne serait plus compatible avec autre chose que vidjil...).
Me fait penser aussi à !691 (mais là ce n'est pas le cas).https://gitlab.inria.fr/vidjil/vidjil/-/issues/43270-based / 1-based2021-12-07T18:39:44+01:00Mathieu Giraud0-based / 1-basedSuite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)...Suite à remarque de @flothoni sur !715.
Je pense qu'on est, pour nos usagers, pour les sorties du ~cpp, et pour le ~client, partout 1-based. Probablement il faut le dire mieux dans la ~doc.
(très anciennes issues: #1942, #1958, #1869)
Par contre, je pense qu'on est 0-based en *interne* du ~cpp. Mais est-ce systématique ? (Je vois par exemple "JUNCTIONstart is 1-based"). Faut-il progresser vers quelque chose de plus systématique ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4316evalue D et autres dans .vidjil2020-06-03T19:51:25+02:00Mathieu Giraudevalue D et autres dans .vidjilAcutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant ...Acutellement, on a `seg.evalue_{left,right}`.
1) Renomme-t-on cela en `seg.{5,3}.evalue` ? C'est un breaking change du format.
2) Ajoute-t-on un `seg.4.evalue` ? C'est un champ de AIRR #3569, pour l'instant on ne le sort pas. D'autant que la e-valeur sur D peut-être informative #2002https://gitlab.inria.fr/vidjil/vidjil/-/issues/4099Virgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUEST2019-12-10T14:09:42+01:00Mathieu GiraudVirgule dans l'export AIRR en cas d'alternatives trouvées par IMGT/V-QUESTHello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02...Hello @pduroux,
Parallèlement à ce que vous faites, @flothoni travaille sur l'import AIRR de plusieurs logiciels #3673, dont IMGT/V-QUEST. On voit par exemple dans une de vos sorties AIRR:
```
Homsap IGKV3-11*01 F, or Homsap IGKV3-11*02 F or Homsap IGKV3D-11*01 F or Homsap IGKV3D-11*02 F
```
Est-ce voulu qu'il y ait une virgule `,` après le premier gène et pas ensuite ? Ou des virgules partout, sans `or`, seraient-elles plus prévisibles ?
(En interne, @flothoni garde `IGKV3-11*01` comme premier choix du V)