vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2019-12-10T10:56:36+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4088Que renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?2019-12-10T10:56:36+01:00Mathieu GiraudQue renseigner dans le .vidjil pour que le "color by N" soit fonctionnel ?Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```Question de @pduroux.
Dans `clone.js` :
```
getNlength: function () {
if (this.hasSeg('3', '5')){
return this.seg['3'].start-this.seg['5'].stop-1
```https://gitlab.inria.fr/vidjil/vidjil/-/issues/3852Grep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQ2019-03-21T09:04:50+01:00Mikaël SalsonGrep reads et vidjil-algo : le fichier résultant peut mélanger FASTA et FASTQIl s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads ...Il s'agit du fichier produit pour chaque clone de Vidjil-algo. Il contient également la séquence de la fenêtre et la séquence consensus. Ces deux séquence sont ajoutées au format fasta alors qu'il y a des chances que le fichier de reads soit au format FASTQ (et donc dans ce cas les reads seront sortis en FASTQ).
Ce mélange de format empêche toute analyse par un autre logiciel sans manipulation manuelle.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3563Use a fasta file for -l ?2018-10-16T18:39:26+02:00Mathieu GiraudUse a fasta file for -l ?Do we have a reason to have a specific format for `-l` ?Do we have a reason to have a specific format for `-l` ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/3363Documenter le format utilisé dans les fichiers `.g`2018-09-07T08:06:36+02:00Mikaël SalsonDocumenter le format utilisé dans les fichiers `.g`https://gitlab.inria.fr/vidjil/vidjil/-/issues/3362À quoi sert le ref dans les fichiers .g / à quoi sert germline_id2018-09-07T09:43:25+02:00Mikaël SalsonÀ quoi sert le ref dans les fichiers .g / à quoi sert germline_idLors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version p...Lors d'une mise à jour du germline il est nécessaire de mettre à jour les fichiers `.g` afin de faire passer le test `should-get-tests/11-get-saved-germline-id.should-get`.
Le champ `"ref"` des fichiers germlines renseigne une version précise des germlines. Pourquoi ? À quoi cela sert ? Je comprends qu'il soit nécessaire d'avoir une version minimale mais je ne vois pas l'utilité d'imposer une version (et de devoir la changer à chaque mise à jour des germlines).https://gitlab.inria.fr/vidjil/vidjil/-/issues/3196.vidjil: better document `top` and/or make it optionnal2019-07-23T10:03:08+02:00Mathieu Giraud.vidjil: better document `top` and/or make it optionnalIn https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] =...In https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] = 0`).
It looks like that the actual `top` value used in the ~client is then computed by fuse.py. We should investigate and better document the value.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3161Vérifier le format d'IMGT2018-04-10T18:02:11+02:00Mathieu GiraudVérifier le format d'IMGTIMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.IMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3159json: simple ou double quotes ?2018-04-10T11:35:48+02:00Mathieu Giraudjson: simple ou double quotes ?Je pensais jusqu'à il y a cinq minutes que `'bla'` et `"bla"` passaient également en json... et j'avais même tendance à privilégier les `'` pour alléger.
En fait seules les doubles quotes ont l'air standard, mais plusieurs implémentatio...Je pensais jusqu'à il y a cinq minutes que `'bla'` et `"bla"` passaient également en json... et j'avais même tendance à privilégier les `'` pour alléger.
En fait seules les doubles quotes ont l'air standard, mais plusieurs implémentations acceptent les deux : https://stackoverflow.com/questions/14355655/jquery-parsejson-single-quote-vs-double-quote
On suit ou pas ?
(En python et en javascript, pas de soucis pour utiliser l'un ou l'autre)https://gitlab.inria.fr/vidjil/vidjil/-/issues/3049Mettre en json structué des infos pour l'instant dans le log2022-07-26T09:51:51+02:00Mathieu GiraudMettre en json structué des infos pour l'instant dans le log@flothoni dans #2235 :
> Discuté hier: pose la question d'avoir les données au format structuré dans le json et non plus en string.@flothoni dans #2235 :
> Discuté hier: pose la question d'avoir les données au format structuré dans le json et non plus en string.json-exporthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3000Option pour afficher le json bien formaté sur stdout et/ou format_json plus i...2018-01-19T11:16:30+01:00Mathieu GiraudOption pour afficher le json bien formaté sur stdout et/ou format_json plus intéressantPlusieurs tests visent le json (`cat bla.vidjil | python format_json.py`).
J'ai plusieurs fois été frustré de ce que je pouvais tester dans le json. Une sortie "une ligne par clone" serait agréable à tester. Avoir une option pour cela d...Plusieurs tests visent le json (`cat bla.vidjil | python format_json.py`).
J'ai plusieurs fois été frustré de ce que je pouvais tester dans le json. Une sortie "une ligne par clone" serait agréable à tester. Avoir une option pour cela dans `format_json` ? Ou bien dans le ~cpp ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2955Farie des wrappers pour d'autres logiciels RepSeq2017-12-13T10:59:58+01:00Mathieu GiraudFarie des wrappers pour d'autres logiciels RepSeqhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2938Stocker la config dans le .vidjil ?2017-12-06T15:17:10+01:00Mathieu GiraudStocker la config dans le .vidjil ?On stocke actuellement dans `producer` la ligne de commande complète du ~cpp, avec les fichiers. On peut "deviner" la config, mais ce n'est pas très explicite. Voudrait-on stocker la config dedans ? A priori non, cela dépend du serveur.On stocke actuellement dans `producer` la ligne de commande complète du ~cpp, avec les fichiers. On peut "deviner" la config, mais ce n'est pas très explicite. Voudrait-on stocker la config dedans ? A priori non, cela dépend du serveur.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2873Utilisation de IGoR sur quelques séquences pour affichage dans le client2017-11-22T22:18:51+01:00Mathieu GiraudUtilisation de IGoR sur quelques séquences pour affichage dans le clientDiscuté avec Thierry.
Prendre la probabilité `--Pgen` et éventuellement les scénarios `--scenarios`, en partant des modèles qu'ils proposent (TRA, TRB, IGH).
On pourrait, soit de notre côté, soit avec eux, soit eux :
- déjà fai...Discuté avec Thierry.
Prendre la probabilité `--Pgen` et éventuellement les scénarios `--scenarios`, en partant des modèles qu'ils proposent (TRA, TRB, IGH).
On pourrait, soit de notre côté, soit avec eux, soit eux :
- déjà faire un script wrapper encodant dans un `.vidjil` et
- éventuellement, avoir directement une sortie `.vidjil` à l'intérieur de IGoR.
vdj#513
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2797Mettre à jour (et renommer) format-analysis.org2018-09-07T08:06:36+02:00Mathieu GiraudMettre à jour (et renommer) format-analysis.orgWeb 2018.01https://gitlab.inria.fr/vidjil/vidjil/-/issues/2550Être plus fin dans le choix du parseur BAM ou Fasta/Fastq2017-07-07T15:07:43+02:00Mathieu GiraudÊtre plus fin dans le choix du parseur BAM ou Fasta/FastqSuite à #2016 et c02b2b5 par @mikael-s :
> OnlineBAM instantiation is based on the file extension.
Pour l'instant cela ira !
> It could be based on the first bytes of the file (which would be more reliable).
Et/ou une option en dur p...Suite à #2016 et c02b2b5 par @mikael-s :
> OnlineBAM instantiation is based on the file extension.
Pour l'instant cela ira !
> It could be based on the first bytes of the file (which would be more reliable).
Et/ou une option en dur pour forcer tel ou tel parseur ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2329app/analyze : conserver lien entre séquence et dénomination2018-10-18T14:36:34+02:00Thonier Florianapp/analyze : conserver lien entre séquence et dénominationRemarque de Véronique :
> peux-t-on retrouver à partir d'une séquence retournée par l'app analysis la séquence d'origine ?
L'idée est de savoir si l'on met trois séquences sen même temps laquelle est laquelle dans le segmenteur.Remarque de Véronique :
> peux-t-on retrouver à partir d'une séquence retournée par l'app analysis la séquence d'origine ?
L'idée est de savoir si l'on met trois séquences sen même temps laquelle est laquelle dans le segmenteur.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2130Champ 'germlines' dans le .vidjil et germlines par défaut2017-04-25T17:24:01+02:00Mathieu GiraudChamp 'germlines' dans le .vidjil et germlines par défautEn faisant #1987, j'ai mis `species{,_taxon_id}` à la racine du `.vidjil`.
Il y a bien un champ `germlines` dans le `.vidjil`, mais il sert uniquement pour les 'custom', et est peu documenté dans `format-analysis.org`.
Que devrait-on fa...En faisant #1987, j'ai mis `species{,_taxon_id}` à la racine du `.vidjil`.
Il y a bien un champ `germlines` dans le `.vidjil`, mais il sert uniquement pour les 'custom', et est peu documenté dans `format-analysis.org`.
Que devrait-on faire de champ `germlines` ? Sert-il déjà au ~client ? Devrait-on toujours le peupler avec les infos venant de `homo-sapiens.germlines`/`germlines.data` ?
@mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2068Faire que la liste des clones et l'aligneur soient copiables en texte2021-04-01T18:56:52+02:00Mathieu GiraudFaire que la liste des clones et l'aligneur soient copiables en texteOn peut presque copier la liste des clones et faire un coller texte ailleurs, mais pour l'instant ce n'est pas très bien formaté.
On devrait pouvoir avoir des choses "compatible Fasta" du type :
`>IGHV3-7 1/7/10 D2-21 8//6 J4 [IGH] ...On peut presque copier la liste des clones et faire un coller texte ailleurs, mais pour l'instant ce n'est pas très bien formaté.
On devrait pouvoir avoir des choses "compatible Fasta" du type :
`>IGHV3-7 1/7/10 D2-21 8//6 J4 [IGH] 18.60%`
Ce serait particulièrement utile pour #2066, mais aussi en lien avec l'export.
Si on fait pareil dans le segmenteur, on pourrait avoir en plus la séquence (voire les annotations dans un certain format) ?
@tydax @mikael-s @RyanHerbmarc duezmarc duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2049Features à l'extérieur d'une séquence2020-10-14T11:29:53+02:00Mikaël SalsonFeatures à l'extérieur d'une séquenceSi une feature se trouve en dehors de notre séquence, on peut vouloir le préciser malgré tout. Cela signifie que les positions pourront être négatives ou supérieures à la longueur de la séquence. C'est une amélioration de ce qui sera réa...Si une feature se trouve en dehors de notre séquence, on peut vouloir le préciser malgré tout. Cela signifie que les positions pourront être négatives ou supérieures à la longueur de la séquence. C'est une amélioration de ce qui sera réalisé dans #2043.
Il ne faut pas non plus que ça fasse planter le segmenteur.
@flothoni @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1968Fichiers avec plus de 2G reads et int overflow2022-06-20T18:18:26+02:00Vidjil TeamFichiers avec plus de 2G reads et int overflowRayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquen...Rayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquenceurs, on devrait tenir quelques mois, mais pas plus :-) Après, il faudra mettre en `unsigned long long` un certain nombre de `int` dans `fasta.{h,c}`, `stats.{h,c}` et ailleurs...
Au passage, c'est désagréable à tester :-)
@magiraud @mikael-s