vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2019-07-23T10:03:08+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/3196.vidjil: better document `top` and/or make it optionnal2019-07-23T10:03:08+02:00Mathieu Giraud.vidjil: better document `top` and/or make it optionnalIn https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] =...In https://github.com/ablab/y-tools/commit/41687407b738436b2c05615afa24548f83fbc595#diff-dfa29d568694d4d8189ce3e61b44972dR79
@eodus assigns a `"top": 1` for every clone. We are doing almost the same in `vidjil-algo` (`json_clone["top"] = 0`).
It looks like that the actual `top` value used in the ~client is then computed by fuse.py. We should investigate and better document the value.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3161Vérifier le format d'IMGT2018-04-10T18:02:11+02:00Mathieu GiraudVérifier le format d'IMGTIMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.IMGT peut modifier ses APIs/csvs.
Avoir un test pour détecter si cela influence notre utilisation, si des colonnes changent.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3159json: simple ou double quotes ?2018-04-10T11:35:48+02:00Mathieu Giraudjson: simple ou double quotes ?Je pensais jusqu'à il y a cinq minutes que `'bla'` et `"bla"` passaient également en json... et j'avais même tendance à privilégier les `'` pour alléger.
En fait seules les doubles quotes ont l'air standard, mais plusieurs implémentatio...Je pensais jusqu'à il y a cinq minutes que `'bla'` et `"bla"` passaient également en json... et j'avais même tendance à privilégier les `'` pour alléger.
En fait seules les doubles quotes ont l'air standard, mais plusieurs implémentations acceptent les deux : https://stackoverflow.com/questions/14355655/jquery-parsejson-single-quote-vs-double-quote
On suit ou pas ?
(En python et en javascript, pas de soucis pour utiliser l'un ou l'autre)https://gitlab.inria.fr/vidjil/vidjil/-/issues/3154Récupérer des infos des pré-process : mécanisme2021-10-07T16:17:55+02:00Mathieu GiraudRécupérer des infos des pré-process : mécanismeVoir #2875 et #2247.
Chaque ~"server-pre-process" pourrait générer un `.json` comme le `.vidjil` (mais sans section `clones` ni ...).
Avec en particulier des warnings #2247 et des variables de qualité #2875.Voir #2875 et #2247.
Chaque ~"server-pre-process" pourrait générer un `.json` comme le `.vidjil` (mais sans section `clones` ni ...).
Avec en particulier des warnings #2247 et des variables de qualité #2875.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3000Option pour afficher le json bien formaté sur stdout et/ou format_json plus i...2018-01-19T11:16:30+01:00Mathieu GiraudOption pour afficher le json bien formaté sur stdout et/ou format_json plus intéressantPlusieurs tests visent le json (`cat bla.vidjil | python format_json.py`).
J'ai plusieurs fois été frustré de ce que je pouvais tester dans le json. Une sortie "une ligne par clone" serait agréable à tester. Avoir une option pour cela d...Plusieurs tests visent le json (`cat bla.vidjil | python format_json.py`).
J'ai plusieurs fois été frustré de ce que je pouvais tester dans le json. Une sortie "une ligne par clone" serait agréable à tester. Avoir une option pour cela dans `format_json` ? Ou bien dans le ~cpp ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2955Farie des wrappers pour d'autres logiciels RepSeq2017-12-13T10:59:58+01:00Mathieu GiraudFarie des wrappers pour d'autres logiciels RepSeqhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2938Stocker la config dans le .vidjil ?2017-12-06T15:17:10+01:00Mathieu GiraudStocker la config dans le .vidjil ?On stocke actuellement dans `producer` la ligne de commande complète du ~cpp, avec les fichiers. On peut "deviner" la config, mais ce n'est pas très explicite. Voudrait-on stocker la config dedans ? A priori non, cela dépend du serveur.On stocke actuellement dans `producer` la ligne de commande complète du ~cpp, avec les fichiers. On peut "deviner" la config, mais ce n'est pas très explicite. Voudrait-on stocker la config dedans ? A priori non, cela dépend du serveur.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2906Afficher mieux les infos de longueur dans l'info, _clone_average_length ?2017-11-29T08:01:22+01:00Mathieu GiraudAfficher mieux les infos de longueur dans l'info, _clone_average_length ?Suite à #2704.
Quand on fait `getHTMLInfo`, le `clone average length` est planqué, alors que le `length`, désormais non utilisé par défaut, est très visible.
Voir aussi #2814.
Transformer d'ailleurs dans le `.vidjil` le `_clone_average_...Suite à #2704.
Quand on fait `getHTMLInfo`, le `clone average length` est planqué, alors que le `length`, désormais non utilisé par défaut, est très visible.
Voir aussi #2814.
Transformer d'ailleurs dans le `.vidjil` le `_clone_average_length` en quelque chose de plus simple / visible `average_length` ? (en conservant la compatibilité) c65f2445bhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2873Utilisation de IGoR sur quelques séquences pour affichage dans le client2017-11-22T22:18:51+01:00Mathieu GiraudUtilisation de IGoR sur quelques séquences pour affichage dans le clientDiscuté avec Thierry.
Prendre la probabilité `--Pgen` et éventuellement les scénarios `--scenarios`, en partant des modèles qu'ils proposent (TRA, TRB, IGH).
On pourrait, soit de notre côté, soit avec eux, soit eux :
- déjà fai...Discuté avec Thierry.
Prendre la probabilité `--Pgen` et éventuellement les scénarios `--scenarios`, en partant des modèles qu'ils proposent (TRA, TRB, IGH).
On pourrait, soit de notre côté, soit avec eux, soit eux :
- déjà faire un script wrapper encodant dans un `.vidjil` et
- éventuellement, avoir directement une sortie `.vidjil` à l'intérieur de IGoR.
vdj#513
cc @flothonihttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2550Être plus fin dans le choix du parseur BAM ou Fasta/Fastq2017-07-07T15:07:43+02:00Mathieu GiraudÊtre plus fin dans le choix du parseur BAM ou Fasta/FastqSuite à #2016 et c02b2b5 par @mikael-s :
> OnlineBAM instantiation is based on the file extension.
Pour l'instant cela ira !
> It could be based on the first bytes of the file (which would be more reliable).
Et/ou une option en dur p...Suite à #2016 et c02b2b5 par @mikael-s :
> OnlineBAM instantiation is based on the file extension.
Pour l'instant cela ira !
> It could be based on the first bytes of the file (which would be more reliable).
Et/ou une option en dur pour forcer tel ou tel parseur ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2344Stocker les informations de pairage des chaînes / de single cell2019-12-13T12:23:51+01:00Mikaël SalsonStocker les informations de pairage des chaînes / de single cell#2318 parle de données avec des chaînes pairées mais nous n'avons pas de moyen de conserver le pairage dans le fichier (et ensuite dans l'affichage).
Il faut donc réfléchir à la manière d'adapter le format dans ce but.
cc @magiraud#2318 parle de données avec des chaînes pairées mais nous n'avons pas de moyen de conserver le pairage dans le fichier (et ensuite dans l'affichage).
Il faut donc réfléchir à la manière d'adapter le format dans ce but.
cc @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2329app/analyze : conserver lien entre séquence et dénomination2018-10-18T14:36:34+02:00Thonier Florianapp/analyze : conserver lien entre séquence et dénominationRemarque de Véronique :
> peux-t-on retrouver à partir d'une séquence retournée par l'app analysis la séquence d'origine ?
L'idée est de savoir si l'on met trois séquences sen même temps laquelle est laquelle dans le segmenteur.Remarque de Véronique :
> peux-t-on retrouver à partir d'une séquence retournée par l'app analysis la séquence d'origine ?
L'idée est de savoir si l'on met trois séquences sen même temps laquelle est laquelle dans le segmenteur.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2195Inclure le .g dans le .vidjil2017-04-25T17:24:01+02:00Mathieu GiraudInclure le .g dans le .vidjilSuite à #2155 et en particulier ff70521, on pourrait se dire que plusieurs informations venant des `.g` sont à récupérer dans le `.vidjil`,
en particulier pour la tracabilité (qui est tout de même bien améliorée par #2155).
Ne pourra...Suite à #2155 et en particulier ff70521, on pourrait se dire que plusieurs informations venant des `.g` sont à récupérer dans le `.vidjil`,
en particulier pour la tracabilité (qui est tout de même bien améliorée par #2155).
Ne pourrait-on pas être plus général et embarquer le `.g`dans le `.vidjil` (et générer ce qu’il faut quand on vient de la ligne de commande) ? Mais cela ajouterait 5 Ko à chaque fichier `.vidjil`… Ou bien tout sauf `systems` (ce qui est dommage quand même).
cc @mikael-s @flothoni https://gitlab.inria.fr/vidjil/vidjil/-/issues/2130Champ 'germlines' dans le .vidjil et germlines par défaut2017-04-25T17:24:01+02:00Mathieu GiraudChamp 'germlines' dans le .vidjil et germlines par défautEn faisant #1987, j'ai mis `species{,_taxon_id}` à la racine du `.vidjil`.
Il y a bien un champ `germlines` dans le `.vidjil`, mais il sert uniquement pour les 'custom', et est peu documenté dans `format-analysis.org`.
Que devrait-on fa...En faisant #1987, j'ai mis `species{,_taxon_id}` à la racine du `.vidjil`.
Il y a bien un champ `germlines` dans le `.vidjil`, mais il sert uniquement pour les 'custom', et est peu documenté dans `format-analysis.org`.
Que devrait-on faire de champ `germlines` ? Sert-il déjà au ~client ? Devrait-on toujours le peupler avec les infos venant de `homo-sapiens.germlines`/`germlines.data` ?
@mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2068Faire que la liste des clones et l'aligneur soient copiables en texte2021-04-01T18:56:52+02:00Mathieu GiraudFaire que la liste des clones et l'aligneur soient copiables en texteOn peut presque copier la liste des clones et faire un coller texte ailleurs, mais pour l'instant ce n'est pas très bien formaté.
On devrait pouvoir avoir des choses "compatible Fasta" du type :
`>IGHV3-7 1/7/10 D2-21 8//6 J4 [IGH] ...On peut presque copier la liste des clones et faire un coller texte ailleurs, mais pour l'instant ce n'est pas très bien formaté.
On devrait pouvoir avoir des choses "compatible Fasta" du type :
`>IGHV3-7 1/7/10 D2-21 8//6 J4 [IGH] 18.60%`
Ce serait particulièrement utile pour #2066, mais aussi en lien avec l'export.
Si on fait pareil dans le segmenteur, on pourrait avoir en plus la séquence (voire les annotations dans un certain format) ?
@tydax @mikael-s @RyanHerbmarc duezmarc duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2049Features à l'extérieur d'une séquence2020-10-14T11:29:53+02:00Mikaël SalsonFeatures à l'extérieur d'une séquenceSi une feature se trouve en dehors de notre séquence, on peut vouloir le préciser malgré tout. Cela signifie que les positions pourront être négatives ou supérieures à la longueur de la séquence. C'est une amélioration de ce qui sera réa...Si une feature se trouve en dehors de notre séquence, on peut vouloir le préciser malgré tout. Cela signifie que les positions pourront être négatives ou supérieures à la longueur de la séquence. C'est une amélioration de ce qui sera réalisé dans #2043.
Il ne faut pas non plus que ça fasse planter le segmenteur.
@flothoni @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1968Fichiers avec plus de 2G reads et int overflow2022-06-20T18:18:26+02:00Vidjil TeamFichiers avec plus de 2G reads et int overflowRayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquen...Rayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquenceurs, on devrait tenir quelques mois, mais pas plus :-) Après, il faudra mettre en `unsigned long long` un certain nombre de `int` dans `fasta.{h,c}`, `stats.{h,c}` et ailleurs...
Au passage, c'est désagréable à tester :-)
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1841VidjilFieldExtractor, extract : autres infos, FR1234/CDR1232020-05-28T13:08:28+02:00Vidjil TeamVidjilFieldExtractor, extract : autres infos, FR1234/CDR123https://mixcr.readthedocs.org/en/latest/export.html#default-anchor-point-positions
On devrait aussi récupérer FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4, à chaque fois avec start et stop.
***
@RyanHerbhttps://mixcr.readthedocs.org/en/latest/export.html#default-anchor-point-positions
On devrait aussi récupérer FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4, à chaque fois avec start et stop.
***
@RyanHerbhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1773clones : null si pas de clones2020-02-03T16:25:09+01:00Vidjil Teamclones : null si pas de clonesVoir "Problème avec fuse ? Nombreux fuse failed"
Le C++ ne devrait pas sortir "null" de toute façon.
Mais bon, maintenant ce n'est plus urgent.
***
@magiraudVoir "Problème avec fuse ? Nombreux fuse failed"
Le C++ ne devrait pas sortir "null" de toute façon.
Mais bon, maintenant ce n'est plus urgent.
***
@magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1544Exploiter les qualités des .fastq ?2019-09-16T16:58:44+02:00Vidjil TeamExploiter les qualités des .fastq ?Difficile, pas de standard... et pour faire quoi ? Si c'est juste pour implémenter un filtre, il doit y avoir cela en sortie des séquenceurs.
Après, cela pourrait être mieux (calcul e-valeur en fonction, k-mots en fonction ?), mais bof...Difficile, pas de standard... et pour faire quoi ? Si c'est juste pour implémenter un filtre, il doit y avoir cela en sortie des séquenceurs.
Après, cela pourrait être mieux (calcul e-valeur en fonction, k-mots en fonction ?), mais bof.
***
Disons que ce qu'on a vu sur les problèmes de représentative (https://www.producteev.com/workspace/t/553e1de8b1fa09d063000007) montrent plutôt qu'on s'en sort déjà bien sans regarder la qualité.
***
@nobody