vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2020-05-19T17:16:23+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4293Faible proportion de reads mergés avec Flash2020-05-19T17:16:23+02:00Mikaël SalsonFaible proportion de reads mergés avec FlashExemple dans le run 37896, fichier 65545
```
[FLASH] Percent combined: 52.87%
```
Voir si avec #4171 ça change quelque chose.Exemple dans le run 37896, fichier 65545
```
[FLASH] Percent combined: 52.87%
```
Voir si avec #4171 ça change quelque chose.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4226Graines différentes pour V et J : usage2020-04-23T19:24:33+02:00Mathieu GiraudGraines différentes pour V et J : usageAprès #3954/!634.
Attend-on une remise à plat globale des graines #1364 et/ou le seul index pour tous #1169, ou déjà essaie-t-on de mettre dès maintenant quelques J plus petits ? Autre chose ?Après #3954/!634.
Attend-on une remise à plat globale des graines #1364 et/ou le seul index pour tous #1169, ou déjà essaie-t-on de mettre dès maintenant quelques J plus petits ? Autre chose ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4214Avoir l'information in frame/out of frame depuis l'algo2021-11-22T12:38:28+01:00Thonier FlorianAvoir l'information in frame/out of frame depuis l'algoUne demande de Necker qui nécessite un ajout dans l'algo.
C'est simple selon vous ? Nous devons déjà avoir de quoi le calculer non ?
Cc @magiraud @mikael-sUne demande de Necker qui nécessite un ajout dans l'algo.
C'est simple selon vous ? Nous devons déjà avoir de quoi le calculer non ?
Cc @magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4054UNSEG strand sur >5% des reads2021-03-31T17:26:04+02:00Mathieu GiraudUNSEG strand sur >5% des reads
Sur un jeu probablement ~"bio-capture", avec 0.01% détecté, on a > 90% de `too few V/J` (normal), mais 5-10% de `UNSEG strand`: http://app.vidjil.org/index.html?sample_set_id=34726&config=25
Est-ce habituel sur de tels jeux ?
Est-ce...
Sur un jeu probablement ~"bio-capture", avec 0.01% détecté, on a > 90% de `too few V/J` (normal), mais 5-10% de `UNSEG strand`: http://app.vidjil.org/index.html?sample_set_id=34726&config=25
Est-ce habituel sur de tels jeux ?
Est-ce vraiment des affectations mixtes +/-, ou un seuil mal mis où on devrait plutôt mettre `too few V/J` ?
#978 et #1273
cc @flothoni @duezhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/4024Clones with different analyses at diagnosis and follow-up2019-10-28T12:56:03+01:00Mathieu GiraudClones with different analyses at diagnosis and follow-upUsers sometimes report sequences with different analyses at diagnosis and follow-up (link to old issue ?)
@meidanis has recently seen such sequences (could you share them?).
The main reason is probably #3970. See also #2726.
We have to ...Users sometimes report sequences with different analyses at diagnosis and follow-up (link to old issue ?)
@meidanis has recently seen such sequences (could you share them?).
The main reason is probably #3970. See also #2726.
We have to be sure and to investigate and/or document things.
cc @flothoni https://gitlab.inria.fr/vidjil/vidjil/-/issues/3977Lymphotrack retourne un IGH que nous ne trouvons pas2019-09-10T15:29:03+02:00Thonier FlorianLymphotrack retourne un IGH que nous ne trouvons pasVoici l'extrait du `.affect`. Il y a seulement 11 nt qui pourrait correspondre au J. Pourtant, j'ai testé l'alignement, mais il ne concorde même pas de ce que j'ai vu avec des IGH J.
```
>seq_xxx
TCTCAGTGAAGGTTTCCTGCAAGGCTTCTGGATACACCTT...Voici l'extrait du `.affect`. Il y a seulement 11 nt qui pourrait correspondre au J. Pourtant, j'ai testé l'alignement, mais il ne concorde même pas de ce que j'ai vu avec des IGH J.
```
>seq_xxx
TCTCAGTGAAGGTTTCCTGCAAGGCTTCTGGATACACCTTCACCGGCTACTATATGCACTGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAACCCTAACAGTGGTGGCACAAACTATGCACAGAAGTTTCAGGGCAGGGTCACCATGACCAGGGACACGTCCATCAGCACAGCCTACATGGAGCTGAGCAGGCTGAGATCTGACGACACGGCCGTGTATTACTGTGCTCCGATG
# 231 ! seed IGH UNSEG only V/5' 4.500000e+01 0.000000e+00/4.500000e+01 _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
```
cc @magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3305Sortir un alignement multiple de reads d'un clone2019-03-08T17:52:08+01:00Mikaël SalsonSortir un alignement multiple de reads d'un clone(similaire mais différent de #1972)
En répondant à #3290 je me rends compte qu'il serait possible de sortir automatiquement (mais à la demande, en cliquant quelque part) un alignement multiple d'un échantillon aléatoire de reads d'un cl...(similaire mais différent de #1972)
En répondant à #3290 je me rends compte qu'il serait possible de sortir automatiquement (mais à la demande, en cliquant quelque part) un alignement multiple d'un échantillon aléatoire de reads d'un clone.
Il suffit de lancer `vidjil-algo` avec l'option `-FaW` sur le germline du clone considéré (c'est donc assez rapide) puis de lancer un alignement multiple. Ce lancement peut se faire de manière asynchrone de la même manière que se fait l'analyse (mystérieuse) de la contamination (cf. #1744).
C'est une première étape qui permettrait ensuite #1972. Cette étape permettrait déjà aux utilisatrices et utilisateurs de vérifier des données que lesquelles des doutes existent.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3214La recherche de recombinaisons inattendues n'utilise pas les version +up et +...2020-05-20T16:21:42+02:00Mikaël SalsonLa recherche de recombinaisons inattendues n'utilise pas les version +up et +down des germlinesDans un problème remonté par Aurélie (cf. https://serveur-vidjil.chrul.net/browser/index.html?set=32653&config=25) on a un réarrangement `+TRDV2 -TRDD2` ce qui devrait être trouvé comme étant unexpected. Sauf que, pour les unexpected, on...Dans un problème remonté par Aurélie (cf. https://serveur-vidjil.chrul.net/browser/index.html?set=32653&config=25) on a un réarrangement `+TRDV2 -TRDD2` ce qui devrait être trouvé comme étant unexpected. Sauf que, pour les unexpected, on n'utilise pas les parties amont et aval des gènes. Du coup il n'y a pas assez de signal pour détecter le TRDD2 (surtout qu'il n'y a que la partie intronique !).
Il faudrait donc les intégrer à la recherche de recombinaison unexepected. Dans ce cas j'imagine qu'il ne faudra prendre que les versions amont ou aval et pas du tout les versions restreintes aux gènes pour éviter des conflits (ce qui conduirait à des ambiguous).Algo -- Importanthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/3165Ikaros : les séquences communiquées sont trop longues, voir ce qu'il faut garder2020-05-20T16:25:46+02:00Mikaël SalsonIkaros : les séquences communiquées sont trop longues, voir ce qu'il faut garderLa région 3'UTR communiquée par ~"PAR-Debré" est grande (près de 800nt) et il est impossible qu'un read couvre toute la région (plus un autre intron).
Cela pose des problèmes d'analyse (#3066), à cause du grand nombre de délétions, des ...La région 3'UTR communiquée par ~"PAR-Debré" est grande (près de 800nt) et il est impossible qu'un read couvre toute la région (plus un autre intron).
Cela pose des problèmes d'analyse (#3066), à cause du grand nombre de délétions, des séquences moins pertinentes peuvent-être préférées.
Même si idéalement ça serait mieux de garder toute la séquence on peut prévoir de n'en garder qu'une partie ou de la couper en plusieurs morceaux.
D'après les documents de ~"PAR-Debré" il y a souvent un point de cassure pas très loin de la fin du 3'UTR (autour d'une centaine de nt) et les exemples qu'ils nous ont donné correspondent à ce point de cassure. Dans leur document il y a un autre point de cassure beaucoup plus lointain dans le 3'UTR qui ne peut jamais être atteint par un read en ayant une amorce à la fin du 3'UTR.
Et en fait la question se pose également pour l'intron 1 et l'intron 1 var (entre 600 et 700nt de long).
Ça serait bien de voir avec ~"PAR-Debré" ce qu'il en est : peut-on on couper en plusieurs morceaux ? ne garder qu'une partie des séquences ? y a-t-il d'autres points de cassure qui sont possibles ?Algo -- ImportantThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2818Pouvoir effectuer des analyses de translocations sur des séquences arbitraires2022-04-07T11:38:16+02:00Ryan HerbertPouvoir effectuer des analyses de translocations sur des séquences arbitrairesDebré voudraient pouvoir saisir des séquences pour les passer comme des germlines au logiciel afin d'analyser les translocations.Debré voudraient pouvoir saisir des séquences pour les passer comme des germlines au logiciel afin d'analyser les translocations.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2507Délétions Vleft / Jright : documenter, intégrer, nouvel axe2017-10-19T11:26:52+02:00Mathieu GiraudDélétions Vleft / Jright : documenter, intégrer, nouvel axeEn discutant de ~"app-stats" avec @flothoni, on s'est dit qu'on pourrait dès maintenant visualiser dans le ~"client-grid" / ~"client-bar".
- [ ] Documenter dans `doc/format-analysis.org` les champs `delRight` et `delLeft`
- [ ] Faire u...En discutant de ~"app-stats" avec @flothoni, on s'est dit qu'on pourrait dès maintenant visualiser dans le ~"client-grid" / ~"client-bar".
- [ ] Documenter dans `doc/format-analysis.org` les champs `delRight` et `delLeft`
- [ ] Faire une fonction d'accès dans clone.js pour récupére `seg.5.delRight` et `seg.3.delLeft`
- [ ] Créer deux axesWeb 2017.09Thonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2506Pas assez de clones pour des études de répertoire2019-04-08T13:24:29+02:00Mathieu GiraudPas assez de clones pour des études de répertoireK. Tarte de ~"REN-Rennes", sur des jeux de TRB, trouve qu'il n'y a pas assez de clones pour étudier la diversité et l'overlap entre des répertoires.
cc @flothoni
Pour une fois ce n'est pas #1382 (car ici un seul locus), mais #2236, ou ...K. Tarte de ~"REN-Rennes", sur des jeux de TRB, trouve qu'il n'y a pas assez de clones pour étudier la diversité et l'overlap entre des répertoires.
cc @flothoni
Pour une fois ce n'est pas #1382 (car ici un seul locus), mais #2236, ou des choses sur ~"server-fuse".https://gitlab.inria.fr/vidjil/vidjil/-/issues/2318Plusieurs recombinaisons dans une séquence, scFv2023-06-28T17:25:24+02:00Mathieu GiraudPlusieurs recombinaisons dans une séquence, scFvDiscussion avec Véronique ~"repseq-IMGT" : depuis mi-2016, V-QUEST a une option pour analyser les scFv, avec du VJ (à confirmer) après un VJ normal.
https://en.wikipedia.org/wiki/Single-chain_variable_fragment
http://www.imgt.org/IMGT_...Discussion avec Véronique ~"repseq-IMGT" : depuis mi-2016, V-QUEST a une option pour analyser les scFv, avec du VJ (à confirmer) après un VJ normal.
https://en.wikipedia.org/wiki/Single-chain_variable_fragment
http://www.imgt.org/IMGT_vquest/share/textes/imgtvquest.html#afunc
Si on souhaite un jour détecter ce type de choses, cela pose des questions à la fois côté algo et côté client.
cc @flothoni @mikael-s @aurelBZHhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2288Segmenter et MiXCR: on ne voit pas les CDR3, ni les bords V/J précis2023-03-01T16:22:07+01:00Mathieu GiraudSegmenter et MiXCR: on ne voit pas les CDR3, ni les bords V/J précisVoir par exemple http://app.vidjil.org?sample_set_id=23112&config=39&plot=lengthCDR3,Size,bar
cc @mikael-s @RyanHerbVoir par exemple http://app.vidjil.org?sample_set_id=23112&config=39&plot=lengthCDR3,Size,bar
cc @mikael-s @RyanHerbRyan HerbertRyan Herberthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2242Fort pourcentage de séquences non assemblées par PEAR2021-11-22T13:00:23+01:00Mikaël SalsonFort pourcentage de séquences non assemblées par PEARLe patient 2755 a 40% de séquences non assemblées par PEAR. Quelle en est la cause ? À creuser.
cc @flothoni @magiraudLe patient 2755 a 40% de séquences non assemblées par PEAR. Quelle en est la cause ? À creuser.
cc @flothoni @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2236Faut-il afficher 1000 clones dans le client sur un échantillon ?2019-04-08T14:18:32+02:00Mathieu GiraudFaut-il afficher 1000 clones dans le client sur un échantillon ?Discussion originale et plus fine dans #1382, depuis au moins début 2016.
Réévoqué ce matin avec ~"Paris-Pitié".
On souhaiterait afficher au plus 1000 clones (même sur un échantillon, même sur un seul système, typiquement `IGH` pour ~"b...Discussion originale et plus fine dans #1382, depuis au moins début 2016.
Réévoqué ce matin avec ~"Paris-Pitié".
On souhaiterait afficher au plus 1000 clones (même sur un échantillon, même sur un seul système, typiquement `IGH` pour ~"bio-CLL" ), et que cela ne rame pas. Indépendamment de #1382, cette tâche (uniquement ~client) réfléchit sur la pertinence d'afficher plus de clones.
cc @mikael-s @flothoni @RyanHerbhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2232Tagguer le IGH D7-27-0/92/0-J1 non recombiné d'une manière particulière2023-08-14T17:11:26+02:00Mathieu GiraudTagguer le IGH D7-27-0/92/0-J1 non recombiné d'une manière particulièreOn a reparlé des D7-J1 lors de la discussion avec ~"Paris-Pitié". Y aurait-il une manière de tagguer ces séquences ? Directement via le ~cpp, qui mettrait un `warning` affiché dans le client ?
Se feriat par une nouvelle germline non rec...On a reparlé des D7-J1 lors de la discussion avec ~"Paris-Pitié". Y aurait-il une manière de tagguer ces séquences ? Directement via le ~cpp, qui mettrait un `warning` affiché dans le client ?
Se feriat par une nouvelle germline non recombinée #1724 (avec la question de la priorité par rapport à l'heuristique habituelle ?)
cc @mikael-s @flothoni
(au passage, #1548 parlait aussi de D7-J1)Algo 2018.08Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2072Recherche des recombinaisons DDH2021-09-08T17:15:26+02:00Mikaël SalsonRecherche des recombinaisons DDHMail de @flothoni du 01/12 : le germlines.data actuel ne recherche pas de D dans le cas d'une recombinaison DJ. C'est effectivement le cas :
```
"recombinations": [ {
"5": ["IGHD_upstream.fa"],
"3": ["IGHJ...Mail de @flothoni du 01/12 : le germlines.data actuel ne recherche pas de D dans le cas d'une recombinaison DJ. C'est effectivement le cas :
```
"recombinations": [ {
"5": ["IGHD_upstream.fa"],
"3": ["IGHJ.fa"]
}],
```
Est-on d'accord qu'on voudrait le rajouter ? Ou alors seulement si l'option `-d` (recherche de D multiples) est passée ? Mais dans ce cas c'est difficile car impose d'avoir un germline qui dépend d'une option.
@magiraudThonier FlorianThonier Florianhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1968Fichiers avec plus de 2G reads et int overflow2022-06-20T18:18:26+02:00Vidjil TeamFichiers avec plus de 2G reads et int overflowRayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquen...Rayan a testé un jeu de 150M reads (fichier de ~40 GB), ce qui a mené à 37c5597e pour corriger un int overflow.
Le C++ actuel devrait pouvoir tenir jusqu'à 2^31 ~ 2G reads (quand "int" se compile comme "long"). Vu l'évolution des séquenceurs, on devrait tenir quelques mois, mais pas plus :-) Après, il faudra mettre en `unsigned long long` un certain nombre de `int` dans `fasta.{h,c}`, `stats.{h,c}` et ailleurs...
Au passage, c'est désagréable à tester :-)
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1801CD et autres choses utiles pour l'immuno en RNA-Seq2021-11-19T11:06:55+01:00Vidjil TeamCD et autres choses utiles pour l'immuno en RNA-Seq(splité depuis "Classes des Ig en RNA-Seq" #2261 ?)
On ne va pas devenir un outil générique de mapping...
... néanmoins, est-ce que cela ne vaudrait pas le coup de détecter qui pourraient arriver en RNA-Seq ? (voire en capture, cela dé...(splité depuis "Classes des Ig en RNA-Seq" #2261 ?)
On ne va pas devenir un outil générique de mapping...
... néanmoins, est-ce que cela ne vaudrait pas le coup de détecter qui pourraient arriver en RNA-Seq ? (voire en capture, cela dépend du protocole)
Par exemple au moins les CD3, CD4, CD8, CD19, CD45RA/CD45RO... ou d'autres...
***
Cela est fortement tentant d'avoir une méthode de segmentation qui fait... uniquement du mapping sur des gènes connus #1724. Hum, c'est interdit par la doxa de Vidjil (recombinaisons)... mais l'intérêt serait toujours de suivre des populations et des ratios (par exemple, un pseudo-germline avec tous les CDx, et les ratios seraient intéressants).