vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2020-03-25T12:09:53+01:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4225Affectations manquantes avec l'option `-1`2020-03-25T12:09:53+01:00Mikaël SalsonAffectations manquantes avec l'option `-1`Comme noté dans #3954, avec l'option `-1` on se retrouve avec des affectations `_` là où on ne devrait pas.Comme noté dans #3954, avec l'option `-1` on se retrouve avec des affectations `_` là où on ne devrait pas.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3954Graines différentes pour V et J2020-03-26T12:45:56+01:00Mathieu GiraudGraines différentes pour V et JSpécialise #1169.
Pensé depuis le début avec ~"cpp-aho".
@mikael-s : "on stocke déjà un `index_load` différent" et "en IGK, 30kbp pour V et 300bp pour J, 100 fois moins !"
Voir aussi #1364.Spécialise #1169.
Pensé depuis le début avec ~"cpp-aho".
@mikael-s : "on stocke déjà un `index_load` différent" et "en IGK, 30kbp pour V et 300bp pour J, 100 fois moins !"
Voir aussi #1364.https://gitlab.inria.fr/vidjil/vidjil/-/issues/3296L'heuristique n'est pas symétrique lorsqu'il y a cheuvauchement entre affecta...2018-07-12T18:26:07+02:00Mikaël SalsonL'heuristique n'est pas symétrique lorsqu'il y a cheuvauchement entre affectations before et after.Dans !148 un test sur les locus échoue mais ce n'est pas imputable à la MR (voir le job en question : https://gitlab.inria.fr/vidjil/vidjil/-/jobs/117114).
La séquence n'est pas segmentée dans le sens + mais elle est segmentée en xxx da...Dans !148 un test sur les locus échoue mais ce n'est pas imputable à la MR (voir le job en question : https://gitlab.inria.fr/vidjil/vidjil/-/jobs/117114).
La séquence n'est pas segmentée dans le sens + mais elle est segmentée en xxx dans le sens -, ce qui n'est pas forcément choquant. En revanche ce qui est choquant c'est que la séquence ne soit pas segmentée de la même manière dans les deux sens.
Ce type de cas se produit lorsqu'il y a chevauchement entre la fin d'une affectation `before` et le début d'une affectation `after` alors qu'on a atteint la valeur maximale (celle qui sert à déterminer le point de jonction). On a alors un plateau de valeurs maximales.
Le problème c'est que dans un sens les affectations `before` rencontrées sur ce plateau seront comptées comme « à gauche ». Ensuite le ratio entre le nombre à gauche et le nombre à droite risque d'être trop élevé et risque de provoquer une absence de segmentation.Algo 2018.08Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2964Séquence non analysée avec la présence du gène constant2020-02-13T16:42:59+01:00Anne de SeptenvilleSéquence non analysée avec la présence du gène constantJ'ai passé dans mon dernier run, 4 patients dont le clontype a été amplifié sur cDNA (et non ADN),
Notamment celui ci, dont le clonotype n'est pas du tout reconnu par Vidjil :
https://app.vidjil.org/index.html?set=26028&config=2
La re...J'ai passé dans mon dernier run, 4 patients dont le clontype a été amplifié sur cDNA (et non ADN),
Notamment celui ci, dont le clonotype n'est pas du tout reconnu par Vidjil :
https://app.vidjil.org/index.html?set=26028&config=2
La reconnaissance du J est peut-être gênée par les mutations ?
Séquence attendue (obtenue en Sanger, et visible sans problème sur Arrest)
```
>CHA
caggtcaccttgaaggagtctggtcctgtactggttaaacccacagagaccctcacgctgacgtgcaccgtctctgggttctcactcaacagtgctagaatgggtgtgacctggatccgtcagtccccagggaaggccctggaatggcttgcacacatttcctcgaatgacgaaaaattgtatagtacatctctgaagaccaggctcaccatctccaaggacacctccagaagccaggtggtcctcaccgtgaccaacatggaccctgtggacacagccacatattactgtgcacggacacggggagtatatagttatgattctcttgagtactggggccagggagccctgatcaccgtctccgcag
```Algo -- Importanthttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2920Documenter germline/homo-sapiens.g et les méthodes de recombinaison2020-09-22T10:49:35+02:00Mathieu GiraudDocumenter germline/homo-sapiens.g et les méthodes de recombinaisonEn faisant !75/!76, je me rends compte que ni `doc/vidjil-algo.md`, ni `doc/locus.md` ne détaillent la syntaxe de `homo-sapiens.g`.
Derrière les questions de syntaxe, il y a aussi les questions de méthodes de recombinaison... qui ne so...En faisant !75/!76, je me rends compte que ni `doc/vidjil-algo.md`, ni `doc/locus.md` ne détaillent la syntaxe de `homo-sapiens.g`.
Derrière les questions de syntaxe, il y a aussi les questions de méthodes de recombinaison... qui ne sont tout simplement pas expliquées. Même si on peut renvoyer aux papiers, la ~doc doit fournir quelques éléments d'explications.
- la différence entre `53` et `543` peut sembler triviale, mais autant le dire.
- `MAX12` est évoquées cryptiquement dans `vidjil-algo.md`, c'est un peu mieux dans `locus.md`... alprs que c'est une option quasi "par défaut"
- `MAX1U` n'est pas évoqué (mais pas utilisé / à retester ?)
- et la nouvelle ONE #1724 (et d'ailleurs, trouver mieux que 31581d712d ?)
====
From duplicate #4012:
vidjil-algo is able to handle different germlines, either from IMGT/GENE-DB, or for other sources. Beyond the `-V / `-D`/`-J`options, the`.g\` file is very flexible. However (Zhang, 2019) reports that "more effort should be made to manage customization" vdj#919.
We should ensure that this is properly documented. What is the syntax of the `.g` file, and what are the recommended steps for anyone wishing to better use a custom germline ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/2913Diminuer ou décaler dynamiquement, par seuil, la taille de la fenêtre2020-04-15T09:18:25+02:00Mikaël SalsonDiminuer ou décaler dynamiquement, par seuil, la taille de la fenêtreDans #2910 on manque un clone car il y a une grosse délétion dans le V, consuisant à une séquence très courte (~129nt) empêchant de bien positionner une fenêtre de 60nt.
C'est très grave puisqu'on peut manquer des clones majoritaires. U...Dans #2910 on manque un clone car il y a une grosse délétion dans le V, consuisant à une séquence très courte (~129nt) empêchant de bien positionner une fenêtre de 60nt.
C'est très grave puisqu'on peut manquer des clones majoritaires. Une solution est de décaler la fenêtre #1580 (soit en encodant directement le décalage, dans la config, mais cela signifie que c'est systématique, soit dynamiquement mais c'est compliqué).
Une autre solution simple serait de prendre une fenêtre plus petite si on n'arrive pas à placer la fenêtre de 60nt. On pourrait essayer différentes longueurs, par ordre décroissant, par seuils (60, 50, 40, 30…) et on prend la première qui passe. Cela permet d'avoir quelque chose de reproductible. Et cela éviterait de passer à côté d'un gros clone.Algo 2017.11Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2910Clone manqué avec une grosse délétion (read trop court pour la fenêtre)2021-01-26T13:29:14+01:00Anne de SeptenvilleClone manqué avec une grosse délétion (read trop court pour la fenêtre)IGH https://app.vidjil.org/index.html?set=25178&config=2
multi+inc https://app.vidjil.org/index.html?set=25178&config=26IGH https://app.vidjil.org/index.html?set=25178&config=2
multi+inc https://app.vidjil.org/index.html?set=25178&config=26Algo 2017.11https://gitlab.inria.fr/vidjil/vidjil/-/issues/2652Aho : Séquences segmentées VD au lieu de VJ2018-07-19T19:50:13+02:00Mikaël SalsonAho : Séquences segmentées VD au lieu de VJLa séquence IGH suivante devrait être segmentée en IGH :
```
>IGHV4-31*03 0/TCCT/1 IGHD3-22 3/AGCG/8 IGHJ4 [IGH]
AGGTGCAGTGGAGCAGTCGGGCCCAGGACTGGTGAAGCCTTCACAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGTCCATAGCAGTGGTGGTTACTACTGGAGCTGGATCCGCCAGCACCC...La séquence IGH suivante devrait être segmentée en IGH :
```
>IGHV4-31*03 0/TCCT/1 IGHD3-22 3/AGCG/8 IGHJ4 [IGH]
AGGTGCAGTGGAGCAGTCGGGCCCAGGACTGGTGAAGCCTTCACAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGTCCATAGCAGTGGTGGTTACTACTGGAGCTGGATCCGCCAGCACCCAGGGAAGGGCCTGGAGTGGATTGGGTACATCTATTACAGTGGGAGCACCTATACAACCCGTCCCTCAAGAGTCGAGTTACCATATCAGTAGACACGTCTAAGAACCAGTTCTCCCTGAAGCTGAGCTCTGTGACTGCCGCGGACACGGCCGTGTATTACTGTGCGAGAGATCCTTATTACTATGATAGTAGTGGTTATTACAGCGGACTACTGGGGCCAGGAACCTGGTCACCGTCGTCCTGCAGGTAAG
```
Mais avec Aho ce n'est pas le cas. Car dans le cas où le germline est unexpected, il y a plus de k-mers Dh (les `+V` ci-dessous) que de k-mers Jh (les `+h` ci-dessous). Du coup la e-valeur est meilleure en faisant du V-D que du V-J !
```
# 258 + VJ 1 292 299 374 seed unexpected SEG_+ 3.376699e-37 0.000000e+00/3.376699e-37
_ _ _+H _ _+G _ _ _ _ _ _ _+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H
+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H ?+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+H+A _
+H ?+H+H+H+H+H+H _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _+V+V+V ?+V+V+V+V+V+V+V+V+V+V+V _ _ _ _ _ _ _+L _ _ _
_ _ _ _ _+h+h+h+h _ _ _ _ _ _ _ _ _ _ _ _ _ _+h _ _ _ _ _ _ _ _ _ _ _ _+K-L _ _ _ _ _ _ _ _ _ _ _ _
```
@magiraud Une idée autre que celle de pénaliser arbitrairement le unexpected ?
Et pas sûr que #1878 arrange les choses là-dessus.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2644Décaler automatiquement voire raccourcir la window quand il n'y a pas assez d...2018-01-18T00:35:54+01:00Mathieu GiraudDécaler automatiquement voire raccourcir la window quand il n'y a pas assez de place(Rendu compte lors de la minimisation #2643, mais s'applique aussi au cas général.)
N'est-il pas dommage que des séquences dont le point de jonction a été trouvé finissent en `TOO_SHORT_FOR_WINDOW` ? Dans ces cas-là, pourrait-on, au mom...(Rendu compte lors de la minimisation #2643, mais s'applique aussi au cas général.)
N'est-il pas dommage que des séquences dont le point de jonction a été trouvé finissent en `TOO_SHORT_FOR_WINDOW` ? Dans ces cas-là, pourrait-on, au moment du `getJunction()`, accepter de décaler un peu la fenêtre jusqu'au bord gauche/droit, voire la raccourcir ?
Ces reads ne serait pas groupées avec les autres... mais a priori ce serait peu problable de les mettre avec d'autres reads non liées, car toutes les fenêtres ainsi décalées viendraient de reads toutes trop courtes de la même façon.
Voir #1580 pour d'autres raisons de décalage.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2643SEG_METHOD_ONE: mettre un minimizer pour extraire une fenêtre normalisée2021-02-10T19:47:40+01:00Mathieu GiraudSEG_METHOD_ONE: mettre un minimizer pour extraire une fenêtre normaliséeActuellement, quand `SEG_METHOD_ONE` réussit, on extrait la fenêtre au milieu, bref cela ne clustérise pas si des reads sont légèrement décalées. Une solution serait d'extraire la fenêtre par minimisation.
- minimisation sur toutes les ...Actuellement, quand `SEG_METHOD_ONE` réussit, on extrait la fenêtre au milieu, bref cela ne clustérise pas si des reads sont légèrement décalées. Une solution serait d'extraire la fenêtre par minimisation.
- minimisation sur toutes les fenêtres possibles ?
- ou bien uniquement sur les k-mers détectés ?
On peut (ou pas) restreindre cela à des positions plutôt centrales pour éviter que la fenêtre ne soit trop au bord... mais est-ce que cela gène vraiment ? Pour les recombinaisons on peut tout à fait avoir une fenêtre au bord.https://gitlab.inria.fr/vidjil/vidjil/-/issues/2556Mettre Aho par défaut2019-03-05T08:55:46+01:00Mathieu GiraudMettre Aho par défautÉvoqué par @mikael-s pour %"Algo 2017.07".
Avant #1169, on pourrait déjà mettre Aho par défaut.
Problèmes restants sur Aho :
* [ ] #2596 (xxx meilleur que recombinaison classique)
* [x] #3404 (xxx IGHV+/IGHJ+ meilleur que IGH !)
* ...Évoqué par @mikael-s pour %"Algo 2017.07".
Avant #1169, on pourrait déjà mettre Aho par défaut.
Problèmes restants sur Aho :
* [ ] #2596 (xxx meilleur que recombinaison classique)
* [x] #3404 (xxx IGHV+/IGHJ+ meilleur que IGH !)
* [x] #2652 (VD au lieu de VDJ)
* [ ] #3402 (DJ au lieu de VDJ)
* [ ] #2595 (segmentation avec un seul k-mer, mais non bloquant je dirais)Algo 2018.12Mikaël SalsonMikaël Salsonhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2318Plusieurs recombinaisons dans une séquence, scFv2023-06-28T17:25:24+02:00Mathieu GiraudPlusieurs recombinaisons dans une séquence, scFvDiscussion avec Véronique ~"repseq-IMGT" : depuis mi-2016, V-QUEST a une option pour analyser les scFv, avec du VJ (à confirmer) après un VJ normal.
https://en.wikipedia.org/wiki/Single-chain_variable_fragment
http://www.imgt.org/IMGT_...Discussion avec Véronique ~"repseq-IMGT" : depuis mi-2016, V-QUEST a une option pour analyser les scFv, avec du VJ (à confirmer) après un VJ normal.
https://en.wikipedia.org/wiki/Single-chain_variable_fragment
http://www.imgt.org/IMGT_vquest/share/textes/imgtvquest.html#afunc
Si on souhaite un jour détecter ce type de choses, cela pose des questions à la fois côté algo et côté client.
cc @flothoni @mikael-s @aurelBZHhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2314Une séquence TRG en xxx2018-07-20T18:57:21+02:00Mathieu GiraudUne séquence TRG en xxxhttp://app.vidjil.org/index.html?sample_set_id=23190&config=25
Une séquence traine en `xxx` alors qu'elle est bien fine segmentée en `TRG`:
```
>TRGV10*01 4/GTTT/7 TRGJP1*01 186 nt, 1125 reads (0.064%, 1973.68% of unexpected)
AGCATG...http://app.vidjil.org/index.html?sample_set_id=23190&config=25
Une séquence traine en `xxx` alors qu'elle est bien fine segmentée en `TRG`:
```
>TRGV10*01 4/GTTT/7 TRGJP1*01 186 nt, 1125 reads (0.064%, 1973.68% of unexpected)
AGCATGGGTAAGACAAGCAACAAAGTGGAGGCAAGAAAGAATTCTCAAACTCTCACTTCAATCCTTACCATCAAGTCCGTAGAGAAAGAAGACATGGCCGTTTACTACTGTGCTGCGTCGTTGG
GGTT
TTGGTTGGTTCAAGATATTTGCTGAAGGGACTAAGCTCATAGTAACTTCGCCTGGTAA
```
cc @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/2107Indication onlyV trompeuse sur anayse de capture2021-03-22T09:31:46+01:00Thonier FlorianIndication onlyV trompeuse sur anayse de captureSur un set issu d'analyses de Necker :
Sur 4 millions de séquences issus de capture, avec de nombreuses sondes autre que les J, on a une forte proportion de séquences faussement anotées "only V" suite à quelques Kmer éparses trouvés da...Sur un set issu d'analyses de Necker :
Sur 4 millions de séquences issus de capture, avec de nombreuses sondes autre que les J, on a une forte proportion de séquences faussement anotées "only V" suite à quelques Kmer éparses trouvés dans la séquence ( ~25% des reads sont concernés).
En détails, ceux-ci ne sont composés que de 5 ou 6 kmer répartis sur toute la longueur du read.
@magiraud @mikael-s Algo 2017.03https://gitlab.inria.fr/vidjil/vidjil/-/issues/1779xxx problème dans le nommage de certains clones2017-02-04T10:12:16+01:00Vidjil Teamxxx problème dans le nommage de certains cloneshttp://rbx.vidjil.org/browser/?patient=1347&config=25
Nom de la séquence : Unexpected -/home/vidjil/vidjil-release//germline//TRBV.fa /+/home/vidjil/vidjil-release//germline//IGHV.fa
***
d65a9c9 : c'était une feature, ou bien j'étais bou...http://rbx.vidjil.org/browser/?patient=1347&config=25
Nom de la séquence : Unexpected -/home/vidjil/vidjil-release//germline//TRBV.fa /+/home/vidjil/vidjil-release//germline//IGHV.fa
***
d65a9c9 : c'était une feature, ou bien j'étais bourré ?
Disons que, en ligne de commande, ce sera souvent " Unexpected germline/TRBV.fa", ce qui peut être souhaitable, en particulier si on a "mouse/TRBV.fa" ou bien "new-germline/TRBV.fa".
Ici, c'est illisible parce que le chemin est absolu. Est-ce que cela pourrait être géré plutôt par le browser ? Comme tu veux, c'est vrai que ce n'est pas joli actuellement.
Si on veut changer cela dans le C++, il suffit de faire ce qu'on veut lignes 707 et 709 de segment.cpp. Il y a bien une fonction basename quelque part ?
***
ae31aba
***
@magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1756Only V / Only J alors qu'il n'y a que du bruit2017-09-19T23:50:40+02:00Vidjil TeamOnly V / Only J alors qu'il n'y a que du bruitLe mail que j'ai envoyé à McGill m'a mis la puce à l'oreille : vraiment, leurs données RNA-Seq contiendraient des dizaines de % de reads en only V ou only J ?
rbx : ~/patients/u061-McGill/V03-372-1T_1.fq
Regardé quelques reads au début ...Le mail que j'ai envoyé à McGill m'a mis la puce à l'oreille : vraiment, leurs données RNA-Seq contiendraient des dizaines de % de reads en only V ou only J ?
rbx : ~/patients/u061-McGill/V03-372-1T_1.fq
Regardé quelques reads au début (-i -x 1000 -K -uU )... et non, on fait n'importe quoi :
>Bla
CTAGGCATGGCTCCTCTCCACAGGAAAACTCCACTCCAGTGCTCAGCTTGCACCCTGGCACAGGCCAGCAGTTGCTGGAAGTCAGACACCTGAGAAGAAC
# 1 ! seed IGK UNSEG only V _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _-K _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Je pensais qu'il y avait un filtre de e-value pour only V / only J...
***
5298c86.
Différence entre 2015.10.2 et 5298c86, sur V03-372-1T_1.fq
(http://rbx.vidjil.org/browser/?patient=1233&config=25, 10M reads) :
UNSEG strand -> 52957 99.5
- UNSEG too few V/J -> 7341235 97.5
- UNSEG only V -> 1660661 94.3
- UNSEG only J -> 1041862 94.7
- UNSEG ambiguous -> 898556 99.4
+ UNSEG too few V/J -> 10786960 96.9
+ UNSEG only V -> 108604 98.5
+ UNSEG only J -> 46512 99.5
+ UNSEG ambiguous -> 238 100.0
UNSEG too short w -> 1 100.0
Cette correction de bug peut justifier 2015.12 :-)
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1735KmerSegmenter++ juste avant le FineSegmenter2018-02-23T09:35:28+01:00Vidjil TeamKmerSegmenter++ juste avant le FineSegmenterIdée de Marc lors de l'audio du 13 novembre, faisant écho à des trucs dont on avait parlé il y a un certain temps.
Faire un KmerSegmenter++ (ou MidSegmenter, ou ...) dont le but est d'identifier le V ou J (ou au moins de restreindre le ...Idée de Marc lors de l'audio du 13 novembre, faisant écho à des trucs dont on avait parlé il y a un certain temps.
Faire un KmerSegmenter++ (ou MidSegmenter, ou ...) dont le but est d'identifier le V ou J (ou au moins de restreindre le choix à quelques V/J, ou au moins les V), pour alléger le FineSegmenter.
Ce Segmenter serait lancé juste avant le FineSegmenter sur les représentatives (On n'a pas à alourdir le KmerSegmenter par défaut).
Voir aussi les commentaires de "accélérer le FineSegmenter"
***
Ah si seulement le AffectAnalyser était templaté pour pouvoir gérer ça simplement.
Oh wait…
***
Au passage, il est confirmé que -c germlines lance un Kmer avant un Fine, pour ne pas avoir à tester toutes les germlines (vidjil.cpp:1518).
Par contre, pas de Kmer relancé pour l'instant avant le Fine sur les représentatives, mais je pense que le faire serait négligeable en temps.
***
@magiraud @mikael-shttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1724SEG_METHOD_ONE : séquences non recombinées, usages2022-02-25T18:21:15+01:00Vidjil TeamSEG_METHOD_ONE : séquences non recombinées, usages
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ......
Utilisations :
- (voir Sarah) détecter les `IGHC=*.fa` (même si le read n'est pas assez long) + quantification relative
- détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ... #1801
- détecter des adaptateurs mal enlevés #1669
- standards / spikes ? ~"user-request"
(Anciens commentaires ci-dessous, implémenté depuis... 2018 !)
> Cela me tente très fort d'avoir une méthode expérimentale pour retrouver des reads matchant *une* séquence dans une germline de référence, non recombinée.
>
> Implémentation proposée (temps estimé : moins qu'un chapitre d'HdR :)
> - en KmerSegmenter, récupérer simplement le k-mer maximum + test e-valeur + extraction d'une fenêtre *centrée* les k-mers détectés. Selon ce qu'on prend comme taille de fenêtre, on fera plus ou moins n'importe quoi. (edit: mieux, minimizers, voir #2643)
> - éventuellement continuer en FineSegmenter avec une DP standard pour identifier la séquence.
>
> On s'éloigne du dogme, "Vidjil analyse les recombinaisons"... mais on reste focus sur choses immuno. Mais il ne faut pas recoder Blast/Yass :-)Algo 2022.01Mathieu GiraudMathieu Giraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1687Classes des Ig en RNA-Seq2017-12-04T14:55:59+01:00Vidjil TeamClasses des Ig en RNA-SeqOn ne va pas devenir un outil générique de mapping...
... néanmoins, est-ce que cela ne vaudrait pas le coup de détecter qui pourraient arriver en RNA-Seq ? (voire en capture, cela dépend du protocole)
Par exemple au moins les CD3, CD4...On ne va pas devenir un outil générique de mapping...
... néanmoins, est-ce que cela ne vaudrait pas le coup de détecter qui pourraient arriver en RNA-Seq ? (voire en capture, cela dépend du protocole)
Par exemple au moins les CD3, CD4, CD8, CD19, CD45RA/CD45RO... ou d'autres...
***
Et les régions constantes pour détecter la classe d'Ig
https://en.wikipedia.org/wiki/Immunoglobulin_class_switching
***
Sarah, 26 oct. 2015 :
> Je voudrais savoir s’il est possible de connaitre la chaine lourde utilisée (IgM ou autre) à partir des analyses faites sur vidjil ?
***
Dans IMGT/GENE-DB, on a :
1 4 IGHA1
3 11 IGHA2
4 18 IGHE
4 18 IGHG1
6 28 IGHG2
19 130 IGHG3
4 15 IGHG4
1 6 IGHGP
3 18 IGHM
Lecture: IGHM, 3 alleles / C-GENE-UNIT, (IGHM*01, *02, *03), mais au total 18 exons (selon les classes, CH1-4, H1-2, M1-2, entre 35 et 400 nt).
***
Attention ! IGHD*01 et IGHD*02 sont des chaînes lourdes constantes IgD, au contraire des gènes habituels IGHD1-1*01 & co.
***
Class switching : mentionné par Cristina Jiminez lors de son talk ESLHO
***
ping
***
Classes : Sarah est extrêmement intéressée.
La pseudo-germline IgJC (mail du 30 octobre, et branche ighc, rebasée à l'instant) lui convient parfaitement ("cela évitera de refaire à Rennes 150 PCRs" :-). Bref, mettre la détection des classes avant notre audio du 25 février.
***
(autres choses que les classes: bougé dans nouvelle tâche)
***
Config 37, avec /home/vidjil/custom-germlines/germlines-classes.data
+ branche ighc (pas utilisée pour l'instant, juste pour vérifier que tout passe, sauf à la marge -2/-4). Lancé sur une dizaine de fichiers de Sarah, on lui fera coucou lundi.
***
@nobody @magiraudhttps://gitlab.inria.fr/vidjil/vidjil/-/issues/1674FineSegmenter donne UNSEG < delta_min sur des belles séquences -> supprimer d...2017-11-24T10:04:37+01:00Vidjil TeamFineSegmenter donne UNSEG < delta_min sur des belles séquences -> supprimer delta_min
@flothoni : J'ai quelques séquences qui sont retrouvées dasn vidjil mais qui n'ont pas de noms définis.
En investigants un peu sur celles-ci (via imgt-quest), il semblerait que vidjil n'ai pas assez d'informations pour discriminer les ...
@flothoni : J'ai quelques séquences qui sont retrouvées dasn vidjil mais qui n'ont pas de noms définis.
En investigants un peu sur celles-ci (via imgt-quest), il semblerait que vidjil n'ai pas assez d'informations pour discriminer les segments, en general entre les alleles.
J'ai essayé de jouer sur la eval pour discriminer grossièrement, mais ça ne marche pas non plus.
Je ne sais aps si vous avez déjà eu le cas ou non.
Du coup, il faudrait que vidjil retourne au moins le nom du seg, même si il ne peut pas discriminer l'allele quand ceux qu'il identifie son similaires.
Vous voyez une autre raison ou méthode pour "recupérer" ces séquences ?
Ps , les fichiers vidjil sont en pj.
@magiraud : L'algo parfois segmente certaines séquences par l'heuristique des k-mers (`SEG_+`/`SEG_-`) mais n'arrive pas à faire la désignation V(D)J (ce qu'on appelle le "FineSegmenter"), par exemple si les séquences sont vraiment bizarres (et dans ce cas on garde quand même la séquence dans le .vidjil, un clone est identifié, mais on ne sait pas le désigner)
... mais ici c'est clairement un bug, ce sont des beaux réarrangements.
`algo/tests/bugs/bug20150909.fa`
@magiraud : c5c781e. On enlève le test, tout se passe bien.
(Les séquences ont d'autres bugs, autre tâche)
@magiraud @mikael-s @flothoniAlgo 2017.07