SEG_METHOD_ONE : séquences non recombinées, usages
Utilisations :
- (voir Sarah) détecter les
IGHC=*.fa
(même si le read n'est pas assez long) + quantification relative - détecter les V / J sans détecter les recombinaisons
- détecter en RNA-Seq ou capture d'autres choses : CD, ... #1801
- détecter des adaptateurs mal enlevés #1669
- standards / spikes ? user-request
(Anciens commentaires ci-dessous, implémenté depuis... 2018 !)
Cela me tente très fort d'avoir une méthode expérimentale pour retrouver des reads matchant une séquence dans une germline de référence, non recombinée.
Implémentation proposée (temps estimé : moins qu'un chapitre d'HdR :)
- en KmerSegmenter, récupérer simplement le k-mer maximum + test e-valeur + extraction d'une fenêtre centrée les k-mers détectés. Selon ce qu'on prend comme taille de fenêtre, on fera plus ou moins n'importe quoi. (edit: mieux, minimizers, voir #2643 (closed))
- éventuellement continuer en FineSegmenter avec une DP standard pour identifier la séquence.
On s'éloigne du dogme, "Vidjil analyse les recombinaisons"... mais on reste focus sur choses immuno. Mais il ne faut pas recoder Blast/Yass :-)
Edited by Mathieu Giraud