Indexer séparément, mais à la suite, les up/down-stream
Nous aimons le up/down-stream. Nous avons fait #3008 (closed) pour J+down, et, précédemment, la même chose Dd2/Dd3.
Mais idéalement, on devrait distinguer des situations comme JJJJJdddd
, JJJJJCCCCC
, JJJJJ----
. Et, avec des reads non-longues, JJJJJdddddCCCC
ne devrait pas arriver.
Certes, avoir d'un côté J.fa
et de l'autre J+down.fa
fournit une solution, idem pour Dd2/Dd3, couplé avec des entrées dans germline.h
différentes (et des méthodes de segmentation différentes), mais on sent la recopie d'informations. Et même en situation "normale" JJJJJdddd
, on aimerait #3147, mais là cela relève plutôt du FineSegmenter.
Serait-ce possible d'avoir un mécanisme où l'on indexe directement (J + down)
, avec un kmer down
déclenché
dès le premier nucléotide de down
? Avec Aho, c'est peut-être encore plus simple à implémenter ?
Cela demanderait aussi d'adapter les méthodes de segmentation... ou possiblement #3377.
Ping #2138 (closed).