Les séquences upstream ou downstream sont parfois trop courtes : récupérer les positions dans le génome, coller up/down
Cas remonté par V.C. (PAR-Debré) : http://app.vidjil.org/browser/?set=25751&config=25
On a une séquence DD2/DD3 qui n'est pas trouvée par Vidjil car il y a 28 délétions dans le D. Cela devrait normalement nous laisser 20nt dans la séquence (40 de upstream plus 8 de D, 48 en théorie moins les 28 délétions). Hors dans le fichier upstream la séquence ne fait que 42 nt, ce qui ne laisse que 14 nt et la jonction n'est pas détectée (e-valeur trop élevée).
Or nous n'avons que 42 nt car la séquence que nous récupérons est au début du locus de M22153.1
et l'API du NCBI ne permet pas de récupérer les positions qui précèdent (avec des positions négatives, par exemple).