Problème merge de séquences de tailles très différentes
Lors de l'analyse de données réalisées sur des cDNA (et non des ADN comme la plupart du temps), je me suis aperçue que mes résultats sont plus ou moins parasités par des produits d'épissage aberrants plus courts que la séquence complète attendue. Vidjil regroupe toutes ces séquences en une seule car le CDR3 (quand il est identifié) est identique. La taille moyenne des reads sur l'image type "genescan" ne reflète pas la taille effective des reads et dans certains cas, la séquence consensus choisie par Vidjil est une version "courte" ce qui fausse le résultat.
Serait-il possible de faire en sorte que des reads avec de trop grandes différences de tailles ne soient pas regroupés ?