Cas particulier d'un clone retrouvé dans une analyse
Désolé pour le nom, il n'est pas très parlant.
@Patrick a remonté une information sur un clone qui avait un problème de dénomination, et qui pouvait l’intéressé car il apparaissait/disparaissait/réapparaissait: https://app.vidjil.org/?set=30814&config=25&clone=94
Le souci c'est que ce clone à une séquence consensus très courte, environ 50% de la longueur moyenne. Point positif, on lève bien une alerte.
J'ai voulu regarder de plus près ce clone. J'ai exploité la nouvelle fonction get_reads
pour obtenir un fichier se concentrant sur ses reads.
En regardant de plus près, on voit que toutes les séquences ont une première partie commune, sur les 60nt en 5', mais complètement différentes sur le reste, avec énormément de stretch de A. (voici le fichier extrait).
J'ai alors voulu jouer avec pour comprendre les affectations, rallonger les fenêtres, ...
>seq1
ATCGATTTTCTGCAGAGAGGCTGACAGTGCTCGGTAAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACTCCGGAGAATCTCGTATGCCGTCTTCTGCTTGAAAAAAAAAAAAAAACAACAATAAAGAACATAAAACTATTCTGAATGTTAAAGAGACAAAAAAACAAATAATATAGAAGATAATATTACGAGGATACAGTAGAGTAATCTAGACATAGCAAAGTAAAACAGGACCAAGAAGGTTGGG
# 18 + VJ 1 18 23 251 seed TRB SEG_+ 1.972121e-08 5.559703e-16/1.972121e-08+B+B+B+B+B+B+B+B+B+B _ _ _ _ _ _ _ _+b+b+b+b+b+b+b+b _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
#>seq1 + VJ 1 18 23 251 w55/10 seed TRB SEG_+ 1.972121e-08 5.559703e-16/1.972121e-08
On peut donc voir que l'on n'a que quelques nt vus comme V et J, sur 251nt. Je pense donc qu'il s'agit d'un artefact.
Si j'essaye de rallonger la fenêtre, je n'ai pas le résultat escompté car il m'indique qu'il shift la fenêtre, probablement trop proche en 5'. Je me retrouve donc quoi qu'il arrive avec la même fenêtre.
Quoi qu'il en soit, je ne sais pas quoi faire de cette séquence. Je peux l'ajouter dans un test, mais que devrait-on y mettre ? On ne devrait pas la ressortir comme un clone avec si peu d'affectations de kmer ?