Algo: mode "filter"
Qui sera presque notre mode principal. On prend un fasta, on renvoie un fasta.
Intéressés :
- Galaxy
- ... et peut-être même IMGT... évoqué avec VG : un filtre pour lancer avant (High)VQ ? Rêvons. #1442
out/clones.vdj.fa
est déjà presque ce qu'on veut, sauf qu'il y a le FineSegmenter et pas tout
/vidjil -G germline/TRG ~/vdj/data/runs/12-09/Lec_10-5.cut_100000.fa -r 1
À chaque fois, les 12000 windows toujours sorties, et pas de SimilarityMatrix
& 20 clones & 1000 clones & tous les 12000
representative + finesegmenter & 7,0 s & 54s & :-)
representative & 1,5 s & 2,1s & 6,3s
representative + out all windows & 2,1 s & 3,3s & 6,3s
Q: Est-ce que cela vaut la peine de lancer representative sur tous les 12000 windows ? En gros 2x plus lent. Pour la MRD, inutile, la representative suffit. On peut s'arrêter à 100 ou 1000 représentatives par défaut, avec option pour en avoir plus (par défaut, vidjil doit aller vite)
Et c'est presque transparent : dans le fichier de sortie on aura :
>clone-099----0000015--0.0604%--BF7RV:268:1192--1-[20,160]
GTGGAGGCAAGAAAGAATTCTCAAACTCTCACTTCAATCCTTACCATCAAGTCCGTAGAGAAAGAAGACATGGCCGTTTACTACTGTGCTGCGTGGGATCCTCCCGACTTATTATAAGAAACTCTTTGGCAGTGGAACAAC
>clone-100----0000015--0.0604%--BF7RV:101:1096--1-[0,143]
GTTGTTCCACTGCCAAAGAGTTTCTTATAATAATGGAGATCCCACGCAGCACAGTAGTAAACGGCCATGTCTTCTTTCTCTACGGACTTGATGGTAAGGATTGAAGTGAGAGTTTGAGAATTCTTTCTTGCCTCCACTTTGTTG
>clone-101----0000015--0.0604%--window
CCGTTTACTACTGTGCTGCGTACCACTGGTTGGTTCAAGA
>clone-102----0000015--0.0604%--window
ACTGTGCTGCGTGGGATTATAAACCACTGGTTGGTTCAAG