Vérifier comment le FineSegmenter gère les séquences en revcomp
Juste pour être sûr. J'aimerais voir une fois la sortie des .should-vdj rev-compés.
Sur 68 tests, seulement 4 ne passent pas en revcomp : python should-vdj-to-tap.py -r should-vdj-tests/*vdj.fa
<== should-vdj-tests/0000-nck-TRB.should-vdj.fa.rc not ok 2 - TRBV7-202 0/0/3 TRBJ2-301 - found instead 0 200 201 257 TRBV7-202 159//13 TRBJ2-301 TRB SEG_- 1.939202e-25 0.000000e+00/1.939202e-25
<== should-vdj-tests/0119-lil-IGK+-TRA+D-TRD+-TRG.should-vdj.fa.rc not ok 2 - Intron 2/0/9 KDE - found instead 0 153 154 277 Intron 116//11 KDE IGK+ SEG_- 0.000000e+00 0.000000e+00/0.000000e+00
<== should-vdj-tests/0122-lil-TRG.should-vdj.fa.rc not ok 1 - TRGV501 4/2/5 TRGJP201 - found instead 0 175 177 235 TRGV501 104/G/24 TRGJP201 TRG SEG_- 1.196297e-29 0.000000e+00/1.196297e-29
<== should-vdj-tests/0169-lil-TRA+D.should-vdj.fa.rc not ok 2 - TRDD201 13//8 TRAJ2901 - found instead 0 70 72 211 TRDD201 21/A/6 TRAJ2901 TRA+D SEG_- 2.796024e-13 2.796024e-13/7.091547e-23
Le D fonctionnait bien (ainsi que les overlap potentiels V/D et D/J), et j’ai retrouvé pourquoi : FineSegmentD travaille sur string str = getSequence().sequence.substr(l, r-l); getSequence() renvoyant déjà la séquence éventuellement rev-comp.
Le bug ne portait donc que sur l’overlap V/J, c’est corrigé par cd28a56c