Avoir une meilleure modélisation des délétions à la fin du V et au début du J
Discussion du 18 janvier avec @mikael-s et @flothoni
On souhaiterait avoir un meilleur paramètre pour del_end
pour éviter des mutations proches de la fin, ce qui réduirait les soucis de #2110.
Actuellement, c'est -1
, dans const Cost VDJ = Cost(+4, -6, -10, -1, -2)
.
Ce qui fait (par rapport au score de VVVVVV
, six matches parfait en fin de V)
del_end = -1 0 +1
1 mutation
VVVVXV -10 VVVVnn -10? -8* -6*
VVVXVV -10 VVVnnn -15 -12* -9*
VVXVVV -10 VVnnnn -20 -16 -12*
VXVVVV -10 Vnnnnn -25 -20 -15
2 mutations
VVVVXXV -20 VVVVnnn -15 -12 -9*
VVVXXVV -20 VVVnnnn -20? -16* -12*
VVXXVVV -20 VVnnnnn -25 -20? -15*
VXXVVVV -20 Vnnnnnn -30 -24 -18*
XXVVVVV -20 nnnnnnn -35 -28 -21
- Colonne de gauche: on étend le V autant que possible, en prenant une pénalité
X
pour une subtitution. - Colonnes de droite: on étend plutôt le N, et donc on a des pénalités
del_end
+ on perd le+4
par position.
*
: on prend celui-là. ?
: même score que les mutations.
On souhaiterait favoriser VVVnnn
et peut-être même VVnnnn
. Des valeurs comme 0
ou même +1
ont été évoquées. Des valeurs positives permettraient effectivement de diminuer l'attrait des mutations, mais conduiraient à favoriser un TRGJ1*02
+ 3 délétions à la place d’un TRGJ1*01
.
Ou bien changer le -6
?