Avoir une meilleure modélisation des délétions à la fin du V et au début du J

Discussion du 18 janvier avec @mikael-s et @flothoni

On souhaiterait avoir un meilleur paramètre pour del_end pour éviter des mutations proches de la fin, ce qui réduirait les soucis de #2110. Actuellement, c'est -1, dans const Cost VDJ = Cost(+4, -6, -10, -1, -2).

Ce qui fait (par rapport au score de VVVVVV, six matches parfait en fin de V)

                 del_end = -1     0    +1

1 mutation
     VVVVXV  -10   VVVVnn -10?   -8*   -6*
     VVVXVV  -10   VVVnnn -15   -12*   -9*
     VVXVVV  -10   VVnnnn -20   -16    -12*
     VXVVVV  -10   Vnnnnn -25   -20    -15

2 mutations
    VVVVXXV  -20   VVVVnnn -15   -12    -9*
    VVVXXVV  -20   VVVnnnn -20?  -16*   -12*
    VVXXVVV  -20   VVnnnnn -25   -20?   -15*
    VXXVVVV  -20   Vnnnnnn -30   -24    -18*
    XXVVVVV  -20   nnnnnnn -35   -28    -21

Colonne de gauche: on étend le V autant que possible, en prenant une pénalité X pour une subtitution.
Colonnes de droite: on étend plutôt le N, et donc on a des pénalités del_end + on perd le +4 par position.

*: on prend celui-là. ?: même score que les mutations.

On souhaiterait favoriser VVVnnn et peut-être même VVnnnn. Des valeurs comme 0 ou même +1 ont été évoquées. Des valeurs positives permettraient effectivement de diminuer l'attrait des mutations, mais conduiraient à favoriser un TRGJ1*02 + 3 délétions à la place d’un TRGJ1*01.

Ou bien changer le -6 ?

Edited Nov 27, 2017 by Mathieu Giraud

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information