Export fasta: afficher d'une certaine manière les bases enlevées sur la germline
par exemple, si /-4 KDE :
KDE... ggagCCCTACAAGT
Minuscules : simple. (mais pb convention ?) Couleur, parenthèses, italique ? peu .fa - compatible Remarque de Tatiana : que faire si plusieurs séquences ? Afficher les V/J plusieurs fois ? Faire une option ?
à réfléchir avant de s'y lancer
On aurait aussi pu faire un équivalent de junction analyser: atcgatcgatcgtagcatcatc atcgAtcaAAA TATTatcatc ... mais non, il faut résister à l'envie, le but est que le segmenter avec l'affichage des germline fasse cela. Bref, on se limite pour cette tâche à un truc simple, qui garde la compatibilité avec un .fa
Discuté aussi vendredi dernier. On pourrait aller vers deux exports :
-
Un export fasta brut, comme actuellement (avec en particulier les V/D/J à la fin, groupés). Utilisation bioinfo derrière.
-
Un export avec alignement du read contre germline V/D/J, avec espaces / tiret, et majuscules/minuscules dans les germlines V/D/J pour mutations. Éventuellement avec des infos de score, e-value... Et même avec couleurs (on se rapproche du rapport...), mais en restant basé texte pour copie facile.
Le 2) est très tentant, mais fera peut-être doublon avec le segmenter ? Pas si sûr, et ce serait très agréable d'avoir cela pour nous aider à faire les .should-vdj et discuter ensemble de segmentation. D'ailleurs, même une fois que le segmenter fera ce qu'on veut, une fonctionnaité d'export du segmenter sera la bienvenue !