Supprimer / rationaliser le format .vdj des headers ?
On l'a peut-être oublié, nous disons sur stdout et dans la doc que le .vdj.fa
est (l'un des) "main output file"(s).
Voir aussi http://www.vidjil.org/doc/vidjil-algo/#main-output-files
>clone-001--IGH--0000008--0.0608%--lcl|FLN1FA001CPAUQ.1|-[106,232]-#2 - 127 bp (54% of 232.0 bp) + VDJ 1 54 73 84 85 127 IGHV3-23*05 6/ACCCGGGAGGAACAATAT/9 IGHD6-13*01 0//5 IGHJ4*02 IGH SEG_+ 1.952469e-18 1.644625e-18/3.078448e-19 {52(45)96 p CTREEQYSSWYFDFW}
CTGTACCTGCAAATGAACAGCCTG ...
Une fois que l'on a #2828 (closed), on peut se demander ce qu'on doit conserver. Est-ce que ces headers sont utiles ? Oui pour dev-tests-curated-vdj, mais qui pourrait utiliser autre chose #3567.
On garde bien sûr la sortie .vdj.fa
... mais :
- cas extrême : on vire ce header, ou tout ce qui est après l'espace
- ou, après la partie sans espace, on met directement le
.tsv
AIRR #2828 (closed) (problème: trop long) - ou au moins le début du .tsv, à supposer qu'on ait un ordre intelligent - (!xxx essaie de faire cela)
Dans tout les cas, au minimum, mettre la génération de tout cela dans une sous-classe de CloneOutput
#3592.