Représentative : mesure de qualité
(voir aussi "Représentative : trop courte ?")
Il faudrait avoir une mesure de qualité globale de la représentative (.fastq, autre tâche, voir ailleurs). Vu les expériences rapportées dans "Représentative : trop courte ?", dans de nombreux cas cela fonctionne très bien et on aurait quelque chose qui s'approche de 1.0. Mais cela serait un bon outil pour détecter s'il y a eu des problèmes, notamment si on se met à segmenter olé-olé.
- ratio de la longueur de la représentative / des reads (maximum, moyen, médiane ?)
- ratio de kmers ?
Dans les deux cas, ce ne serait pas grave si on considère uniquement le dernier BinReadStorage (et si vraiment on voudrait avoir une mesure exacte, on pourrait stocker des choses en plus dans le BinReadStorage).
Au final, c'est presque plus important d'avoir une mesure de confiance que d'améliorer le calcul :-)
"coverage", c'est bon