Splitter un clone / ré-analyser un sous-ensemble de reads
Évoqué directement par Alice (et Matin il y a longtemps). Ma première réaction : non, l’algo ne marche pas comme cela !
Mais bon… si on est capable de récupérer les reads d’une fenêtre, on pourrait les ré-analyser avec d’autres paramètres (par exemple un -w 100
ou 200
, voire un -w
égal à la taille du read, comme dans l'option -!
),voire avec un autre programme... le browser n’y verrait que du feu, on pourrait avoir des windows de taille différente. Au final, ce serait un bouton « split to reads ».
On s’éloigne de la philosophie de l’algo, mais pourquoi pas ? D’ailleurs, si certains reads sont trouvés par d’autres méthodes (grep, séquences connues, xxx, autre heuristique, autre logiciel…), leur id va peut-être varier.
Marc: "Cela pourrait aussi être fait directement dans la première passe de Vidjil. On détecte mauvais coverage/..., et on applique d'autres paramètres"
Avec les données de la Pitié on a tendance à rassembler des choses qui ne devraient pas l'être. Il serait bien que la taille de la fenêtre s'adapte automatiquement aux données, sans avoir à relancer le jeu de données en tâtonnant pour savoir quelle taille de fenêtre est la mieux (une puissance de 10 ou pas ? ;) )
Exemple de jeu où on fait n'importe quoi avec la taille de fenêtre par défaut : http://rbx.vidjil.org/browser/?patient=914&config=26
Argh... je pensais à cette tâche justement en voyant votre échange de mail...