Splitter un clone / ré-analyser un sous-ensemble de reads

Évoqué directement par Alice (et Matin il y a longtemps). Ma première réaction : non, l’algo ne marche pas comme cela !

Mais bon… si on est capable de récupérer les reads d’une fenêtre, on pourrait les ré-analyser avec d’autres paramètres (par exemple un -w 100 ou 200, voire un -w égal à la taille du read, comme dans l'option -!),voire avec un autre programme... le browser n’y verrait que du feu, on pourrait avoir des windows de taille différente. Au final, ce serait un bouton « split to reads ».

On s’éloigne de la philosophie de l’algo, mais pourquoi pas ? D’ailleurs, si certains reads sont trouvés par d’autres méthodes (grep, séquences connues, xxx, autre heuristique, autre logiciel…), leur id va peut-être varier.

Marc: "Cela pourrait aussi être fait directement dans la première passe de Vidjil. On détecte mauvais coverage/..., et on applique d'autres paramètres"

Avec les données de la Pitié on a tendance à rassembler des choses qui ne devraient pas l'être. Il serait bien que la taille de la fenêtre s'adapte automatiquement aux données, sans avoir à relancer le jeu de données en tâtonnant pour savoir quelle taille de fenêtre est la mieux (une puissance de 10 ou pas ? ;) )

Exemple de jeu où on fait n'importe quoi avec la taille de fenêtre par défaut : http://rbx.vidjil.org/browser/?patient=914&config=26

Argh... je pensais à cette tâche justement en voyant votre échange de mail...

Edited Mar 05, 2019 by Mathieu Giraud

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information