Skip to content
GitLab
Projects Groups Topics Snippets
  • /
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
    • Contribute to GitLab
  • Sign in
  • vidjil vidjil
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributor statistics
    • Graph
    • Compare revisions
  • Issues 1.7k
    • Issues 1.7k
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 115
    • Merge requests 115
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Packages and registries
    • Packages and registries
    • Container Registry
  • Monitor
    • Monitor
    • Incidents
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • vidjilvidjil
  • vidjilvidjil
  • Issues
  • #3764
Closed
Open
Issue created Feb 28, 2019 by Mikaël Salson@mikael-sOwner

SampleReads : échantillon aléatoire des reads.

@Anne m'a parlé de problèmes de séquences consensus qui ne représentent pas vraiment l'ensemble des reads du clone.

C'est dû à notre manière de conserver les reads : quand il y en a trop on n'en conserve qu'un échantillon composé des reads les plus longs et de meilleure qualité. Dans certains cas cela peut entraîner un biais, comme favoriser les séquences qui possèdent des insertions.

On pourrait essayer de ne conserver qu'un échantillon aléatoire des reads qui, selon la statistique, devrait être représentatif de l'ensemble des reads. Si les reads ainsi conservés sont de mauvaise qualité ou trop courts… hé bien on n'aurait pas fait mieux avec l'échantillon complet.

@Anne n'hésite pas à nous pointer vers un ou deux exemples pour qu'on puisse tester si cela changerait effectivement quelque chose.

To upload designs, you'll need to enable LFS and have an admin enable hashed storage. More information
Assignee
Assign to
Time tracking