vidjil issueshttps://gitlab.inria.fr/vidjil/vidjil/-/issues2021-04-06T15:06:29+02:00https://gitlab.inria.fr/vidjil/vidjil/-/issues/4631Follow-up from "Resolve "Avoir les données germline du cochon (Sus Scrofa)""2021-04-06T15:06:29+02:00Thonier FlorianFollow-up from "Resolve "Avoir les données germline du cochon (Sus Scrofa)""The following discussion from !839 should be addressed:
- [ ] @mikael-s started a [discussion](https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/839#note_428910): (+5 comments)
> Est-ce que ces différentes sous-espèces ont bien d...The following discussion from !839 should be addressed:
- [ ] @mikael-s started a [discussion](https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/839#note_428910): (+5 comments)
> Est-ce que ces différentes sous-espèces ont bien des noms de gènes différents ? Autrement dit est-ce que, par exemple, on ne va pas se retrouver avec deux IGHV1*01 chez *Sus scrofa* ?
```
IGHC=G1.fa:>M81770|IGHG1*02|Sus scrofa_Minnesota miniature swine|F|CH1|3..296|294 nt|1| | | | |294+72=366| | |
IGHC=G1.fa:>M81770|IGHG1*02|Sus scrofa_Minnesota miniature swine|F|H|297..332|36 nt|1| | | | |36+0=36| | |
IGHC=G1.fa:>M81770|IGHG1*02|Sus scrofa_Minnesota miniature swine|F|CH2|333..659|327 nt|1| | | | |327+51=378| | |
IGHC=G1.fa:>M81770|IGHG1*02|Sus scrofa_Minnesota miniature swine|F|CH3-CHS|660..986|327 nt|1| | | | |327+66=393| | |
```
>Ces 4 séquences correspondent en fait à une même séquence d'identifiant M81770 mais ce sont des régions différentes de la séquence (comme l'indiquent les positions : 3 à 296, puis 297 à 332 puis 333 à 659, et enfin 660 à 986). Bref il faudrait certainement clarifier cela, mais ça n'a pas l'air si grave qu'elles aient le même nom… puisque c'est la même séquence.https://gitlab.inria.fr/vidjil/vidjil/-/issues/4620Sous-espèces et germlines (quasi-)dupliquées2021-04-08T16:09:54+02:00Mathieu GiraudSous-espèces et germlines (quasi-)dupliquéesVu à l'occasion de https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/839#note_428910:
> @mikael-s
> > Est-ce que ces différentes sous-espèces ont bien des noms de gènes différents ? Autrement dit est-ce que, par exemple, on ne va ...Vu à l'occasion de https://gitlab.inria.fr/vidjil/vidjil/-/merge_requests/839#note_428910:
> @mikael-s
> > Est-ce que ces différentes sous-espèces ont bien des noms de gènes différents ? Autrement dit est-ce que, par exemple, on ne va pas se retrouver avec deux IGHV1\*01 chez *Sus scrofa* ?
> @flothoni
> > On a pire que ça: on a plusieurs fois les mêmes entrées pour un même combo segment/allèle/sous-espèce.
> (...)
mais au final
> > On voit que le problème ne concerne donc que les fichiers des classes et pas les germlines directement. Cependant, les séquences ne sont pas les mêmes lorsqu'il y a des duplications...
Qu'en est-il pour Mus Musculus et les autres déjà présentes ?
Que faire s'il y a vraiment une ambiguïté ?https://gitlab.inria.fr/vidjil/vidjil/-/issues/4185La présence du gène constant après le J pourrait rendre une séquence non anal...2020-02-13T17:20:55+01:00Mathieu GiraudLa présence du gène constant après le J pourrait rendre une séquence non analyséeLe cas particulier #2964 a été résolu par ~"cpp-aho". Mais le problème pourrait apparaître dans d'autres situations.
@mikael-s : "surtout pour ~"bio-rnaseq", en effet ~"bio-capture" implique J+downstream, donc moins marqué."Le cas particulier #2964 a été résolu par ~"cpp-aho". Mais le problème pourrait apparaître dans d'autres situations.
@mikael-s : "surtout pour ~"bio-rnaseq", en effet ~"bio-capture" implique J+downstream, donc moins marqué."