Taille des sorties / utilisation du disque dans un serveur, particulièrement en -y all
Beaucoup d'issues ces derniers temps sur la taille des sorties et l'occupation du disque en -y all
.
Issue ici pour faire le point, que ce soit sur les choses déjà faites ou les choses possibles.
Sur un lancement de vidjil-algo
, indépendament de tout server :
- --no-windows, --no-airr, --no-windows #3861 (closed)
- clone.fa #4386 (closed)
- .vdj.fa #4387 (closed) (et #3795 (closed))
- .vidjil allégé #4036 (#4334 (closed), #4343)
- .vidjil.gz #4253 (closed)
Sur interaction avec server-database / server-hosting :
- vijdil.gz #2015 (après #4254 (closed))
- supprimer .vidjil après insertion dans db #4388 (closed)
- nettoyer régulièrement
/tmp/
vdj#1083.
Documenter également cela:
- pour vidjil-algo, 1 sample
- pour "server requirements"
Avec 2020.06, sur -g germline/homo-sapiens.g -r 1 -y all
(pas fait -3
ou autre, mais cela devrait être négligeable)
Autres colonnes/lignes bienvenues.
S22 | L3.0 | lil #4386 (closed) | |
---|---|---|---|
.fasta.gz | 405 KB | -- | |
.fastq.gz | -- | 308 MB | |
.vidjil | 16 MB | 180 MB | |
.tsv | 3.3 MB | 30 MB | |
.vdj.fa | 3.5 MB | 56 MB | |
.windows.fa | 726 KB | 7.1 MB | |
seq/* | 43 MB | 415 MB | 15.1 GB |
total | 66 MB | 687 MB | 27.3 GB |
---- | ------ | ------ | |
.vidjil.gz | 980 K | 15 MB |
Et .edges et .log sont négligeables.
(au passage, --gz
et gzip du fichier .vidjil donnent en gros la même taille... mais pas exactement le même fichier)