| Issue |
Biologie Aujourd'hui
Volume 211, Number 3, 2017
|
|
|---|---|---|
| Page(s) | 233 - 237 | |
| Section | La biologie computationnelle parle à la biologie expérimentale | |
| DOI | https://doi.org/10.1051/jbio/2017029 | |
| Published online | 7 février 2018 | |
Article Original
Nextflow : un outil efficace pour l’amélioration de la stabilité numérique des calculs en analyse génomique
Nextflow, an efficient tool to improve computation numerical stability in genomic analysis
1
Comparative Bioinformatics Group, Bioinformatics and Genomics Programme, Center for Genomic Regulation (CRG),
Dr Aiguader, 88,
08003
Barcelona, Spain
2
Universitat Pompeu Fabra (UPF),
Barcelona, Spain
* Auteur correspondant : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Reçu :
20
Octobre
2017
Résumé
La reproduction des analyses bio-informatiques de routine est difficile en raison d’une combinaison de facteurs difficiles à contrôler. Nextflow est un gestionnaire de flux (workflow manager) qui utilise la technologie des conteneurs pour assurer un déploiement et une reproductibilité efficace des pipelines d’analyse computationnelle. Les pipelines tiers peuvent être portés dans Nextflow avec un recodage minimum. Nous montrons ici à l’aide d’exemples concrets comment la quantification des niveaux d’expression, l’annotation de génomes et la reconstruction de phylogénie peuvent se révéler non reproductibles lorsqu’elles sont réalisées sur des plates-formes UNIX différentes, alors qu’elles deviennent stables lorsqu’elles sont déployées dans Nextflow. Nextflow est disponible sur www.nextflow.io.
Abstract
Reproducing routine bioinformatics analysis is challenging owing to a combination of factors hard to control for. Nextflow is a flow management framework that uses container technology to insure efficient deployment and reproducibility of computational analysis pipelines. Third party pipelines can be ported into Nextflow with minimum re-coding. We used RNA-Seq quantification, genome annotation and phylogeny reconstruction examples to show how two seemingly irreproducible analyzes can be made stable across platforms when ported into Nextflow.
Mots clés : pipelines / workflow manager / reproductibilité / Nextflow
Key words: pipelines / workflow manager / reproducibility / Nextflow
© Société de Biologie, 2018
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.
