Numéro |
Biologie Aujourd'hui
Volume 211, Numéro 3, 2017
|
|
---|---|---|
Page(s) | 233 - 237 | |
Section | La biologie computationnelle parle à la biologie expérimentale | |
DOI | https://doi.org/10.1051/jbio/2017029 | |
Publié en ligne | 7 février 2018 |
Article Original
Nextflow : un outil efficace pour l’amélioration de la stabilité numérique des calculs en analyse génomique
Nextflow, an efficient tool to improve computation numerical stability in genomic analysis
1
Comparative Bioinformatics Group, Bioinformatics and Genomics Programme, Center for Genomic Regulation (CRG),
Dr Aiguader, 88,
08003
Barcelona, Spain
2
Universitat Pompeu Fabra (UPF),
Barcelona, Spain
* Auteur correspondant : cedric.notredame@crg.eu
Reçu :
20
Octobre
2017
La reproduction des analyses bio-informatiques de routine est difficile en raison d’une combinaison de facteurs difficiles à contrôler. Nextflow est un gestionnaire de flux (workflow manager) qui utilise la technologie des conteneurs pour assurer un déploiement et une reproductibilité efficace des pipelines d’analyse computationnelle. Les pipelines tiers peuvent être portés dans Nextflow avec un recodage minimum. Nous montrons ici à l’aide d’exemples concrets comment la quantification des niveaux d’expression, l’annotation de génomes et la reconstruction de phylogénie peuvent se révéler non reproductibles lorsqu’elles sont réalisées sur des plates-formes UNIX différentes, alors qu’elles deviennent stables lorsqu’elles sont déployées dans Nextflow. Nextflow est disponible sur www.nextflow.io.
Abstract
Reproducing routine bioinformatics analysis is challenging owing to a combination of factors hard to control for. Nextflow is a flow management framework that uses container technology to insure efficient deployment and reproducibility of computational analysis pipelines. Third party pipelines can be ported into Nextflow with minimum re-coding. We used RNA-Seq quantification, genome annotation and phylogeny reconstruction examples to show how two seemingly irreproducible analyzes can be made stable across platforms when ported into Nextflow.
Mots clés : pipelines / workflow manager / reproductibilité / Nextflow
Key words: pipelines / workflow manager / reproducibility / Nextflow
© Société de Biologie, 2018
Les statistiques affichées correspondent au cumul d'une part des vues des résumés de l'article et d'autre part des vues et téléchargements de l'article plein-texte (PDF, Full-HTML, ePub... selon les formats disponibles) sur la platefome Vision4Press.
Les statistiques sont disponibles avec un délai de 48 à 96 heures et sont mises à jour quotidiennement en semaine.
Le chargement des statistiques peut être long.