Summary

Suivi de la dynamique des variantes structurelles dans les populations expérimentalement évoluées

Published: February 03, 2023
doi:

Summary

Nous avons développé une méthode rentable pour suivre la dynamique des allèles de polymorphisme non nucléotidique qui peut facilement être adaptée aux archives congelées de l’évolution expérimentale. Une technique de PCR triplet a été couplée à une électrophorèse capillaire parallèle automatisée pour quantifier la fréquence relative d’un allèle d’insertion au cours de l’évolution expérimentale.

Abstract

On sait maintenant que les variantes structurelles (SV) (c.-à-d. les délétions, les insertions, les duplications et les inversions) jouent un rôle important dans la variation phénotypique et, par conséquent, dans des processus tels que la détermination de la maladie ou l’adaptation à un nouvel environnement. Cependant, les variantes mononucléotidiques reçoivent beaucoup plus d’attention que les SV, probablement parce qu’elles sont plus faciles à détecter et que leurs effets phénotypiques sont plus faciles à prévoir. Le développement de technologies de séquençage profond à lecture courte et longue a fortement amélioré la détection des SV, mais la quantification de leur fréquence à partir des données de séquençage groupé (poolseq) est encore techniquement complexe et coûteuse.

Ici, nous présentons une méthode plutôt simple et peu coûteuse, qui permet aux chercheurs de suivre la dynamique de la fréquence des allèles SV. À titre d’exemple d’application, nous suivons la fréquence d’insertion d’une séquence d’insertion (SI) dans des populations expérimentales d’évolution bactérienne. Cette méthode est basée sur la conception de triplets d’amorces autour des bordures de variantes structurelles, de sorte que les amplicons produits par amplification des allèles de type sauvage (WT) et dérivés diffèrent en taille d’au moins 5%, et que leur efficacité d’amplification est similaire. La quantité de chaque amplicon est ensuite déterminée par électrophorèse capillaire parallèle et normalisée à une courbe d’étalonnage. Cette méthode peut être facilement étendue à la quantification de la fréquence d’autres variantes structurelles (délétions, duplications et inversions) et aux approches pool-seq des populations naturelles, y compris les populations pathogènes intra-hospitalisées.

Introduction

Les variantes structurelles (SV) sont des altérations de la séquence génomique, affectant généralement 50 pb ou plus. Les quatre catégories de SV décrites sont les grandes insertions, les suppressions importantes, les inversions et les duplications. Jusqu’à récemment, on accordait plus d’attention aux variantes mononucléotidiques (SNV) qu’aux variantes structurelles, en termes d’effets phénotypiques et de leur rôle en tant que déterminants génétiques de la maladie, ou de leur contribution à l’adaptation. C’est probablement parce qu’il est plus facile de détecter les SNV et de prédire leurs effets phénotypiques. Cependant, les technologies de séquençage profond à lecture courte et longue ont fortement amélioré la détection des SV, au moins dans les génomes individuels ou clonaux1. En parallèle, leurs effets phénotypiques ont été mieux caractérisés, et de nombreux exemples de leur implication en tant que déterminants génétiques de la maladie humaine 2,3 ou de l’adaptation à un nouvel environnement4 ont été documentés.

Les délétions et les insertions, souvent dues à des insertions d’éléments génétiques mobiles (MGE), sont beaucoup plus perturbatrices que les polymorphismes mononucléotidiques (SNP) et entraînent des mutations par décalage de trame et des modifications de la structure des protéines. Les délétions et les insertions de MGE dans les gènes entraînent presque toujours l’inactivation des gènes, et les insertions dans des régions non codantes peuvent entraîner une répression ou une expression constitutive de gènes adjacents lorsque les séquences d’insertion (SI) contiennent des séquences promotrices ou de terminaison5. Alors que l’élimination des gènes essentiels entraîne des effets néfastes évidents sur la condition physique bactérienne, la perte de gènes non essentiels est bénéfique dans certains cas. Malgré leurs coûts inhérents, les duplications peuvent également être avantageuses et participer à l’adaptation car elles entraînent un changement de dosage des gènes; Une augmentation de l’activité d’une protéine spécifique peut être avantageuse selon les conditions6.

Les populations d’évolution expérimentale microbienne sont généralement commencées avec des clones. Cette absence initiale de diversité génétique, combinée à la caractéristique « environnement fermé » des éprouvettes, conduit à un potentiel très limité d’évolution par gain de gènes par transfert horizontal de gènes et recombinaison de gènes. Dans ces conditions spécifiques, la contribution à l’adaptation des délétions, des duplications et de l’insertion intragénomique de MGE est particulièrement importante; Les bactéries s’adaptent souvent par des mutations de perte de fonction (principalement dues à des délétions ou à des insertions de MGE), affectant des gènes qui ne sont pas utiles dans des environnements artificiels de monoculture stables, souvent riches en nutriments7. Dans l’expérience d’évolution d’E. coli la plus longue, les insertions d’IS150 sont particulièrement fréquentes parmi les populations ayant évolué après 50 000 générations, les éléments IS représentant 35% des mutations qui atteignent une fréquence élevée dans les populations qui conservent leur taux de mutation ponctuelle ancestral8.

Les études d’évolution et de reséquence associent les technologies d’évolution expérimentale et de séquençage de nouvelle génération (NGS) pour étudier comment les bactéries s’adaptent, aux niveaux phénotypique et génomique, à différentes conditions et contraintes environnementales, telles que différentes sources de carbone et d’énergie, les antibiotiques et le stress osmotique 9,10,11 . Ces études obtiennent généralement des informations génomiques sur les populations évoluées ou les clones uniquement au point final expérimental et, dans certains cas, à un certain nombre de points temporels intermédiaires12,13,14. Ces données donnent un aperçu des gènes et des voies impliqués dans l’adaptation à un environnement donné, mais permettent rarement aux chercheurs de suivre la dynamique des allèles émergents et balayants de novo au fil du temps.

Une approche pour suivre ces dynamiques consiste à choisir un nombre limité d’allèles ségrégateurs d’intérêt (en raison de la fonction des gènes qu’ils affectent, parce qu’ils balayent en parallèle dans des populations indépendantes, etc.) et à utiliser le séquençage d’amplicon pour quantifier la proportion d’allèles, en regroupant de nombreux points temporels dans le même séquençage15. Cette méthode a été utilisée avec succès pour suivre la dynamique de variantes de petite taille (SNP ou indels de 1 pb) dans des populations expérimentalesde microbes 16 etnaturelles 17 . Cependant, dans le cas d’insertions plus grandes ou d’insertions MGE, la différence de taille des amplicons induit des différences d’efficacité de PCR, ce qui fausse la relation entre les proportions de lecture et d’allèle. Dans certains cas, la différence de taille entre les deux allèles est supérieure à la longueur classique de l’amplicon. Ici, nous avons couplé une technique de PCR triplet avec une électrophorèse capillaire parallèle automatisée pour quantifier la fréquence relative d’un allèle d’insertion basé sur la discrimination de taille. Cette approche permet d’exploiter des points temporels expérimentaux sous-utilisés pour déterminer la dynamique d’un allèle mutant émergent et suivre sa fréquence de fixation ou de perte, de manière rentable. Nous avons appliqué cette méthode pour suivre les allèles mutS émergents, mutés par insertion IS10, fournissant au génotype muté un phénotype hypermutateur.

Cette méthode nécessite deux allèles cibles avec une différence de taille de ≥5%. Tout d’abord, les triplets d’amorce sont conçus pour produire des fragments de taille similaire, qui partagent une amorce commune. Deuxièmement, les conditions de PCR sont optimisées et une courbe d’étalonnage est produite à l’aide de mélanges d’ADNg de type sauvage (WT) et mutant. Enfin, les échantillons sont amplifiés par PCR, et la fréquence relative de chaque allèle est quantifiée par électrophorèse capillaire quantitative parallèle.

Protocol

La mise en place de ce protocole nécessite une connaissance précise du point d’insertion, de suppression, d’inversion ou de duplication au sein de la séquence ancestrale. Cette information est généralement obtenue par séquençage du génome entier (WGS) des échantillons terminaux ou intermédiaires. Dans le protocole suivant, le principe général pour le cas d’une mutation d’insertion est donné pour chaque étape, à côté d’un cas représentatif où la fréquence d’une insertion IS10 dans le gène …

Representative Results

En utilisant l’ADN extrait d’un clone ancestral et d’un clone hypermutateur isolé de la population S2.11 à la génération 1 000, nous avons établi la courbe d’étalonnage illustrée à la figure 2. Les proportions mutantes réelles provenant de mélanges d’ADN préparés en laboratoire et mesurées par l’instrument d’électrophorèse capillaire parallèle ont été liées par une relation linéaire de pente 1,0706, avec un R2 de 0,9705. De plus, il y avait une bo…

Discussion

Ici, nous avons proposé une méthode rentable qui permet de suivre la dynamique des allèles SV adaptatifs émergents dans les populations expérimentales de l’évolution. Cette méthode associe des techniques classiques de PCR et une électrophorèse capillaire parallèle automatisée, ce qui permet de déterminer les quantités relatives de deux allèles. Une fois mis en place, il permet de quantifier les proportions d’allèles dans de nombreux échantillons en parallèle, et est beaucoup moins coûteux que WGS. C…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ce travail a été soutenu par l’ERC HGTCODONUSE (ERC-2015-CoG-682819) à S.B. Les données utilisées dans ces travaux ont été (en partie) produites par les installations techniques GenSeq de l’Institut des Sciences de l’Evolution de Montpellier avec le soutien du LabEx CeMEB, programme ANR « Investissements d’avenir » (ANR-10-LABX-04-01).

Materials

96 Well Skirted PCR Plate 4titude 4Ti – 0740 PCR
Agarose molecular biology grade Eurogentec EP-0010-05 Agarose gel electrophoresis 
Agilent DNF-474 HS NGS Fragment Kit Quick Guide for the Fragment Analyzer Systems Agilent PDF instruction guide
Buffer TBE Panreac appliChem A4228,5000Pc Agarose gel electrophoresis 
Calibrated Disposable Inoculating Loops and Needles LABELIANS 8175CSR40H Bacterial culture
Dneasy Blood and Tissue Kit Qiagen 69506 DNA extraction
Electrophoresis power supply Amilabo ST606T Agarose gel electrophoresis 
Fragment Analyzer Automated CE System Agilent Parallel capillary electrophoresis
Fragment DNA Ladder Agilent DNF-396, range 1-6000bp Parallel capillary electrophoresis
GENTAMICIN SULFATE SALT BIOREAGENT Sigma-Aldrich G1264-1G Bacterial culture
High Sensitivity diluent marker Agilent DNF-373 Parallel capillary electrophoresis
High Sensitivity NGS quantitative analysis kit Agilent DNF-474 Parallel capillary electrophoresis
Ladder quick load 1 kb plus DNA ladder NEB N0469S Agarose gel electrophoresis 
LB Broth, VegitoneNutriSelect Plus Millipore 28713 Bacterial culture
Master Mix PCR High Fidelity Phusion Flash Thermo Fisher Scientific F548L PCR
Primers Eurogentec PCR
Prosize data analysis software v.4 Agilent V.4 Parallel capillary electrophoresis
Qubit assays Invitrogen MAN0010876 DNA quantification
Qubit dsDNA HS Assay Kit LIFE TECHNOLOGIES SAS Q32854 DNA quantification
Thermocycler Eppendorf Ep gradients PCR
UVbox, eBOX VX5 Vilber Lourmat Agarose gel electrophoresis visualisation
Water for injectable preparation Aguettant PROAMP PCR

References

  1. Mahmoud, M., et al. Structural variant calling: the long and the short of it. Genome Biology. 20 (1), 246 (2019).
  2. Bragg, D. C., et al. Disease onset in X-linked dystonia-parkinsonism correlates with expansion of a hexameric repeat within an SVA retrotransposon in TAF1. Proceedings of the National Academy of Sciences. 114 (51), 11020-11028 (2017).
  3. Stransky, N., Cerami, E., Schalm, S., Kim, J. L., Lengauer, C. The landscape of kinase fusions in cancer. Nature Communications. 5, 4846 (2014).
  4. Tenaillon, O., et al. The molecular diversity of adaptive convergence. Science. 335 (6067), 457-461 (2012).
  5. Vandecraen, J., Chandler, M., Aertsen, A., Van Houdt, R. The impact of insertion sequences on bacterial genome plasticity and adaptability. Critical Reviews in Microbiology. 43 (6), 709-730 (2017).
  6. Andersson, D. I., Gene Hughes, D. amplification and adaptive evolution in bacteria. Annual Review of Genetics. 43, 167-195 (2009).
  7. Bailey, S. F., Bataillon, T. Can the experimental evolution programme help us elucidate the genetic basis of adaptation in nature. Molecular Ecology. 25 (1), 203-218 (2016).
  8. Consuegra, J., et al. Insertion-sequence-mediated mutations both promote and constrain evolvability during a long-term experiment with bacteria. Nature Communications. 12 (1), 980 (2021).
  9. Burch, C. L., Romanchuk, A., Kelly, M., Wu, Y., Jones, C. D. Genome-wide determination of barriers to horizontal gene transfer. bioRxiv. , (2022).
  10. Slomka, S., et al. Experimental evolution of Bacillus subtilis reveals the evolutionary dynamics of horizontal gene transfer and suggests adaptive and neutral effects. Genetics. 216 (2), 543-558 (2020).
  11. Choudhury, D., Saini, S. Evolution of Escherichia coli in different carbon environments for 2,000 generations. Journal of Evolutionary Biology. 32 (12), 1331-1341 (2019).
  12. Tenaillon, O., et al. Tempo and mode of genome evolution in a 50,000-generation experiment. Nature. 536 (7615), 165-170 (2016).
  13. Behringer, M. G., et al. Escherichiacoli cultures maintain stable subpopulation structure during long-term evolution. Proceedings of the National Academy of Sciences. 115 (20), 4642-4650 (2018).
  14. Voordeckers, K., et al. Adaptation to high ethanol reveals complex evolutionary pathways. PLoS Genetics. 11 (11), 1005635 (2015).
  15. Levy, S. F., et al. Quantitative evolutionary dynamics using high-resolution lineage tracking. Nature. 519 (7542), 181-186 (2015).
  16. Bruger, E. L., Marx, C. J. A decade of genome sequencing has revolutionized studies of experimental evolution. Current Opinion in Microbiology. 45, 149-155 (2018).
  17. Grubaugh, N. D., et al. An amplicon-based sequencing framework for accurately measuring intrahost virus diversity using PrimalSeq and iVar. Genome Biology. 20 (1), 8 (2019).
  18. Bedhomme, S., et al. Evolutionary changes after translational challenges imposed by horizontal gene transfer. Genome Biology and Evolution. 11 (3), 814-831 (2019).
  19. Tenaillon, O., Toupance, B., Le Nagard, H., Taddei, F., Godelle, B. Mutators, population size, adaptive landscape and the adaptation of asexual populations of bacteria. Genetics. 152 (2), 485-493 (1999).

Play Video

Cite This Article
Finnegan, M., Hamet, J., Desmarais, E., Bedhomme, S. Following the Dynamics of Structural Variants in Experimentally Evolved Populations. J. Vis. Exp. (192), e64709, doi:10.3791/64709 (2023).

View Video