Nous avons développé une méthode rentable pour suivre la dynamique des allèles de polymorphisme non nucléotidique qui peut facilement être adaptée aux archives congelées de l’évolution expérimentale. Une technique de PCR triplet a été couplée à une électrophorèse capillaire parallèle automatisée pour quantifier la fréquence relative d’un allèle d’insertion au cours de l’évolution expérimentale.
On sait maintenant que les variantes structurelles (SV) (c.-à-d. les délétions, les insertions, les duplications et les inversions) jouent un rôle important dans la variation phénotypique et, par conséquent, dans des processus tels que la détermination de la maladie ou l’adaptation à un nouvel environnement. Cependant, les variantes mononucléotidiques reçoivent beaucoup plus d’attention que les SV, probablement parce qu’elles sont plus faciles à détecter et que leurs effets phénotypiques sont plus faciles à prévoir. Le développement de technologies de séquençage profond à lecture courte et longue a fortement amélioré la détection des SV, mais la quantification de leur fréquence à partir des données de séquençage groupé (poolseq) est encore techniquement complexe et coûteuse.
Ici, nous présentons une méthode plutôt simple et peu coûteuse, qui permet aux chercheurs de suivre la dynamique de la fréquence des allèles SV. À titre d’exemple d’application, nous suivons la fréquence d’insertion d’une séquence d’insertion (SI) dans des populations expérimentales d’évolution bactérienne. Cette méthode est basée sur la conception de triplets d’amorces autour des bordures de variantes structurelles, de sorte que les amplicons produits par amplification des allèles de type sauvage (WT) et dérivés diffèrent en taille d’au moins 5%, et que leur efficacité d’amplification est similaire. La quantité de chaque amplicon est ensuite déterminée par électrophorèse capillaire parallèle et normalisée à une courbe d’étalonnage. Cette méthode peut être facilement étendue à la quantification de la fréquence d’autres variantes structurelles (délétions, duplications et inversions) et aux approches pool-seq des populations naturelles, y compris les populations pathogènes intra-hospitalisées.
Les variantes structurelles (SV) sont des altérations de la séquence génomique, affectant généralement 50 pb ou plus. Les quatre catégories de SV décrites sont les grandes insertions, les suppressions importantes, les inversions et les duplications. Jusqu’à récemment, on accordait plus d’attention aux variantes mononucléotidiques (SNV) qu’aux variantes structurelles, en termes d’effets phénotypiques et de leur rôle en tant que déterminants génétiques de la maladie, ou de leur contribution à l’adaptation. C’est probablement parce qu’il est plus facile de détecter les SNV et de prédire leurs effets phénotypiques. Cependant, les technologies de séquençage profond à lecture courte et longue ont fortement amélioré la détection des SV, au moins dans les génomes individuels ou clonaux1. En parallèle, leurs effets phénotypiques ont été mieux caractérisés, et de nombreux exemples de leur implication en tant que déterminants génétiques de la maladie humaine 2,3 ou de l’adaptation à un nouvel environnement4 ont été documentés.
Les délétions et les insertions, souvent dues à des insertions d’éléments génétiques mobiles (MGE), sont beaucoup plus perturbatrices que les polymorphismes mononucléotidiques (SNP) et entraînent des mutations par décalage de trame et des modifications de la structure des protéines. Les délétions et les insertions de MGE dans les gènes entraînent presque toujours l’inactivation des gènes, et les insertions dans des régions non codantes peuvent entraîner une répression ou une expression constitutive de gènes adjacents lorsque les séquences d’insertion (SI) contiennent des séquences promotrices ou de terminaison5. Alors que l’élimination des gènes essentiels entraîne des effets néfastes évidents sur la condition physique bactérienne, la perte de gènes non essentiels est bénéfique dans certains cas. Malgré leurs coûts inhérents, les duplications peuvent également être avantageuses et participer à l’adaptation car elles entraînent un changement de dosage des gènes; Une augmentation de l’activité d’une protéine spécifique peut être avantageuse selon les conditions6.
Les populations d’évolution expérimentale microbienne sont généralement commencées avec des clones. Cette absence initiale de diversité génétique, combinée à la caractéristique « environnement fermé » des éprouvettes, conduit à un potentiel très limité d’évolution par gain de gènes par transfert horizontal de gènes et recombinaison de gènes. Dans ces conditions spécifiques, la contribution à l’adaptation des délétions, des duplications et de l’insertion intragénomique de MGE est particulièrement importante; Les bactéries s’adaptent souvent par des mutations de perte de fonction (principalement dues à des délétions ou à des insertions de MGE), affectant des gènes qui ne sont pas utiles dans des environnements artificiels de monoculture stables, souvent riches en nutriments7. Dans l’expérience d’évolution d’E. coli la plus longue, les insertions d’IS150 sont particulièrement fréquentes parmi les populations ayant évolué après 50 000 générations, les éléments IS représentant 35% des mutations qui atteignent une fréquence élevée dans les populations qui conservent leur taux de mutation ponctuelle ancestral8.
Les études d’évolution et de reséquence associent les technologies d’évolution expérimentale et de séquençage de nouvelle génération (NGS) pour étudier comment les bactéries s’adaptent, aux niveaux phénotypique et génomique, à différentes conditions et contraintes environnementales, telles que différentes sources de carbone et d’énergie, les antibiotiques et le stress osmotique 9,10,11 . Ces études obtiennent généralement des informations génomiques sur les populations évoluées ou les clones uniquement au point final expérimental et, dans certains cas, à un certain nombre de points temporels intermédiaires12,13,14. Ces données donnent un aperçu des gènes et des voies impliqués dans l’adaptation à un environnement donné, mais permettent rarement aux chercheurs de suivre la dynamique des allèles émergents et balayants de novo au fil du temps.
Une approche pour suivre ces dynamiques consiste à choisir un nombre limité d’allèles ségrégateurs d’intérêt (en raison de la fonction des gènes qu’ils affectent, parce qu’ils balayent en parallèle dans des populations indépendantes, etc.) et à utiliser le séquençage d’amplicon pour quantifier la proportion d’allèles, en regroupant de nombreux points temporels dans le même séquençage15. Cette méthode a été utilisée avec succès pour suivre la dynamique de variantes de petite taille (SNP ou indels de 1 pb) dans des populations expérimentalesde microbes 16 etnaturelles 17 . Cependant, dans le cas d’insertions plus grandes ou d’insertions MGE, la différence de taille des amplicons induit des différences d’efficacité de PCR, ce qui fausse la relation entre les proportions de lecture et d’allèle. Dans certains cas, la différence de taille entre les deux allèles est supérieure à la longueur classique de l’amplicon. Ici, nous avons couplé une technique de PCR triplet avec une électrophorèse capillaire parallèle automatisée pour quantifier la fréquence relative d’un allèle d’insertion basé sur la discrimination de taille. Cette approche permet d’exploiter des points temporels expérimentaux sous-utilisés pour déterminer la dynamique d’un allèle mutant émergent et suivre sa fréquence de fixation ou de perte, de manière rentable. Nous avons appliqué cette méthode pour suivre les allèles mutS– émergents, mutés par insertion IS10, fournissant au génotype muté un phénotype hypermutateur.
Cette méthode nécessite deux allèles cibles avec une différence de taille de ≥5%. Tout d’abord, les triplets d’amorce sont conçus pour produire des fragments de taille similaire, qui partagent une amorce commune. Deuxièmement, les conditions de PCR sont optimisées et une courbe d’étalonnage est produite à l’aide de mélanges d’ADNg de type sauvage (WT) et mutant. Enfin, les échantillons sont amplifiés par PCR, et la fréquence relative de chaque allèle est quantifiée par électrophorèse capillaire quantitative parallèle.
Ici, nous avons proposé une méthode rentable qui permet de suivre la dynamique des allèles SV adaptatifs émergents dans les populations expérimentales de l’évolution. Cette méthode associe des techniques classiques de PCR et une électrophorèse capillaire parallèle automatisée, ce qui permet de déterminer les quantités relatives de deux allèles. Une fois mis en place, il permet de quantifier les proportions d’allèles dans de nombreux échantillons en parallèle, et est beaucoup moins coûteux que WGS. C…
The authors have nothing to disclose.
Ce travail a été soutenu par l’ERC HGTCODONUSE (ERC-2015-CoG-682819) à S.B. Les données utilisées dans ces travaux ont été (en partie) produites par les installations techniques GenSeq de l’Institut des Sciences de l’Evolution de Montpellier avec le soutien du LabEx CeMEB, programme ANR « Investissements d’avenir » (ANR-10-LABX-04-01).
96 Well Skirted PCR Plate | 4titude | 4Ti – 0740 | PCR |
Agarose molecular biology grade | Eurogentec | EP-0010-05 | Agarose gel electrophoresis |
Agilent DNF-474 HS NGS Fragment Kit Quick Guide for the Fragment Analyzer Systems | Agilent | PDF instruction guide | |
Buffer TBE | Panreac appliChem | A4228,5000Pc | Agarose gel electrophoresis |
Calibrated Disposable Inoculating Loops and Needles | LABELIANS | 8175CSR40H | Bacterial culture |
Dneasy Blood and Tissue Kit | Qiagen | 69506 | DNA extraction |
Electrophoresis power supply | Amilabo | ST606T | Agarose gel electrophoresis |
Fragment Analyzer Automated CE System | Agilent | Parallel capillary electrophoresis | |
Fragment DNA Ladder | Agilent | DNF-396, range 1-6000bp | Parallel capillary electrophoresis |
GENTAMICIN SULFATE SALT BIOREAGENT | Sigma-Aldrich | G1264-1G | Bacterial culture |
High Sensitivity diluent marker | Agilent | DNF-373 | Parallel capillary electrophoresis |
High Sensitivity NGS quantitative analysis kit | Agilent | DNF-474 | Parallel capillary electrophoresis |
Ladder quick load 1 kb plus DNA ladder | NEB | N0469S | Agarose gel electrophoresis |
LB Broth, VegitoneNutriSelect Plus | Millipore | 28713 | Bacterial culture |
Master Mix PCR High Fidelity Phusion Flash | Thermo Fisher Scientific | F548L | PCR |
Primers | Eurogentec | PCR | |
Prosize data analysis software v.4 | Agilent | V.4 | Parallel capillary electrophoresis |
Qubit assays | Invitrogen | MAN0010876 | DNA quantification |
Qubit dsDNA HS Assay Kit | LIFE TECHNOLOGIES SAS | Q32854 | DNA quantification |
Thermocycler | Eppendorf | Ep gradients | PCR |
UVbox, eBOX VX5 | Vilber Lourmat | Agarose gel electrophoresis visualisation | |
Water for injectable preparation | Aguettant | PROAMP | PCR |