Summary

ARN polimerasa atado al ADN para transcripción in vitro programable y computación molecular

Published: December 29, 2021
doi:

Summary

Describimos la ingeniería de una nueva ARN polimerasa T7 atada al ADN para regular las reacciones de transcripción in vitro. Discutimos los pasos para la síntesis y caracterización de proteínas, validamos la regulación transcripcional de prueba de concepto y discutimos sus aplicaciones en computación molecular, diagnóstico y procesamiento de información molecular.

Abstract

La nanotecnología del ADN permite el autoensamblaje programable de ácidos nucleicos en formas y dinámicas prescritas por el usuario para diversas aplicaciones. Este trabajo demuestra que los conceptos de la nanotecnología del ADN se pueden utilizar para programar la actividad enzimática de la ARN polimerasa T7 derivada de fagos (RNAP) y construir redes reguladoras de genes sintéticos escalables. En primer lugar, un RNAP T7 atado a oligonucleótidos se diseña a través de la expresión de un RNAP marcado con SNAP N-terminal y el posterior acoplamiento químico de la etiqueta SNAP con un oligonucleótido modificado con bencilguanina (BG). A continuación, el desplazamiento de la hebra de ácido nucleico se utiliza para programar la transcripción de la polimerasa bajo demanda. Además, los conjuntos auxiliares de ácidos nucleicos se pueden utilizar como “factores de transcripción artificiales” para regular las interacciones entre el RNAP T7 programado por ADN con sus plantillas de ADN. Este mecanismo regulador de la transcripción in vitro puede implementar una variedad de comportamientos de circuitos como la lógica digital, la retroalimentación, la cascada y la multiplexación. La componibilidad de esta arquitectura reguladora de genes facilita la abstracción, estandarización y escalado del diseño. Estas características permitirán la creación rápida de prototipos de dispositivos genéticos in vitro para aplicaciones como la biodetección, la detección de enfermedades y el almacenamiento de datos.

Introduction

La computación del ADN utiliza un conjunto de oligonucleótidos diseñados como medio para el cálculo. Estos oligonucleótidos están programados con secuencias para ensamblarse dinámicamente de acuerdo con la lógica especificada por el usuario y responder a entradas específicas de ácido nucleico. En los estudios de prueba de concepto, la salida del cálculo generalmente consiste en un conjunto de oligonucleótidos marcados fluorescentemente que se pueden detectar a través de electroforesis en gel o lectores de placas de fluorescencia. En los últimos 30 años, se han demostrado circuitos computacionales de ADN cada vez más complejos, como varias cascadas de lógica digital, redes de reacción química y redes neuronales1,2,3. Para ayudar con la preparación de estos circuitos de ADN, se han utilizado modelos matemáticos para predecir la funcionalidad de los circuitos genéticos sintéticos4,5,y se han desarrollado herramientas computacionales para el diseño de secuencias de ADN ortogonales6,7,8,9,10 . En comparación con las computadoras basadas en silicio, las ventajas de las computadoras de ADN incluyen su capacidad para interactuar directamente con biomoléculas, operar en solución en ausencia de una fuente de alimentación, así como su compacidad y estabilidad generales. Con el advenimiento de la secuenciación de próxima generación, el costo de sintetizar computadoras de ADN ha estado disminuyendo durante las últimas dos décadas a un ritmo más rápido que la Ley11de Moore. Las aplicaciones de tales computadoras basadas en ADN ahora están comenzando a surgir, como para el diagnóstico de enfermedades12,13, para alimentar la biofísica molecular14y como plataformas de almacenamiento de datos15.

Figure 1
Figura 1: Mecanismo de desplazamiento de la cadena de ADN mediada por el dedo del pie. El punto de apoyo, δ, es una secuencia libre y sin encuadernar en un dúplex parcial. Cuando se introduce un dominio complementario (δ*) en una segunda hebra, el dominio de δ libre sirve como punto de apoyo para la hibridación, permitiendo que el resto de la hebra (ɑ*) desplace lentamente a su competidor a través de una reacción reversible de compresión / descompresión conocida como migración de hebras. A medida que aumenta la duración de δ, el ΔG para la reacción hacia adelante disminuye y el desplazamiento ocurre más fácilmente. Haga clic aquí para ver una versión más grande de esta figura.

Hasta la fecha, la mayoría de las computadoras de ADN utilizan un motivo bien establecido en el campo de la nanotecnología dinámica del ADN conocido como desplazamiento de cadenas de ADN mediadas por dedo del pie (TMDSD, Figura 1)16. Este motivo consiste en un dúplex de ADN parcialmente de doble cadena (dsDNA) que muestra voladizos cortos de “puntera” (es decir, de 7 a 10 nucleótidos (nt)). Las hebras de “entrada” de ácido nucleico pueden interactuar con los dúplex parciales a través del punto de apoyo. Esto conduce al desplazamiento de una de las hebras del dúplex parcial, y esta hebra liberada puede servir como entrada para los dúplex parciales aguas abajo. Por lo tanto, TMDSD permite la señal en cascada y el procesamiento de información. En principio, los motivos ortogonales TMDSD pueden operar de forma independiente en solución, lo que permite el procesamiento paralelo de la información. Ha habido una serie de variaciones en la reacción de TMDSD, como el intercambio de hebras de ADN mediado por el punto de apoyo (TMDSE)17,los puntos de apoyo “sin fugas” con dominios de doble longitud18,los puntos de apoyo no coincidentes con la secuencia19y el desplazamiento de la hebra mediado por el “asidero”20. Estos principios de diseño innovadores permiten una energía y dinámica TMDSD más ajustadas para mejorar el rendimiento de la computación de ADN.

Los circuitos genéticos sintéticos, como los circuitos de genes transcripcionales, también son capaces de calcular21,22,23. Estos circuitos están regulados por factores de transcripción de proteínas, que activan o reprimen la transcripción de un gen uniéndose a elementos reguladores específicos del ADN. En comparación con los circuitos basados en ADN, los circuitos transcripcionales tienen varias ventajas. En primer lugar, la transcripción enzimática tiene una tasa de rotación mucho mayor que los circuitos de ADN catalítico existentes, generando así más copias de salida por copia única de entrada y proporcionando un medio más eficiente de amplificación de la señal. Además, los circuitos transcripcionales pueden producir diferentes moléculas funcionales, como aptámeros o ARN mensajero (ARNm) que codifican para proteínas terapéuticas, como resultados de cálculo, que pueden explotarse para diferentes aplicaciones. Sin embargo, una limitación importante de los circuitos transcripcionales actuales es su falta de escalabilidad. Esto se debe a que hay un conjunto muy limitado de factores de transcripción ortogonales basados en proteínas, y el diseño de novo de nuevos factores de transcripción de proteínas sigue siendo técnicamente desafiante y requiere mucho tiempo.

Figure 2
Figura 2: Abstracción y mecanismo del complejo polimerasa “tether” y “cage”. (A y B) Una correa de oligonucleótidos se marca enzimáticamente a una polimerasa T7 a través de la reacción SNAP-tag. Una jaula que consiste en un promotor T7 “falso” con un voladizo de complemento de amarre le permite hibridarse con la correa y bloquear la actividad transcripcional. (C) Cuando el operador (a*b*) está presente, se une al punto de apoyo de la correa del oligonucleótido (ab) y desplaza la región b* de la jaula, permitiendo que se produzca la transcripción. Esta figura ha sido modificada de Chou y Shih27. Abreviaturas: RNAP = ARN polimerasa. Haga clic aquí para ver una versión más grande de esta figura.

Este artículo presenta un nuevo bloque de construcción para la computación molecular que combina las funcionalidades de los circuitos transcripcionales con la escalabilidad de los circuitos basados en ADN. Este bloque de construcción es un RNAP T7 unido covalentemente con una correa de ADN de cadena simple(Figura 2A). Para sintetizar este ARNP T7 atado al ADN, la polimerasa se fusionó con un SNAP-tag24 N-terminal y se expresó recombinantemente en Escherichia coli. La etiqueta SNAP se reaccionó con un oligonucleótido funcionalizado con el sustrato BG. La correa de oligonucleótidos permite el posicionamiento de los huéspedes moleculares en estrecha proximidad a la polimerasa a través de la hibridación del ADN. Uno de esos invitados fue un bloqueador transcripcional competitivo conocido como “jaula”, que consiste en un dúplex de ADN promotor T7 “falso” sin gen aguasabajo (Figura 2B). Cuando se une al RNAP a través de su correa de oligonucleótidos, la jaula detiene la actividad de la polimerasa al superar a otras plantillas de ADN para la unión al RNAP, lo que hace que el RNAP esté en un estado “OFF”(Figura 2C).

Para activar la polimerasa a un estado “ON”, se diseñaron plantillas de ADN T7 con dominios “operador” monocatenarios aguas arriba del promotor T7 del gen. El dominio operador (es decir, dominio a*b* Figura 2C)puede diseñarse para desplazar la jaula del RNAP a través de TMDSD y posicionar el RNAP proximal al promotor T7 del gen, iniciando así la transcripción. Alternativamente, también se diseñaron plantillas de ADN donde la secuencia del operador era complementaria a las hebras auxiliares de ácido nucleico que se conocen como “factores de transcripción artificiales” (es decir, hebras TFA y TFB en la Figura 3A). Cuando ambas hebras se introducen en la reacción, se ensamblarán en el sitio del operador, creando un nuevo dominio pseudo-contiguo a*b*. Este dominio puede desplazar la jaula a través de TMDSD para iniciar la transcripción(Figura 3B). Estas hebras pueden ser suministradas exógenamente o producidas.

Figure 3
Figura 3: Programación selectiva de la actividad de la polimerasa a través de un activador de interruptor de tres componentes. (A) Cuando los factores de transcripción (TFA y TFB)están presentes, se unen al dominio del operador aguas arriba del promotor, formando una secuencia pseudo de cadena simple (a*b*) capaz de desplazar la jaula a través del desplazamiento del ADN mediado por el punto de apoyo. (B) Este dominio a*b* puede desplazar la jaula a través de TMDSD para iniciar la transcripción. Esta figura ha sido modificada de Chou y Shih27. Abreviaturas: TF = factor de transcripción; RNAP = ARN polimerasa; TMDSD = desplazamiento de la cadena de ADN mediada por el dedo del pie. Haga clic aquí para ver una versión más grande de esta figura.

El uso de factores de transcripción basados en ácidos nucleicos para la regulación transcripcional in vitro permite la implementación escalable de comportamientos de circuitos sofisticados como la lógica digital, la retroalimentación y la señal en cascada. Por ejemplo, se pueden construir cascadas de puertas lógicas diseñando secuencias de ácidos nucleicos de tal manera que las transcripciones de un gen aguas arriba activen un gen aguas abajo. Una aplicación que explota la cascada y la multiplexación que esta tecnología propuesta hace capaces es el desarrollo de circuitos de computación molecular más sofisticados para diagnósticos portátiles y procesamiento de datos moleculares. Además, la integración de la computación molecular y las capacidades de síntesis de ARN de novo puede permitir nuevas aplicaciones. Por ejemplo, se puede diseñar un circuito molecular para detectar uno o una combinación de ARN definidos por el usuario como ARN terapéuticos de entrada y salida o ARNm que codifican péptidos o proteínas funcionales para aplicaciones médicas en el punto de atención.

Protocol

1. Preparación del búfer NOTA: La preparación del tampón de purificación de proteínas puede ocurrir en cualquier día; aquí, se hizo antes de comenzar los experimentos. Preparar tampón de lisis/equilibrio que contenga 50 mM de tris(hidroximetil)aminometano (Tris), 300 mM de cloruro de sodio (NaCl), 5% de glicerol y 5 mM de β-mercaptoetanol (BME), pH 8. Agregue 1.5 mL de 1M Tris, 1.8 mL de 5M NaCl, 1.5 mL de glicerol, 25.2 mL de agua desionizada (ddH2O) en un tubo …

Representative Results

Figura 5:Análisis SDS-PAGE de la expresión de SNAP T7 RNAP y ensayo de transcripción in vitro. (A) Análisis de purificación de proteínas SNAP T7 RNAP, snap T7 RNAP peso molecular: 119.4kDa. FT = flujo a través de la columna, W1 = fracciones de elución del tampón de lavado que contiene impurezas, E1-3 = fracciones de elución que cont…

Discussion

Este estudio demuestra un enfoque inspirado en la nanotecnología del ADN para controlar la actividad de la ARN polimerasa T7 mediante el acoplamiento covalente de un RNAP T7 recombinante marcado con SNAP N-terminal con un oligonucleótido funcionalizado de BG, que posteriormente se utilizó para programar reacciones TMDSD. Por diseño, la etiqueta SNAP se colocó en el extremo N de la polimerasa, ya que el extremo C del ARNP T7 de tipo salvaje está enterrado dentro del núcleo de la estructura de la proteína y hace co…

Disclosures

The authors have nothing to disclose.

Acknowledgements

L.Y.T.C reconoce el generoso apoyo de New Frontiers in Research Fund-Exploration (NFRF-E), la Beca discovery del Consejo de Investigación de Ciencias Naturales e Ingeniería de Canadá (NSERC) y la Iniciativa de Medicina por Diseño de la Universidad de Toronto, que recibe fondos del Fondo de Excelencia en Investigación de Canadá First (CFREF).

Materials

0.5% polysorbate 20 (TWEEN 20) BioShop TWN510.5
0.5M ethylenediaminetetraacetic acid (EDTA) Bio Basic SD8135
10 mM sodium phosphate buffer (pH 7) Bio Basic PD0435 Tablets used to make 10 mM buffer
10% ammonium persulfate (APS) Sigma Aldrich A3678-100G
100 kDa Amicon Ultra-15 Centrifugal Filter Unit Fisher Scientific UFC910008
100% acetone Fisher Chemical A18P4
100% ethanol (EtOH) House Brand 39752-P016-EAAN
10x in vitro transcription (IVT) buffer New England Biolabs B9012
10x Tris-Borate-EDTA (TBE) buffer Bio Basic A0026
1M Isopropyl β- d-1-thiogalactopyranoside (IPTG) Sigma Aldrich I5502-1G
1M sodium bicarbonate buffer Sigma Aldrich S6014-500G
1M Tris(hydroxymethyl)aminomethane (Tris) Sigma Aldrich 648311-1KG
1X Tris-EDTA (TE) buffer ThermoFisher 12090015
2M imidazole Sigma Aldrich 56750-100G
2-mercaptoethanol (BME) Sigma Aldrich M3148
3M sodium acetate Bio Basic SRB1611
40% acrylamide (19:1) Bio Basic A00062
4x LDS protein sample loading buffer Fisher Scientific NP0007
5M sodium chloride (NaCl) Bio Basic DB0483
5mM dithiothreitol (DTT) Sigma Aldrich 43815-1G
6x gel loading dye New England Biolabs B7024S
agarose B powder Bio Basic AB0014
BG-GLA-NHS New England Biolabs S9151S
BL21 competent E. coli Addgene C2530H
BLUeye prestained protein ladder FroggaBio PM007-0500
bromophenol blue Bio Basic BDB0001
coomassie blue (SimplyBlue SafeStain) ThermoFisher LC6060
cyanine dye (SYBR Gold nucleic acid gel stain) Fisher Scientific S11494
cyanine dye (SYBR Safe nucleic acid gel stain) Fisher Scientific S33102
dry dimethyl sulfoxide (DMSO) Fisher Scientific D12345
formamide Sigma Aldrich F9037-100ML
glycerol Bio Basic GB0232
kanamycin sulfate BioShop KAN201.5
lysogeny broth Sigma Aldrich L2542-500ML
malachite green oxalate Sigma Aldrich 2437-29-8
N,N,N'N'-Tetramethylethane-1,2-diamine (TEMED) Sigma Aldrich T9281-25ML
NuPAGE MES SDS running buffer (20x) Fisher Scientific LSNP0002
NuPAGE Novex 4-12% Bis-Tris gel 1.0 mm 12-well Life Technologies NP0322BOX
oligonucleotide (cage antisense) IDT N/A TATAGTGAGTCGTATTAATTTG
oligonucleotide (cage sense) IDT N/A TCAGTCACCTATCTGTTTCAAA
TTAATACGACTCACTATA
oligonucleotide (malachite green aptamer antisense) IDT N/A GGATCCATTCGTTACCTGGCT
CTCGCCAGTCGGGATCCTATA
GTGAGTCGTATTACAGTTCCAT
TATCGCCGTAGTTGGTGTACT
oligonucleotide (malachite green aptamer sense) IDT N/A TAATACGACTCACTATAGGATC
CCGACTGGCGAGAGCCAGGT
AACGAATGGATCC
oligonucleotide (Transcription Factor A) IDT N/A AGTACACCAACTACGAGTGAG
oligonucleotide (Transcription Factor B) IDT N/A TCAGTCACCTATCTGGCGATAA
TGGAACTG
oligonucleotide with 3’ Amine modification (tether) IDT N/A GCTACTCACTCAGATAGGTGAC
TGA/3AmMO/
Pierce strong ion exchange spin columns Fisher Scientific 90008
plasmid encoding SNAP T7 RNAP and kanamycin resistance genes Genscript N/A custom gene insert
protein purification column (HisPur Ni-NTA spin column) Fisher Scientific 88226
rNTP mix New England Biolabs N0466S
Roche mini quick DNA spin column Sigma Aldrich 11814419001
Triton X-100 Sigma Aldrich T8787-100ML
Ultra Low Range DNA ladder Fisher Scientific 10597012
urea BioShop URE001.1

References

  1. Cherry, K. M., Qian, L. Scaling up molecular pattern recognition with DNA-based winner-take-all neural networks. Nature. 559 (7714), 370-376 (2018).
  2. Qian, L., Winfree, E., Bruck, J. Neural network computation with DNA strand displacement cascades. Nature. 475 (7356), 368-372 (2011).
  3. Chen, Y. -. J., et al. Programmable chemical controllers made from DNA. Nature Nanotechnology. 8 (10), 755-762 (2013).
  4. di Bernardo, D., Marucci, L., Menolascina, F., Siciliano, V. Predicting synthetic gene networks. Synthetic Gene Networks: Methods and Protocols. 813, 57-81 (2012).
  5. Xiang, Y., Dalchau, N., Wang, B. Scaling up genetic circuit design for cellular computing: advances and prospects. Natural Computing. 17 (4), 833-853 (2018).
  6. Gould, N., Hendy, O., Papamichail, D. Computational tools and algorithms for designing customized synthetic genes. Frontiers in Bioengineering and Biotechnology. 2, (2014).
  7. MacDonald, J. T., Siciliano, V. Computational sequence design with R2oDNA Designer. Mammalian Synthetic Promoters. 1651, 249-262 (2017).
  8. Cervantes-Salido, V. M., Jaime, O., Brizuela, C. A., Martínez-Pérez, I. M. Improving the design of sequences for DNA computing: A multiobjective evolutionary approach. Applied Soft Computing. 13 (12), 4594-4607 (2013).
  9. Zadeh, J. N., et al. NUPACK: Analysis and design of nucleic acid systems. Journal of Computational Chemistry. 32 (1), 170-173 (2011).
  10. Fornace, M. E., Porubsky, N. J., Pierce, N. A. A unified dynamic programming framework for the analysis of interacting nucleic acid strands: enhanced models, scalability, and speed. ACS Synthetic Biology. 9 (10), 2665-2678 (2020).
  11. Wetterstrand, K. DNA sequencing costs: Data. Genome.gov. , (2020).
  12. Lopez, R., Wang, R., Seelig, G. A molecular multi-gene classifier for disease diagnostics. Nature Chemistry. 10 (7), 746-754 (2018).
  13. Pardee, K., et al. low-cost detection of Zika virus using programmable biomolecular components. Cell. 165 (5), 1255-1266 (2016).
  14. Yurke, B., Turberfield, A. J., Mills, A. P., Simmel, F. C., Neumann, J. L. A DNA-fuelled molecular machine made of DNA. Nature. 406 (6796), 605-608 (2000).
  15. Lin, K. N., Volkel, K., Tuck, J. M., Keung, A. J. Dynamic and scalable DNA-based information storage. Nature Communications. 11 (1), 2981 (2020).
  16. Yurke, B., Mills, A. P. Using DNA to power nanostructures. Genetic Programming and Evolvable Machines. 4 (2), 111-122 (2003).
  17. Zhang, D. Y., Turberfield, A. J., Yurke, B., Winfree, E. Engineering entropy-driven reactions and networks catalyzed by DNA. Science. 318 (5853), 1121-1125 (2007).
  18. Wang, B., Thachuk, C., Ellington, A. D., Winfree, E., Soloveichik, D. Effective design principles for leakless strand displacement systems. Proceedings of the National Academy of Sciences. 115 (52), 12182-12191 (2018).
  19. Machinek, R. R. F., Ouldridge, T. E., Haley, N. E. C., Bath, J., Turberfield, A. J. Programmable energy landscapes for kinetic control of DNA strand displacement. Nature Communications. 5 (1), 5324 (2014).
  20. Cabello-Garcia, J., Bae, W., Stan, G. -. B. V., Ouldridge, T. E. Handhold-mediated strand displacement: a nucleic acid-based mechanism for generating far-from-equilibrium assemblies through templated reactions. bioRxiv. , (2020).
  21. Brophy, J. A. N., Voigt, C. A. Principles of genetic circuit design. Nature Methods. 11 (5), 508-520 (2014).
  22. Khalil, A. S., et al. A synthetic biology framework for programming eukaryotic transcription functions. Cell. 150 (3), 647-658 (2012).
  23. Swank, Z., Laohakunakorn, N., Maerkl, S. J. Cell-free gene-regulatory network engineering with synthetic transcription factors. Proceedings of the National Academy of Sciences. 116 (13), 5892-5901 (2019).
  24. Howland, S. W., Tsuji, T., Gnjatic, S., Ritter, G., Old, L. J., Wittrup, K. D. Inducing efficient cross-priming using antigen-coated yeast particles. Journal of immunotherapy. 31 (7), 607 (2008).
  25. Abil, Z., Ellefson, J. W., Gollihar, J. D., Watkins, E., Ellington, A. D. Compartmentalized partnered replication for the directed evolution of genetic parts and circuits. Nature Protocols. 12 (12), 2493-2512 (2017).
  26. Baugh, C., Grate, D., Wilson, C., Doudna, J. A. 2.8 Å crystal structure of the malachite green aptamer11. Journal of Molecular Biology. 301 (1), 117-128 (2000).
  27. Chou, L. Y. T., Shih, W. M. In vitro transcriptional regulation via nucleic acid-based transcription factors. ACS Synthetic Biology. 8 (11), 2558-2565 (2019).
  28. Lykke-Andersen, J., Christiansen, J. The C-terminal carboxy group of T7 RNA polymerase ensures efficient magnesium ion-dependent catalysis. Nucleic Acids Research. 26 (24), 5630-5635 (1998).
  29. Pu, J., Disare, M., Dickinson, B. C. Evolution of C-terminal modification tolerance in full-length and split T7 RNA Polymerase biosensors. Chembiochem. 20 (12), 1547-1553 (2019).
  30. Gardner, L. P., Mookhtiar, K. A., Coleman, J. E. Initiation, elongation, and processivity of carboxyl-terminal mutants of T7 RNA polymerase. Biochemistry. 36 (10), 2908-2918 (1997).
  31. Yin, J., Lin, A. J., Golan, D. E., Walsh, C. T. Site-specific protein labeling by Sfp phosphopantetheinyl transferase. Nature Protocols. 1 (1), 280-285 (2006).
  32. Warden-Rothman, R., Caturegli, I., Popik, V., Tsourkas, A. Sortase-tag expressed protein ligation: combining protein purification and site-specific bioconjugation into a single step. Analytical Chemistry. 85 (22), 11090-11097 (2013).
  33. Zhang, W. -. B., Sun, F., Tirrell, D. A., Arnold, F. H. Controlling macromolecular topology with genetically encoded SpyTag-SpyCatcher chemistry. Journal of the American Chemical Society. 135 (37), 13988-13997 (2013).
check_url/62073?article_type=t

Play Video

Cite This Article
Lee, R. C., Douglas, T. R., Chou, L. Y. T. DNA-Tethered RNA Polymerase for Programmable In vitro Transcription and Molecular Computation. J. Vis. Exp. (178), e62073, doi:10.3791/62073 (2021).

View Video