Summary

ARN de predicción de estructura secundaria Utilizando SHAPE de alto rendimiento

Published: May 31, 2013
doi:

Summary

De alto rendimiento selectiva 2 'acilación hidroxilo analizados por extensión del cebador (FORMA) utiliza un software de predicción de estructura secundaria de producto químico nuevo sondeo de la tecnología, la transcripción inversa, electroforesis capilar y para determinar las estructuras de ARN de varios cientos a varios miles de nucleótidos en una sola resolución de nucleótidos.

Abstract

Comprender la función del ARN que participan en los procesos biológicos exige un conocimiento profundo de la estructura del ARN. Con este fin, la metodología denominada "acilación hidroxilo de alto rendimiento 2 selectivo 'analizado mediante extensión de cebador", o forma, permite la predicción de la estructura secundaria de ARN con una sola resolución de nucleótidos. Este enfoque utiliza agentes químicos de sondeo que preferentemente acilato de regiones de cadena sencilla o flexible de ARN en solución acuosa. Sitios de modificación química se detectan mediante transcripción inversa del ARN modificado, y los productos de esta reacción son fraccionados por electroforesis capilar automatizado (CE). Dado que la transcriptasa inversa se detiene en esos nucleótidos de ARN modificados por los reactivos de la forma, la biblioteca de cDNA resultante asigna indirectamente estos ribonucleótidos que son de cadena sencilla en el contexto de los ARN plegadas. El uso de software ShapeFinder, los producidos por electroferogramas automatizado CE son procesados ​​y convertidos en nutablas de reactividad cleotide que se convierten ellos mismos en las limitaciones del pseudo-energía utilizadas en el RNAStructure (v5.3) algoritmo de predicción. Las estructuras de ARN de dos dimensiones obtenidos por combinación de una forma sondeo con ARN in silico de predicción de estructura secundaria se han encontrado para ser mucho más precisa que la estructuras obtenidas usando cualquier método solo.

Introduction

Para comprender las funciones de los ARN catalíticos y no codificantes implicadas en la regulación del corte y empalme, traducción, replicación del virus y el cáncer, se requiere un conocimiento detallado de la estructura del ARN 1,2. Desafortunadamente, la predicción exacta de ARN plegado presenta un reto formidable. Agentes de sondeo clásicas sufren de muchas desventajas tales como la toxicidad, la cobertura incompleta de nucleótidos y / o un caudal limitado a 100-150 nucleótidos por experimento. Algoritmos de predicción de estructura secundaria sin ayuda son igualmente desventajoso, debido a las inexactitudes que resultan de su incapacidad para distinguir efectivamente entre estructuras energéticamente similares. Grandes de ARN, en particular, también son a menudo refractario a los métodos de determinación de la estructura 3D, tales como la cristalografía de rayos X y resonancia magnética nuclear (RMN), debido a su flexibilidad conformacional y grandes cantidades de muestras muy puras requeridas para estas técnicas.

HFORMA igh rendimiento resuelve muchos de estos problemas al proporcionar un enfoque eficaz, sencilla de sondeo de las grandes estructuras de ARN a una resolución de un solo nucleótido. Por otra parte, los reactivos utilizados para la forma son seguros, fáciles de manejar y, en contraste con la mayoría de otros productos químicos de sondeo reactivos, reaccionan con los cuatro ribonucleótidos. Estos reactivos también pueden penetrar en las membranas celulares, por lo que es posible para sondear RNAs en su contexto in vivo (s) 3. Originalmente desarrollado en las Semanas de laboratorio 4, la forma ha sido utilizado para analizar una amplia variedad de ARN, el ejemplo más notable es la determinación de la estructura secundaria completa del ~ 9 kb VIH-1 ARN del genoma 5. Otros logros notables incluyen SHAPE utilizando elucidación de las estructuras de los viroides infecciosas 6, ARNs no codificantes largas humanos 7, ribosomas de levadura 8 y 9 riboswitches así como para identificar los sitios de unión de proteínas de virión asociada a VIH-1 RNA 3. While las variaciones originales y de alto rendimiento del protocolo SHAPE se han publicado en otros lugares 10 a 12, el presente trabajo ofrece una descripción detallada de la determinación de la estructura secundaria del ARN por la forma de alto rendimiento utilizando oligonucleótidos fluorescentes, la Beckman Coulter CEQ 8000 Genetic Analyzer y software SHAPEfinder y RNAStructure (v5.3). Detalles técnicos inéditas y consejos de solución de problemas también se incluyen.

Las variaciones de la forma

La esencia de la forma y sus variaciones es la exposición de ARN en solución acuosa a anhídridos electrófilos que acilar selectivamente grupos ribosa 2'-hidroxilo (2'-OH), produciendo aductos voluminosos en los sitios de modificación. Esta reacción química sirve como un medio de interrogar a la dinámica estructural de ARN locales, como los nucleótidos de cadena simple son más propensas a adoptar conformaciones favorables para ataque electrofílico por estos reactivos, mientras que la base emparejado o arquitectónicamente Constrnucleótidos objetivó son menos o no reactivo 10. Los sitios de formación de aductos se detectan mediante transcripción inversa a partir de la iniciación fluorescentemente o radiomarcado cebadores hibridados a un sitio específico en el ARN modificado (el "(+)" reacción de extensión del cebador). Cuando la transcriptasa inversa (RT) no atravesar los ribonucleótidos acilados, un grupo de productos de ADNc se produce cuyas longitudes coinciden con los sitios de modificación. Un control, "(-)" cebador de extensión reacción utilizando ARN que no ha sido expuestos a reactivo también se realiza de modo que la terminación prematura de la síntesis de ADN (es decir, "se detiene") debido a la estructura del ARN, no específica de ARN de hebra rotura, etc, mayo. distinguirse de deteniéndose producido por modificación química. Por último, dos reacciones de secuenciación didesoxi-inician a partir de los mismos cebadores se utilizan como marcadores para correlacionar nucleótidos reactivos con la secuencia primaria de ARN después de la electroforesis.

En la solicitud original de SHAPE, el mismo 32-P marcado en el extremo cebador se utiliza para los (+), -, y dos reacciones de secuenciación (). Los productos de estas reacciones se cargan en pocillos adyacentes en una placa de gel de poliacrilamida al 5-8%, y se fraccionó por electroforesis en gel desnaturalizante de poliacrilamida (PAGE; Figura 1). El análisis cuantitativo de las imágenes de gel producidas por la forma convencional se puede realizar utilizando SAFA, un software de análisis de la huella de semi-automatizado 13.

Por el contrario, la forma de alto rendimiento emplea cebadores marcados con fluorescencia y electroforesis capilar automatizado. Específicamente, para cada región de ARN bajo investigación, un conjunto de cuatro cebadores de ADN que tienen una secuencia común pero diferentes 5 'etiquetas fluorescentes deben ser sintetizados o comprados. Estos oligonucleótidos marcados de manera diferente-sirven para dos reacciones principales forma y dos reacciones de secuenciación, los productos de los cuales se agrupan y se fraccionó / ​​detectaron por electroforesis capilar automatizado (CE). WherEAS el perfil de reactividad de los nt 100-150 de ARN se puede obtener a partir de un conjunto de cuatro reacciones utilizando el enfoque original, la forma de alto rendimiento permite la resolución de 300-600 nt a partir de una sola muestra agrupada 3. Hasta 8 conjuntos de reacciones puede ser fraccionado simultáneamente, mientras que tanto como 96 muestras pueden preparado para el fraccionamiento en el transcurso de 12 ejecuciones consecutivas de la CE (Figura 2). Por otra parte, el software SHAPEfinder, desarrollado para procesar y analizar los datos que se desprenden del CEQ y otros analizadores genéticos, es más automatizado y requiere mucho menos intervención del usuario de SAFA 13 u otros paquetes de gel de análisis.

Más avanzadas metodologías de alto rendimiento han surgido recientemente tales como PARS (análisis paralelo de la estructura del ARN) 14 y Frag-Seq (fragmento de secuenciación) 15, que utilizan enzimas específicos de la estructura en lugar de reactivos de alquilación en conjunción con técnicas de secuenciación de próxima generación para obtener information sobre la estructura del ARN. A pesar del atractivo de estas técnicas, las muchas limitaciones inherentes a la nucleasa de sondeo siguen siendo 16. Estos problemas pueden ser evitados en la secuenciación FORMA (SHAPE-Seq) 17 protocolo, donde la secuenciación de próxima generación está precedida por modificación química y la transcripción inversa del ARN de una manera similar a la realizada en la forma convencional. Si bien estos métodos pueden representar el futuro de la determinación de la estructura de ARN, es importante recordar que la secuenciación de próxima generación es muy caro, y sigue sin estar disponible para muchos laboratorios.

Análisis de datos SHAPE

Los datos producidos en el analizador genético se presentan en la forma de un electroferograma, en el que la intensidad de fluorescencia de la muestra (s) que fluye a través del detector capilar se representa en función de un índice de tiempo de migración. Esta parcela tiene la forma de las huellas superpuestas, según el canal cuatro de fluorescencias utiliza para detectar los diferentes fluoróforos, y donde cada traza se compone de los picos correspondientes a los productos de ADNc o secuenciación individuales. Datos electroferograma se exporta desde el analizador genético como un archivo de texto delimitado por tabuladores y se importan en la transformación ShapeFinder y software de análisis 18.

ShapeFinder se utiliza inicialmente para llevar a cabo una serie de transformaciones matemáticas en los datos para asegurar que los tiempos de migración y volúmenes pico reflejan con precisión las identidades y cantidades de los productos de reacción, respectivamente. Los picos son entonces alineados e integrados, y los resultados se tabulan junto con la secuencia de ARN primario. Un "perfil de reactividad" para el segmento pertinente de ARN se obtiene restando los valores de control a partir de la (+) valores asociados con cada ARN de nucleótidos, y la normalización de los datos tal como se describe a continuación. Este perfil se importa en RNAstructure (v5.3) Software de 19,20, lo que convierte la val reactividad normalizadaUES en limitaciones pseudo-energía que se incorporan en el algoritmo de plegado estructura secundaria del ARN. La combinación química de sondeo y plegado algoritmos de esta manera mejora significativamente la exactitud de la predicción de la estructura en comparación con cualquiera de los métodos solos 12,21. La salida de RNAstructure (v5.3) incluye imágenes de la energía más baja ARN estructuras secundarias con código de colores con el perfil FORMA reactividad (s), así como las mismas estructuras en Pruebas notación de punto-soporte. Este último puede posteriormente ser exportado al software dedicado a la representación gráfica de la estructura secundaria del ARN tales como Varna PseudoViewer 22 y 23.

Figura 1
Figura 1. Organigrama de la estructura de la determinación de ARN a través de SHAPE 4,10. (A) RNA may se obtiene a partir de muestras biológicas o por transcripción in vitro. (B) Dependiendo de la fuente, el ARN se pliega o se procesa y se modificó con el reactivo FORMA lo contrario. (C) La transcripción inversa usando cebadores marcados radiactivamente o fluorescentemente. (D) son productos de ADNc fraccionado ya sea a través de electroforesis capilar a base de gel o de poca altura. (E) Análisis de fragmentos. (F) la predicción de estructura de ARN. Haz clic aquí para ver más grande la figura.

La figura 2
Figura 2. El carácter de alto rendimiento de FORMA basados ​​en CE permite el análisis rápido de múltiples ARN, y / o múltiples segmentos de los mismos ARN. (A) </strong> Representa cómo una RNA puede ser dividido en secciones 300-600 nt (código de color en verde, azul y rojo) (B) Las secciones del ARN se probaron de forma independiente utilizando diferentes conjuntos de cebadores fluorescentes (flechas negras) (C) juegos de reacciones se combinaron y se cargaron en los pocillos A1, B1, C1, etc, respectivamente, proporcionando una cobertura completa para el ~ 3 kb ARN1. Productos de reacción de RNAs 2, 3, 4, etc pueden prepararse de forma similar para el fraccionamiento de carreras electroforéticas consecutivos. Haz clic aquí para ver más grande la figura.

Protocol

Diseño de cebadores y extensión de la terminal del ARN 3 ' Para el análisis de ARN de largo por FORMA de alto rendimiento, una serie de sitios de hibridación de cebadores debe ser seleccionado de tal manera que (i) están separados por ~ 300 nt, (ii) son 20-30 nt de longitud, y (iii) que el ARN / híbridos de ADN producidos por el recocido de ADN a estos sitios tienen una temperatura de fusión esperada de> 50 ° C. Además, los segmentos de ARN que se predicen para ser altamente est…

Representative Results

ARN que contiene el VIH-1 elemento de respuesta rev (RRE) y un 3 'casete estructura de la terminal 4 se preparó a partir de un plásmido linealizado por la transcripción in vitro, después de lo cual se pliega por calentamiento, enfriamiento, y la incubación a 37 ° C en la presencia de MgCl 2. ARN fue expuesto a NMIA y luego a transcripción inversa a partir de un cebador de ADN 5'-marcado en el extremo hibridó con el casete de estructura de la terminal 3 '. La fo…

Discussion

Se presenta aquí un protocolo detallado para la forma de alto rendimiento, una técnica que permite la determinación de la estructura secundaria de la resolución de un solo nucleótido de ARN de cualquier tamaño. Por otra parte, el acoplamiento de datos experimentales forma con algoritmos de predicción de estructura secundaria facilita la generación de modelos de ARN 2D con un mayor grado de precisión que es posible con cualquiera de los métodos solos. La combinación de cebadores marcados con fluorescencia y au…

Disclosures

The authors have nothing to disclose.

Acknowledgements

S. Lusvarghi, J. Sztuba-Solinska, KJ Purzycka, JW Rausch y SFJ Le Grice son apoyados por el Programa de Investigación Intramural del Instituto Nacional del Cáncer, de los Institutos Nacionales de Salud, EE.UU..

Materials

      REAGENTS
N-methylisatoic anhydride (NMIA) Life technologies M25 Dissolve in anhydrous DMSO
1-methyl-t-nitroisatoic anhydride (1M7) see ref. 22    
Superscript III Reverse Transcriptase Life technologies 18080044 10,000 units
Thermo sequenase cycle sequencing kit Affymetrix 78500  
      Materials provided by the user
RNA of interest     6 pmol per reaction (the limit of detection will be determined by the instrument)
Sets of four 5′ labeled primers (Cy5, Cy5.5, WellRed D2 and WellRed D1/Licor IR800)     Primers are complementary to the RNA and are used in reverse transcription and sequencing reactions. The listed fluorophores are optimal for the Beckman Coulter 8000 CEQ. Primers may be purchased or synthesized in house.
DNA template     DNA is used for sequencing reactions, and must contain the sequence of the RNA being studied – including any 3’terminal extension, if present. Where applicable, it is often convenient to use the RNA transcription template.
      Buffers
10x RNA renaturation buffer     100 mM Tris-HCl pH 8.0, 1 M KCl, 1 mM EDTA
5X RNA folding buffer     200 mM Tris-HCl pH 8.0, 25 mM MgCl2, 2.5 mM EDTA, 650 mM KCl. (This buffer might be changed depending on the case (e.g. pH, EDTA, Mg, RNase inhibitor)
2.5X RT mix     4 μl 5X buffer, 1 μl 100 mM DTT, 1.5 μl water,1 μl 10 mM dNTPs, 0.5 μl SuperScript III. Note that the 5X buffer and 100 mM DTT are provided with purchase of SuperScript III (Invitrogen).
GenomeLab Sample Loading Solution (Beckman Coulter)     Attention: Avoid multiple freeze-thaw cycles
      EQUIPMENT
Capillary electrophoresis Beckman CEQ8000  
Thermocycler varies    

References

  1. Scott, W. G., Martick, M., Chi, Y. I. Structure and function of regulatory RNA elements: ribozymes that regulate gene expression. Biochim. Biophys. Acta. 1789, 634-641 (2009).
  2. Moore, P. B., Steitz, T. A. The roles of RNA in the synthesis of protein. Cold Spring Harb. Perspect. Biol. 3, a003780 (2011).
  3. Wilkinson, K. A., et al. High-throughput SHAPE analysis reveals structures in HIV-1 genomic RNA strongly conserved across distinct biological states. Plos Biol. 6, 883-899 (2008).
  4. Merino, E. J., Wilkinson, K. A., Coughlan, J. L., Weeks, K. M. RNA structure analysis at single nucleotide resolution by selective 2 ‘-hydroxyl acylation and primer extension (SHAPE). J. Am. Chem. Soc. 127, 4223-4231 (2005).
  5. Watts, J. M., et al. Architecture and secondary structure of an entire HIV-1 RNA genome. Nature. 460, 711-716 (2009).
  6. Xu, W., Bolduc, F., Hong, N., Perreault, J. P. The use of a combination of computer-assisted structure prediction and SHAPE probing to elucidate the secondary structures of five viroids. Mol. Plant Pathol. , (2012).
  7. Novikova, I. V., Hennelly, S. P., Sanbonmatsu, K. Y. Structural architecture of the human long non-coding RNA, steroid receptor RNA activator. Nucleic Acids Res. 40, 5034-5051 (2012).
  8. Leshin, J. A., Heselpoth, R., Belew, A. T., Dinman, J. High-throughput structural analysis of yeast ribosomes using hSHAPE. RNA Biol. 8, 478-487 (2011).
  9. Souliere, M. F., Haller, A., Rieder, R., Micura, R. A powerful approach for the selection of 2-aminopurine substitution sites to investigate RNA folding. J. Am. Chem. Soc. 133, 16161-16167 (2011).
  10. Wilkinson, K. A., Merino, E. J., Weeks, K. M. Selective 2 ‘-hydroxyl acylation analyzed by primer extension (SHAPE): quantitative RNA structure analysis at single nucleotide resolution. Nat. Protoc. 1, 1610-1616 (2006).
  11. McGinnis, J. L., Duncan, C. D. S., Weeks, K. M. High-Throughput Shape and Hydroxyl Radical Analysis of Rna Structure and Ribonucleoprotein Assembly. Method Enzymol. 468, 67-89 (2009).
  12. Low, J. T., Weeks, K. M. SHAPE-directed RNA secondary structure prediction. Methods. 52, 150-158 (2010).
  13. Das, R., Laederach, A., Pearlman, S. M., Herschlag, D., Altman, R. B. S. A. F. A. Semi-automated footprinting analysis software for high-throughput quantification of nucleic acid footprinting experiments. Rna-a Publication of the Rna Society. 11, 344-354 (2005).
  14. Kertesz, M., et al. Genome-wide measurement of RNA secondary structure in yeast. Nature. 467, 103-107 (2010).
  15. Underwood, J. G., et al. FragSeq: transcriptome-wide RNA structure probing using high-throughput sequencing. Nat. Methods. 7, 995-1001 (2010).
  16. Mauger, D. M., Weeks, K. M. Toward global RNA structure analysis. Nat. Biotechnol. 28, 1178-1179 (2010).
  17. Lucks, J. B., et al. Multiplexed RNA structure characterization with selective 2′-hydroxyl acylation analyzed by primer extension sequencing (SHAPE-Seq). Proc. Natl. Acad. Sci. USA. 108, 11063-11068 (2011).
  18. Vasa, S. M., Guex, N., Wilkinson, K. A., Weeks, K. M., Giddings, M. C. ShapeFinder: a software system for high-throughput quantitative analysis of nucleic acid reactivity information resolved by capillary electrophoresis. RNA. 14, 1979-1990 (2008).
  19. Reuter, J. S., Mathews, D. H. RNAstructure: software for RNA secondary structure prediction and analysis. BMC Bioinformatics. 11, 129 (2010).
  20. Pang, P. S., Elazar, M., Pham, E. A., Glenn, J. S. Simplified RNA secondary structure mapping by automation of SHAPE data analysis. Nucleic Acids Res. 39, e151 (2011).
  21. Deigan, K. E., Li, T. W., Mathews, D. H., Weeks, K. M. Accurate SHAPE-directed RNA structure determination. Proc. Natl. Acad. Sci. USA. 106, 97-102 (2009).
  22. Darty, K., Denise, A., Ponty, Y. VARNA: Interactive drawing and editing of the RNA secondary structure. Bioinformatics. 25, 1974-1975 (2009).
  23. Byun, Y., Han, K. PseudoViewer: web application and web service for visualizing RNA pseudoknots and secondary structures. Nucleic Acids Res. 34, 416-422 (2006).
  24. Brown, T., Brown, D. J. S., Eckstein, F. . Oligonucleotides and Analogues – A Practical Approach. , 20 (1990).
  25. Legiewicz, M., et al. The RNA Transport Element of the Murine musD Retrotransposon Requires Long-range Intramolecular Interactions for Function. J. Biol. Chem. 285, 42097-42104 (2010).
  26. Steen, K., Siegfried, N. A., Weeks, K. M. Syntheis of 1-methyl-8-nitroisatoic anhydride (1M7). Protocol Exchange. , (2011).
  27. Mortimer, S. A., Weeks, K. M. A fast-acting reagent for accurate analysis of RNA secondary and tertiary structure by SHAPE chemistry. J. Am. Chem. Soc. 129, 4144-4145 (2007).
  28. Mitra, S., Shcherbakova, I. V., Altman, R. B., Brenowitz, M., Laederach, A. High-throughput single-nucleotide structural mapping by capillary automated footprinting analysis. Nucleic Acids Res. 36, e63 (2008).
  29. Giddings, M. C., Severin, J., Westphall, M., Wu, J., Smith, L. M. A software system for data analysis in automated DNA sequencing. Genome Res. 8, 644-665 (1998).
  30. Aviran, S., et al. Modeling and automation of sequencing-based characterization of RNA structure. Proc. Natl. Acad. Sci. USA. 108, 11069-11074 (2011).
check_url/cn/50243?article_type=t

Play Video

Cite This Article
Lusvarghi, S., Sztuba-Solinska, J., Purzycka, K. J., Rausch, J. W., Le Grice, S. F. RNA Secondary Structure Prediction Using High-throughput SHAPE. J. Vis. Exp. (75), e50243, doi:10.3791/50243 (2013).

View Video