O sequenciamento de nanopore é uma nova tecnologia que permite o sequenciamento econômico em locais remotos e configurações pobres em recursos. Aqui, nós apresentamos um protocolo para arranjar em seqüência dos mRNAs do sangue inteiro que é compatível com tais circunstâncias.
O sequenciamento em locais remotos e configurações pobres em recursos apresenta desafios únicos. O sequenciamento de nanoporos pode ser usado com sucesso nessas condições e foi implantado na África Ocidental durante a recente epidemia do vírus Ebola, destacando essa possibilidade. Além de suas vantagens práticas (baixo custo, facilidade de transporte e uso de equipamentos), esta tecnologia também fornece vantagens fundamentais sobre as abordagens de sequenciamento de segunda geração, particularmente o comprimento de leitura muito longo, a capacidade de sequenciar diretamente RNA e disponibilidade em tempo real dos dados. A precisão de leitura bruta é menor do que com outras plataformas de sequenciamento, o que representa a principal limitação dessa tecnologia; no entanto, isso pode ser parcialmente atenuado pela alta profundidade de leitura gerada. Aqui, nós apresentamos um protocolo campo-compatível para arranjar em seqüência da codificação de mRNAs para Niemann-Pick C1, que é o receptor celular para Ebolavirus. Este protocolo abrange a extração de RNA de amostras de sangue animal, seguido por RT-PCR para enriquecimento alvo, código de barras, preparação da biblioteca, e o seqüenciamento próprio executar, e pode ser facilmente adaptado para uso com outros alvos de DNA ou RNA.
O sequenciamento é uma ferramenta poderosa e importante na pesquisa biológica e biomédica. Permite a análise dos genomas, das variações genéticas, e dos perfis da expressão do RNA, e joga assim um papel importante na investigação das doenças humanas e animais iguais1,2. Sequenciamento de Sanger, um dos métodos mais antigos disponíveis para sequenciamento de DNA, ainda é rotineiramente usado até hoje e tem sido uma pedra de canto de biologia molecular. Ao longo dos últimos 50 anos, esta tecnologia foi melhorada para alcançar comprimentos de leitura de mais de 1.000 NT e uma precisão tão alta quanto 99,999%1. No entanto, o sequenciamento de Sanger também tem limitações. Seqüenciamento de um conjunto maior de amostras ou a análise de genomas inteiros com este método é demorado e caro1,3. Os métodos de sequenciamento de DNA de segunda geração (de última geração), como 454 pirosequenciação e tecnologia Illumina, nos permitiram reduzir significativamente o custo e a carga de trabalho necessários para o sequenciamento na última década, e levaram a um tremendo aumento na quantidade de informação de sequência biológica disponível4. No entanto, o seqüenciamento individual é executado usando essas tecnologias de segunda geração são caras, e seqüenciamento em condições de campo é desafiador, como o equipamento necessário é volumoso e frágil (semelhante a dispositivos de sequenciamento Sanger), e muitas vezes tem que ser calibrado e atendido por pessoal especialmente treinado. Além disso, para muitas das tecnologias de segunda geração, os comprimentos de leitura são bastante limitados, o que muitas vezes torna a análise de Bioinformática downstream desses dados desafiadores.
O sequenciamento de terceira geração usando dispositivos de sequenciamento de nanoporos de bolso (ver tabela de materiais) pode servir como uma alternativa para essas plataformas de sequenciamento estabelecidas. Nesses dispositivos, uma molécula de DNA ou RNA de cadeia única passa através de um nanoporo simultaneamente com uma corrente iónica que é então medida por um sensor (Figura 1). Como a vertente atravessa o nanopore, a modulação da corrente pelos nucleotídeos presentes nos poros em um determinado momento é detectada, e computacionalmente retrotraduzida para a sequência de nucleotídeo5. Devido a este princípio operacional, o sequenciamento de nanoporos permite a geração de leituras muito longas (perto de 1 x 106 nucleotídeos6) e a análise de dados de sequenciamento em tempo real. A codificação de barras é possível anexando sequências de nucleotídeo definidas aos ácidos nucleicos em uma amostra, o que permite a análise de várias amostras em uma única execução de seqüenciamento, aumentando assim a taxa de transferência da amostra e diminuindo por custos de amostragem. Devido à sua alta portabilidade e facilidade de uso, os dispositivos de sequenciamento de nanoporos têm sido usados com sucesso no campo durante a recente epidemia de doença do vírus Ebola na África Ocidental, destacando sua adequação para a implantação rápida em regiões remotas7 , a 8.
Aqui, nós descrevemos um protocolo detalhado campo-compatível para arranjar em seqüência da codificação do mRNA para a proteína de Niemann-Pick C1 (NPC1), que é o receptor obrigatório da entrada para Filovirus tais como Ebolavirus, e foi mostrado para limitar a susceptibilidade da espécie ao estes vírus9,10. O protocolo abrange a extração de RNA inteiro a partir de amostras de sangue, amplificação específica de NPC1 mRNA por RT-PCR, código de barras de amostras, preparação da biblioteca e sequenciamento com um dispositivo de sequenciamento de nanoporos. A análise dos dados não pode ser discutida devido a limitações espaciais, embora algumas direções básicas sejam fornecidas nos resultados representativos; no entanto, o leitor interessado é encaminhado para uma publicação anterior11 para uma descrição mais detalhada do fluxo de trabalho que utilizamos, bem como para publicações de outros12,13,14 para informações detalhadas sobre as ferramentas de análise utilizadas neste fluxo de trabalho.
Nas últimas duas décadas, o sequenciamento de amostras biológicas tornou-se um aspecto cada vez mais importante dos estudos em uma ampla gama de áreas de assunto. O desenvolvimento de sistemas de sequenciamento de segunda geração com base no sequenciamento de uma matriz densa de recursos de DNA usando ciclos iterativos de manipulação enzimática e aquisição de dados baseada em imagem1 aumentou drasticamente o throughput comparado ao técnica de sequenciamento de Sanger tradicional, e permite a análise de várias amostras, bem como várias espécies de ácidos nucleicos em uma determinada amostra em paralelo4. No entanto, para a maioria dos sistemas de segunda geração comumente usados, somente leituras curtas são produzidas, e todas as plataformas dependem de equipamentos sensíveis, volumosos e caros3,4.
Em contraste com as plataformas de sequenciamento de segunda geração, o dispositivo de sequenciamento utilizado neste protocolo é baseado na tecnologia nanoporo. Aqui uma molécula de ácido nucleico de cadeia única passa através de um nanopore, resultando na modulação de uma corrente iónica que também flui através do mesmo nanopore, e que pode ser medido e retrotraduzido para inferir a seqüência da molécula de ácido nucleico. Essa abordagem de sequenciamento de terceira geração oferece uma série de vantagens em relação a outras abordagens. As principais vantagens que estão diretamente relacionadas com o princípio de funcionamento exclusivo desta tecnologia são o comprimento de leitura extremamente longo produzido (comprimentos de leitura de até 8,8 x 105 nucleotídeos foram relatados6), a capacidade de seqüência não só o DNA, mas também o RNA diretamente, que foi demonstrado recentemente para um genoma completo17do vírus da gripe, e a habilidade de analisar dados no tempo real enquanto estão sendo gerados, que permite a deteção rápida do metagenômica dos micróbios patogénicos dentro dos minutos18. Vantagens práticas adicionais são o tamanho extremamente pequeno do dispositivo de sequenciamento de nanoporos, permitindo o seu uso em qualquer laboratório ou em missões de campo para locais remotos19,20, e o baixo preço em comparação com outros sequenciamento Plataformas. Em termos de custos de funcionamento, atualmente uma nova célula de fluxo é necessária para cada execução de seqüenciamento, o que resulta em custos de cerca de $1100 por execução para a célula de fluxo e reagentes de preparação de biblioteca. Esses custos podem ser reduzidos em alguns casos, lavando e reutilizando a célula de fluxo, ou por código de barras e seqüenciamento de várias amostras em uma única execução. Além disso, um novo tipo de célula de fluxo está sendo testado beta por um pequeno número de laboratórios, o que exigirá o uso de um adaptador de célula de fluxo (chamado de “flongle”), e deve reduzir significativamente o preço da célula de fluxo e, portanto, os custos de execução.
A maior lacuna do sequenciamento de nanoporos continua sendo sua acurácia, com precisão de leitura única na faixa de 83 a 86% sendo relatada6,21,22e a maioria das imprecisões causadas por inserção/deleções ( indels)5,21. No entanto, a profundidade de leitura elevada pode compensar essas imprecisões, e um estudo recente sugerido com base em Considerações teóricas que uma profundidade de leitura de > 10 pode aumentar a precisão geral para > 99,8%21. No entanto, novas melhorias na precisão serão necessárias, especialmente se a análise deve ser realizada em um nível de molécula única, em vez de em um nível de seqüência de consenso. O uso da tecnologia 1D2 como descrito neste protocolo, que é baseado na adição dos adaptadores 1D2 e do código de barras (cf. seção 5,5) que resultam em ambas as vertentes de uma única molécula do ADN que está sendo seqüenciada pelo mesmo nanopore, aumentos lidos a exatidão desde que as informações de ambas as costas do ADN podem ser usadas para a determinação da seqüência. Além disso, uma estratégia de solução alternativa que pode ser prosseguida, a fim de combinar as vantagens do sequenciamento de nanoporos (particularmente longo comprimento de leitura) com a maior precisão de outras tecnologias de sequenciamento é usar informações de sequenciamento de nanoporos como um andaime, que é em seguida, polido usando dados de sequenciamento de outras plataformas6.
O fator mais crítico para o sucesso do protocolo aqui apresentado é a qualidade da amostra e, principalmente, a quantidade e a qualidade do RNA extraído. O armazenamento apropriado e a extração alerta do RNA ajudam em conseguir um rendimento adequado do RNA. O uso de tubos de coleta de sangue adequados permite o armazenamento de amostras de sangue por até um mês, mas a coagulação do sangue pode ser um problema, especialmente quando as amostras estão sendo armazenadas em temperaturas elevadas, o que pode ser o caso em condições de campo. A segunda etapa crítica é a amplificação das sequências alvo, e particular condições de campo as reações do PCR executam frequentemente menos poço do que circunstâncias padrão do laboratório7. Para este fim, o projeto e a optimização cuidadosos da primeira demão são primordial conseguir a amplificação robusta. Adicionalmente, as aproximações aninhadas do PCR e o PCR do touchdown, como usados neste protocolo, podem aumentar a especificidade e a sensibilidade da amplificação do gene do alvo4,7. Com efeito, na nossa experiência na Libéria e na Guiné com esta tecnologia foram necessários protocolos aninhados em condições de campo com amostras de campo, mesmo para conjuntos de primers que permitiram a amplificação de alvos de amostras laboratoriais e em condições laboratoriais com uma única rodada de PCR (7 e resultados inéditos).
Em contraste com essas etapas mais críticas, a preparação da biblioteca e a execução de sequenciamento propriamente dita são procedimentos bastante robustos. No entanto, em condições de campo, questões práticas, como a disponibilidade de certas peças de equipamentos podem ser problemáticas. Por exemplo, um espectrofotômetro UV é necessário para determinar as concentrações de DNA antes da preparação da biblioteca de amostras com código de barras. No entanto, caso tal dispositivo não esteja disponível em condições de campo, um volume igual de cada amostra pode ser simplesmente combinado para compensar os 45 μL necessários para a preparação da biblioteca, com diferenças no material de entrada da amostra, em seguida, sendo geralmente atenuada pela grande número de leituras. Da mesma forma, a necessidade de conectividade com a Internet para a execução de seqüenciamento pode ser um problema, mesmo que a chamada base não tenha mais que ser realizada online, mas pode ser feita localmente; no entanto, esta necessidade pode ser removida em determinadas circunstâncias pelo fabricante, se necessário.
Em resumo, o protocolo apresentado permite um sequenciamento relativamente baixo custo em locais sem acesso ao equipamento de sequenciamento tradicional, incluindo em locais remotos. Pode facilmente ser adaptado a todo o RNA ou ADN do alvo, assim permitindo que os investigadores respondam a perguntas biológicas numerosas.
The authors have nothing to disclose.
Os autores agradecem a Allison Groseth pela leitura crítica do manuscrito. Este trabalho foi apoiado financeiramente pelo Ministério Federal alemão da alimentação e da agricultura (BMEL) baseado em uma decisão do parliament da República de Germany federal através do escritório federal para a agricultura e a alimentação (BLE).
1D2 adapter, barcode adapter mix, ABB buffer, elution buffer, RBF buffer, LBB beads | Oxford Nanopore Technologies | SQK-LSK308 | 1D² Sequencing Kit |
blood collection tube with DNA/RNA stabilizing reagent | Zymo Research | R1150 | DNA/RNA Shield – Blood Collection Tube |
blunt/TA ligase master mix | New England Biolabs | M0367S | Blunt/TA Ligase Master Mix |
DNA-low binding reaction tube | Eppendorf | 30108051 | DNA LoBind Tube |
DNase buffer and DNase | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
flow cell | Oxford Nanopore Technologies | FLO-MIN105.24 | flow cell R9.4 |
hot start high fidelity DNA polymerase | New England Biolabs | M0493L | Q5 Hot Start High-Fidelity DNA Polymerase (500 U) |
magnetic beads | Beckman Coulter | A63881 | Agencourt AMPure XP beads |
magnetic rack | ThermoFisher Scientific | 12321D | DynaMag-2 Magnet |
nanopore sequencing device | Oxford Nanopore Technologies | – | MinION Mk 1B |
PCR barcoding kit | Oxford Nanopore Technologies | EXP-PBC001 | PCR Barcoding Kit I (R9) |
reverse transcriptase master mix | ThermoFisher Scientific | 11766050 | SuperScript™ IV VILO™ Master Mix with ezDNase™ Enzyme |
RNA purification spin column, DNA/RNA prep buffer, DNA/RNA wash buffer, DNase I, DNA digestion buffer | Zymo Research | R1151 | Quick-DNA/RNA Blood Tube Kit |
rotating mixer | ThermoFisher Scientific | 15920D | HulaMixer Sample Mixer |
Taq DNA polymerase | New England Biolabs | M0287S | LongAmp Taq 2X Master Mix |
Ultra II End-prep kit | New England Biolabs | E7546S | NEBNext Ultra II End-Repair/dA-tailing Modul |
UV spectrophotometer | Implen | – | NanoPhotometer |
vacuum manifold | Zymo Research | S7000 | EZ-Vac Vacuum Manifold |