De beschreven protocollen toestaan de bouw, karakterisering en selectie (tegen het doelwit) van een bibliotheek van de “domainome” gemaakt van elke bron van DNA. Dit wordt bereikt door een onderzoek-pijpleiding dat verschillende technologieën combineert: faag display, een opvouwbare verslaggever en de volgende generatie sequencing met een web-tool voor data-analyse.
Opvouwbare verslaggevers zijn eiwitten met herkenbaar fenotypen, zoals antibioticaresistentie, waarvan vouwen en functie in gevaar komt wanneer gesmolten tot slecht het vouwen van eiwitten of willekeurige open lezing frames. Met behulp van TEM-1 β-lactamase (het enzym overdracht van resistentie tegen ampicilline) op een genomic schaal, kunnen wij waar, collecties van correct gevouwen proteïne domeinen selecteren uit het codering gedeelte van het DNA van elke intronless genoom, hebben we een strategie ontwikkeld. De fragmenten van de eiwitten verkregen door deze aanpak, de zogenaamde “domainome”, zullen goed uitgedrukt en oplosbaar, waardoor ze geschikt zijn voor structurele/functionele studies.
Door klonen en het weergeven van de “domainome” rechtstreeks in een faag display systeem, hebben wij aangetoond dat het mogelijk is te selecteren van specifieke proteïne domeinen met de gewenste bindende eigenschappen (bijvoorbeeld andere proteïnen of antilichamen), waardoor essentiële experimentele informatie voor gene aantekening of antigeen identificatie.
De identificatie van de meest verrijkt klonen in een geselecteerde polyklonale populatie kan worden bereikt met behulp van nieuwe sequencing van de volgende generatie technologieën (NGS). Om deze redenen introduceren we diep sequencing analyse van de bibliotheek zelf en de selectie-uitgangen volledige informatie te verstrekken over diversiteit, overvloed en nauwkeurige toewijzing van elk van het geselecteerde fragment. De protocollen die hier gepresenteerd tonen de belangrijkste stappen voor de bouw van de bibliotheek, karakterisatie en validatie.
Hier beschrijven we een hoge-doorvoer-methode voor de bouw en de selectie van bibliotheken van gevouwen en oplosbaar eiwit domeinen van elke genenreservoir/genomic startende bron. De aanpak combineert drie verschillende technologieën: faag display, het gebruik van een opvouwbare verslaggever en de volgende generatie sequencing (NGS) met een specifieke web-tool voor data-analyse. De methoden kunnen worden gebruikt in vele verschillende contexten van onderzoek op basis van eiwitten, voor identificatie en annotatie van nieuwe eiwitten/proteïne domeinen, karakterisering van structurele en functionele eigenschappen van bekende eiwitten, alsmede definitie van eiwit-interactie netwerk.
Veel open vragen zijn nog steeds aanwezig in onderzoek op basis van eiwitten en de ontwikkeling van methoden voor de eiwitproductie van de optimale is een belangrijke behoefte voor verschillende velden van onderzoek. Bijvoorbeeld, ondanks de beschikbaarheid van duizenden prokaryote en eukaryote genomen1ontbreekt een bijbehorende kaart van de relatieve proteomes met een directe annotatie van de gecodeerde eiwitten en peptiden nog steeds voor de overgrote meerderheid van organismen. De catalogus van volledige proteomes is in opkomst als een uitdagend doel vereist een enorme inspanning in termen van tijd en middelen. De gouden standaard voor experimentele aantekening blijft het klonen van alle Open lezing Frames (ORFs) van een genoom, bouw van de zogenaamde “ORFeome”. Meestal genfuncties is toegewezen op basis van homologie aan verwante genen van bekende activiteit maar deze aanpak is slecht juist als gevolg van de aanwezigheid van veel incorrect aantekeningen in de verwijzing databases2,3,,4, 5. Bovendien, zelfs voor eiwitten die zijn geïdentificeerd en geannoteerd, aanvullend onderzoek moeten bereiken van karakterisering in termen van overvloed, expressiepatronen in verschillende contexten, met inbegrip van structurele en functionele eigenschappen, evenals interactienetwerken.
Bovendien, omdat eiwitten zijn samengesteld uit verschillende domeinen, elk van hen specifieke kenmerken tonen en anders bijdragen aan eiwitfuncties, de studie en de exacte definitie van deze domeinen kunt u een meer gedetailleerd beeld, zowel op de single gen en op het niveau van het volledige genoom. Al deze noodzakelijke informatie maakt op basis van eiwitten onderzoek een breed en uitdagend veld.
In dit perspectief, kan een belangrijke bijdrage worden gegeven door onbevooroordeelde en high-throughput methoden voor de productie van eiwitten. Het succes van dergelijke benaderingen, naast de aanzienlijke investeringen nodig zijn, is echter afhankelijk van het vermogen te produceren van oplosbare/stabiele eiwit constructies. Dit is een belangrijke beperking van factor omdat men schat dat slechts ongeveer 30% van de eiwitten met succes kan worden uitgedrukt en geproduceerd op voldoende niveau experimenteel nuttig6,7,8. Een aanpak te overwinnen van deze beperking is gebaseerd op het gebruik van willekeurig gefragmenteerde DNA te produceren verschillende polypeptiden, waarmee elkaar overlappende fragment vertegenwoordiging van afzonderlijke genen. Slechts een klein percentage van de willekeurig gegenereerde DNA-fragmenten zijn functionele ORFs terwijl de overgrote meerderheid van hen zijn niet-functionele (als gevolg van de aanwezigheid van stop codonen binnen hun sequenties) of coderen voor niet-natuurlijke (ORF in een frame dan het origineel) polypeptiden met geen biologische betekenis.
Om al deze kwesties, heeft onze fractie een high-throughput eiwit expressie en interactie analyse platform ontwikkeld die kan worden gebruikt op een genomic schaal9,10,11,12. Dit platform integreert de volgende technieken: 1) een methode te selecteren van collecties van correct gevouwen proteïne domeinen uit het codering gedeelte van DNA van een organisme; 2) de bacteriofaag display technologie voor het selecteren van de partners van interacties; 3) de NGS volledig karakteriseren de hele interactome bestudeerde en identificeren van de klonen van belang; en 4) een webtool voor data-analyse voor gebruikers zonder bioinformatics of programmeringsvaardigheden Interactome-Seq analyses uit te voeren op een eenvoudige en gebruiksvriendelijke manier.
Het gebruik van dit platform biedt belangrijke voordelen ten opzichte van alternatieve strategieën van onderzoek; de methode is vooral volledig onpartijdige, high-throughput en modulaire voor studie, variërend van een enkel gen tot een hele genoom. De eerste stap van de pijpleiding is de oprichting van een bibliotheek van willekeurig gefragmenteerde DNA bestudeerd, die vervolgens diep door NGS wordt gekenmerkt. Deze bibliotheek is gegenereerd met behulp van een gemanipuleerde vector waar genen/fragmenten van belang zijn gekloond tussen een signaal volgorde voor eiwit secretie in de periplasmatische ruimte (dat wil zeggen, een leider van de Sec) en het TEM1 β-lactamase gen. De fusieproteïne zal verlenen de ampicilline-resistentie en de mogelijkheid om te overleven onder ampicilline druk alleen als gekloonde fragmenten in-frame is met deze elementen zowel de resulterende fusieproteïne correct gevouwen10,13 ,14. Alle klonen gered na antibiotica selectie, de zogenaamde “gefilterd klonen”, ORFs en een grote meerderheid van hen (meer dan 80%), zijn afgeleid van echte genen9. Bovendien ligt de kracht van deze strategie in de bevindingen dat alle klonen van de ORF gefilterd voor correct gevouwen/oplosbare eiwitten en/of domeinen15 codeert. Zoals veel klonen, aanwezig in de bibliotheek en de toewijzing in de zelfde regio/domein, hebben verschillende begin- en einddatum van de punten, hierdoor onbevooroordeelde, -voor-stapmodus identificatie van de minimale fragmenten die zouden kunnen resulteren in oplosbare producten.
Een verdere verbetering van de technologie wordt gegeven door het gebruik van NGS te karakteriseren van de bibliotheek. De combinatie van dit platform en van een specifieke web-tool voor data-analyse geeft belangrijke onbevooroordeelde informatie over de exacte nucleotidesequenties en over de locatie van geselecteerde ORFs op de verwijzing DNA bestudeerde zonder de behoefte aan verdere uitgebreide analyses of experimentele inspanning.
Domainome bibliotheken kunnen worden omgezet in een selectie-context en gebruikt als een universele instrument functionele studies te verrichten. De high-throughput eiwit expressie en interactie analyse platform dat we geïntegreerde en dat we Interactome-Seq noemden gebruik van de bacteriofaag display technologie maakt door overdracht van de gefilterde ORF in een vector van phagemid en het creëren van een bacteriofaag-ORF bibliotheek. Eenmaal opnieuw gekloond in een faag display context, eiwit domeinen worden weergegeven op het oppervlak van M13 deeltjes; op deze manier kunnen domainome bibliotheken direct worden geselecteerd voor gene fragmenten codering van domeinen met specifieke enzymatische activiteiten of bindende eigenschappen, waardoor interactome netwerken profilering. Deze aanpak werd voor het eerst beschreven door Zacchi et al. 16 en later gebruikt in verschillende andere context13,17,18.
Vergeleken met andere technologieën gebruikt bij het bestuderen van de eiwit-eiwit interactie (inclusief Gist twee hybridesysteem en massaspectrometrie19,20), is een groot voordeel de versterking van de binding-partner die tijdens de bacteriofaag optreedt weergeven meerdere rondes van de selectie. Dit verhoogt de gevoeligheid van de selectie waardoor de identificatie van lage overvloedige bindende proteïnen domeinen aanwezig in de bibliotheek. De efficiëntie van de selectie uitgevoerd met ORF-gefilterd bibliotheek is verder toegenomen als gevolg van het ontbreken van niet-functionele klonen. Ten slotte, de technologie staat de selectie moet worden uitgevoerd tegen zowel eiwitten als niet-proteïne lokaas21,22,23,24,25.
Phage selecties met behulp van de bibliotheek domainome-bacteriofaag kunnen worden uitgevoerd met behulp van antilichamen vanuit sera van patiënten met verschillende pathologische condities, zoals auto-immune ziekten13, kanker of een infectie ziekten als aas. Deze aanpak wordt gebruikt voor het verkrijgen van de zogenaamde “antilichaam handtekening” van de ziekte onder studie waardoor massaal identificeren en typeren de antigenen/epitopes specifiek erkend door de patiënten antilichamen op hetzelfde moment. Vergeleken met andere methoden het gebruik van bacteriofaag display kan de identificatie van zowel lineaire als conformationele antigene epitopes. De identificatie van een bepaalde handtekening kon potentieel belangrijke gevolgen voor begrip pathogenese, nieuwe vaccin design, identificatie van nieuwe therapeutische doelen en ontwikkelen van nieuwe en specifieke diagnostische en prognostische hulpmiddelen hebben. Bovendien, wanneer het onderzoek is gericht op besmettelijke ziekten, een groot voordeel is dat de ontdekking van immunogene eiwitten onafhankelijk van pathogen teelt is.
Onze aanpak bevestigt dat de opvouwbare verslaggevers op een genomic schaal kunnen worden gebruikt om te selecteren van de “domainome”: een verzameling correct gevouwen, goed uitgedrukt, oplosbaar eiwit domeinen uit het codering gedeelte van het DNA en/of cDNA van elk organisme. Eenmaal geïsoleerd de eiwit-fragmenten zijn bruikbaar voor vele doeleinden, essentiële experimentele voorlichting voor gene aantekening alsmede wat betreft structurele studies, antilichaam epitoop toewijzing, antigeen identificatie, enz. De volledigheid van hoge-doorvoer door NGS verstrekte gegevens maakt de analyse van de zeer complexe monsters, zoals faag display bibliotheken, en heeft het potentieel om de traditionele moeizame plukken en testen van individuele faag gered klonen te omzeilen.
Op hetzelfde moment dankzij de functies van de gefilterde bibliotheek en de extreme gevoeligheid en de kracht van het NGS-analyse is het mogelijk om te identificeren van het eiwit domein verantwoordelijk voor elke interactie rechtstreeks in een eerste scherm, zonder de noodzaak te creëren extra bibliotheken voor elk gebonden eiwit. NGS kan verkrijgen van een uitgebreide definitie van het hele domainome van elke genenreservoir/genomic startende bron en de data analyse webtool kan de aanschaf van een zeer specifieke karakterisering van een kwalitatieve en kwantitatieve oogpunt van de interactome eiwitten domeinen.
De oprichting van een hoge kwaliteit zeer uiteenlopende ORFs gefilterde bibliotheek is de eerste cruciale stap in de hele procedure, aangezien het gevolgen voor alle latere stappen van de pijpleiding hebben zal.
Een belangrijk voordeel kenmerk van onze methode is dat elke bron (intronless) DNA (cDNA, genomic DNA, PCR afgeleid of synthetisch DNA) geschikt voor de bouw van de bibliotheek is. De eerste parameter waarmee rekening moet worden gehouden is dat de lengte van de DNA-fragmenten in de ve…
The authors have nothing to disclose.
Dit werk werd gesteund door een subsidie van het Italiaanse ministerie van onderwijs en de Universiteit (2010P3S8BR_002 naar CP).
Sonopuls ultrasonic homogenizer | Bandelin | HD2070 | or equivalent |
GeneRuler 100 bp Plus DNA Ladder | Thermo Scientific | SM0321 | or equivalent |
GeneRuler 1 kb DNA Ladder | Thermo Fisher Scientific | SM0311 | or equivalent |
Molecular Biology Agarose | BioRad | 161-3102 | or equivalent |
Green Gel Plus | Fisher Molecular Biology | FS-GEL01 | or equivalent |
6x DNA Loading Dye | Thermo Fisher Scientific | R0611 | or equivalent |
QIAquick Gel Extraction Kit | Qiagen | 28704 | or equivalent |
Quick Blunting Kit | New England Biolabs | E1201S | |
NanoDrop 2000 UV-Vis Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
High-Capacity cDNA Reverse Transcription Kit | Thermo Fisher Scientific | 4368813 | |
Streptavidin Magnetic Beads | New England Biolabs | S1420S | or equivalent |
QIAquick PCR purification Kit | Qiagen | 28104 | or equivalent |
EcoRV | New England Biolabs | R0195L | |
Antarctic Phosphatase | New England Biolabs | M0289S | |
T4 DNA Ligase | New England Biolabs | M0202T | |
Sodium Acetate 3M pH5.2 | general lab supplier | ||
Ethanol for molecular biology | Sigma-Aldrich | E7023 | or equivalent |
DH5aF' bacteria cells | Thermo Fisher Scientific | ||
0,2 ml tubes | general lab supplier | ||
1,5 ml tubes | general lab supplier | ||
0,1 cm electroporation cuvettes | Biosigma | 4905020 | |
Electroporator 2510 | Eppendorf | ||
2x YT medium | Sigma-Aldrich | Y1003 | |
Ampicillin sodium salt | Sigma-Aldrich | A9518 | |
Chloramphenicol | Sigma-Aldrich | C0378 | |
DreamTaq DNA Polymerase | Thermo Fisher Scientific | EP0702 | |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447S | |
96-well thermal cycler (with heated lid) | general lab supplier | ||
150 mm plates | general lab supplier | ||
100 mm plates | general lab supplier | ||
Glycerol | Sigma-Aldrich | G5516 | |
BssHII | New England Biolabs | R0199L | |
NheI | New England Biolabs | R0131L | |
QIAprep Spin Miniprep Kit | Qiagen | 27104 | or equivalent |
M13KO7 Helper Phage | GE Healthcare Life Sciences | 27-1524-01 | |
Kanamycin sulfate from Streptomyces kanamyceticus | Sigma-Aldrich | K1377 | |
Polyethylene glycol (PEG) | Sigma-Aldrich | P5413 | |
Sodium Cloride (NaCl) | Sigma-Aldrich | S3014 | |
PBS | general lab supplier | ||
Dynabeads Protein G for Immunoprecipitation | Thermo Fisher Scientific | 10003D | or equivalent |
MagnaRack Magnetic Separation Rack | Thermo Fisher Scientific | CS15000 | or equivalent |
Tween 20 | Sigma-Aldrich | P1379 | |
Nonfat dried milk powder | EuroClone | EMR180500 | |
KAPA HiFi HotStart ReadyMix | Kapa Biosystems, Fisher Scientific | 7958935001 | |
AMPure XP beads | Agencourt, Beckman Coulter | A63881 | |
Nextera XT dual Index Primers | Illumina | FC-131-2001 or FC-131-2002 or FC-131-2003 or FC-131-2004 | |
MiSeq or Hiseq2500 | Illumina | ||
Spectrophotomer | Nanodrop | ||
Agilent Bioanalyzer or TapeStation | Agilent | ||
Forward PCR primer | general lab supplier | 5’ TACCTATTGCCTACGGCAGCCGCTGGATTGTTATTACTC 3’ | |
Reverse PCR primer | general lab supplier | 5’ TGGTGATGGTGAGTACTATCCAGGCCCAGCAGTGGGTTTG 3’ | |
Forward primer for NGS | general lab supplier | 5’ TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGCAAGCGGCGCGCATGC 3’; | |
Reverse primer for NGS | general lab supplier | 5’ GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGATTGGTTTGCCGCTAGC 3’; |