Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins

Savannah E. Sanchez; Daniel A. Cuevas; Jason E. Rostron; Tiffany Y. Liang; Cullen G. Pivaroff; Matthew R. Haynes; Jim Nulton; Ben Felts; Barbara A. Bailey; Peter Salamon; Robert A. Edwards; Alex B. Burgin; Anca M. Segall; Forest Rohwer

doi:10.3791/52854

JoVE Journal > Immunology and Infection

Immunology and Infection

Fag Phenomics: Fysiologiske tilgange til Karakterisere Novel virale proteiner

Published: June 11, 2015

doi:

10.3791/52854

Summary

Here, we present phenomic approaches for the functional characterization of putative phage genes. Techniques include a developed assay capable of monitoring host anabolic metabolism, the Multi-phenotype Assay Plates (MAPs), in addition to the established method of metabolomics, capable of measuring effects to catabolic metabolism.

Abstract

Aktuelle undersøgelser fag-vært interaktioner er afhængige af ekstrapolering viden fra (meta) genomer. Interessant, 60 – deler 95% af alle fag sekvenser ingen homologi til aktuelle kommenteret proteiner. Som følge heraf er en stor del af faggener kommenteret som hypotetisk. Denne virkelighed er stærkt påvirker annotation af både strukturelle og hjælpestoffer metaboliske gener. Her præsenterer vi Phenomic metoder designet til at fange den fysiologiske reaktion (er) af en udvalgt vært under ekspression af en af disse ukendte faggener. Multi-fænotype assayplader (kort) bruges til at overvåge de forskellige værten substratudnyttelse og efterfølgende biomasse dannelse, mens metabolomics giver bi-produktanalyse ved at overvåge metabolit mangfoldighed og diversitet. Begge værktøjer anvendes samtidigt at tilvejebringe et fænotypisk profil associeret med ekspression af et enkelt formodet fag åben læseramme (ORF). Repræsentative resultater for begge metoder sammenlignes, highlighting de fænotypiske profil forskelle en vært bærer enten formodede strukturelle eller metaboliske fag gener. Derudover er de visualiseringsteknikker og højt gennemløb beregningsmæssige rørledninger, at den lettere eksperimentel analyse fremlagt.

Introduction

Virus, der inficerer bakterier (aka bakteriofager eller fag) skønnes at eksistere på mere end 10 ³¹ viruslignende partikler (VLP) globalt og overtal alle andre organismer i et miljø ^1,2. Den første metagenomisk undersøgelse undersøger de virale samfund er forbundet med marine miljøer med fokus på at kvantificere mangfoldighed ses i den virale fraktion ^3. Derudover Breitbart og kolleger fandt, at over 65% af de virale community sekvenser delt ingen homologi til nogen sekvenser tilgængelige i offentlige databaser. Efterfølgende metagenomisk undersøgelser fundet lignende beviser: metagenomes fra marine sedimenter i San Diego, Californien indeholder 75% ukendte virale sekvenser ^4; metagenomes fra hypersaline søer i Salton Sea indeholder 98% ukendte virale sekvenser ^5; og koral-associerede metagenomes indeholder 95-98% ukendt virale sekvenser ^6. Denne ophobning af fremavlet information har resulteret ifag genetisk materiale er "det mørke stof af den biologiske univers" ^7.

Genomisk karakterisering af fag afhængig identificere sekvens lighed gennem sammenligning mod eksisterende nukleinsyre og protein-databaser. Fordi phag-indkodede genetiske information er overvejende ukendt, homologi-baserede metoder er ineffektive. I genomet, fager koder typisk tre store gen-typer: transskription og replikation gener, metaboliske gener og strukturelle gener. Transkription og replikationsgenerne (klasse I / II-gener ⁸⁾ indbefatter polymeraser, primases, endo / exo-nukleaser og kinaser. Disse gener er særdeles konserveret på grund af deres betydning i faginfektion, transskribere og replikerende fag genetisk materiale. Fag-polymeraser identificeres let ved hjælp af traditionelle sekvenshomologi metoder på grund af deres globale bevarelse ⁹ og er blevet vist at tjene som effektive fylogenetiske markører ^10.I modsætning hertil fag metaboliske og strukturelle gener (klasse II / III gener ⁸⁾ er i stigende grad divergerende og ofte kommenteret som hypotetiske gener.

Fag-metaboliske gener påvirker den metaboliske kapacitet af værten og er ikke nødvendigvis påkrævet for viral replikation. Disse gener, der ofte omtales som hjælpestoffer metaboliske gener ¹¹ (AMGs), synes at modulere værtens metabolisme og muliggøre optimal progression af infektion og succes virion modning. AMGs har været forbundet med udnyttelsen og optagelsen af begrænsende næringsstoffer eller energiproduktion veje. Nogle eksempler indbefatter fotosystem gener findes i genomerne af forskellige cyanophage ^12-16, gener forbundet til og reguleret af phosphatmetabolisme ^17,18, og udnyttelsen af det pentosephosphatvejen til fag dNTP biosyntese ^18,19. Til sammenligning strukturelle gener er blandt de midten til slutningen af gener produceret under infektion og varierer på tværs forskellige fag-host systemer. Produktionen af strukturelle proteiner er afhængige af tilgængeligheden af viral dNTP, og energi pools for deres transskription, translation, og montering ^8. Capsidet og hale fiber strukturelle proteiner anses som den mest divergente af alle virale protein-kodende gener og er nødvendige for en vellykket virion produktion. Deres divergens typisk tilskrives den aktive rolle, de spiller i udformningen af virus-vært coevolution ^20. Divergerende proteiner, uanset genet klassen, let overses, når der anvendes traditionelle homologi og sekvenssammenligning teknikker. En indsats for at korrigere for de begrænsninger, set med strenge sekvenssammenligninger har resulteret i bioinformatik værktøjer, der kan bruge sekvens egenskaber til at bestemme forening, såsom kunstige neurale net ^21. Kunstige neurale net (ANNs) giver mulighed for forudsigelse af strukturelle og metaboliske gener kræver imidlertid nedstrøms eksperimentel validering til direkte karakteriseregenfunktion.

Formålet med dette manuskript er at tilvejebringe Phenomic protokoller kan overvåge både kataboliske og anaboliske metabolisme af en vært bakterie under ekspression af et hidtil ukendt faggen, funktionelt forudsagt gennem ANNs. Feltet af phenomics, biologien forbundet med cellulære fænotyper, er veletableret i systembiologi at hjælpe ved undersøgelsen af proteiner med ukendt eller pleiotropisk funktion. Phenomic værktøjer bruges til at linke fænotypisk information til genotypisk information. Vi hypotesen for formodede fag gener, deres funktion (er) kan bestemmes ved at observere vært fysiologiske virkninger under fag genekspression. For at undersøge denne hypotese blev valgt to kvantitative metoder. Multi-fænotype assayplader (kort) blev anvendt til at overvåge vært substratudnyttelse og den efterfølgende biomasse dannelse mens metabolomics målt vært metabolit mangfoldighed og relative forekomst under vækst i specifikke miljøpsykiske forhold. Formodede strukturelle og metaboliske proteiner blev overudtrykt i Escherichia coli og repræsentative resultater fra begge eksperimenter sammenlignes. Talrige visuelle teknikker og high throughput forarbejdning rørledninger præsenteres for at lette eksperimentelle replikation. Endelig er reproducerbarheden og nøjagtigheden af de præsenterede metoder diskuteres i sammenhæng med de forventede fysiologiske virkninger for en kommenteret capsidprotein og fag metaboliske protein, thioredoxin, plus to formodede AMGs.

Protocol

1. Forberedelse af Multi-fænotype assayplade (MAP) Substrater, Basal Media, Pre-vækst Media, og Buffer Lav 50 ml 1,0-1,25% substrat bestande. Opløs 1,0-1,25% (vægt / volumen) fast substrat i sterilt vand (varme, hvis nødvendigt). Filter sterilisere løsninger med et 0,22 um filterenhed og gemme bestande på RT. Eksempler på substrater, der anvendes i disse forsøg er angivet i tabel 2. Gøre 250 ml 3x basale medier for alle substrat klasser (carbon, nitrogen, svovl og phosphor). De MOPS (3-morpholinopropan-1-sulfonat) baseret basale medier 22 indeholder følgende: 1x MOPS (40 mM MOPS + 10 mM Tricine), 0,4% glycerol *, 9,5 mM NH4CI *, 0,25 mM Naso 4 *, 1,0 mM MgSO4 *, 1,32 mM K 2 HPO 4 *, 10 mM KCI, 0,5 uM CaCl2, 5 mM NaCl, 6 pM FeCl3, og 0,1% (vægt / volumen) L-arabinose ** (tabel 1 og 2) . Bemærk: * Disse forbindelser er ikke inkluderet afhængigt af den basale medier. For eksempel er 0,4% glycerol ikke anvendes i de carbon basale medier og i svovlet basale medier 1,0 mM MgSO4 erstattes af 1,0 mM MgCl2. ** L-arabinose er specifik for induktion af pBAD promoter-vektor, pEMB11, som blev omdannet til en ara – E. coli K-12-stamme (BW 27784) 23. Tilføj hver komponent i den basale medier til en steril kolbe og bringe løsningen på volumen. Bland godt. Med en 0,22 um filterenhed, filter sterilisere hver basale medier i en steril flaske. Gøre 500 ml MOPS pre-vækstmedier. MOPS baseret pre-vækstmedier 22 indeholder følgende: 1x MOPS (40 mM MOPS + 10 mM Tricin), 0,4% glycerol, 9,5 mM NH4CI, 0,25 mM Naso 4, 1,0 mM MgSO4, 1,32 mM K 2 HPO 4, 10 mM KCI, 0,5 uM CaCl2, 5 mM NaCl og 6 uM FeCl3. Tilføj hverkomponent af før-vækstmedier til en steril kolbe og bringe til volumen. Filtersteriliser med en 0,22 um filterenhed, hvorefter der tilsættes ampicillin ved en slutkoncentration på 100 ug / ml. Store opløsning ved 4 ° C. Lav 500 ml 0,5x Luria-Bertani (LB) agarplader. Til en steril kolbe, der tilsættes LB komponenter til at lave en koncentration 0,5x (1,25 g gærekstrakt, 2,5 g NaCl, 2,5 g trypton, 7,5 g agar). Bland godt og autoklaver til sterilisering. Cool agar, tilsæt derefter 100 ug / ml ampicillin antibiotisk under blanding. Hæld ~ 25 ml agar i petriskåle, tillade at indstille, og opbevares ved 4 ° C indtil brug. Gøre 250 ml 10 mM Tris (pH 7,4) plus 10 mM MgSO4 bufferopløsning. Filtersteriliser med en 0,22 um filterenhed og opbevar opløsningen ved stuetemperatur. 2. Udarbejdelse af bakteriel celle-suspension Forbered friske kolonier. Fra et glycerol frossen lager 12,5%, plade frisk E. coli Clones onto 0,5x LB-agar indeholdende 100 ug / ml ampicillin. Der inkuberes ved 37 ° C i 24 timer. Forbered flydende kulturer: Afpipetteres 3 ml af præ-vækstmedium indeholdende 100 ug / ml ampicillin i dyrkningsrør. For hver klon, bruge biologiske tre eksemplarer. Podes uafhængige kolonier fra afsnit 2.1 i forberedt dyrkningsrør. Der inkuberes ved 37 ° C under omrystning i 22 timer. Pellet og vaske bakterieceller: Transfer O / N kulturer i 1,7 ml mikrocentrifugerør. Pellet celler via centrifugering ved maksimal hastighed (16900 xg) i 2 minutter i en mikrocentrifuge. Dekanter supernatanten og vask celler ved at resuspendere i 500 pi 10 mM Tris / 10 mM MgSO4 puffer. Gentag. Re-pellet celler, dekanteres supernatanten og resuspender celler i 1 ml 10 mM Tris / 10 mM MgSO4 puffer. Måle celledensitet og koncentrere celler (hvis nødvendigt): Fortynd celler fra afsnit 2.3.3 10-fold i10 mM Tris / 10 mM MgSO4 puffer og overføre denne fortynding i en kuvette. Mål optiske densitet (OD 600 nm) i denne fortynding og rekord. Koncentrer celler for at opnå den endelige koncentration på 0,07 (OD 600 nm) i kortene (de celler vil blive fortyndet 15 gange, når de føjes til kortene, derfor celler har brug for at være på en indledende koncentration af OD 600 nm = 1,05). Overfør koncentreret cellesuspension i et reservoir og gemme (ved RT), indtil trin 3.5 af kort forberedelse. 3. Udarbejdelse af Multi-fænotype assayplader (kort) Label kort. Label sterile 96-brønds mikro-titer plader med en E. coli klon identifikationsnummer og MAP skematiske type. Alikvot sterilt vand i kort. Overfør aseptisk sterilt vand til en flydende reservoir. Pipette 60 pi til hver brønd af mikrotiterplade ved anvendelse af en multi-kanal pipette. Portion basal medier into Maps. Overfør aseptisk 3x basale medier i et væskereservoir. Pipette 50 pi til hver brønd af mikrotiterplade ved anvendelse af en multi-kanal pipette. Gentag trin 3.2 og 3.3 for hver basale medier, der anvendes i MAP skematisk. Alikvote substrater til kort. Overfør 30 ul af hvert substrat i den relevante brønd af kortene. Tilføj bakteriesuspension til kortene. Overfør 10 pi bakterieceller fra punkt 2.4.2 i hver brønd af MAP ved hjælp af en multi-kanal pipette. Skift tips før genindføre pipette tilbage i kulturen lager. Cover kort med selvklæbende film. Omfatte hver plade med en enkelt klæbende plade film. Fast trykke filmen på toppen af pladens huller og langs kanterne for at skabe en jævn og tæt forsegling. Fjern overskydende film fra kanterne af mikrotiterplade med et sterilt barberblad. Mål optiske densitet Maps: Placer forberedt kort i "Input" ærme af en multi-plade spektrofotometer pladelæser. Åben pladelæser software og skabe en protokol, der måler absorbansen (OD 600 nm) hver 30 min, for i alt 32 timer, med 60 sekunders rystning mellem læser. Indstil temperatur i apparatet til 37 ° C. Start protokol når MAP'er har ligevægt at indstille temperaturen. Efter 32 timer, fjerne kort fra "Output" ærme af pladen læseren. Mærk hver data tekstfil at omfatte: E. coli klon identifikationsnummer, dato MAP løb, og MAP skematiske type. 4. Multi-fænotype assayplader (kort) behandling og parametrisering Vurdere vækstkurver bruger en automatiseret QA proces, f.eks PMAnalyzer 24. Kontroller, at vækstkurver har OD 600 nm <0,20 i første 2 timer. Brug ikke absorbans ved den indledende tidspunkt (t 0) i filteret skyldes artefakter af kondensvand, der typisk løse påt 1 (30 min). Fjern vækstkurver, der overtræder QA filter. Gem kurve oplysninger (prøve navn, godt nummer, og OD 600 nm-værdier) i en separat udgang fil til senere brug. Fortsæt med analyse, hvis vækstkurve passerer QA filter. Beregn median vækstkurver. Hjælp replikere data, per brønd, beregne medianen vækstkurve ved at tage medianen optisk densitet (OD 600 nm) værdi på hvert tidspunkt. Record resulterer median vækstkurver i en separat outputfil til fremtidig brug. Beregne den bedste-fit logistisk model for hver vækstkurve ved hjælp af en tilpasning af foreslået Zwietering 25 ligning. Den logistiske ligning omfatter tre parametre, der beskriver bakterievækst: latenstiden, λ (t), den maksimale vækstrate, μ max (OD 600 nm 100 -1), og den endelige biomasse udbytte, α (OD 600 nm). Brug data ved tid = 30 min (y 1) som den startværdi på grund af artefakter for kondensation. [1] Beregn den maksimale væksthastighed ved hjælp af en direkte søgning. Optage den største ændringshastighed over et 90 min interval inden dataene. [2] Estimere endelige biomasse udbytte ved at søge efter den øverste asymptotiske værdi største bevægelige gennemsnit over en 90 min vindue. Specifikt definere som asymptote for vækstkurven. [3] Brug af μ max og A værdier fra 4.3.1 og 4.3.2, finder λ værdi ved at prøve alle værdier λ: [4] Brug hver λ-værdi til at beregne en sum af kvadrerede fejl (SSE). Brug laveste SSE er SSE (λS): /files/ftp_upload/52854/52854eq5.jpg "/> [5] 5. Fænotype Analyse af MAPs Beregn niveau vækst (GL) for hver vækstkurve at vurdere den samlede vækst per klon per substrat. Definer GL som det harmoniske gennemsnit af de forskudte logistiske udstyret værdier: [6] Tildele en fænotype til hver vækstkurve baseret på GL værdier. Her, de fire fænotyper anvendes: forventede vækst, ingen vækst, gevinst på funktion og tab af funktion. Bestem fænotyper ved at sammenligne væksten på tværs af alle kloner på et specifikt substrat i form af standardafvigelser væk fra middelværdien. Bruge denne statistik og en minimal vækst tærskel til at udpege den fænotype forelagt af vækstkurve (figur 1A, B). Figur 1C giver eksempler på fænotype opgave. Definer vækst som GL ≥ 0,4 (Figure 1A, B). Definer Gain af funktion (figur 1C, grøn) som havende en GL> to standardafvigelser over middelværdien og en gennemsnitlig> tærsklen vækst. Tab af funktion (figur 1C, rød) er defineret som at have en GL <to standardafvigelser under gennemsnittet og en middelværdi> tærsklen vækst. Skabe visuelle repræsentationer af datasættet baseret på fænotyper og vækstkurver. Vis vækstdynamik portrættere OD 600 nm værdier farve til hurtigt at sammenligne vækstkurver mellem flere kloner (figur 2). Vis fænotypiske distributioner blandt alle kloner baseret på vækstbetingelser (figur 3). 6. Opbygning af Kontinuerlig Culture Apparatus Reaktor havnebyggeri (figur 4A, B). Bor tre 1/4 i. Huller, fordelt 3/4 i. Fra hinanden, i hætten af den kontinuerlige kultur reaktoren. For port α: skru en kvindelig luer tråd stil panelmontering til 1/16 i barb fra bunden af hætten med modhagen peger op, ud af hætten.. Sikker modhager med en 1/4 i. Panelmontering låsemøtrikken. For port β: skru en kvindelig luer tråd stil panelmontering til 1/16 i barb med modhagen peger op, ud af hætten.. Sikker modhager med en 1/4 i. Panelmontering låsemøtrikken. For port γ: skru en kvindelig luer tråd stil panelmontering til 1/16 i barb fra bunden af hætten, så modhagen peger op, ud af hætten.. Sikker modhager med 1/4 i. Panelmontering låsemøtrikken. Skrue en han-luer med integreret låsering til 1/8 i. Bred boring slange til modhagen montering på indersiden af hætten. For udstrømningen port: bore et 5/16 i hul på 75 ml mærket af den kontinuerlige kultur reaktoren.. Skær 3/4 in. Off møtrikken ende af 1/4 in. Modhager skot montering. Skrue i 1/4 in. Modhager skot fitting (pakning er på ydersiden af flasken, og møtrikken er på indersiden, Figur 4B). Sutteflaske havnebyggeri (figur 4C). Bor to 1/4 i. Huller fordelt 1 i. Fra hinanden i hætten af sutteflasken. For havnen δ: skru en kvindelig luer tråd stil panelmontering til 1/8 i barb med modhagen peger op, ud af hætten.. Sikker modhager med en 1/4 i. Panelmontering låsemøtrikken. For havnen ε: skru en kvindelig luer tråd stil panelmontering til 1/16 i barb med modhagen peger op, ud af hætten.. Sikker modhager med en 1/4 i. Panelmontering låsemøtrikken. Skrue en han-luer med integreret låsering til 1/8 i. Bred boring slange til modhagen montering på indersiden af hætten. Fodring rør og rør extensions: Skær to 1 i. Stykker af rør (1/8 in. Ydre diameter (OD) x 1/16 in. Indre diameter (ID)). Fit stykker onto havnene α og γ af den kontinuerlige kultur reaktor lavet i afsnit 5.2. Skær en enkelt 1 i. Stykke tubing (1/4 in. OD x 1/8 i. ID). Fit stykke på port Β af den kontinuerlige kultur reaktoren. Skær en enkelt 3,5 i. Stykke slange (1/8 in. OD x 1/16 i. ID). Passe denne brik til indersiden af havne γ på den han-luer med integreret låsering til 1/8 i. Bred boring slange. Port γ er prøvetagning havnen i den kontinuerlige kultur reaktoren. Skær en enkelt 1 i. Stykke slange (1/4 in. OD x 1/8 i. ID). Passe denne brik på δ port sutteflasken. Skær en enkelt 11 i. Stykke slange (1/16 in. OD x 1/8 i. ID). Passe denne brik til indersiden af porten ε af sutteflasken, på han-luer med integreret låsering til 1/8 i. Bred boring slange. Skær to 18 i. Stykker af rør (1/8 in. OD x 1/16 i. ID). Monter et stykke til port ε af sutteflasken. Gem det andet stykke til afsnit 7. 7. Kørsel Kontinuerlig kulturer for Metabolomics Sterilisere materialer: Autoclave de tørre materialer til 30 min. Sørg for at vikle hætten af sutteflaske lavet i afsnit 5 i alufolie. Hold vedhæftet slange lige. Wrap hætten af kontinuerlige kultur reaktor, lavet i afsnit 5, i aluminiumsfolie. Hold vedhæftet slange lige. Wrap 18 i. Rør skåret i afsnit 6.3.5 og den mindste peristaltisk pumpe slange adapter i aluminiumsfolie. Hold slangen lige. Autoklav i 30 min. Lav 2 liter 0,5x LB bouillon. I sutteflasken, gør 0,5x LB-bouillon. Dæk sutteflaske med folie. Autoklave i 1 time. Lav 70 ml 0,5x LB bouillon. Hæld bouillon i kontinuerlig kultur reaktoren. Placer en omrører i kontinuerlig kultur reaktoren. Dæk reaktor med folie og autoklave i 30 minutter. Kontinuerlig kultur set-up: Bakteriel celle-suspension. Fra et glycerol frossen lager 12,5%, plade frisk E. coli-kloner onto 0,5x LB-agar indeholdende 100 ug / ml ampicillin. Inkuberved 37 ° C i 24 timer. Inokulere en enkelt koloni i 3 ml 0,5 x LB-medium indeholdende 100 ug / ml ampicillin. For hver klon anvende biologiske triplikater. Der inkuberes ved 37 ° C under omrystning i 22 timer. Forbinde delene sammen. Læg alle autoklaverede materialer i et biologisk sikkerhedsskab og slå ultraviolet lys, mens mediet køler. Når medier er afkølet, tilsættes 0,1% L-arabinose og 100 ug / ml ampicillin til alle 0,5x LB-bouillon. Pak kontinuert kultur reaktor og skru på reaktoren. Undgå at berøre røret prøveudtagning. Pak sutteflasken og skru på sutteflasken. Undgå at berøre røret prøveudtagning. Hold 18 i. Rør fastgjort til havnen ε sterile. Un-wrap 18 i. Slanger og peristaltisk pumpe slange adapter. Passe en fri ende af 18 in. Slangen på den ene ende af den peristaltiske pumpe slange adapter. Monter den anden ende af den peristaltiske pumpe slange adapter til18 i. rør fastgjort til havnen ε af sutteflasken hætte. Skrue 0,22 um filterenheder onto havne β og δ af kontinuerlig kultur reaktoren. Skru et 0,22 um filterenhed på adapteren port α. Til 0,22 um filterenhed, passer den frie ende af 18 in. Slange. Start kontinuerlig kultur. I biosikkerhed hætte, pode den kontinuerlige kultur reaktor med 100 ul O / N kultur foretaget i afsnit 7.2.1.1. Tæt system, før flytter kontinuerlig kultur i en 37 ° C inkubator. I inkubatoren har en magnetomrører og mini peristaltisk pumpe sat op. Monter peristaltikpumpen slange adapter i peristaltisk pumpe. Slangen fra sutteflasken starter ved "I" side og slanger, der fører til reaktoren starter ved "Out" side. Indstil peristaltikpumpen til: "FAST". Start den peristaltiske pumpe ved at skifte til R20; FREM ". Kontroller at medierne begynder at strømme gennem slangen. Placer reaktor på magnetomrører plade og begynde at blande. Kontinuerlig kultur reaktor skal ligevægt i 24 timer før prøveudtagning. Sampling af den kontinuerlige kultur. Skru en 5 ml luer lok sprøjte på port γ og trække op 4,5 ml kultur. Anvende 500 pi af kulturen til at måle densitet (OD 600 nm). Fortynd celler til at gøre 4 x 1 ml kulturer på OD 600 nm = 0,35. Portion fortyndet kulturer i 1,7 ml mikrocentrifugerør. Gentag prøveudtagning hver 12 timer i 4 dage. Forbered prøver til GC-TOFMS: Pellet celler via centrifugering ved maks hastighed (16.900 xg) i 2 min. Dekanteres supernatanten. Vask cellerne med 500 pi phosphatpufret saltvand (PBS). Gentag dette trin. Dekanteres supernatanten en sidste gang, og derefter nedsænkes mikrocentrifugerør med pelleterede celler i flydende nitrogen, indtil boblende stopper. Store prøver i -80 ° C fryser. 8. Løb seriepassage batchkulturer for Metabolomics Forberedelse bakteriel celle-suspension. Fra et glycerol frossen lager 12,5%, plade frisk E. coli kloner onto 0,5x LB-agar indeholdende 100 ug / ml ampicillin. Der inkuberes ved 37 ° C i 24 timer. Inokulere individuelle kolonier i 3 ml 0,5x LB-bouillon indeholdende 100 pg / ml ampicillin. Anvende biologiske triplikater for hver klon. Seriel passage batchkulturer. Subkultur O / N fra 8.1.1 via en 500-gange fortynding i 3 ml LB-bouillon indeholdende 50 ug / ml ampicillin og 0,1% L-arabinose. Subkultur bør have en OD 600 nm <0,005. Der inkuberes ved 37 ° C under omrystning. Check optisk densitet (OD 600 nm) ved 2 og 2,5 timer. Grow celler til opnåelse OD 600 nm = 0,35. Subkultur via en 500-fold dilution i 3 ml LB-bouillon indeholdende 50 ug / ml ampicillin og 0,1% L-arabinose. Subkultur bør have en OD 600 nm <0,005. Check optisk densitet (OD 600 nm) ved 2 og 2,5 timer. Grow celler til opnåelse OD 600 nm = 0,35. Prøveudtagning seriel passage batchkulturer. Anvendelse af steril pincet, placere en 0,22 um membranfilter på toppen af et filter manifold. Portion slå 1 ml phosphatpufret saltopløsning (PBS) på filterpapir og derefter vakuumpumpe. Gentag tilsætning af 1 ml PBS. Overfør 1 ml subkultur fra afsnit 8.2.3 på filtrerpapir. Herfra bevæge sig hurtigt at få prøver i flydende nitrogen med det samme. Fuldføre denne i 1 min. Alikvote 1 ml PBS onto filtrerpapir til at vaske prøven. Skyl hurtigt uden at spilde prøven over sider filtrerpapir. Gentag. Anvendelse af steril pincet sted filter over i en 1,7 ml mikrocentrifugerør ved omhyggeligt at folde filter. Nedsænkes mikrofugerør i flydende nitrogen indtil boblende stopper. Opbevar prøve i -80 ° C fryser. 9. metabolitanalyse & Processing Skib 3 prøver pr klon på tøris til en metabolomics core facilitet for prøve behandling, analyse og normalisering af GC-TOFMS. For hver prøve bestemme middelværdi, median, standardafvigelse og variationskoefficient tværs metabolitter, ved hjælp gentagne data. Til statistisk analyse, manuelt kode en QA rørledning ved hjælp betingede udsagn og gentagne henrettelser 26 at fjerne metabolitter, der ikke følger definerede betingelser. For betingelse 1, fjerne metabolitter, hvor mere end 2 prøver har nul overflod. Fjern interne standarder fra metabolomiske profiler. For betingelse 2, fjerne disse metabolitter, som ikke findes i cellerne af interesse. Her fjerne følgende metabolitter: indol 3 acetat, dihydroabiet ic acid, nonadecansyre, salicylsyre, salicylaldehyd, cholesterol, phenol, 1-monostearin, octadecanol, 1-monopalmitin, dodecan, dodecanol, 1-hexadecanol, 5-methoxytryptamin, benzoesyre, pentadecansyre, phosphorsyre, pelargonsyre, palmitinsyre , caprinsyre, hydroxylamin, stearinsyre, myristinsyre, maleimid, levoglucosan og 4-hydroxysmørsyre. For betingelse 3, fjerne disse metabolitter hvis variationskoefficient er større end 1. Capture globale metabolomics effekter ved at se på metabolit relative mængder. Opret en visuel repræsentation af medianen metabolit overflod pr klon for hver metabolit (figur 6). Identificere outliers ved at observere klon-metabolit pair frekvenser. Beregn Z-score for hver medianværdien af hver metabolit i en klon. Beregn z scores ved hjælp af følgende ligning: /52854/52854eq7.jpg "/> [7] Bemærk: Term X MC repræsenterer overflod niveau af en specifik metabolit for en specifik klon. Udtrykket μ C repræsenterer middelværdien af alle kloner for en specifik metabolit. Term σ C er den tilhørende standardafvigelse. Opret en visuel repræsentation af de data, hvor outliers er fremhævet (data ikke).

Representative Results

Alle prøver, der anvendes til at bestemme de åbne læserammer (ORF'er) valgt i denne undersøgelse blev indsamlet fra Starbuck Island, Alm 7 (STAR7) og Caroline Atoll, site 9 (CAR9) af de sydlige linje Øer. En anslået 100 liter havvand fra disse steder blev indsamlet under de koraller grænselag hjælp lænsepumper, som beskrevet tidligere 5. Indholdet af pumperne var underlagt fractionalization gennem store porer filtrene til at fjerne små eukaryoter og efterfølgende koncentreret under anvendelse af 100 kDa tangential flow filtre så kun mikrober og viral lignende partikler (VLP'er). At adskille VLP'er blev resterende havvand passeret gennem 0,45 um filtre resulterer i virome. Chloroform blev introduceret til denne virale fraktion for at standse vækst af eventuelle tilbageværende celler og opbevaret ved 4 ° C. VLP'erne blev oprenset ved anvendelse caesiumchloridoploesning metode, hvor densitetsgradienter adskilt gennem centrifugering og give mulighed for inddrivelse af virioner ved ~ 1,35 g / ml til 1,5 g / ml 3. Viralt DNA blev ekstraheret under anvendelse af en CTAB / phenol: chloroform-protokol og forstærkes via amplifikation multipel fortrængning under anvendelse phi29 reagenser. Sekventering af virome blev opnået med kommercielt tilgængeligt pyrosekventering teknologi. Bioinformatik, der anvendes i behandling og udvælgelse af virale ORFs til denne undersøgelse er som følger. Tre pre-procestrin blev brugt på CAR9 og STAR7 virale metagenomes. Først blev offentligt software, der bruges til at fjerne tag-sekvenserne, der resulterede fra amplifikation af det virale DNA inden sekventering 27. For det andet blev fælles sekventering artefakter såsom sekvens dubletter og lavt kopiantal filtreres ud af datasættet via en ekstra bioinformatik program 28. Endelig blev fjernelse af udenlandsk sekvens forurening 29 udføres for de sekvenser, der havde ≥ 90% dækning og ≥ 94% identitet med sekvenser i følgende databaser: RefSeq vIrus genomer; Menneske – reference GRCh37; Menneske – Celera Genomics; Menneske – Craig Venter (HuRef); Menneske – Seong-Jin Kim (Korean); Menneske – kromosom 7 version 2 (TCAG); og human – James Watson, Yanhuang (YH, asiatiske), Yoruba (NA18507; afrikansk) reference- sekvenser 21. Efter disse processer, sekvenser fra CAR9 prøverne udgjorde 591.600 og STAR7 sekvenser udgjorde 939.311. Disse sekvenser blev uploadet på MGRAST og samles via assembler software ved hjælp af standardindstillingerne. Contigs blev oversat til 6 læserammer og formodede åbne læserammer (pORFs) blev identificeret ved hjælp af scripts, som tidligere beskrevet 21. For at identificere ukendte ORF'er en række af lighed baserede søgninger blev udført for at fjerne ORF'er med kendt funktion. Kort beskrevet blev følgende søgninger udført med deres tilsvarende søge kriterier 21: Signifikant lighed på ≥ 95% identitet over ≥40 basepar (bp) ved MGRAST BLAT i M5NR database. Signifikant lighed (e-værdi ≤ 0,001) ved TBLASTN mod alle offentlige metagenomes i My metagenom Database ressource. Signifikant lighed (e-værdi ≤ 0,001) af BLASTP og TBLASTN mod NR databasen. Signifikant lighed (e-værdi ≤ 0,001) ved RPS-BLAST mod Conserved Domain Database. Protein oversættelser fra en udvalgt brøkdel af hvert datasæt sammenlignet mod løste proteinstrukturer i Protein Data Bank. Beregning af dinukleotid frekvenser ved hjælp dinukleotid Signatures pakke. De resulterende pORFs blev konstrueret til ekspression i E. coli under anvendelse af offentligt tilgængelig gen design software. Back-translation af de aminosyresekvenser ansat en Universal kodonanvendelse Tabel konstrueret til ekspression i E. coli med en sædvane tærskel på 2% minimum. Restriktionsenzym-genkendelsessekvenss for BamHI og HindIII blev udelukket fra sekvenserne for at lette kloning. En ekstern virksomhed syntetiseret det manipuleret gen sekvenser 30 og derefter ORF'erne blev klonet i et medium-copy nummer pBAD promotor vektor pEMB11, via standard restriktionsenzym kloning. Alle kloner blev transformeret ind i E. coli K-12-stamme BW 27784 23. Multi-fænotype assayplader (kort) En høj kapacitet og robust software pipeline blev gearede til analyse af kortene, at PMAnalyzer 24. Rørledningen blev udviklet i en Linux-server miljø og udfører forskellige trin herunder: parsing af optiske densitet filer, formatering data i læsbar tekst filer, forbehandling af vækstkurver for kvalitetssikring (QA), og udfører matematisk modellering teknikker til at analysere vækstkurver . De primære modellering scripts blev udviklet i Python-version 2.7.5 at gøre brug af PyLab modulet. Kort reproducerbarhed blev vurderet ved hjælp af den standard fejl (SE) for gentagne data (figur 2A). Rå vækstkurver blev sammenlignet med logistiske vækstkurver for at bestemme, om programmet PMAnalyzer præcist parameteriserede og modelleret vækst klon under eksperimenter (data ikke vist). For yderligere information om nøjagtigheden og gyldigheden af kortene og PMAnalyzer se Cuevas et al. 24 Efter validering af metoden, blev MAPs data analyseres ved hjælp af de mange parametre, såsom maksimal væksthastighed (μ max) og vækst niveau (GL), der leveres af behandlingen pipeline. Sammenlignende visualisering af vækstkurver bruges ofte til vækst datafortolkning; imidlertid, at antallet af kurver, der kan visualiseres på et tidspunkt til sammenligning har begrænsninger. At analysere mange vækstkurver samtidigt, blev varme kort afledte parceller bønfaldt at sammenligne snesevis af kloner dyrket på et enkelt substrate mod at betingelser gennemsnitlige respons (figur 2B). Påvirkningen observeres placeret ved overekspression af et hidtil ukendt fag-protein via ændringer i kurvens parametre, specifikt: halter fase eksponentielle fase og den maksimale biomasse udbytte (asymptote). Som et eksempel er den stejle opstigning fra lag-fase i eksponentielle fase modelleret i kurven for capsidproteinet (figur 2A) vækst gengives af en hurtig ændring i farveintensiteten fra sort til hvid for det samme klon i den dynamiske plot af figur 2B . For at få et samlet billede af klon fordeling på tværs substrater blev fænotypiske klassifikationer afledt af GL bruges (figur 3). Her, de fire fænotyper er adskilt i fire diagrammer, hvor højden af hver søjle repræsenterer antallet af kloner, der udviser denne fænotype for et specifikt substrat. Outliers i data indregnes som kloner, der falder ind i "gevinst på funktion "eller" tab af kategori funktion ". Outliers kan derefter opsøgte individuelt og tættere undersøgt eksperimentelt. Desuden global analyse genkender substrat bias i assayet. Substrater, såsom phenylalanin, æblesyre og glycin førte til en "ingen vækst" klassificering. Substrater, der konsekvent falder ind under ingen vækst klassificering, på tværs af alle kloner, er ikke stærkt vægtet i nedstrøms funktionel karakterisering. Metabolomics Kataboliske produkter fra kloner, der udtrykker ukendte fag-gener blev identificeret under anvendelse metabolomics. Kort fortalt blev kloner dyrket under enten en kontinuerlig kultur eller seriel passage i batchkultur miljø, før de sendes ud til GC-TOFMS analyse på et metabolomics core facilitet. For nærmere oplysninger om prøve behandling, analyse og normalisering for GC-TOFMS gennemføres af den valgte kerne facilitet se Fiehn et al. 31 Briefly, 1 ml kold ekstraktion opløsningsmiddel tilsættes til hver prøve, hvorefter prøver hvirvlet og ultralydsbehandlet i et koldt bad i 5 min. Prøver endelig centrifugeret, og halvdelen af prøven dekanteres og tørres ned til analyse. Ekstrakter er oprenset og tilsat intern retention indeksmærker før det lastes på gaskromatografen og efterfølgende overført til massespektrometeret. Data fra hver prøve analyseres således, at signalintensiteter for alle detekterede signaler i kromatogrammet rapporteres. Til normalisering, er den overflod af toppe for hver prøve summeres og den samlede peak mængderne midles mellem alle prøver i sættet. Metabolit mængderne pr prøve divideret med prøvens peak overflod og derefter ganget med den gennemsnitlige peak overflod af prøvesæt. De resulterende data anvendes til analyse af metabolomics i forskningen diskuteret. Validering af metabolomics reproducerbarhed var forpligtet til atfastsætte en passende stikprøvestørrelse for hver dyrkning metode. At detektere præcision ses inden prøver og variationen set på tværs af prøven størrelser standardfejlen af middelværdien (S M) for både n = 3 og n = 6 datasæt blev gennemgået (figur 5B). Uanset den kontinuerlige kultur (CC) stikprøvestørrelse, mindre end 1% af de data, havde en S M ≤ 1,5. Median S M s var 221 og 300, og værdierne varierede fra 0 til 7,55 x 10 5 og 3,74 x 10 5 henholdsvis for n = 3 og n = 6. S M s blev også beregnet for hvert sæt af prøve replikerer i den serielle kultur (SC) metode. Igen, mindre end 1% af de data, havde en S M ≤ 1,5, en median S M på 137, og en række 0-3,51 x 10 5. For at sammenligne S M fordelinger mellem hvert prøvesæt (CC n = 3 vs CC. n = 6, CC n = 3 vs. SC n = 3, og CC n = 6 vs. SC n = 3) en permutation test blev udført. Den distribution af enten kontinuerlig kultur S M værdier datasæt var ikke signifikant forskellig fra fordelingen af de serielle kultur S M værdier (p-værdi = 0,0). Men fordelingen af S M værdier for kontinuerlig kultur n = 3-data var signifikant forskellig fra den af de S M værdier for kontinuerlig kultur n = 6 data (p-værdi = 1,908804 x 10 -49). Endelig blev variationskoefficienten pr metabolit sammenlignet før og efter gennemførelsen af en kvalitetssikring (QA) trin (figur 5C). I alt blev 210 metabolitter fjernet efter gennemførelsen af QA-rørledningen (40% af data). Mindre end 1% af de fjernede data havde en metabolit overflod af nul, ~ 2% var intern standard data, ~ 5% blev data fra metabolitter aldrig før observeret i E. coli, og de resterende metabolitter (> 30%) havde en variationskoefficient større end 1. Som med analysen kort, global observations forudsat en indledende forståelse af dybden af informations- metabolomik tilbud. For at få et samlet billede, blev kloner hierarkisk klynger baseret på deres relative metabolit mængderne med oplysninger om klon-metabolit profiler, potentielle kloner med beslægtede funktioner og klon-metabolit outliers (figur 6). For at fremhæve protein funktioner, er metabolitter separeret og grupperet baseret på fælles metaboliske veje. Brug af denne analyse med foreløbige resultater, var det klart, metabolomics er i stand til at separere gener fra forskellige klasser (figur 6, fremhævet kloner). Desuden blev outlier identifikation med metabolomics data bestemmes ved beregning standard scores (Z-score) for hver klon-metabolit par. At sikre statistisk signifikans blev outliers defineret som en klon-metabolit par med en Z-score værdi på 2, svarende til kun 5 procent af dataene (data ikke vist). Figur 1. Definitioner af fænotype klassifikationer. (A) Forholdet mellem niveauet vækst (GL) og maksimal vækstrate. Datapunkter kredsede i rødt repræsenterer vækstkurver viser lidt at ingen substrat udnyttelse. (B) Boxplot repræsentation definerer vækst tærskel baseret på fordelingen af vækstkurver med en minimal vækst (<0,15 OD / time). (C) Variansen og standardafvigelse af GL beregnes for substrat D-galactose. Korte stiplede linjer repræsenterer to standardafvigelser væk fra middelværdien. Klik her for at se en større version af dette tal. highres.jpg "/> Figur 2. Kort validering via præcision og differentiering. (A) vækstkurver for kommenterede strukturelle (capsid) og metaboliske kloner (thioredoxin), to hidtil ukendte metaboliske kloner (EDT2440, EDT2441), og den gennemsnitlige respons af kloner dyrket på saccharose, D- galactose og D-mannose i kortene. Blå linier angiver standardfejlen set mellem gentagne data (n = 3). (B) Kurverne for 47 forskellige kloner vækst er repræsenteret som varme kort til saccharose, D-galactose og D-mannose. Den kommenterede strukturelle (grøn cirkel) og metaboliske kloner (orange cirkel), to nye metaboliske kloner (mørke og lyse blå cirkler), og den gennemsnitlige respons (rød cirkel) er fremhævet. Klik her for at se en større version af dette tal. pload / 52854 / 52854fig3highres.jpg "width =" 700 "/> Figur 3. Klon fordeling for hver fænotype på tværs af flere substrater. Fænotypen-klonen tæller for 47 kloner på tværs 72 kulstof-specifikke vækstbetingelser. Tabel giver direkte tæller for hver fænotype. Klik her for at se en større version af dette tal. Figur 4. Diagram beskriver konstruktionen af det kontinuerlige apparat kultur. (A) trin, der anvendes til at bygge havne α-γ af kontinuerlig kultur reaktor (B) trin anvendes den ud flow port kontinuerlig kultur reaktoren, og (at bygge C ) de skridt til at opbygge porte δ og ε af den kontinuerlige kultur sutteflaske. = "Https://www.jove.com/files/ftp_upload/52854/52854fig4highres.jpg" target = "_ blank"> Klik her for at se en større version af dette tal. Figur 5. Sammenligning af Phenomic metoder præsenteres. (A) Workflow for udarbejdelsen af Multi-fænotype assayplader (kort), kontinuerlige kulturer og serielle kulturer. (B) Procentdelen af Middelfejl på middelværdien (S M) tæller for både n = 3 og n = 6 stikprøvestørrelser til kontinuerlig kultur (CC) og serienummer kultur (SC) forberedelse metoder til metabolomics. Y-aksen er på en logaritmisk skala. (C) De distributioner af variationskoefficienter (CV) pr metabolit, før og efter gennemførelsen af QA rørledning til kontinuerlig kultur (CC) metode.g5highres.jpg "target =" _ blank "> Klik her for at se en større version af dette tal. Figur 6. metabolomiske profiler af kloner dyrkes i kontinuerlig kultur. De mediane metabolit mængderne til et sæt af metabolitter er plottet i 84 kloner dyrkes i kontinuerte kulturer. Metabolit profiler for kommenterede strukturelle (kapsid) og metaboliske kloner (thioredoxin), to nye metaboliske kloner (EDT2440, EDT2441), og den gennemsnitlige metaboliske respons er fremhævet med rødt. Klik her for at se en større version af dette tal. Forbindelse Carbon Nitrogen Svovl Fosfor Glycerol – 0,40% 0,40% 0,40% Ammoniumchlorid 9,5 mM – 9,5 mM 9,5 mM Natriumsulfat 0,250 mM 0,250 mM – 0,250 mM Magnesiumsulfat 1,0 mM 1,0 mM – 1,0 mM Kaliumphosphat 1.32 mM 1.32 mM 1.32 mM – Magnesiumchlorid – – * – Kaliumchlorid 10 mM 10 mM 10 mM 10 mM Calciumchlorid 0,5 uM <tD> 0,5 uM 0,5 uM 0,5 uM Natriumchlorid 5 mM 5 mM 5 mM 5 mM Ferrichlorid 6 uM 6 uM 6 uM 6 uM L- arabinose 0,10% 0,10% 0,10% 0,10% MOPS pH 7,4 1x 1x 1x 1x Tabel 1. Forbindelserne og koncentrationer af de forskellige basale medier, der anvendes i kortene. * 1,0 mM af magnesiumchlorid er substitueret. 1x MOPS = 40 mM MOPS, 4 mM Tricine. Carbonsubstrater Nitrogen substrater Svovl substrater Phosphorus substrater 2 deoxy-D-ribose 2-deoxy-D-ribose 1-butan-sulfonsyre adenosin-5-monophoshate 4 hydroxyphenyl eddikesyre acetamid acetylcystein beta-glycerophosphat eddikesyre adenin D-cystein creatinephosphate adenosin-5-monophosphat adenosin D-methionin D-glucose-6-phosphat adonitol allantoin diethyl-dithiophosphat diethyl-dithiophosphat alfa-D-glucose beta-phenylethylamin DL-ethionin DL-alfa-glycerophosphat alfa-D-lactose biuret glutathion kaliumphosphat alfa-D-melebiose cytidin isethionsyre natriumpyrophosphat Citronsyre cytosin L-cysteinsyre natrium thiophosphat D-alanin D-alanin L-Cystein D-arabinose D-asparagin L-djenkolic syre D-arabitol D-aspartat L-methionin D-asparagin D-cystein magnesiumsulfat D-aspartat D-glucosamin methansulfonsyre D-cellubiose D-glutaminsyre N-acetyl-DL-methionin D-cystein DL-alpha-amino-N-smørsyre N-acetyl-L-cystein D-fructose D-methionin kalium-tetra-thionate </tr> D-galactose D-serin natriumthiosulfat D-glucosamin D-valin sulfanic syre D-glucose gamma-amino-N-smørsyre taurin D-glucose-6-phosphat glycin taurocholsyre D-glutamat guanidin thiourinstof D-mannose histamin D-raffinose inosin D-ribose L-alanin D-salicin L-arginin D-serin L-asparagin D-trehalose L-citrullin D-xylose L-cystein dulcitol L-glutaminsyre glycerol L-glutamin glycin L-glutathion i-erythritol L-histidin inosin L-isoleucin L-alanin L-leucin L-arabinose L-lysin L-arabitol L-methionin L-asparagin L-ornithin L-aspartat L-phenyl-alanin L-cysteinsyre L-prolin L-cystein L-pyro-glutaminsyre L-fucose L-serin; L-threonin L-glutaminsyre L-tryptophan L-glutamin L-valin L-isoleucin N-acetyl-D-glucosamin L-leucin putrescin <tr> L-lysin thiourinstof L-methionin thymidin L-phenylalanin thymin L-pyro-glutaminsyre tyramin L-rhamnose tyrosin L-serin uridin L-sorbose L-threonin L-tryptophan L-valin L-xylose laktat lactulose malat myo-inositol oxalsyre kaliumsorbat propionsyre putrescin quinasyre natriumpyruvat natriumsuccinat </td> saccharose thymidin xylitol Tabel 2. Liste over substrater, der anvendes i MAP eksperimenter.

Discussion

Her præsenterer vi Phenomic metoder til funktionel karakterisering af formodede fag gener. Teknikker indbefatter et udviklet assay stand til at overvåge vært anabolsk metabolisme, Multi-fænotype assayplader (kort), ud over den etablerede fremgangsmåde til metabolomics, der kan måle effekter til kataboliske metabolisme. Vi forudsat yderligere værktøjer til at håndtere de store datasæt som følge af disse teknologier, der giver mulighed for high throughput bearbejdning og analyse ^24. Endelig gennem sammenligningen af en kommenteret fag capsidprotein, fag thioredoxin, to formodede metaboliske fag gener, og den gennemsnitlige eksperimentelle respons vi foreslår forskellige strategier til at fortolke både datasæt og gen-klasser, med vægt på identifikation af fænotypiske tendenser og identificere outliers.

Som nævnt begge tilgange kvantitativ måling kun halvdelen af værtens metabolisme. At fortolke den relative funktion af enhver af denye proteiner, der undersøges, er data fra begge metoder fremlægge bevis for funktion. Selvom dette ikke er en fokus for vores nuværende manuskript, er data output fra hver Phenomic metode sat gennem kombinatoriske analyser, der fokuserer på klyngedannelse teknikker såsom tilfældig skov og principal komponent analyse. Desuden skal hypoteser som følge af kombineret analyse efterfølgende valideret af traditionelle genetiske metoder.

Endelig metoder præsenteres, er stærkt påvirket af bakteriel fysiologi og derfor følge de samme standarder. Når virksomheden enten metode, skal gøres for at sikre uafhængige, klonede grupper eksperimenteret med hensyn; kontaminering forhindres; en enkelt variabel testes; og passende kontroller bliver kørte samtidigt. Manglende forklare disse punkter vil resultere i uklare resultater, der ligner fysiologiske assay.

Multi-fænotype assayplader(MAP)

Udviklingen af kort giver en høj kapacitet og smidig assay i forhold til nuværende teknologier (figur 5A og tabeller 1,2). Analysen benytter forsyninger, udstyr og de grundlæggende teknikker til rådighed i alle mikrobiologi laboratorier. Indarbejdelsen af en beregningsmæssige pipeline, PMAnalyzer ^24, til efterfølgende behandling og analyse af data sikrer hurtig tolkning af data. Desuden kan både eksperimentelle og analytiske aspekter af den fremgangsmåde let indstilles eller tunet til skræddersyede formål. For eksempel, hvis en stor del af de data, ikke består filtrering skitseret i afsnit 4, kan man manuelt finkæmme gennem vækstkurverne at identificere problemer. Hvis problemet opstår på grund af strenge filterparametre, kan foretages justeringer af scriptet. Alternativt, hvis problemer er forbundet med den eksperimentelle proces (dvs. langvarig kondens, ukorrekt overførsel af bakteriel cells, etc.) derefter yderligere gentagelser kan let gentages.

Som beskrevet i Cuevas et al. ^24, den PMAnalyzer er en enkelt bash program skrevet som en wrapper script, der udfører de parsing og analyse scripts som en sammenhængende, automatiseret rørledning. Alle scripts er frit tilgængelige fra en Git repository ved ²⁵ ved at tage medianen værdi for hvert tidspunkt på tværs af tre eksemplarer af data, og efterfølgende parameterizes den logistiske kurve for at opnå den tidsforsinkelse, maksimal væksthastighed, asymptote og en ny valgperiode, Growth Level. Medianværdien blev valgt frem middelværdien i vores undersøgelse at reducere effekten af store outliers imidlertid scriptet let kan tilpasses til at beregne middelværdien replikater data. På grund af reduceret variation (SE) set på tværs replikere data (figur 2A) vi fastholdt brugen af medianen i PMAnalyzer til montering en logistisk kurve. Derudover afskåret for vækst i denne undersøgelse (GL ≥ 0,4) var DETErmined ved at sammenligne, hvordan data adskilles tværs Vækst Level og maksimal vækstrate (figur 1A, B). Afhængig af instrumenter og model, der anvendes dette udtryk kan variere, kræver omdefinering af dette afskåret værdi.

En stor fordel ved vores assay er evnen til at sammenligne fænotyper hjælp af en enkelt parameter karakteriserer samlede mikrobiel vækst, som vi definerer som Growth Level (GL). GL er en harmoniske gennemsnit, og derfor afbøder virkningerne af store outliers i dataene. Brugen af en harmoniske gennemsnit med flyttet logistiske udstyret værdier for at give en oversigt over vækst nås gennem trial and error. Andre metoder forsøgt at differentiere væksten inkluderet: tid, det tog at nå bestemte kurve parametre (halv μ _max, μ _max, og bæreevne), determinationskoefficienten ^(R2) og kombinationer af R ² ganget med specifikke kurve parametre. Ved hjælp af en harmoniske middelværdi med forskudtlogistic-fit værdier for GL billede det største udvalg ved evalueringen vækst og dermed blev den foretrukne metode. En overvejelse at bemærke, er, at dynamiske vækstkurve mønstre har potentiale til at blive tabt, når anvendelse af en enkelt parameter eller en monteret model. For eksempel er de enkelte kurve parametre for logistisk kurve og GL er ude af stand repræsenterer bifasisk vækst. I en enkelt kulstof miljø, denne effekt på vækst indebærer formidling af det virale protein på hver konvertering af underlaget eller skift i underlaget udnyttelse. Yderligere effekter potentielt tabt, når de ikke overvejer flere vækstparametre inkluderer: forlænget latenstid, foreslå en øget belastning af viral maskiner eller produkter; hastigt accelererende eksponentiel fase, hvilket tyder på virale proteiner koblet til vært energiproduktion veje; eller højere dannelse biomasse, hvilket indebærer viral støtte vært næringsstofoptagelse og anabolisme (data ikke vist). Således plotte vordende vækstkurver ( Figur 2A, B) giver oplysninger om tendenser over tid mens GL tager hensyn til de store variabler i den logistiske model, der giver et enkelt kvantitativt tal til at repræsentere generelle succes en klon.

Når man overvejer de forskellige reaktioner bidraget med strukturelle og metaboliske gener i kortene, er det konstateret, at de forskellige underlag klasser pågældende giver størst evidens for protein funktion. For eksempel er metaboliske proteiner ofte forbundet med erhvervelse af begrænsende næringsstoffer, der er uspecifikt til vært centrale metabolisme ^16,32. Indledende MAP eksperimenter viser, at kloner, der huser formodede metaboliske fag-gener har en forøget forsinkelsesfase ved dyrkning på centrale metabolisme carbonkilder (figur 2A). Omvendt kloner bærer formodede strukturelle gener, som kræver store dele af host energi- og dNTP pools, resultere i en falsk positiv respons på vækst til central og aminosyre-metabolisme carbonsubstrater. Dette er sandsynligvis på grund af ophobning af uopløselige proteiner resulterer i værten filamentering og / eller inklusionslegemer, som observeret via mikroskopi (figur 2A og data ikke vist). Mens yderligere analyse er nødvendig for at validere disse foreløbige resultater, kortene er i stand til at hente fænotypiske responser, der korrelerer til den hypotese, funktioner af specifikke fag gen klasser.

Ud over den belysning af ukendte virale proteiner, kortene er en roman ressource til at undersøge den funktionelle og metaboliske mangfoldighed af en individuel bakterie eller et fællesskab af bakterier. MAP komponenter er designet til nem ændring til at understøtte væksten af en række bakterier; herunder marine, auxotrofisk, og anaerobe mikrober. For at lette disse bestræbelser den definerede basal og præ-vækstmedier kræver yderligere eller justerede kemiske arter, før en anden bakteriel slægt kan støttes i kortene.En note i denne anvendelse af kortene er at opretholde definerede medier, der forbyder brugen af ingredienser såsom trypton, gærekstrakt og pepton.

Metabolomics

Feltet af metabolomics er afhængig af metabolit databaser, som omfatter isolerede metabolitter identificeret ved massespektrometri. Kernen facilitet valgt her har et af de største metabolomik databaser. Interessant, mere end halvdelen af de metabolitter, der følger af vores eksperimenter var uidentificerbare (~ 65%), mens andre havde aldrig før blevet registreret i vores vært, Escherichia coli (eksempler: Indole 3 eddikesyre ^33, salicylsyre ^34, og dihydroabietinsyre ^35). Dette faktum kan tilskrives enten en stærk slagside af databasen mod plantemetabolitter eller de specifikke proteiner, der undersøges. Uanset hvad, er resultatet en begrænset antal kendte metabolitter tilgængelige for data repræsentation og analyse. I fuklatur, ville flere metabolomics metoder under anvendelse af forskellige databaser giver mulighed for større metabolit dækning.

I øjeblikket, både kendte og ukendte metabolitter bruges, når man sammenligner og kontrasterende vores nye virale proteiner. Ved hjælp af denne metode, vi hypotesen, at kloner huser funktionelt tilsvarende proteiner vil dele en øget lighed i deres fuldstændige metabolomiske profil. Indledende metabolomics analyse afslørede, at mens strukturelle og metaboliske gener ikke klart adskilt fra hinanden, de gener, der udviser lignende virkninger på værten ved overekspression nogen korrelation (figur 6). For eksempel er de annoterede capsidgenet klynger tæt med de formodede metaboliske gener fremhævet i denne undersøgelse, EDT2440 og EDT2441. Undersøgelser ved hjælp af en offentligt tilgængelig transmembrane topologi og signalpeptid prædiktor program viste tegn på, at de to formodede metaboliske gener huser en enkelt transmembrandomæne. Interessant 5 ud af the 9 kloner i den første klynge gruppe (mest venstre del af dendrogram) har forudsagt transmembrandomæne anvender samme topologi program. Der er behov for yderligere undersøgelser, er det imidlertid sandsynligt, at metabolitter til stede under overekspression af disse kloner er forbundet med cellulære stressrespons følge af membran eller strukturelle byrder. Dette beviser understøtter, at mens metabolomics data besidder en øget mængde støj, metoden er i stand til at fremhæve signaler, der adskiller generelle virkninger af gener, både inden for og på tværs af et gen klasse. For at bestemme om fremgangsmåden er i stand til at ekstrahere ud specifikke oplysninger af genfunktion blev metabolitter grupperet i specifikke metaboliske veje. Hypotesen væsen, hvis en klon påvirker metabolitter er specifikke for en enkelt vej, så den overudtrykte gen er aktiv i denne reaktionsvej. Forud for etableringen af vores metabolomics kvalitetssikring pipeline, foreløbige data viste, at over end underrepræsenterede metabolitter var typisk "ukendt", der giver lidt oplysninger om de veje, de er knyttet til (data ikke vist). Forbehandlet metabolomics data, viser imidlertid, at størstedelen af metabolitten profiler er ens, og kun et udvalgt antal af kendte og ukendte metabolit mængderne varierer på tværs kloner, fx putrescin og uracil (figur 6). At tilvejebringe større opløsning af proteinfunktion indsats bliver gjort til eksperimentelt sammenligne de hidtil ukendte faggener mod kendte fag-gener, som kan anvendes til at udfylde de "huller" af metabolit baserede funktionel karakterisering. Ved hjælp af denne teknik, den tildelte funktion af kendte virale gener giver en reference for funktionen af de ukendte gener. Ikke desto mindre, den begrænsende faktor for metabolomiske analyse er størrelsen og relevansen af databasen. For at korrigere for disse begrænsninger og metabolomiske databaser relatable til denne forskning skal udvikles; sådansom en database af metabolitter og deres mængderne specifikke for ASKA samling af E. coli-kloner, hvor en enkelt ORF overudtrykkes ^36. Bevis for behovet for sådanne databaser var forudsat i 2013, hvor forskere ved Lawerence Berkeley National Laboratory udarbejdet den første omfattende database af metabolitter specifikke for hele mutant biblioteker af model bakterier ^37. Denne forskning billede hidtil ukendt indsigt i gener, der er nødvendige for udnyttelsen af specifikke metabolitter, afslører klar sammenhæng mellem fænotype og genotype.

Når man overvejer metabolomics som et værktøj, er det vigtigt at definere behandlingen regime fulgt kernen facilitet. En artefakt af de fleste eksperimentelle procedurer er den dag-til-dag varians forbundet med instrumenterne i brug. Til dato alle GC-MS-analyse implementerer brugen af interne standarder, der er inkluderet i hver analytisk kørsel; dog tilsætning af specifikke interne prøver projekt kørte hver dag i eksperimenter fjerner ekstra varians. Disse overvejelser skal behandles tidligt for at undgå normalisering problemer og fordomme. En anden løsning er at behandle alle prøver på en kerne facilitet på samme maskine og som en enkelt batch, en mulighed til rådighed til enhver core facilitet.

De forskellige værktøjer både indført og re-udforsket i dette manuskript give roman betyder at screene og karakterisere funktionelt ukendte fag gener. Enkelheden og tilpasningsevne af de eksperimentelle teknikker med strømline brugen af beregningsmæssige rørledninger forsikrer disse metoder kan anvendes på en bred vifte af forskning bestræbelser og marker. Vores mål er, at de Phenomic tilgange præsenteres her vil hjælpe yderligere undersøgelser af nye fag proteiner ud over systemer, der er lige så funktionelt udefineret.

Disclosures

The authors have nothing to disclose.

Acknowledgements

We thank Benjamin Knowles, Yan Wei Lim, Andreas Haas, and members of the Viral Dark Matter consortium for their help and constructive input on this manuscript. This research is funded by the National Science Foundation (DEB-1046413) and is part of the Dimensions: Shedding Light on Viral Dark Matter project.

Materials

0.22µm Sterivex Filter	Fisher Scientific	SVGP01050	Millipore
0.22µm Millex Filters	Fisher Scientific	SLGV033RS	Millipore
0.22µm SteriCap Filter	Fisher Scientific	SCGPS02RE	Millipore
0.22 µm Omnipore membrane filters	Millipore	JHWP02500	Millipore
96 well micro-titer plates	VWR	82050-764	Standard F-Bottom 96 well Microplates
2 mL 96 well plate	Fisher Scientific
Adhesive Seal Plate Film	Sigma-Aldrich	Z369667
2 L Nalgene square bottles	Cole Parmer	T-06040-70
125 mL Nalgene square bottles	Cole Parmer	T-06040-50
1/4inch Panel Mount Lock Nut, black nylon	Cole Parmer	EW-45509-04
Female Luer Thread Style Panel Mount to 200 Series Barb 1/16inch	Cole Parmer	EW-45500-30
Female Luer Thread Style Panel Mount to 200 Series Barb, 1/8inch	Cole Parmer	EW-45500-34
Male Luer Integral Lock Ring to 500 Series Barb, 1/16inch ID tubing	Cole Parmer	EW-45505-31
Male Luer with Lock Ring x Female Luer Coupler	Cole Parmer	T-45508-80
Barbed Bulkhead Fittings 1/4inch OD	Fisher Scientific	6149-0002
Sanipure Tubing 1/16inch ID x 1/8inch OD	SaniPure	AR400002
Sanipure Tubing 1/4inch OD x 1/8inch ID	SaniPure	AR400007
Variable Flow Mini Pump (Peristaltic pump)	Fisher Scientific	13-876-1
Magnetic Stirrer	Velp Scientifica	F203A0160
Forceps	Fisher Scientific	14-512-141	Millipore* Filter Forceps
Multi-plate spectrophotometer plate reader	Molecular Devices Analyst GT
Filter manifold	Fisher Scientific	XX10 025 02

Software:
Python version 2.7.5			http://www.python.org/
PyLab module			http://wiki.scipy.org/PyLab
R version 3.0.1			http://www.r-project.org/
reshape2 library			http://had.co.nz/reshape
ggplot2 library			http://ggplot2.org/
Gene Composer	PSI Tech Portal		http://www.genecomposer.net

Services:
West Coast Metabolomics Center	UC Davis		http://metabolomics.ucdavis.edu
DNA 2.0			https://www.dna20.com

References

Wommack, K. E., Colwell, R. R. Virioplankton: Viruses in Aquatic Ecosystems. Microbiology and Molecular Biology Reviews. 64 (1), 69-114 (2000).
Hendrix, R. W. Recoding in Bacteriophages. Recoding: Expansion of decoding rules enriches gene expression. 24, 249-258 (2010).
Breitbart, M., et al. Genomic analysis of uncultured marine viral communities. Proceedings of the National Academy of Sciences. 99 (22), 14250-14255 (2002).
Breitbart, M., et al. Diversity and population structure of a near-shore marine-sediment viral community. Proceedings. Biological sciences / The Royal Society. 271 (1539), 565-574 (2004).
Dinsdale, E. A., et al. Functional metagenomic profiling of nine biomes. Nature. 452 (7187), 629-632 (2008).
Vega Thurber, R. L., et al. Metagenomic analysis indicates that stressors induce production of herpes-like viruses in the coral Porites compressa. Proceedings of the National Academy of Sciences of the United States of America. 105 (47), 18413-18418 (2008).
Pedulla, M. L., et al. Origins of highly mosaic mycobacteriophage genomes. Cell. 113 (2), 171-182 (2003).
Calendar, R., Abedon, S. T. . The bacteriophages. , (2006).
Breitbart, M., Miyake, J. H., Rohwer, F. Global distribution of nearly identical phage-encoded DNA sequences. FEMS microbiology letters. 236 (2), 249-256 (2004).
Klenk, H. -. P., Palm, P., Zillig, W. DNA-Dependent RNA Polymerases as Phylogenetic Marker Molecules. Systematic and Applied Microbiology. 16 (4), 638-647 (1993).
Breitbart, M., Thompson, L., Suttle, C., Sullivan, M. Exploring the Vast Diversity of Marine Viruses. Oceanography. 20 (2), 135-139 (2007).
Mann, N. H., Cook, A., Millard, A., Bailey, S., Clokie, M. Marine ecosystems: bacterial photosynthesis genes in a virus. Nature. 424 (6950), 741 (2003).
Mann, N. H., et al. The genome of S-PM2, a “photosynthetic” T4-type bacteriophage that infects marine Synechococcus strains. Journal of bacteriology. 187 (9), 3188-3200 (2005).
Lindell, D., et al. Transfer of photosynthesis genes to and from Prochlorococcus viruses. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11013-11018 (2004).
Millard, A., Clokie, M. R. J., Shub, D. A., Mann, N. H. Genetic organization of the psbAD region in phages infecting marine Synechococcus strains. Proceedings of the National Academy of Sciences of the United States of America. 101 (30), 11007-11012 (2004).
Sullivan, M. B., Coleman, M. L., Weigele, P., Rohwer, F., Chisholm, S. W. Three Prochlorococcus cyanophage genomes: signature features and ecological interpretations. PLoS biology. 3 (5), e144 (2005).
Rohwer, F., et al. The complete genomic sequence of the marine phage Roseophage SIOI shares homology with nonmarine phages. Limnology and Oceanography. 45 (2), 408-418 (2000).
Miller, E. S., et al. Complete genome sequence of the broad-host-range vibriophage KVP40: comparative genomics of a T4-related bacteriophage. Journal of bacteriology. 185 (17), 5220-5233 (2003).
Thompson, L. R., et al. Phage auxiliary metabolic genes and the redirection of cyanobacterial host carbon metabolism. Proceedings of the National Academy of Sciences of the United States of America. 108 (39), E757-E764 (2011).
Paterson, S., et al. Antagonistic coevolution accelerates molecular evolution. Nature. 464 (7286), 275-278 (2010).
Seguritan, V., et al. Artificial neural networks trained to detect viral and phage structural proteins. PLoS computational biology. 8 (8), e1002657 (2012).
Neidhardt, F. C., Bloch, P. L., Smith, D. F. Culture Medium for Enterobacteria. Journal of Bacteriology. 119 (3), 736-747 (1974).
Khlebnikov, A., Datsenko, K. A., Skaug, T., Wanner, B. L., Keasling, J. D. Homogeneous expression of the P(BAD) promoter in Escherichia coli by constitutive expression of the low-affinity high-capacity AraE transporter. Microbiology (Reading, England). 147 (Pt 2), 3241-3247 (2001).
Cuevas, D. A., et al. Elucidating genomic gaps using phenotypic profiles. F1000Research. , (2014).
Zwietering, M. H., Jongenburger, I., Rombouts, F. M., van’t Riet, K. Modeling of the bacterial growth curve. Applied and environmental microbiology. 56 (6), 1875-1881 (1990).
Schmieder, R., Lim, Y. W., Rohwer, F., Edwards, R. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC bioinformatics. 11, 341 (2010).
Schmieder, R., Edwards, R. Quality control and preprocessing of metagenomic datasets. Bioinformatics (Oxford, England). 27 (6), 863-864 (2011).
Schmieder, R., Edwards, R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PloS One. 6 (3), e17288 (2011).
Welch, M., et al. Design parameters to control synthetic gene expression in Escherichia coli. PloS One. 4 (9), e7002 (2009).
Fiehn, O., et al. Quality control for plant metabolomics: reporting MSI-compliant studies. The Plant journal: for cell and molecular biology. 53 (4), 691-704 (2008).
Zeng, Q., Chisholm, S. W. Marine viruses exploit their host’s two-component regulatory system in response to resource limitation. Current biology: CB. 22 (2), 124-128 (2012).
Shindy, W. W., Smith, O. E. Identification of plant hormones from cotton ovules. Plant physiology. 55 (3), 550-554 (1975).
Lee, H. I., Leon, J., Raskin, I. Biosynthesis and metabolism of salicylic acid. Proceedings of the National Academy of Sciences of the United States of America. 92 (10), 4076-4079 (1995).
Chappell, J. The Biochemistry and Molecular Biology of Isoprenoid Metabolism. Plant Physiology. 107 (1), 1-6 (1995).
Kitagawa, M., et al. Complete set of ORF clones of Escherichia coli ASKA library (a complete set of E. coli K-12 ORF archive): unique resources for biological research. DNA research: an international journal for rapid publication of reports on genes and genomes. 12 (5), 291-299 (2005).
Baran, R., et al. Metabolic footprinting of mutant libraries to map metabolite utilization to genotype. ACS chemical biology. 8 (1), 189-199 (2013).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Sanchez, S. E., Cuevas, D. A., Rostron, J. E., Liang, T. Y., Pivaroff, C. G., Haynes, M. R., Nulton, J., Felts, B., Bailey, B. A., Salamon, P., Edwards, R. A., Burgin, A. B., Segall, A. M., Rohwer, F. Phage Phenomics: Physiological Approaches to Characterize Novel Viral Proteins. J. Vis. Exp. (100), e52854, doi:10.3791/52854 (2015).

Fag Phenomics: Fysiologiske tilgange til Karakterisere Novel virale proteiner

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Fag Phenomics: Fysiologiske tilgange til Karakterisere Novel virale proteiner

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below