Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Chemistry

Identifisering av antibakteriell immunitet Proteiner i Escherichia coli ved bruk av MALDI-TOF-TOF-MS/MS og Ovenfra og ned Proteomisk analyse

Published: May 23, 2021 doi: 10.3791/62577

Summary

Her presenterer vi en protokoll for rask identifisering av proteiner produsert av genomisk sekvenserte patogene bakterier ved hjelp av MALDI-TOF-TOF tandemmassespektrometri og ovenfra og ned proteomisk analyse med programvare utviklet internt. Metastabile proteinioner fragmenterer på grunn av aspartiginsyreeffekten, og denne spesifisiteten utnyttes for proteinidentifikasjon.

Abstract

Denne protokollen identifiserer immunitetsproteinene til bakteriedrepende enzymer: kolikkin E3 og bakteriocin, produsert av en patogen Escherichia coli-stamme ved hjelp av antibiotikainduksjon, og identifisert av MALDI-TOF-TOF tandemmassespektrometri og ovenfra og ned proteomisk analyse med programvare utviklet internt. Immunitetsproteinet til kolikkin E3 (Im3) og immunitetsproteinet til bakteriocin (Im-Bac) ble identifisert fra fremtredende b- og/eller y-type fragmentioner generert av polypeptid ryggradsspalting (PBC) på C-terminalsiden av aspartiksyre, glutaminsyre og asparginrester av aspartic acid effekt fragmenteringsmekanismen. Programvaren skanner raskt i silicoproteinsekvenser avledet fra hele genomsekvenseringen av bakteriestammen. Programvaren fjerner også iterativt aminosyrerester av en proteinsekvens i tilfelle den modne proteinsekvensen avkortes. En enkelt proteinsekvens hadde masse- og fragmentioner som var i samsvar med de som ble oppdaget for hvert immunitetsprotein. Kandidatsekvensen ble deretter manuelt inspisert for å bekrefte at alle oppdagede fragmentioner kunne tilordnes. N-terminal methionine av Im3 ble post-translationally fjernet, mens Im-Bac hadde hele sekvensen. I tillegg fant vi ut at bare to eller tre ikke-komplementære fragmentioner dannet av PBC er nødvendige for å identifisere riktig proteinsekvens. Til slutt ble en promotor (SOS-boks) identifisert oppstrøms for antibakterielle og immunitetsgener i et plasmidgenom av bakteriestammen.

Introduction

Analyse og identifisering av ufordøyde proteiner ved massespektrometri kalles ovenfra og ned proteomisk analyse1,2,3,4. Det er nå en etablert teknikk som benytter elektrosprayionisering (ESI)5 og høyoppløselige masseanalysatorer6, og sofistikerte dissosiasjonsteknikker, for eksempel elektronoverføringsdissosiasjon (ETD), elektronfangst dissosiasjon (ECD)7, ultrafiolett foto-dissosiasjon (UV-PD)8, etc.

Den andre myke ioniseringsteknikken er matriseassistert laseravledning / ionisering (MALDI)9,10,11 som har blitt mindre utnyttet for ovenfra-og-ned-analysen, delvis fordi den hovedsakelig er koblet til tof-masseanalysatorer, som har begrenset oppløsning sammenlignet med andre masseanalysatorer. Til tross for disse begrensningene har MALDI-TOF- og MALDI-TOF-TOF-instrumenter blitt utnyttet for rask ovenfra-og-ned-analyse av rene proteiner og fraksjonerte og fraksjonerte blandinger av proteiner. For identifisering av rene proteiner er in-source decay (ISD) en spesielt nyttig teknikk fordi den tillater massespektrometri (MS) analyse av ISD-fragmentioner, samt tandemmassespektrometri (MS / MS) av proteinionfragmenter som gir sekvensspesifikt fragment ofte fra N- og C-termini av målproteinet, analogt med Edman-sekvensering12,13 . En ulempe med ISD-tilnærmingen er at, som i Edman-sekvensering, må prøven bare inneholde ett protein. Det ene proteinkravet skyldes behovet for entydig tilskrivelse av fragmentioner til en forløperion. Hvis to eller flere proteiner er til stede i en prøve, kan det være vanskelig å tildele hvilke fragmentioner som tilhører hvilke forløperioner.

Fragmention-/forløper-attribusjon kan adresseres ved hjelp av MALDI-TOF-TOF-MS/MS. Som med alle klassiske MS/MS-eksperimenter, er forløperioner massevalgt/isolert før fragmentering, og fragmentjonene som oppdages kan tilskrives en bestemt forløperion. Dissosiasjonsteknikkene som er tilgjengelige for denne tilnærmingen, er imidlertid begrenset til primært høyenergikollisjonsindusert dissosiasjon (HE-CID)14 eller forfall etter kilden (PSD)15,16. HE-CID og PSD er mest effektive til fragmentering av peptider og små proteiner, og sekvensdekningen kan i noen tilfeller begrenses. I tillegg resulterer PSD i polypeptid ryggrad spalting (PBC) primært på C-terminalsiden av aspartic og glutaminsyrerester av et fenomen som kalles aspartinsyreeffekten17,18,19,20.

MALDI-TOF-MS har også funnet en nisjeapplikasjon i taksonomisk identifisering av mikroorganismer: bakterier21, sopp22og virus23. For eksempel brukes MS-spektra til å identifisere ukjente bakterier sammenlignet med et referansebibliotek med MS-spektra av kjente bakterier ved hjelp av mønstergjenkjenningsalgoritmer til sammenligning. Denne tilnærmingen har vist seg svært vellykket på grunn av sin hastighet og enkelhet, selv om det krever en nattlig dyrking av isolasjonen. Proteinionene som oppdages av denne tilnærmingen (vanligvis under 20 kDa) består av et MS-fingeravtrykk som tillater taksonomisk oppløsning på slekts- og artsnivå og i noen tilfeller på underarten24 og belastningsnivå25,26. Imidlertid er det fortsatt behov for ikke bare taksonomisk klassifisere potensielt patogene mikroorganismer, men også identifisere spesifikke virulensfaktorer, toksiner og antimikrobielle resistensfaktorer (AMR). For å oppnå dette måles massen av peptider, proteiner eller små molekyler av MS og deretter isoleres og fragmenteres av MS / MS.

Patogene bakterier bærer ofte sirkulære biter av DNA kalt plasmider. Plasmider, sammen med prophages, er en stor vektor av horisontal genoverføring mellom bakterier og er ansvarlige for rask spredning av antimikrobiell motstand og andre virulensfaktorer på tvers av bakterier. Plasmider kan også bære antibakterielle (AB) gener, f.eks. Når disse genene uttrykkes og proteinene utskilles, virker de for å deaktivere proteinoversettelsesmaskineriet til nærliggende bakterier som opptar samme miljønisje27. Imidlertid kan disse bakteriedrepende enzymene også utgjøre en risiko for verten som produserte dem. Som en konsekvens er et gen co-uttrykt av verten som spesifikt hemmer funksjonen til et AB-enzym og kalles immunitetsproteinet (Im).

DNA-skadelige antibiotika som mitomycin-C og ciprofloxacin brukes ofte til å indusere SOS-responsen i Shiga toksinproduserende E. coli (STEC) hvis Shiga toksingen (stx) finnes i et prophagegenom tilstede i bakteriegenomet28. Vi har brukt antibiotikainduksjon, MALDIV-TOF-TOF-MS/MS, og ovenfra og ned proteomisk analyse tidligere for å oppdage og identifisere Stx-typer og undertyper produsert av STEC-stammer29,30,31,32. I det forrige arbeidet ble STEC O113:H21-stammen RM7788 dyrket over natten på agarmedier supplert med mitomycin-C. Men i stedet for å oppdage den forventede B-underenheten av Stx2a ved m/z ~7816, ble det påvist en annen proteinion ved m/z ~7839 og identifisert som et plasmidkodet hypotetisk protein av ukjent funksjon33. I det nåværende arbeidet identifiserte vi to plasmid-kodede AB-Im-proteiner produsert av denne stammen ved hjelp av antibiotikainduksjon, MALALDI-TOF-TOF-MS / MS, og ovenfra og ned proteomisk analyse ved hjelp av frittstående programvare utviklet for å behandle og skanne i silicoproteinsekvenser avledet fra fullgenomsekvensering (WGS). I tillegg ble muligheten for endringer etter oversettelse (PTM) som involverer sekvensavkorting innlemmet i programvaren. Immunitetsproteinene ble identifisert ved hjelp av denne programvaren fra den målte massen av den modne proteinionen og sekvensspesifikke fragmentioner fra PBC forårsaket av aspartinsyreeffekten og oppdaget av MS / MS-PSD. Til slutt ble en promotor identifisert oppstrøms ab / im gener i et plasmidgenom som kan forklare uttrykket av disse genene når denne stammen er utsatt for et DNA-skadelig antibiotika. Deler av dette arbeidet ble presentert på National American Chemical Society Høsten 2020 Virtual Meeting &Expo (17.-20. august 2020)34.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. Mikrobiologisk prøvepreparering

  1. Inokuler 25 ml Luria buljong (LB) i et 50 ml konisk rør med E. coli O113:H21 stamme RM7788 (eller en annen bakteriestamme) fra en glyserolbestand ved hjelp av en steril 1 μL sløyfe. Hette røret og prekulturen ved 37 °C med risting (200 o/min) i 4 timer.
  2. Aliquot 100 μL pre-kultivert buljong og spredt på en LB agar plate supplert med 400 eller 800 ng / ml mitomycin-C. Kultur agar plater statisk over natten i en inkubator ved 37 °C.
    FORSIKTIG: STEC-stammer er patogene mikroorganismer. Utfør alle mikrobiologiske manipulasjoner, utover dyrking, i et BSL-2 biosikkerhetsskap.
  3. Høst bakterieceller fra enkelt synlige kolonier ved hjelp av en steril 1 μL sløyfe og overfør til et 2,0 ml O-ringforet skruehette mikrosenterrør som inneholder 300 μL HPLC-grade vann. Cap røret, virvel kort, og sentrifuge på 11,337 x g i 2 min for å pellet cellene.

2. Massespektrometri

  1. Spot 0,75 μL aliquot av prøven supernatant på det rustfrie stål MALDI-målet og la det tørke. Overlegg det tørkede prøvestedet med a0,75 μL aliquot av en mettet løsning av sinapinsyre i 33% acetonitril, 67% vann og 0,2% trifluoracetisk syre. La stedet tørke.
  2. Analyser de tørkede prøvestedene ved hjelp av et MALDI-TOF-TOF massespektrometer.
    1. Etter å ha lastet MALDI-målet inn i massespektrometeret, klikker du på knappen for MS-lineær modusanskaffelse i oppkjøpsprogramvaren. Angi m/z-området som skal analyseres ved å angi m/z for nedre og øvre grense (f.eks. 2 kDa til 20 kDa) i sine respektive felt i programvaren for anskaffelsesmetoden.
    2. Klikk på eksempelpunktet som skal analyseres på Mal for MALDI-mål i programvaren. Trykk deretter på venstre museknapp og dra musepekeren over prøvepunktet for å angi det rektangulære området som skal prøves for laserablasjon/ionisering. Slipp museknappen, så starter anskaffelsen. Samle 1000 laserbilder for hvert prøvepunkt.
      MERK: Datainnsamling vises i sanntid i vinduet for programvareanskaffelse.
    3. Hvis ingen ioner oppdages, øker du laserintensiteten ved å justere glideskalalinjen under laserintensitet i programvaren til proteinionsignalet oppdages. Dette kalles terskelverdi.
      MERK: Før prøvepunktanalysen kalibrerer instrumentet eksternt i MS-lineær modus med proteinkalibrer hvis m/z spenner over området som analyseres, for eksempel, dekker +1 og +2 ladetilstandene til proteinkalipanter: cytokrom-C, lysozym og myoglobin et masseområde på 2 kDa til 20 kDa. En mellommasse innenfor det angitte masseområdet brukes som fokusmasse, for eksempel 9 kDa. Fokusmassen er ion hvis m/ z er optimalt fokusert for deteksjon av lineær modusdetektoren.
    4. Når ms lineær modus oppkjøpet er fullført, klikker du på knappen for MS / MS reflectron modus oppkjøp i anskaffelsesprogramvaren. Angi forløpermassen som skal analyseres, i feltet Forløpermasse. Deretter skriver du inn en isolasjonsbredde (i Da) i forløperens massevindu for den lave og høye massesiden av forløpermassen, for eksempel ±100 Da.
    5. Klikk på CID Off-knappen. Klikk på Metastable Suppressor ON-knappen. Juster laserintensiteten til minst 90 % av maksimumsverdien ved å justere glideskalalinjen under laserintensiteten i programvaren.
    6. Klikk på eksempelpunktet som skal analyseres på Mal for MALDI-mål i programvaren. Trykk deretter på venstre museknapp og dra musepekeren over prøvepunktet for å angi det rektangulære området som skal prøves for laserablasjon/ionisering. Slipp museknappen, så starter anskaffelsen. Samle 10 000 laserbilder for hvert prøvepunkt.
      MERK: Før prøvepunktanalysen skal instrumentet kalibreres eksternt i MS/MS-reflektormodus ved hjelp av fragmentionene fra etterkildens forfall (PSD) for +1-ladetilstanden til alkylert tioredoxin35.
  3. Ikke behandle rå MS-data. Behandle MS/MS-PSD-rådata ved hjelp av følgende trinnsekvens i den angitte rekkefølgen: avansert grunnlinjekorrigering (32, 0,5, 0,0) etterfulgt av støyfjerning (to standardavvik) etterfulgt av gaussisk utjevning (31 punkt).
  4. Inspiser MS/MS-PSD-data manuelt for tilstedeværelse av fremtredende fragmentioner generert av PBC19,20.
  5. Evaluer MS/MS-data med hensyn til absolutt og relativ overflod av fragmentioner og deres signal-til-støy (S/N). Bruk bare de mest tallrike fragmentionene for proteinidentifikasjon, spesielt hvis MS/MS-PSD-dataene er støyende.

3. I silico protein database konstruksjon

  1. Generer en tekstfil som inneholder i silico proteinsekvenser av bakteriestammen, som vil bli skannet av Protein Biomarker Seeker programvare for proteinidentifikasjon. Proteinsekvenser er avledet fra helgenomsekvensering (WGS) av stammen som analyseres (eller en nært beslektet stamme).
  2. Gå til nettstedet NCBI/PubMed (https://www.ncbi.nlm.nih.gov/protein/) for å laste ned omtrent 5000 proteinsekvenser av den spesifikke bakteriestammen (f.eks. Escherichia coli O113:H21-stammen RM7788) som analyseres. Maksimal nedlastingsstørrelse er 200 sekvenser.
    1. Kopier og lim inn de 25 nedlastingene i en enkelt tekstfil. Velg FASTA-formatet (tekstformatet) for hver nedlasting.

4. Bruk av Protein Biomarker Seeker-programvare

  1. Dobbeltklikk på den kjørbare filen Protein Biomarker Seeker. Et grafisk brukergrensesnittvindu (GUI) vises (Figur 1, øverste panel).
  2. Gå inn i massen av proteinbiomarkøren (målt i MS-lineær modus) i Mature Protein Mass-feltet. Deretter angir du massemålingsfeilen i Massetoleranse-feltet. Standard massemålingsfeil er ±10 Da for et 10.000 Da protein.
  3. Klikk eventuelt på den komplementære b / y ion Protein Mass Calculator-knappen for å beregne proteinmassen fra et putativt komplementært fragmentionpar (CFIP eller b / y). Et popup-vindu, Protein Mass Calculator Tool, vises (Figur 1, nederste panel).
    1. Skriv inn m/ z av den putative CFIP og klikk på Legg til par-knappen. Den beregnede proteinmassen vises.
    2. Kopier og lim inn dette tallet i feltet Moden proteinmasse, og lukk vinduet Proteinmassekalkulatorverktøy.
  4. Velg en N-terminal Signal Peptide Length ved å klikke på Set Residue Restriction-boksen. Et popup-vindu med glideskala og markør vises. Flytt markøren til ønsket signalpeptidlengde (maksimalt 50). Hvis ingen signalpeptidlengde er valgt, utføres en ubegrenset sekvensavkorting av programvaren.
  5. Under fragmentiontilstanden i GUI velger du rester for spalting av polypeptid-ryggrad (PBC). Klikk på boksene til en eller flere rester: D, E, N og /eller P.
    1. Klikk på knappen Angi fragmentioner (+1) det skal søkes i. En popup-fragmentside vises. Deretter klikker du på Legg til fragmention-knappen, som tilsvarer antall fragmentioner som skal legges inn, det vil si ett klikk for hver fragmention. Det vises et rullegardinfelt for hver fragmention som skal angis.
    2. Angi m/z for fragmentionene og tilhørende m/z-toleranse. Når du er ferdig, klikker du på Lagre og lukk-knappen.
      MERK: En rimelig m/z-toleranse er ±1,5.
    3. Velg det minste antallet fragmentioner som må samsvares for en identifikasjon ved å bla til ønsket nummer i boksen til høyre for Hvor mange fragmentioner som må samsvares.
      MERK: Tre kamper skal være tilstrekkelige.
    4. Velg cysteinrester som skal være i oksidasjonstilstand ved å klikke på den tilsvarende sirkelen. Hvis ingen proteinidentifikasjoner blir funnet etter søket, gjenta søket med cysteiner i redusert tilstand. Hvis det ikke blir funnet noen identifikasjoner etter søket, utvider du fragmentiontoleransen til ±3 og gjentar søket.
  6. Under Filoppsettklikker du på Knappen Velg FASTA-fil for å bla gjennom og velge FASTA-filen (tekstfilen) som inneholder in silicoproteinsekvensene til bakteriestammen som tidligere var konstruert i protokolltrinnene 3.1 til 3.2. Velg deretter en utdatamappe og opprett et utdatafilnavn.
  7. Klikk knappen Kjør søk etter filoppføringer. Et popup-vindu vises med tittelen Bekreft søkeparametere (Figur 1, nederste panel), som viser søkeparameterne før søket startes.
  8. Hvis søkeparametrene er riktige, klikker du på Start søk-knappen. Hvis søkeparameterne ikke er riktige, klikker du avbryt-knappen og skriver inn de riktige parameterne på nytt. Når søket er startet, lukkes parametervinduet, og et nytt popup-vindu med en fremdriftslinje vises (Figur 1, nederste panel) som viser fremdriften for søket og en løpende oversikt over antall identifikasjoner som er funnet.
  9. Når søket er fullført (noen sekunder), lukkes fremdriftslinjen automatisk, og et sammendrag av søket vises i Logg -feltet i GUI(figur 2, øverste panel). I tillegg vises også et nytt popup-vindu som viser proteinidentifikasjonen(e) hvis det finnes (Figur 2, nederste panel).
    MERK: I silicoproteinsekvenser som har ukjente rester, for eksempel U eller X, hoppes automatisk over fra analysen, og disse sekvensene rapporteres deretter med et eget popup-vindu for å varsle operatøren om hvilke (om noen) sekvenser som ble hoppet over når søket var fullført.

5. Bekreftelse etter søk av proteinsekvens

  1. Bekreft korrektheten av en kandidatsekvens ved manuell analyse.
    MERK: Formålet med Protein Biomarker Seeker-programvaren er å identifisere en proteinsekvens med høy nøyaktighet ved å eliminere mange åpenbart feil proteinsekvenser fra vurdering og innlemme sekvensavkorting som en mulig PTM i det modne proteinet. Ettersom antallet mulige kandidatsekvenser som returneres er få, er manuell bekreftelse håndterbar.
  2. Generer en tabell over gjennomsnittlige m/z av b- og y-type fragmentioner av kandidatsekvensen ved hjelp av massespektrometri eller proteomisk programvare som har slik funksjonalitet. Sammenlign gjennomsnittlig m/z av i silicofragmentioner på C-terminalsiden av D-, E- og N-rester (og på N-terminalsiden av P-rester) med m/z av fremtredende fragmentioner fra MS/MS-PSD-dataene.
    MERK: De mest fremtredende MS/MS-PSD-fragmentionene skal enkelt tilpasses D-, E- og N-assosiert i silicofragmentioner. Aspartic acid effekt fragmenteringsmekanismen er imidlertid mindre effektiv i nærheten av N- eller C-termini av en proteinsekvens36.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Figur 3 (topppanel) viser MS av STEC O113:H21-stammen RM7788 dyrket over natten på LBA supplert med 400 ng/ml mitomycin-C. Topper på m/z 7276, 7337 og 7841 var tidligere identifisert som kaldsjokkprotein C (CspC), kaldsjokkprotein E (CspE) og et plasmidbåren protein med ukjent funksjon, henholdsvis33. Proteinionen ved m/z 9780 [M+H]+ ble analysert av MS/MS-PSD som vist i figur 3 (nederste panel). Forløperionen ble isolert med et tidsbestemt ionvelgervindu (TIS) ±100 Da. Fragmentioner identifiseres av m/z og type/tall. Fragmentionen ved m/z 2675,9 (uthevet med en stjerne) er oversvømmelse fra dissosiasjonen av den metastabile proteinionen ved m/z 9655 vist i figur 3 (topppanelet). Den teoretiske gjennomsnittlige m/z av hver fragmention er vist i parentes basert på PBC i sekvensen av kolikkin E3 immunitetsprotein (Im3) vist ovenfor. Steder av PBC er uthevet med en rød stjerne med tilsvarende fragmention(er) produsert. N-terminal metionin understrekes som indikerer at den er post-translationally fjernet i det modne proteinet. Sekvensen har en enkelt cysteinrester (bokset) og vurderes derfor i redusert tilstand.

Ved hjelp av massen av proteinbiomarkøren og noen få fremtredende ikke-komplementære fragmentioner: m / z 1813,8, 2128.9 og 4293.7 (±1,5 toleranse) (Figur 1, bunnpanel) og begrensning av PBC til C-terminalsiden av D- og E-rester, ble bare én kandidatsekvens rapportert av programvaren: Im3 proteinsekvens (uten N-terminal metionin) (Figur 2 , nederste panel). Når du velger fragmentioner for et søk, bør det understrekes at enhver gruppe ikke-komplementære fragmentioner antar at oppsummering av m / z av to fragmentioner i gruppen (og trekke fra to protoner) resulterer i en massesum som ikke faller innenfor biomarkørmassen og tilhørende massetoleranse (±10 Da). Utkast WGS av RM7788 avslørte 5008 proteinsekvenser (åpne leserammer)37. Av disse ~5000 fulle proteinsekvensene oppfylte 189 490 hele og delvise sekvenser (ubegrenset avkorting) biomarkørens massekriterier (figur 2, topppanelet). Disse sekvensene som passerer massekriteriene gjennomgår deretter i silico PBC på C-terminalsiden av D- og/eller E-rester. De resulterende fragmentionene som genereres, sammenlignes deretter med de observerte fragmentionene som er angitt. Kandidatsekvensen rapportert av programvaren var utelukkende basert på dens masse og tre D- og / eller E-spesifikke PBC-nettsteder. Spesifisiteten oppnådd ved en så liten mengde informasjon vil bli diskutert i neste avsnitt.

Som vist i figur 3 (bunnpanel), er de mest tallrike fragmentionene resultatet av PBC på C-terminalsiden av D- og E-rester via aspartinsyreeffektfragmenteringsmekanismen19,20. To CFIP observeres: b67/y17 (m/z 7645,1 / m/z 2128,9) og b70/y14 (m/z 7959,4 / m/z 1813,8). Disse CFIP kan brukes til å beregne massen av proteinforløperionen mer nøyaktig ved hjelp av den enkle formelen: b (m / z) + y (m / z) - 2H+ = proteinmasse (Da)33. Ved hjelp av de to CFIP får vi en gjennomsnittlig masse av proteinet: 9771.6 Da, som er nærmere sin teoretiske verdi på 9772,5 Da enn den målte massen av proteinionen i MS-lineær modus: 9779 Da (Figur 3, topppanel). Bare noen få CFIP ble oppdaget fordi de fleste forløperionene som fikk den ioniserende protonen beslaglagt ved de eneste argininrester: R80. Den høyere gassfase-basiciteten til arginin (237,0 kcal/mol38) sammenlignet med en lysinrester (K) (221,8 kcal/mol38) er sannsynligvis ansvarlig for preferanse-sekvensering av ioniserende proton ved eneste R-residue.

Figur 4 (topppanel) viser MS av STEC O113:H21-stammen RM7788 dyrket over natten på LBA supplert med 800 ng/ml mitomycin-C. Figur 4 (topppanel) er ganske lik figur 3 (topppanel), selv om det er forskjeller i den relative overfloden av noen proteinioner på grunn av forskjellene i antibiotikakonsentrasjoner som brukes. Det er også små endringer i proteinbiomarkør m/z som reflekterer forskjeller i ekstern kalibrering av instrumentet på forskjellige dager. Nok en gang er proteinionene ved m/z 7272, 7335 og 7838 CspC, CspE og et plasmidbåren protein. I tillegg oppdager vi Im3-proteinionen ved m/z 9778 (om enn med mindre overflod enn i figur 3) samt en proteinion ved m/z 9651 [M+H]+. Figur 4 (nederste panel) viser MS/MS-PSD for proteinforløperionen ved m/z 9651. Forløperionen ble isolert ved hjelp av et smalere og asymmetrisk TIS-vindu på -75/+60 Da for å eliminere bidrag fra tilstøtende proteinioner ved m/z 9539 og 9778. Fragmentioner identifiseres av m/z og type/nummer. Sekvensen av immunitetsproteinet av bakteriocin (Im-Bac) er vist ovenfor. Nettsteder av PBC er uthevet med en rød stjerne med tilhørende fragmention(er). Det teoretiske gjennomsnittet m/z for hver fragmention er også vist i parentes i spekteret. Im-Bac-sekvensen har også en enkelt cysteinrester (bokset) og vurderes derfor i redusert tilstand.

Ved hjelp av proteinbiomarkørmassen, tre fremtredende ikke-komplementære fragmentioner: m/z 2675,4, 3853,5 og 5772,8 (±1,50 toleranse) fra figur 4 og begrense PBC til bare C-terminalsiden av D- og/eller E- og/eller asparagin (N)-rester, ble bare én kandidatsekvens rapportert av programvaren: Im-Bac protein. Kandidatsekvensen ble hentet etter skanning av 191 375 hele eller delvise sekvenser som oppfylte biomarkørmassen og toleransekriteriene (±10 Da). Kandidatsekvensen ble identifisert av programvare basert utelukkende på dens masse og tre D- og/eller E- og/eller N-spesifikke PBC-nettsteder.

De mest fremtredende fragmentionene i figur 4 (bunnpanelet) var nok en gang resultatet av PBC på C-terminalsiden av D- og/eller E-rester og også på N-terminalsiden av en av P-rester20. Vi observerer også PBC på C-terminalsiden av en N-rester som også sannsynligvis vil oppstå ved en aspartinsyreeffektlignende fragmenteringsmekanisme39,40. Svakheten ved proteinforløperionsignalet resulterer i et begrenset antall tolkelige fragmentioner. Nøyaktigheten av fragmentet ion m/z avtar med fragment ion overflod. Ingen CFIP ble oppdaget på grunn av at den ioniserende protonen ble beslaglagt ved den eneste argininrester (R74) av proteinionsekvensen. Alle fragmentioner inneholder R74-rester, i samsvar med denne hypotesen.

Promotoren av antibakterielle immunitetsgener
Figur 5 viser en del av 6482 bp contig00100 av E. coli-stammen RM7788 (GenBank: NWVS01000096.1) fra haglesekvensering av hele genomet37. Kodingsregionene for kolikkin E3, immunitetsproteinet (Im3), immunitetsproteinet av bakteriocin (Im-Bac) og et lysisprotein fremheves i gult. Oppstrøms for kodeområdet for colicin E3-genet er -35-regionen, Pribnow-boksen (PB), invertert repetisjon av SOS-boksen, Shine-Dalgarno / ribosomal bindingssted (SD / RBS)27. Det er en ni base-par intergenic region mellom colicin E3 og Im3. LexA (et repressorprotein og en autopeptidase) binder seg til SOS-boksen som blokkerer uttrykket av gener nedstrøms. Ved DNA-skade (f.eks. UV-stråling eller DNA-skadelige antibiotika) gjennomgår LexA selvskading som tillater uttrykk for gener nedstrøms27,28. Dermed er uttrykket av disse to immunitetsproteinene i samsvar med eksponeringen av denne stammen for et DNA-skadelig antibiotika.

Figure 1
Figur 1: Skjermbilder av Protein Biomarker Seeker-programvare. Topp panel: Grafisk brukergrensesnitt (GUI) av Protein Biomarker Seeker programvare. Bunnpaneler: Popup-vinduer i Protein Mass Calculator Tool, Fragment Page, Confirm Search Parameters og Search progress bar. Klikk her for å se en større versjon av denne figuren.

Figure 2
Figur 2: Søkeresultater for proteinidentifikasjon ved hjelp av Protein Biomarker Seeker-programvare. Øverste panel: Sammendrag av søkeresultatene som vises i log field for programvaren GUI. Bunnpanel: Et popup-vindu som viser en proteinidentifikasjon ved hjelp av programvaren. Klikk her for å se en større versjon av denne figuren.

Figure 3
Figur 3: Massespektrometrianalyse av STEC O113:H21-stammen RM7788. Topppanel: MS av STEC O113:H21 stamme RM7788 dyrket over natten på LBA supplert med 400 ng/ml mitomycin-C. Bunnpanel: MS/MS-PSD av proteinforløperionen ved m/z 9780 (topppanel). Forløperionen ble isolert med et TIS-vindu ±100 Da. Fragmentioner identifiseres av m / z og iontype. Sekvensen av immunitetsproteinet for kolikkin E3 (Im3) er vist. Grunnleggende rester (steder med mulig ladefangst) er uthevet i blått. PBC er uthevet med en rød stjerne med de tilsvarende fragmentionene som genereres. Det teoretiske gjennomsnittet m/z for hver fragmentioner vises i parentes. Klikk her for å se en større versjon av denne figuren.

Figure 4
Figur 4: Massespektrometrianalyse av STEC O113:H21-stammen RM7788. Topppanel: MS av STEC O113:H21 stamme RM7788 dyrket over natten på LBA supplert med 800 ng/ml mitomycin-C. Bunnpanel: MS/MS-PSD for proteinforløperionen ved m/z 9651 (topppanel). Forløperionen ble isolert med et asymmetrisk TIS-vindu på -75 på den lave m/z-siden av forløperionen og +60 på den høye m/z-siden av forløperionen. Fragmentioner identifiseres av m/z og iontype. Sekvensen av immunitetsproteinet av bakteriocin (Im-Bac) er vist. Grunnleggende rester (steder med mulig ladefangst) er uthevet i blått. PBC er uthevet med en rød stjerne med de tilsvarende fragmentionene som genereres. Det teoretiske gjennomsnittet m/z for hver fragmention er vist i parentes. Klikk her for å se en større versjon av denne figuren.

Figure 5
Figur 5: Analyse av en del av plasmidgenomet som bæres av E. coli O113:H21-stammen RM7788. En del av 6482 bp contig00100 av E. coli O113:H21 stamme RM7788 (GenBank: NWVS01000096.1) fra hele genome hagle sekvensering37. Klikk her for å se en større versjon av denne figuren.

Tilleggsfil 1 (S1 Im3): Resultater av benchmarking analyse av programvare ved hjelp av utvalgte fragmentioner av Im3 (fra figur 3, nederste panel). Klikk her for å laste ned denne filen.

Tilleggsfil 2 (S2 ImBac): Resultater av benchmarking analyse av programvare ved hjelp av utvalgte fragmentioner av Im-Bac (fra figur 4, nederste panel). Klikk her for å laste ned denne filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Hensyn ved protokollen
De primære styrkene til den nåværende protokollen er hastigheten, enkelheten i prøvepreparering og bruk av et instrument som er relativt enkelt å betjene, trenes på og vedlikeholde. Selv om bunn- og ovenfra-og-ned proteomisk analyse av flytende kromatografi-ESI-HR-MS er allestedsnærværende og langt bedre på mange måter til ovenfra og ned av MALDI-TOF-TOF, krever de mer tid, arbeidskraft og kompetanse. Instrumentkompleksitet kan ofte påvirke om visse instrumentplattformer sannsynligvis vil bli vedtatt av forskere som ikke formelt er opplært i massespektrometri. Ovenfra-og-ned-tilnærmingen med MALDI-TOF-TOF er ment å utvide analysen av MALDI-TOF-MS utover den nåværende bruken for taksonomisk identifisering av bakterier i kliniske mikrobiologiske laboratorier, samtidig som den ikke dramatisk øker arbeidet, kompleksiteten eller kompetansen som kreves for analyse.

Protokollen bruker ikke noe mekanisk (eller elektrisk) cellelysetrinn. Selv om utskilte eller ekstracellulære proteiner kan påvises ved hjelp av protokollen, ble en tidligere versjon av denne metoden først utviklet for påvisning av Shiga toksin (Stx) fra STEC-stammer der antibiotikainduksjon utløser bakteriell SOS-respons som resulterer i uttrykk for fôrgener, inkludert stx samt sene phagegener som er ansvarlige for bakteriell cellelys41 . Vi fant at antibiotikaindusert cellelys har visse fordeler for påvisning av Stx samt plasmidproteiner som har SOS-promotorer (nåværende arbeid). Sikkert, mekanisk celle lysis (f.eks. bead-beating) kan også brukes (men ikke brukt i det nåværende arbeidet). Mekanisk lysis resulterer imidlertid i at alle bakterieceller blir lysed (ikke bare induserte celler) noe som resulterer i at prøven blir beriket med rikelige, høyt bevarte vertsproteiner som kan gjøre deteksjon av fôr og plasmidproteiner fra en ukfraksjonert prøve mer utfordrende.

Antibiotikakonsentrasjonene for en bakteriestamme ble funnet å være generelt reproduserbare med hensyn til de antibiotikainduserte proteinene som ble oppdaget. Vi noterte variasjoner i den relative proteinoverflod med hensyn til de antibiotikainduserte proteinene som ble oppdaget. Siden vår analyse er kvalitativ (ikke kvantitativ), trenger proteinbiomarkør overflod bare være tilstrekkelig for tilstrekkelig MS / MS-analyse. En putativ STEC-stamme dyrkes først med en rekke antibiotikakonsentrasjoner (f.eks. 300 ng/ml til 2000 ng/ml mitomycin-C) for å bestemme den optimale konsentrasjonen slik at den utløser bakteriell SOS-respons samtidig som den gir nok bakterieceller til høsting. For STEC-stammen RM7788 fant vi at den optimale antibiotikakonsentrasjonen for påvisning av biomarkørene som ble identifisert var 400 til 800 ng/ml mitomycin-C.

I tillegg til proteinsekvensavkorting kan E. coli-proteiner ha PTMer som involverer tilsetning av masse, for eksempel fosforylering, glykosylering, etc. Ettersom MS/MS bruker PSD for dissosiasjon av enkeltladede metastable proteinioner (under 20 kDa i masse) generert av MALDI, vil slike PTMer knyttet til rester av sidekjeder sannsynligvis gjennomgå facile dissociative tap fordi PSD er en ergodisk dissosiasjonsteknikk. Tilstedeværelsen av slike PTMer kan utledes fra utseendet av en fragmention nær i masse til den opprinnelige forløperionen (minus massen av PTM) i MS / MS-dataene. Verken PSD eller programvaren vil imidlertid kunne identifisere hvor slike PTMer er koblet til. I tillegg kan programvaren bare identifisere proteiner fra fragmentioner av PBC og ikke dissosiativt tap av små molekyler (f.eks. vann eller ammoniakk) eller PTMer festet til sidekjedene av rester. Men hvis fragmentioner fra PBC oppdages, kan proteinet fortsatt identifiseres ved hjelp av programvaren ved enten å utvide proteinmassetoleransevinduet for å inkludere massen av PTM eller bare komme inn i massen av proteinfragmentionen som tilsvarer dissosiativt tap av den mistenkte PTM. Enhver identifikasjon av programvaren ville være av proteinsekvensen uten PTM. Interessant nok har vi ikke oppdaget proteiner som har fosforylering, glykosylering, etc. i vårt bakterielle arbeid så langt. Det kan imidlertid skyldes: deres relative overflod av MALDI, masseområdet som brukes: 2-20 kDa, at slike PTMer kan være uvanlig labile og kanskje ikke overleve anvendelsen av MALDI-matrisen, eller at slike PTMer kan gjennomgå svært raskt dissosiativt tap i kilden før ioner akselereres fra kilden.

For tiden inkluderer programvaren ikke cystein alkylering, og vår prøveprotokoll inkluderer ikke et disulfidreduksjonstrinn for cysteinrester. Protokollen er avklart for å indikere at søket skal drives med cysteinrester i oksidasjonstilstand, og hvis ingen identifikasjon oppnås, så for å utføre søket igjen med cysteinrester i redusert tilstand. Hvis ingen identifikasjoner blir funnet igjen, vil utvidelse av fragmentiontoleransen til ±2 eller ±3 senke terskelen for fragmentionmatching slik at sekvenser med cysteiner samsvarer med om de er til stede i oksiderte og/ eller reduserte tilstander.

Ovenfra og ned proteomisk analyse av MALDI-TOF-TOF massespektrometri
De fleste ovenfra og ned proteomiske analyser er oppnådd ved hjelp av ESI og høyoppløselige massespektrometriplattformer. Til sammenligning er det utført færre proteomiske analyser ovenfra og ned ved hjelp av MALDI-TOF-TOF-plattformer. Som en konsekvens er det svært lite ovenfra og ned proteomisk programvare for analyse av singly ladede metastable proteinioner generert og analysert av MALDI-TOF-TOF-MS / MS-PSD som utnytter aspartic acid-effekten for fragmentering15,42. Det er flere grunner til dette. For det første er ioniseringseffektiviteten til MALDI partisk mot lavere molekylvektpeptider og proteiner, og denne skjevheten er spesielt tydelig med en blanding av proteiner som finnes i en ukfraksjonert bakteriell cellelysat. For det andre genererer MALDI lavladingstilstander, og det er liten eller ingen Coulomb-frastøtelse for å lette proteiniondissosiasjon. For det tredje er PSD-sekvensdekningen ganske begrenset i motsetning til andre teknikker ECD7, ETD7, UV-PD8, etc. For det fjerde avtar fragmenteringseffektiviteten til PSD med økende masse av proteinionen. For det femte har ergoiske dissosiasjonsteknikker, som PSD, en tendens til å resultere i facile dissosiativt tap av PTMer festet til rester, for eksempel fosforylering, glykosylering, etc., noe som gjør det utfordrende å bestemme stedet for PTM-vedlegg. Til tross for disse alvorlige begrensningene har ovenfra-og-ned-analyse ved bruk av MALDI-TOF-TOF-MS/MS-PSD klare fordeler, for eksempel enkelhet i prøvepreparering, fravær av LC-separasjon, isolering av metastabile proteinioner av MS/MS som gjør det mulig å tilskrive fragmentioner til forløperioner, identifisering av PTMer som involverer sekvensavkorting og intramolekylære disulfidbindinger og viktigst av analysens hastighet. Når den kombineres med i silicoproteinsekvenser avledet fra WGS-data, kan denne teknikken gi rask informasjon før andre mer tidkrevende og arbeidskrevende analyser fullføres.

Protein Biomarker Seeker programvare ble utviklet ved hjelp av IntelliJ og skrevet i Java for effektivt å behandle og søke protein aminosyre sekvenser avledet fra WGS av en bakteriell stamme. Programvaren ble endret fra en tidligere algoritme som fungerte som en makro i Excel33. Vi bestemte oss for å utvikle en frittstående versjon av programvaren med et GUI-grensesnitt for å gjøre den mer brukervennlig, samt gi ytterligere forbedringer.

I tilfelle PTMer som involverer proteinsekvensavkorting, fjerner programvaren sekvensielt en aminosyrerester fra N-terminus mens den iterativt legger til rester av sekvensen til massesummen oppfyller eller overskrider den målte massen av den påviste proteinbiomarkøren. Selv om denne prosessen kan resultere i et svært stort antall proteinmassefragmenter (~ 200.000 fra ~ 5000 fulle proteinsekvenser), har den fordelen av ikke å utelukke potensielle proteinfragmenter fra avkortingen ved N-terminus eller C-terminus (eller begge deler), men usannsynlig slik avkorting kan være fra et biologisk perspektiv. Denne fremgangsmåten kalles ubegrenset avkorting. Imidlertid er de vanligste bakterielle PTMene som involverer avkorting fjerning av N-terminal metionin eller N-terminal signalpeptid. Som en konsekvens av dette tillater programvaren også operatøren å velge en øvre grense (50 rester) for rester av avkorting fra N-terminus, noe som resulterer i mye færre proteinfragmenter som oppfyller proteinbiomarkørens massekriterier.

PBC på C-terminalsiden av D- og E-rester samt på N-terminalsiden av P-rester er i samsvar med aspartinsyreeffektmekanismen, som har blitt studert mye både eksperimentelt og teoretisk17,18,19,20. Inkludering av PBC på C-terminalsiden av N-rester ble inkludert i programvaren på grunn av en aspartinsyreeffektlignende mekanisme som har blitt observert for en rekke metastabile proteinioner i vårt laboratorium39,40. De mest tallrike fragmentionene fra dissosiasjonen av singly ladede metastabile proteinioner analysert av MS / MS-PSD skyldes aspartic acid effect fragmenteringsmekanismen. Operatøren velger de mest fremtredende fragmentionene fra MS/MS-PSD-dataene og legger inn m/z i programvaren, i tillegg til en tilknyttet fragmentiontoleranse (±m/z). Fragmentiontoleransen kan justeres for hver fragmention for å gjenspeile sin relative overflod. En passende fragmentiontoleranse kan variere mellom ±1,0 til ±2,5 m/z, avhengig av fragmentionens absolutte overflod, samt den relative overfloden sammenlignet med bakgrunnskjemisk støy. Vanligvis, jo mer rikelig en fragmention, jo bedre er massenøyaktigheten, noe som gjør at en smalere fragmentiontoleranse kan brukes.

MS/MS-PSD-data om metastabile proteinioner kan variere dramatisk når det gjelder kompleksiteten. Noen MS/MS-PSD-spektra er lettere å tolke enn andre. Det er flere grunner til dette fenomenet. For det første kan proteinionen ikke fragmentere effektivt på tidsskalaen av analysen (~ 10-30 μs) kanskje fordi den forblir brettet eller delvis brettet selv etter solubilisering i MalDSji-matriseløsningen. For det andre, i tillegg til PBC, kan metastabile proteinioner gjennomgå dissosiativt tap av små molekyler, det vil si ammoniakk (-17 Da) eller vann (-18 Da)15. En betydelig bidragsyter til spektral kompleksitet ser ut til å være dissosiativt tap av ammoniakk fra sidekjeden av R-rester33. Vi har observert en økning i spektral kompleksitet av MS/MS-PSD-data med antall R-rester i proteinsekvensen. Proteiner uten R-rester (YahO-protein36 og kaldsjokkprotein CspC33,43), med en R-rester (kaldsjokkprotein CspE33 og B-underenhet av Stx241), med to R-rester (hypotetisk protein33), produserer MS/MS-PSD-spektra som er relativt ukomplisert og lett å tolke. Men når antall R-rester øker til tre (HU-protein44), eller fire (ubiquitin35andcold-shock protein CsbD33,43), øker spektral kompleksitet betydelig. Programvaren sammenligner fragmentioner fra PBC ved rester som er spesifikke for aspartic acid effekt mekanismen bare som dette er den mest tilgjengelige dissosiasjonskanalen av singly ladet metastable protein ioner analysert av MS / MS-PSD. Programvaren inkluderer ikke fragmentioner som følge av dissosiativt tap (eller tap) av små nøytrale molekyler. Det er derfor viktig at operatøren ikke velger fragmentioner som inkluderer små nøytrale dissosiative tap. Fragmentioner fra PBC er vanligvis de mest fremtredende fragmentionene; Men når antall R-rester i et protein øker til tre eller fire, kan den mest tallrike fragmentionen på et PBC-sted være en som inkluderer et lite dissosiativt tap (eller tap). Hvis en slik klynge av fragmentioner (separert av multipler på 17 eller 18 m/ z) oppdages, bør fragmentionen med høyest m / z i en klynge være den som er angitt i fragmentionsøkparametrene.

Det bør understrekes at programvaren ikke er designet for operatørfri proteomisk identifikasjon. Operatøren må velge hvilke fragmentioner fra MS/MS-PSD-data som skal inkluderes i søket. Imidlertid, basert på mange eksperimenter som har bekreftet aspartiginsyreeffekten av MS / MS-PSD, er de mest fremtredende fragmentionene alltid et resultat av PBC på C-terminalsiden av D- eller E- eller N-rester. Nytten av programvaren er at den eliminerer mange åpenbart feil sekvenser og henter bare noen få sannsynlige kandidater. Noen kandidatsekvenser kan elimineres basert på fraværet av en fragmention der en D-rest i en sekvens forventes å generere en fremtredende fragmention. Alltid resulterer D-rester i fremtredende fragmentioner i hele polypeptid ryggraden bortsett fra når de ligger innenfor noen få rester av N- eller C-termini der effektiviteten av aspartic acid effekten avtar36.

Minimum antall PBC-lokaliteter som trengs for foreløpig proteinidentifikasjon
En CFIP er dannet av to identiske proteinforløperioner som dissosierer på samme PBC-nettsted, men har sin ioniserende proton på motsatte sider av spaltningsstedet. Selv om en CFIP kan brukes til å beregne massen av proteinbiomarkøren mer nøyaktig (slik at en innsnevring av proteinmassetoleransen under et søk), er verktøyet for sekvensspesifikk identifikasjon mindre nyttig enn for to ikke-komplementære fragmentioner dannet fra to forskjellige spaltingssteder, noe som gir større identifikasjonsspektifisitet. Den enkle som de to AB-Im-proteinene ble identifisert med, førte oss til å spekulere i det minste antall fragmentioner som er nødvendige for å foreløpig identifisere riktig proteinsekvens fra tusenvis av proteiner eller proteinfragmentsekvenser. Vi bestemte oss raskt for at det ikke var antall fragmentioner i seg selv, men antall ikke-komplementære fragmentioner som er viktige fordi hver ikke-komplementær fragmention representerer ett PBC-nettsted, mens en CFIP representerer samme spaltingssted. Dermed er identifikasjons spesifisitet avledet fra antall PBC-nettsteder oppdaget ikke antall fragmentioner.

Det er mulig at suksessen med identifikasjon med bare tre fragmentioner kan ha vært ganske enkelt fortuitous. For å teste denne hypotesen og for å eliminere skjevheter i valg av fragmentioner, opprettet vi en benchmarkingmodul i programvaren som tilfeldig velger fragmentioner fra et større utvalg av komplementære og / eller ikke-komplementære fragmentioner. Det større fragmentionbassenget ble valgt ut fra de 14 fremtredende fragmentionene identifisert i figur 3 (bunnpanelet) basert på deres relative overflod.

Testprotokollen var som følger. Ved hjelp av et binært søk ble tre fragmentioner tilfeldig valgt fra utvalget av 14 fremtredende fragmentioner i figur 3 (nederste panel) (m/z 1813,8, 2128,9, 3881,3, 4293,7, 5158,0, 6505,0, 6619,9, 6939,4, 7645,1, 7959,4, 8022,7, 8136,2, 8583,3 og 8961,5). En tre-fragment ion kohort ble sammenlignet med i silico fragmentioner fra PBC på C-terminalsiden av D- eller E- eller N-rester samt en kombinasjon av D &E og D &E &N. Denne sammenligningen ble utført for hver enkelt fragmention av en kohort, for de tre fragmentionparene til en kohort og for tre fragmentionkombinasjonen av en kohort. For at en sammenligning skal telles som en kamp, må både fragmentioner av et par og alle tre fragmentionene av en kombinasjon samsvare med i silicofragmentioner. Etter ferdigstillelse av analysen velges en annen tre-fragmentionkohort tilfeldig, og analysen gjentas. Repetisjon i valg av fragmention var tillatt. Da det er 364 mulige kombinasjoner [(n!/r!( n-r)!] av en tre-fragment ion kohort (r) fra et basseng på 14 fragmentioner (n), ble bare 10 analyser utført som vist i S1Im3 (Supplementary Information).

Kravet til identifikasjon av tre fragmenter ser ut til å være et generelt fenomen som vist i kolonne 3_ABC i tabell 2-7, 9-10 (S1Im3). Alle tellinger på 1 i kolonnen 3_ABC tilsvarer Im3-sekvensen (uten N-terminal metionin). Den eneste feilen i identifikasjonen oppstod fordi fragmentionen ved m/z 8136.2 (vist i figur 3, nederste panel og uthevet i grått i tabell 1 og 8) overskred fragmentiontoleransen (±1,5 m/z) som er angitt for analysen. Siden testalgoritmen krever at alle fragmentioner av en tre-fragmentionkohort samsvarer, vil enhver gruppe som inkluderte m / z 8136.2 fragmention ikke identifisere / telle riktig proteinsekvens.

Tabell 6 i S1Im3 viser at når to av tre fragmentioner er komplementære (uthevet i gult), samsvarte flere feilsekvenser med kriteriene enn det som ble observert da alle tre fragmentionene ikke var komplementære. Som nevnt tidligere, er dette fordi en CFIP tilsvarer et enkelt PBC-nettsted, en terskel som kan oppnås med mange flere feil i silicosekvenser sammenlignet med å bruke to ikke-komplementære fragmentioner som tilsvarer to PBC-nettsteder, et strengere kriterium.

En lignende analyse ble utført på seks fremtredende fragmentioner (m/z 2675,4, 2904,5, 3076,2, 3853,5, 5657,5 og 5772,8) av Im-Bac vist i figur 4 (nederste panel). I motsetning til Im3 har Im-Bac ingen merkbar CFIP, derfor samsvarer de seks fragmentionene antagelig med seks PBC-nettsteder. Siden det er 20 mulige kombinasjoner av en tre-fragmentionkohort valgt fra et basseng på seks fragmentioner, ble bare 10 analyser utført som vist i tabellene til S2 Im-Bac (Supplementary Information). Im-Bac-sekvensen ble korrekt identifisert/telt for alle tre fragmentiongrupper i kolonne 3_ABC i alle analyser. I fire analyser ble også en eller to feil sekvenser matchet. Dette lille antallet feilsekvenser er imidlertid et håndterbart nummer for manuell bekreftelse.

Totalt sett ser det ut til at komplementære og/eller ikke-komplementære fragmentioner som tilsvarer to eller tre PBC-områder, gir nok spesifisitet til å hente en eller to kandidatsekvenser. Selvfølgelig bør fragmentionene valgt av operatøren være relativt rikelig og ha god S / N. En eller to fragmentioner fra et enkelt PBC-område gir ikke nok spesifisitet til å unngå å hente et ubrukelig antall feilsekvenser som må bekreftes av operatøren. Det er ikke klart hvorfor to eller tre PBC-nettsteder er tilstrekkelige, men et enkelt PBC-nettsted er tilsynelatende ikke spesifikt nok. Selv om ubegrenset avkorting resulterer i ~ 200 000 proteiner og proteinfragmentsekvenser som oppfyller proteinmassekriteriene, er det sannsynlig at området / rester-spesifikke naturen til spaltningsstedene, det vil si C-terminalsiden av D-, E- og N-rester, bidrar til skarp innsnevring av mulige sekvenser under fragmentjonssammenligning. Dette kan delvis skyldes frekvensen av D-, E- og N-rester i bakterielle proteinsekvenser, samt deres unike steder i proteinsekvenser over proteomet av bakterier. Sure rester spiller kritiske roller i proteinstruktur og løsningsmiddelinteraksjoner. Følgelig er deres frekvens og steder i primærsekvensen kritiske, om ikke unike for proteinfunksjon, og kan forklare hvorfor bare noen få PBC-nettsteder er nødvendige for å foreløpig identifisere riktig proteinsekvens blant hundretusenvis av feil sekvenser.

Fra et gassfasekjemiperspektiv stammer betydningen av D-, E- og N-rester fra deres deltakelse i en dissosiasjonskanal som er tilgjengelig ved lave interne energier av enkeltladede metastable proteinioner generert av MALDI og forfall av PSD20. Den relativt lange tidsskalaen (~ 10-30 μs) av molekylær ionfragmentering av PSD betyr at proteinionens indre energi randomiseres blant alle vibrasjons- og rotasjonsgrader av den molekylære ionen slik at dissosiasjon er ergodisk og statistisk. Det bør også påpekes at mekanismen for aspartinsyreeffekt innebærer en molekylær ion-omorganisering som oppstår ved en sekvens av trinn eller et enkelt samordnet trinn som involverer flere atomer til en gunstig geometri oppnås som senker aktiveringsbarrieren til PBC17,18,19.

To plasmidkodede antibakterielle immunitetsproteiner produsert av en STEC-stamme ble identifisert ved hjelp av en protokoll som involverer antibiotikainduksjon, Maldiv-TOF-TOF-MS/MS-PSD og ovenfra og ned proteomisk analyse. Disse proteinene ble identifisert ved hjelp av programvare utviklet internt som inkorporerer proteinets målte masse og et relativt lite antall sekvensspesifikke fragmentioner dannet som følge av aspartiginsyreeffekten. Programvaren sammenligner MS- og MS/MS-data med i silicoprotein- og proteinfragmentsekvenser avledet fra WGS-data. Selv om programvaren ikke gir identifikasjonsmålinger eller poengregning, eliminerer den en svært høy prosentandel av feil sekvenser, noe som resulterer i et svært lite antall kandidatsekvenser (en eller to) som lett kan bekreftes ved manuell inspeksjon. Til slutt avslørte manuell inspeksjon av WGS-dataene i denne bakteriestammen en promotor (SOS-boks) oppstrøms AB- og Im-genene i et plasmidgenom, som rasjonaliserer uttrykk for disse genene på grunn av eksponering av DNA-skadelige antibiotika.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Forfatterne har ingen interessekonflikter.

Acknowledgments

Protein Biomarker Seeker programvare er fritt tilgjengelig (uten kostnad) ved å kontakte Clifton K. Fagerquist på clifton.fagerquist@usda.gov. Vi ønsker å anerkjenne støtte til denne forskningen av ARS, USDA, CRIS grant: 2030-42000-051-00-D.

Materials

Name Company Catalog Number Comments
4000 Series Explorer software AB Sciex Version 3.5.3
4800 Plus MALDI TOF/TOF Analyzer AB Sciex
Acetonitrile Optima LC/MS grade Fisher Chemical A996-1
BSL-2 biohazard cabinet The Baker Company SG403A-HE
Cytochrome-C Sigma C2867-10MG
Data Explorer software AB Sciex Version 4.9
Focus Protein Reduction-Alkylation kit G-Biosciences 786-231
GPMAW software Lighthouse Data Version 10.0
Incubator VWR 9120973
LB Agar Invitrogen 22700-025
Luria Broth Invitrogen 12795-027
Lysozyme Sigma L4919-1G
Microcentrifuge Tubes, 2 mL, screw-cap, O-ring Fisher Scientific 02-681-343
MiniSpin Plus Centrifuge Eppendorf 22620207
Mitomycin-C (from streptomyces) Sigma-Aldrich M0440-5MG
Myoglobin Sigma M5696-100MG
Shaker MaxQ 420HP Model 420 Thermo Scientific Model 420
Sinapinic acid Thermo Scientific 1861580
Sterile 1 uL loops Fisher Scientific 22-363-595
Thioredoxin (E. coli, recombinant) Sigma T0910-1MG
Trifluoroacetic acid Sigma-Aldrich 299537-100G
Water Optima LC/MS grade Fisher Chemical W6-4

DOWNLOAD MATERIALS LIST

References

  1. Fornelli, L., et al. Accurate sequence analysis of a monoclonal antibody by top-down and middle-down orbitrap mass spectrometry applying multiple ion activation techniques. Analytical Chemistry. 90 (14), 8421-8429 (2018).
  2. Fornelli, L., et al. Top-down proteomics: Where we are, where we are going. Journal of Proteomics. 175, 3-4 (2018).
  3. He, L., et al. Top-down proteomics-a near-future technique for clinical diagnosis. Annals of Translational Medicine. 8 (4), 136 (2020).
  4. Wu, Z., et al. MASH explorer: A universal software environment for top-down proteomics. Journal of Proteome Research. 19 (9), 3867-3876 (2020).
  5. Konermann, L., Metwally, H., Duez, Q., Peters, I. Charging and supercharging of proteins for mass spectrometry: recent insights into the mechanisms of electrospray ionization. Analyst. 144 (21), 6157-6171 (2019).
  6. Bourmaud, A., Gallien, S., Domon, B. Parallel reaction monitoring using quadrupole-Orbitrap mass spectrometer: Principle and applications. Proteomics. 16 (15-16), 2146-2159 (2016).
  7. Hart-Smith, G. A review of electron-capture and electron-transfer dissociation tandem mass spectrometry in polymer chemistry. Analitica Chimica Acta. 808, 44-55 (2014).
  8. Brodbelt, J. S., Morrison, L. J., Santos, I. Ultraviolet photodissociation mass spectrometry for analysis of biological molecules. Chemical Reviews. 120 (7), 3328-3380 (2020).
  9. Karas, M., Bachmann, D., Bahr, U., Hillenkamp, F. Matrix-assisted ultraviolet-laser desorption of nonvolatile compounds. International Journal of Mass Spectrometry and Ion Processes. 78, 53-68 (1987).
  10. Karas, M., Bachmann, D., Hillenkamp, F. Influence of the wavelength in high-irradiance ultraviolet-laser desorption mass-spectrometry of organic-molecules. Analytical Chemistry. 57 (14), 2935-2939 (1985).
  11. Tanaka, K., et al. Protein and polymer analyses up to m/z 100 000 by laser ionization time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 2 (8), 151-153 (1988).
  12. Resemann, A., et al. Top-down de Novo protein sequencing of a 13.6 kDa camelid single heavy chain antibody by matrix-assisted laser desorption ionization-time-of-flight/time-of-flight mass spectrometry. Analytical Chemistry. 82 (8), 3283-3292 (2010).
  13. Suckau, D., Resemann, A. T3-sequencing: targeted characterization of the N- and C-termini of undigested proteins by mass spectrometry. Analytical Chemistry. 75 (21), 5817-5824 (2003).
  14. Mikhael, A., Jurcic, K., Fridgen, T. D., Delmas, M., Banoub, J. Matrix-assisted laser desorption/ionization time-of-flight/time-of-flight tandem mass spectrometry (negative ion mode) of French Oak Lignin: A Novel Series of Lignin and Tricin Derivatives attached to Carbohydrate and Shikimic acid Moieties. Rapid Communications in Mass Spectrometry. 34 (18), 8841 (2020).
  15. Demirev, P. A., Feldman, A. B., Kowalski, P., Lin, J. S. Top-down proteomics for rapid identification of intact microorganisms. Analytical Chemistry. 77 (22), 7455-7461 (2005).
  16. Fagerquist, C. K. Unlocking the proteomic information encoded in MALDI-TOF-MS data used for microbial identification and characterization. Expert Review of Proteomics. 14 (1), 97-107 (2017).
  17. Gu, C., Tsaprailis, G., Breci, L., Wysocki, V. H. Selective gas-phase cleavage at the peptide bond C-terminal to aspartic acid in fixed-charge derivatives of Asp-containing peptides. Analytical Chemistry. 72 (23), 5804-5813 (2000).
  18. Herrmann, K. A., Wysocki, V. H., Vorpagel, E. R. Computational investigation and hydrogen/deuterium exchange of the fixed charge derivative tris(2,4,6-trimethoxyphenyl) phosphonium: implications for the aspartic acid cleavage mechanism. Journal of the American Society for Mass Spectrometry. 16 (7), 1067-1080 (2005).
  19. Rozman, M. Aspartic acid side chain effect-experimental and theoretical insight. Journal of the American Society for Mass Spectrometry. 18 (1), 121-127 (2007).
  20. Yu, W., Vath, J. E., Huberty, M. C., Martin, S. A. Identification of the facile gas-phase cleavage of the Asp-Pro and Asp-Xxx peptide bonds in matrix-assisted laser desorption time-of-flight mass spectrometry. Analytical Chemistry. 65 (21), 3015-3023 (1993).
  21. Luethy, P. M., Johnson, J. K. The use of Matrix-Assisted Laser Desorption/Ionization Time-of-Flight Mass Spectrometry (MALDI-TOF MS) for the identification of pathogens causing sepsis. The Journal of Applied Laboratory Medicine. 3 (4), 675-685 (2019).
  22. Knabl, L., Lass-Florl, C. Antifungal susceptibility testing in Candida species: current methods and promising new tools for shortening the turnaround time. Expert Review of Anti-Infective Therapy. 18 (8), 779-787 (2020).
  23. Gould, O., Ratcliffe, N., Krol, E., de Lacy Costello, B. Breath analysis for detection of viral infection, the current position of the field. Journal of Breath Research. 14 (4), 041001 (2020).
  24. Fagerquist, C. K., et al. Sub-speciating Campylobacter jejuni by proteomic analysis of its protein biomarkers and their post-translational modifications. Journal of Proteome Research. 5 (10), 2527-2538 (2006).
  25. Sandrin, T. R., Goldstein, J. E., Schumaker, S. MALDI TOF MS profiling of bacteria at the strain level: a review. Mass Spectrometry Reviews. 32 (3), 188-217 (2013).
  26. Christner, M., et al. Rapid MALDI-TOF mass spectrometry strain typing during a large outbreak of Shiga-Toxigenic Escherichia coli. PLoS One. 9 (7), 101924 (2014).
  27. Masaki, H., Ohta, T. Colicin E3 and its immunity genes. Journal of Molecular Biology. 182 (2), 217-227 (1985).
  28. Michel, B. After 30 years of study, the bacterial SOS response still surprises us. PLoS Biology. 3 (7), 255 (2005).
  29. Fagerquist, C. K., Sultan, O. Induction and identification of disulfide-intact and disulfide-reduced beta-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS and top-down proteomics. Analyst. 136 (8), 1739-1746 (2011).
  30. Fagerquist, C. K., Sultan, O. Top-down proteomic identification of furin-cleaved alpha-subunit of Shiga toxin 2 from Escherichia coli O157:H7 using MALDI-TOF-TOF-MS/MS. Journal of Biomedicine & Biotechnology. 2010, 123460 (2010).
  31. Fagerquist, C. K., et al. Top-down proteomic identification of Shiga toxin 2 subtypes from Shiga toxin-producing Escherichia coli by matrix-assisted laser desorption ionization-tandem time of flight mass spectrometry. Applied and Environmental Microbiology. 80 (9), 2928-2940 (2014).
  32. Fagerquist, C. K., Zaragoza, W. J., Lee, B. G., Yambao, J. C., Quiñones, B. Clinically-relevant Shiga toxin 2 subtypes from environmental Shiga toxin-producing Escherichia coli identified by top-down/middle-down proteomics and DNA sequencing. Clinical Mass Spectrometry. 11, 27-36 (2019).
  33. Fagerquist, C. K., Lee, B. G., Zaragoza, W. J., Yambao, J. C., Quiñones, B. Software for top-down proteomic identification of a plasmid-borne factor (and other proteins) from genomically sequenced pathogenic bacteria using MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 438, 1-12 (2019).
  34. Fagerquist, C. K., Rojas, E. ACS Fall 2020 Virtual Meeting & Expo. American Chemical Society, Virtual. , (2020).
  35. Fagerquist, C. K., Sultan, O. A new calibrant for matrix-assisted laser desorption/ionization time-of-flight-time-of-flight post-source decay tandem mass spectrometry of non-digested proteins for top-down proteomic analysis. Rapid Communications in Mass Spectrometry. 26 (10), 1241-1248 (2012).
  36. Fagerquist, C. K., Zaragoza, W. J. Complementary b/y fragment ion pairs from post-source decay of metastable YahO for calibration of MALDI-TOF-TOF-MS/MS. International Journal of Mass Spectrometry. 415, 29-37 (2017).
  37. Quinones, B., Yambao, J. C., Lee, B. G. Draft genome sequences of Escherichia coli O113:H21 strains recovered from a major produce production region in California. Genome Announcements. 5 (44), 01203-01217 (2017).
  38. Harrison, A. G. The gas-phase basicities and proton affinities of amino acids and peptides. Mass Spectrometry Reviews. 16 (4), 201-217 (1997).
  39. Fagerquist, C. K. Polypeptide backbone cleavage on the C-terminal side of asparagine residues of metastable protein ions analyzed by MALDI-TOF-TOF-MS/MS and post-source decay. International Journal of Mass Spectrometry. 457, (2020).
  40. Fagerquist, C. K., Zaragoza, W. J. Mass Spectrometry: Application to the Clinical Lab 2019 (MSACL 2019). , Palm Springs, CA. (2019).
  41. Fagerquist, C. K., Zaragoza, W. J. Bacteriophage cell lysis of Shiga toxin-producing Escherichia coli for top-down proteomic identification of Shiga toxins 1 & 2 using matrix-assisted laser desorption/ionization tandem time-of-flight mass spectrometry. Rapid Communications in Mass Spectrometry. 30 (6), 671-680 (2016).
  42. Fagerquist, C. K., et al. Web-based software for rapid top-down proteomic identification of protein biomarkers, with implications for bacterial identification. Applied and Environmental Microbiology. 75 (13), 4341-4353 (2009).
  43. Fagerquist, C. K., et al. Rapid identification of protein biomarkers of Escherichia coli O157:H7 by matrix-assisted laser desorption ionization-time-of-flight-time-of-flight mass spectrometry and top-down proteomics. Analytical Chemistry. 82 (7), 2717-2725 (2010).
  44. Maus, A., Bisha, B., Fagerquist, C., Basile, F. Detection and identification of a protein biomarker in antibiotic-resistant Escherichia coli using intact protein LC offline MALDI-MS and MS/MS. Journal of Applied Microbiology. 128 (3), 697-709 (2020).

Tags

Kjemi utgave 171
Identifisering av antibakteriell immunitet Proteiner i <em>Escherichia coli</em> ved bruk av MALDI-TOF-TOF-MS/MS og Ovenfra og ned Proteomisk analyse
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Fagerquist, C. K., Rojas, E.More

Fagerquist, C. K., Rojas, E. Identification of Antibacterial Immunity Proteins in Escherichia coli using MALDI-TOF-TOF-MS/MS and Top-Down Proteomic Analysis. J. Vis. Exp. (171), e62577, doi:10.3791/62577 (2021).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter