Her presenterer vi en protokoll for å utforske biomarkør og overlevelse som er en indikasjon på brystkreft basert på den omfattende analysen av samlede kliniske datasett avledet fra en rekke offentlig tilgjengelige databaser, ved hjelp av uttrykks strategi, korrelasjon og overlevelse analyse trinn for trinn.
I de senere årene, nye databaser ble utviklet for å senke barrierer for nærmer seg intrikate kreft genomisk datasett, og dermed tilrettelegge etterforskere til å analysere og tolke gener, prøver og kliniske data på tvers av ulike typer kreft. Heri, beskriver vi en praktisk operasjon prosedyre, tar ID1 (hemmer av DNA bindende proteiner 1) som et eksempel, for å karakterisere uttrykket mønstre av biomarkør og overlevelse prediktorer av brystkreft basert på samlede kliniske datasett avledet fra Online tilgjengelige databaser, inkludert ONCOMINE, bcGenExMiner v 4.0 (brystkreft gen-uttrykk miner v 4.0), GOBO (Gene Expression-basert utfall for brystkreft online), HPA (den menneskelige protein Atlas), og Kaplan-Meier plotter. Analysen begynte med å spørre uttrykket mønster av genet av interesse (f. eks, ID1) i kreft prøver kontra normale prøver. Deretter ble korrelasjons analysen mellom ID1 og clinicopathological egenskaper i brystkreft utført. Deretter ble uttrykks profilene til ID1 lagdelt i henhold til ulike undergrupper. Til slutt ble tilknytningen mellom ID1 uttrykk og overlevelses utfall analysert. Operasjons prosedyren forenkler konseptet med å integrere flerdimensjonale datatyper på gen nivået fra ulike databaser og test hypoteser om gjentakelse og genomisk kontekst for gen endring i brystkreft. Denne metoden kan forbedre troverdigheten og representativitet av konklusjonene, og dermed presentere informativt perspektiv på et gen av interesse.
Brystkreft er en heterogen sykdom med ulike prognose og behandling strategier i ulike molekylære under typer, der patogenesen og utvikling er trolig forbundet med ulike molekylære mekanismer1,2 , 3. men å identifisere et terapeutisk mål tar vanligvis år, eller til og med flere ti år, fra første oppdagelse i grunnleggende forskning til klinisk bruk4. Genova bred anvendelse av høy-produksjon sekvensering teknologien for kreften Genova har høyeste avansert prosessen av forskende for kostbar biomarkører eller terapeutisk mål 5.
Den overveldende mengden av kreft Genomics data generert fra stor skala kreft Genomics plattformer, slik som ICGC (International Cancer Genova Consortium) og TCGA (The Cancer Genova Atlas), er poserer en stor utfordring for forskere å utføre data leting, integrasjon og analyse, spesielt for brukere som mangler intensiv opplæring i informatikk og beregning6,7,8,9,10. I de senere årene, nye databaser, (f. eks, ONCOMINE, bcGenExMiner v 4.0, og Kaplan-Meier plotter, etc.) ble designet og utviklet for å senke bar for nærmer seg intrikate kreft genomisk datasett, og dermed tilrettelegge etterforskere å analysere og tolke gener, prøver og kliniske data på tvers av ulike typer kreft11. Målet med denne protokollen er å beskrive en forskningsstrategi som integreres med flere nivåer av gen informasjon fra en rekke åpne tilgang databaser, som har blitt allment anerkjent av et stort antall forskere, for å identifisere de potensielle biomarkører og Prognostisk faktorer for brystkreft.
Den ONCOMINE databasen er en Web-basert data-mining plattform med kreft Microarray informasjon og er utformet for å lette oppdagelsen av romanen biomarkører og terapeutiske mål11. For tiden er det mer enn 48 000 000 genuttrykk målinger fra 65 Gene Expression datasett i denne databasen11,12. Den bcGenExMiner v 4.0 (et gratis verktøy for non-profit institusjon), også kalt brystkreft Gene-Expression miner, er en bruker-vennlig Web-basert applikasjon bestående av DNA Microarrays resultatene av 3 414 gjenvunnet brystkreftpasienter og 1 209 opplevde en nedsettende hendelse13. Den er designet for å forbedre gen Prognostisk analyse ytelse med R statistisk programvare og pakker.
Den GOBO er et multifunksjonelt brukervennlig online verktøy med Microarrays informasjon (f. eks Affymetrix U133A) fra en 51-sample brystkreft cellelinje sett og en 1881-sample bryst tumor datasett, som gjør at en rekke analyser14. Det finnes en rekke programmer tilgjengelig i GOBO database, som inkluderer rask analyse av genuttrykk profiler i ulike molekylære undergrupper av brystkreft svulster og cellelinjer, screening for co-uttrykt gener for etablering av potensielle metagenes, og korrelasjon analyse mellom utfall og genuttrykk nivåer av enkelt gener, sett av gener, eller gen underskrifter i brystkreft datasett15.
Human protein Atlas er en åpen tilgang program utviklet for forskere å utforske menneskelig proteom, som allerede har bidratt til et stort antall publikasjoner innen menneskets biologi og sykdom. Den menneskelige protein Atlas er anerkjent som en europeisk kjerne ressurs for Life Science Community16,17.
Den Kaplan Meier plotter er et nettbasert verktøy integrere genuttrykk og kliniske data samtidig som tillater vurdering av Prognostisk effekten av 54 675 gener basert på 10 461 kreft prøver, som inkluderer 1 065 mage, 2 437 lunge, 1 816 eggstokkene og 5 143 brystkreftpasienter med en gjennomsnittlig oppfølging av 33/49/40/69 måneder18. Informasjon om genuttrykk, overlevelse uten tilbakefall (RFs) og total overlevelse (OS) kan lastes ned fra denne databasen19,20.
Her beskriver vi en praktisk operasjonsprosedyre for å bruke flere offentlig tilgjengelige databaser for å sammenligne, analysere og visualisere mønstre av endringer i uttrykket av genet av interesse på tvers av flere kreft studier, med mål om å oppsummere uttrykks profiler, Prognostisk verdier og potensielle biologiske funksjoner i brystkreft. For eksempel har nyere studier indikert de kreftfremkallende egenskapene til ID proteiner i svulster og var assosiert med ondartede funksjoner, inkludert cellulær transformasjon, immortalization, forbedret spredning og metastasering21, 22,23. Men hvert medlem av ID-familien spiller forskjellige roller i ulike typer solide svulster, og deres rolle i brystkreft er fortsatt uklart24. I tidligere studier, utforsket gjennom denne metoden, fant vi ut at ID1 var en meningsfull Prognostisk indikator i brystkreft25. Derfor protokollen vil ta ID1 som et eksempel for å innføre data mining metoder.
Analysen starter fra spørring uttrykket mønster av genet av interesse i kreft prøver kontra normale prøver i ONCOMINE. Deretter ble uttrykket korrelasjon av gener av interesse for brystkreft utført ved hjelp av BC-GenExMiner v 4.0, GOBO, og ONCOMINE. Deretter ble uttrykks profilene til ID1 lagdelt i henhold til ulike undergrupper ved hjelp av de tre databasene ovenfor. Til slutt ble foreningen mellom ID1 uttrykk og overlevelse ut analysert ved hjelp av BC-GenExMiner v 4.0, den menneskelige protein Atlas, og Kaplan-Meier plotter. Operasjons prosedyren ble vist som flytskjema i figur 1.
Omfattende analyse av offentlige databaser kan indikere den underliggende funksjonen av genet av interesse og avdekke den potensielle koblingen mellom dette genet og clinicopathological parametere i bestemte kreft27,31. Leting og analyse basert på en enkelt database kan gi begrensede eller isolerte perspektiver på grunn av den potensielle utvalgs bias, eller i en viss grad, muligens på grunn av mangfoldet av datakvalitet, inkludert datainnsamling og analytisk …
The authors have nothing to disclose.
Dette arbeidet ble delvis støttet av Natural Science Foundation of Guangdong-provinsen, Kina (no. 2018A030313562), den Teaching reform prosjekt av Guangdong klinisk undervisning Base (nr. 2016JDB092), National Natural Science Foundation i Kina (81600358), og Youth innovative talent prosjekt for høyskoler og universiteter i Guangdong-provinsen, Kina (NO. 2017KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |