Her præsenterer vi en protokol for at udforske biomarkør og overlevelses Prædikeren for brystkræft baseret på en omfattende analyse af puljede kliniske datasæt afledt af en række offentligt tilgængelige databaser, ved hjælp af strategien for udtryk, korrelation og overlevelse analyse trin for trin.
I de seneste år, nye databaser blev designet til at sænke barriererne for at nærme sig indviklede kræft genomiske datasæt, dermed lette undersøgere til at analysere og fortolke gener, prøver og kliniske data på tværs af forskellige typer af kræft. Heri beskriver vi en praktisk Operations procedure, der tager ID1 (hæmmer af DNA-bindings proteiner 1) som et eksempel, for at karakterisere udtryks mønstrene for biomarkør og overlevelses indikatorer for brystkræft baseret på poolede kliniske datasæt afledt af online tilgængelige databaser, herunder ONCOMINE, bcGenExMiner v 4.0 (Breast Cancer gen-Expression minearbejder v 4.0), GOBO (gene Expression-baseret udfald for Breast Cancer online), HPA (det humane protein Atlas), og Kaplan-Meier plotter. Analysen begyndte med at forespørge på udtryks mønstret af genet af interesse (f. eks. ID1) i kræft prøver vs. normale prøver. Derefter blev korrelationsanalysen mellem ID1 og clinicopatologiske egenskaber ved brystkræft udført. Dernæst blev udtryks profilerne for ID1 stratificeret efter forskellige undergrupper. Endelig blev sammenslutningen mellem ID1 udtryk og overlevelses resultatet analyseret. Operations proceduren forenkler konceptet for at integrere multidimensionelle datatyper på genniveauet fra forskellige databaser og test hypoteser vedrørende gentagelse og genomisk kontekst af genmodificering af brystkræft. Denne metode kan forbedre troværdigheden og repræsentativitet af konklusionerne, dermed præsentere informative perspektiv på et gen af interesse.
Brystkræft er en heterogen sygdom med forskellig prognose og behandlingsstrategier i forskellige molekylære subtyper, hvor patogenesen og udvikling sandsynligvis er forbundet med uensartede molekylære mekanismer1,2 , 3. men identifikation af et terapeutisk mål tager normalt år, eller endda årtier, fra første opdagelse i grundforskning til klinisk brug4. Genom bred anvendelse af høj-gennemløb sekventering teknologi for kræft genom har i høj grad fremmet processen med at søge efter værdifulde biomarkører eller terapeutiske mål 5.
Den overvældende mængde af kræft genomforskning data genereret fra de store kræft genomforskning platforme, såsom ICGC (International Cancer genom Consortium) og tcga (The Cancer genom Atlas), udgør en stor udfordring for forskerne at udføre data udforskning, integration og analyse, især for brugere, der mangler intensiv træning i Informatik og beregning6,7,8,9,10. I de seneste år er nye databaser (f. eks., ONCOMINE, bcGenExMiner v 4.0 og Kaplan-Meier-plotter osv.) designet og udviklet til at sænke linjen for at nærme sig de indviklede kræft genomdatasæt og derved gøre det lettere for efterforskerne at analysere og fortolke gener, prøver og kliniske data på tværs af forskellige typer af kræft11. Formålet med denne protokol er at beskrive en forskningsstrategi, der er integreret med flere niveauer af geninformation fra en række åbne databaser, som er blevet bredt anerkendt af et stort antal forskere, for at identificere de potentielle biomarkører og prognostiske faktorer for brystkræft.
ONCOMINE database er en web-baseret data-mining platform med kræft microarray information og er designet til at lette opdagelsen af nye biomarkører og terapeutiske mål11. I øjeblikket er der mere end 48.000.000 genekspressions målinger fra 65 genekspressions datasæt i denne database11,12. Den bcGenExMiner v 4.0 (et gratis værktøj til non-profit institution), også kaldet brystkræft gene-Expression miner, er en brugervenlig web-baseret applikation, der omfatter DNA-mikroarrays resultater af 3.414 genvundet brystkræftpatienter og 1.209 oplevede en nedsættende hændelse13. Det er designet til at forbedre genprognostisk analyse ydeevne med R statistisk software og pakker.
GOBO er et multifunktionelle brugervenligt online værktøj med mikroarrays oplysninger (f. eks Affymetrix U133A) fra en 51-prøve brystkræft cellelinje sæt og en 1881-prøve bryst tumordata sæt, der giver mulighed for en bred vifte af analyser14. Der er en bred vifte af applikationer til rådighed i GOBO database, som omfatter hurtig analyse af genekspression profiler i forskellige molekylære undertyper af brysttumorer og cellelinjer, screening for Co-udtrykte gener for skabelse af potentielle metagener, og korrelationsanalyse mellem resultater og genekspressions niveauer for enkelt gener, sæt af gener eller gensignaturer i datasættet for brystkræft15.
Human protein Atlas er et åbent program designet til videnskabsfolk til at udforske menneskelige proteome, som allerede har bidraget til en lang række publikationer inden for human biologi og sygdom. Det humane protein Atlas er anerkendt som en europæisk kerneressource for Life Science community16,17.
Kaplan Meier-plotteren er et online værktøj, der integrerer genekspression og kliniske data samtidigt, som gør det muligt at vurdere den prognostiske effekt af 54.675 gener baseret på 10.461 Cancer prøver, som omfatter 1.065 gastrisk, 2.437 lunge, 1.816 æggestokke og 5.143 brystcancer patienter med en gennemsnitlig opfølgning på 33/49/40/69 måneder18. Oplysninger om genekspression, recidiv-fri overlevelse (RFS) og samlet overlevelse (os) kan downloades fra denne database19,20.
Her beskriver vi en praktisk Operations procedure for brug af flere offentligt tilgængelige databaser til at sammenligne, analysere og visualisere mønstre af ændringer i udtrykket af det gen af interesse på tværs af flere kræft undersøgelser, med det formål at opsummere de udtryks profiler, prognostiske værdier og potentielle biologiske funktioner i brystkræft. For eksempel har nylige undersøgelser indikeret de onkogene egenskaber af ID-proteiner i tumorer og var forbundet med maligne egenskaber, herunder cellulær omdannelse, immortalisering, øget proliferation og metastase21, 22,23. Men, hvert medlem af ID-familien spiller forskellige roller i forskellige typer af solide tumorer, og deres rolle i brystkræft er stadig uklart24. I tidligere undersøgelser, udforsket gennem denne metode, fandt vi, at ID1 var en meningsfuld prognostisk indikator i brystkræft25. Derfor vil protokollen tage ID1 som et eksempel for at indføre datamining metoder.
Analysen starter fra at forespørge udtryks mønstret af genet af interesse i kræft prøver vs normale prøver i ONCOMINE. Derefter, udtrykket korrelation af gener af interesse i brystkræft blev udført ved hjælp af BC-GenExMiner v 4.0, GOBO, og ONCOMINE. Dernæst blev udtryks profilerne for ID1 stratificeret efter forskellige undergrupper ved hjælp af de tre ovennævnte databaser. Endelig, sammenslutningen mellem ID1 udtryk og overlevelse ud blev analyseret ved hjælp af BC-GenExMiner v 4.0, det humane protein Atlas, og Kaplan-Meier plotter. Operations proceduren blev vist som rutediagrammet i figur 1.
Omfattende analyse af offentlige databaser kan indikere den underliggende funktion af genet af interesse og afslører den potentielle forbindelse mellem dette gen og patologiske parametre i specifikke kræft27,31. Efterforskning og analyse baseret på en enkelt database kan give begrænsede eller isolerede perspektiver på grund af den potentielle selektions skævhed eller i et vist omfang, muligvis på grund af de mange forskellige data kvaliteter, herunder data…
The authors have nothing to disclose.
Dette arbejde blev delvist støttet af naturvidenskab Foundation af Guangdong provinsen, Kina (nr. 2018A030313562), undervisning reform projekt af Guangdong klinisk undervisning base (NO. 2016JDB092), national naturvidenskab Foundation i Kina (81600358), og ungdom innovative talent projekt af gymnasier og universiteter i Guangdong provinsen, Kina (NO. 2017KQNCX073)
A personal computer or computing device with an Internet browser with Javascript enabled |
Microsoft | 051690762553 | We support and test the following browsers: Google Chrome, Firefox 3.0 and above, Safari, and Internet Explorer 9.0 and above |
Adobe Flash player | Adobe Systems Inc. | It can be freely downloaded from http://get.adobe.com/flashplayer/. | This browser plug-in is required for visualizing networks on the network analysis tab. |
Chrome Broswer | Google Inc. | It can be freely downloaded from https://www.google.cn/chrome/ | This is necessary for viewing PDF files including the Pathology Reports and many of the downloadable files. |
Java Runtime Environment | Oracle Corporation | It can be downloaded from http://www.java.com/getjava/. | |
Office 365 ProPlus for Faculty | Microsoft | 2003BFFD8117EA68 | This is necessary for viewing the Pathology Reports and for viewing many of the downloadable files. |
Vectr Online | Vectr Labs Inc. | It can be freely used from https://vectr.com/new | This is necessary for visualizing and editing many of the downloadable files and pictures. |