Summary

Navigering MARRVEL, en Web-basert verktøy som integrerer Human Genomics og modell organisme genetikk informasjon

Published: August 15, 2019
doi:

Summary

Her presenterer vi en protokoll for å få tilgang til og analysere mange menneskelige og modell organisme databaser effektivt. Denne protokollen demonstrerer bruken av MARRVEL å analysere kandidat sykdomsfremkallende varianter identifisert fra neste generasjons sekvensering innsats.

Abstract

Gjennom hel-exome/Genova sekvensering, menneskelige Genetikere identifisere sjeldne varianter som skille med sykdom fenotyper. For å vurdere om en bestemt variant er patogene, må man spørre mange databaser for å avgjøre om genet av interesse er knyttet til en genetisk sykdom, om den spesifikke varianten er rapportert før, og hvilke funksjonelle data som er tilgjengelig i modellen organisme databaser som kan gi ledetråder om genet funksjon i menneske. MARRVEL (modell organisme aggregerte ressurser for rare variant ExpLoration) er en one-stop datainnsamlingsverktøy for menneskelige gener og varianter og deres orthologous gener i sju modell organismer inkludert i mus, rotte, sebrafisk, frukt fly, nematode orm, fisjon gjær, og spirende gjær. I denne protokoll, gir vi en oversikt over hva MARRVEL kan brukes til og diskutere hvordan ulike datasett kan brukes til å vurdere om en variant av ukjent betydning (VUS) i et kjent sykdomsfremkallende gen eller en variant i et gen av usikker betydning (GUS) kan være Sykdomsfremkallende. Denne protokollen vil lede en bruker gjennom å søke flere menneskelige databaser samtidig starter med en menneskelig genet med eller uten en variant av interesse. Vi diskuterer også hvordan man bruker data fra OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV og DECHIPHER. Videre illustrerer vi hvordan man tolker en liste over ortholog kandidat gener, uttrykks mønstre og GO-termer i modell organismer som er knyttet til hvert menneske gen. Videre diskuterer vi verdien protein strukturelle domene merknader gitt og forklarer hvordan du bruker flere arter protein justering funksjonen for å vurdere om en variant av interesse påvirker en evolutionarily bevart domene eller aminosyre. Til slutt vil vi diskutere tre forskjellige bruksområder-tilfeller av dette nettstedet. MARRVEL er en lett tilgjengelig åpen tilgang nettsted designet for både kliniske og grunnleggende forskere og fungerer som et utgangspunkt for å designe eksperimenter for funksjonell studier.

Introduction

Bruk av neste generasjons sekvensering teknologi vokser i både forskning og kliniske genetiske laboratorier1. Hel-exome (WES) og hele-Genova sekvensering (WGS) analyser avslører en rekke sjeldne varianter av ukjent betydning (VUS) i kjente sykdomsfremkallende gener, samt varianter av gener som ennå ikke er assosiert med en Mendelsk sykdom (GUS: gener av usikre betydning). Presentert med en liste over gener og varianter i en klinisk sekvens rapport, må medisinsk Genetikere manuelt besøke flere elektroniske ressurser for å få mer informasjon for å vurdere hvilken variant kan være ansvarlig for en viss fenotype sett hos pasienten av interesse . Denne prosessen er tidkrevende, og effekten er svært avhengig av kompetansen til den enkelte. Selv om flere retningslinjer papirer har blitt publisert2,3, tolkning av Wes og WGS krever manuell håndplukking siden det ennå ikke er en standardisert metodikk for variant analyse. For tolkningen av VUS, kunnskap om tidligere rapportert genotype-fenotype forhold, modus for arv, og allel frekvenser i befolkningen generelt blir verdifulle. I tillegg kunnskap om varianten påvirker et kritisk protein domene, eller en evolutionarily bevarte rester kan øke eller redusere sannsynligheten for patogenitet. For å samle all denne informasjonen, trenger man vanligvis å navigere gjennom 10-20 menneskelige og modell organisme databaser siden informasjonen er spredt gjennom World Wide Web.

Tilsvarende modell organisme forskere som jobber med spesifikke gener og trasé er ofte interessert i å koble sine funn til menneskelig sykdom mekanismer og ønsker å dra nytte av den kunnskapen som blir generert i den menneskelige Genomics feltet. Men på grunn av den raske ekspansjon og utvikling av datasett om den menneskelige Genova, har det vært utfordrende å identifisere databaser som gir nyttig informasjon. I tillegg, siden de fleste modell organisme databaser er designet for forskere som arbeider med den spesifikke organismen på daglig basis, er det svært vanskelig, for eksempel, for en mus forsker for å søke etter spesifikk informasjon i en Drosophila database og vice versa. I likhet med den varianten tolkning søk utført av medisinsk Genetikere, identifisere nyttig menneskelig og annen modell organisme informasjon er tidkrevende og sterkt avhengig av bakgrunnen av modellen organisme forsker. MARRVEL (modell organisme aggregerte ressurser for rare variant ExpLoration)4 er et verktøy utviklet for begge brukergrupper for å effektivisere arbeidsflyten.

MARRVEL (http://marrvel.org) ble utformet som en sentralisert søkemotor som samler inn data systematisk på en effektiv og konsistent måte for klinikere og forskere. Med informasjon fra 20 eller flere offentlig tilgjengelige databaser, dette programmet lar brukerne raskt samle informasjon og få tilgang til et stort antall menneskelige og modell organisme databaser uten reiterative søk. Søkeresultatsidene inneholder også hyperkoblinger til de opprinnelige informasjonskildene, slik at enkeltpersoner kan få tilgang til rådata og innhente tilleggsinformasjon fra kildene.

I motsetning til mange av varianten prioritering verktøy som krever store sekvensering data input i form av VCF eller BAM filer og installasjoner av ofte proprietære/kommersiell programvare, MARRVEL opererer på alle Web-Browser. Den kan brukes uten kostnader og er kompatibel med bærbare enheter (for eksempel smarttelefoner, nettbrett) så lenge en er koblet til Internett. Vi valgte dette formatet siden mange klinikere og forskere vanligvis trenger å søke en eller noen få gener og varianter på en gang. Note det vi er utvikler bakst-dataoverføre og API (søknad Programmerer Grenseflate) vise egenskaper for MARRVEL å senere tillate brukernes å kapellan flere hundre av gener og varianter med ett tid igjennom tilpasses spørsmål verktøy dersom det er nødvendig.

På grunn av det brede spekteret av applikasjoner, vil vi i denne protokollen beskrive en omfattende tilnærming til hvordan man navigerer gjennom ulike datasett som MARRVEL viser. Mer målrettede eksempler som er skreddersydd mot spesifikke brukeres behov, vil bli beskrevet i delen representative resultater. Det er viktig å merke seg at produksjonen av MARRVEL fortsatt krever en viss grad av bakgrunn kunnskap i enten menneskelig genetikk eller modell organismer å trekke ut verdifull informasjon. Vi henviser leserne til tabellen som viser primære papirer som beskriver funksjonen til hver av de opprinnelige databasene som er utvalgt av MARRVEL (tabell 1). Følgende protokoll er delt inn i tre seksjoner: (1) Hvordan starte et søk, (2) hvordan du tolker MARRVEL menneskelige genetikk utganger, og (3) hvordan å gjøre bruk av modellen organisme data i MARRVEL. I delen representative resultater beskrives mer fokuserte og spesifikke tilnærminger. MARRVEL blir aktivt oppdatert, så henvises det til gjeldende nettstedets FAQ-side for detaljer om datakilder. Vi anbefaler på det sterkeste brukerne av MARRVEL å registrere deg for å motta oppdateringsvarsler via e-post innsending skjemaet nederst på MARRVEL hjemmeside.

Protocol

1. Hvordan starte et søk For den menneskelige genet og variant-basert søk, gå til trinn 1.1.1.-1.1.2. For menneskelig gen BAS ert søk (ingen variant input), gå til trinn 1,2. For modell organisme gen-baserte søk, se trinn 1.3.1.-1.3.2. Gå til startsiden for MARRVEL4 på http://marrvel.org/. Begynn med å skrive inn et menneskelig gen symbol. Kontroller at kandidat gen navnene er listet under inntastingsboksen med hvert tegn inn. Hvis søket kommer tilbake negativt, sørg f…

Representative Results

Human Genetikere og modell organisme forskere bruker MARRVEL i forskjellige måter, hver med ulike ønskede utfall. Nedenfor er tre scener av mulige bruksområder for MARRVEL. Evaluere patogenitet av en variant i en dominerende sykdomDe fleste av brukerne som besøker MARRVEL bruke dette nettstedet til å analysere sannsynligheten for at en sjelden menneskelig variant kan forårsake en viss sykdom. For eksempel, en missense (17:59477596 G > A, p. R20Q) variant i TBX2</…

Discussion

Kritiske trinn i denne protokollen inkluderer den opprinnelige input (trinn 1.1-1.3) og påfølgende tolkning av utdataene. Den vanligste grunnen til at søkeresultatene er negative, er på grunn av de mange måtene et gen og/eller en variant kan beskrives på. Mens MARRVEL oppdateres på en planlagt basis, kan disse oppdateringene forårsake frakobling mellom de ulike databasene som MARRVEL kobler til. Det første trinnet i feilsøkingen sjekker derfor alltid for å se om alternative navn på genet eller varianten vil f…

Declarações

The authors have nothing to disclose.

Acknowledgements

Vi takker DRS. Rami Al-Ouran, seon-Young Kim, Yanhui (Claire) Hu, Ying-Wooi WAN, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr, og Norbert Perrimon for deres støtte i utvikling og vedlikehold av MARRVEL. Vi er takknemlige for Samantha L. Deal og J. Michael høste for deres innspill på dette manuskriptet.

Den første utviklingen av MARRVEL ble støttet delvis av udiagnostisert sykdommer nettverket modell organismer screening sentrum gjennom NIH Commonfund (U54NS093793) og gjennom NIH kontoret til forskning infrastruktur programmer (ORIP) (R24OD022005). JW er støttet av NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) og The Robert og Janice McNair Foundation McNair MD/PhD student Scholar program ved BCM. HJB er videre støttet av NIH National Institute of General Medical Sciences (R01GM067858) og er en etterforsker av Howard Hughes Medical Institute. ZL er støttet av NIH National Institute of General Medical Science (R01GM120033), National Institute of aging (R01AG057339), og Huffington Foundation. SY fikk ekstra støtte fra NIH National Institute on døvhet og andre kommunikasjons forstyrrelser (R01DC014932), Simons Foundation (SFARI Award: 368479), Alzheimer ‘ s Association (ny etterforsker Research Grant: 15-364099), naman familie Fund for Basic Research og Caroline Wiess Law Fund for forskning i molekylær medisin.

Materials

Human Genetics ClinVar PMID: 29165669 https://www.ncbi.nlm.nih.gov/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www.ncbi.nlm.nih.gov/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

Referências

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).
check_url/pt/59542?article_type=t

Play Video

Citar este artigo
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video