Summary

Fastställandet av risken för Variant patogenicitet med aminosyra-nivå Signal-brus-analys av genetisk Variation

Published: January 16, 2019
doi:

Summary

Aminosyra-nivå signal-brus-analys avgör förekomsten av genetisk variation vid en viss aminosyra position normaliserade till bakgrunden genetisk variation i en viss population. Detta möjliggör identifiering av variant ”hotspots” inom en proteinsekvens (signal) som stiger över frekvensen av sällsynta varianter hittade i en population (buller).

Abstract

Framsteg i kostnad och hastigheten på nästa generation genetisk sekvensering har genererat en explosion av kliniska hela exome och hela genomet testning. Detta har lett till ökad identifiering av sannolikt patogena mutationer som förknippas med genetiska syndrom, har det också dramatiskt ökat antalet förresten hittat genetiska varianter av okänd betydelse (FE). Avgöra den kliniska betydelsen av dessa varianter är en stor utmaning för både forskare och kliniker. En metod att hjälpa att avgöra sannolikheten för patogenicitet är signal-brus-analys på protein sequence nivå. Det här protokollet beskriver en metod för aminosyra-nivå signal-brus-analys som utnyttjar variant frekvens på varje aminosyra position av proteinet med kända protein topologi att identifiera områden av primära sekvensen med förhöjd sannolikhet för patologisk variation (i förhållande till befolkningen ”bakgrund” variation). Denna metod kan identifiera aminosyra rester läge ”hotspots” av hög patologisk signal, som kan användas för att förfina den diagnostiska vikten av VUSs såsom de identifieras av nästa generation genetisk testning.

Introduction

Den snabba förbättringen av genetisk sekvensering plattformar har revolutionerat tillgängligheten och rollen av genetik i medicin. När begränsad till en enda gen, eller en handfull gener, minskade kostnaderna och ökning i hastighet av nästa generations genetisk sekvensering lett rutinmässiga sekvensering av hela genomet kodande sekvens (hela exome sekvensering, WES) och hela genomet ( hela Genomsekvensering, WGS) kliniskt. WES och WGS har använts ofta i fastställandet av kritiskt sjuka nyfödda och barn med oro för genetiska syndrom där det är ett beprövat diagnostiskt verktyg som kan förändra klinisk hantering1,2. Medan detta har lett till ökad identifiering av sannolikt patogena mutationer som förknippas med genetiska syndrom, ökat det också dramatiskt antalet förresten hittat genetiska varianter, eller oväntade positiva resultat, av okänd diagnostiska betydelse (FE). Medan vissa av dessa varianter är inte beaktas och inte rapporterats, varianter lokalisera till redovisas ofta gener associerade med potentiellt livshotande eller mycket sjuklig sjukdomar. Nuvarande riktlinjer rekommenderar rapportering av tillfälliga varianter finns i specifika gener som kan vara till medicinsk nytta för patienten, inklusive gener associerade med utveckling av plötslig kardiell död-predisponerande sjukdomar såsom kardiomyopatier och channelopathies3. Även om denna rekommendation var utformat för att fånga individer i riskzonen för en SCD-predisponerande sjukdom, överstiger variant upptäckt känslighet vida specificitet. Detta återspeglas i ett växande antal VUSs och för övrigt identifierade varianter med oklara diagnostiska verktyg som vida överstiger frekvensen av de respektiva sjukdomarna i en viss befolkning4. En sådan sjukdom, långt QT-syndrom (LQTS), är en kanoniska hjärt channelopathy orsakas av mutationer lokalisera gener som kodar hjärtats jonkanaler, eller kanal interagera proteiner, vilket resulterar i försenad kardiell repolarisering5. Detta försenade repolarisering, sett genom ett förlängt QT-intervall på vilar elektrokardiogram, resulterar i en elektrisk anlag till livshotande ventrikulära arytmier såsom torsades de pointes. Medan ett antal gener har kopplats till utvecklingen av denna sjukdom, mutationer i KCNQ1-kodade jagKs kalium kanal (KCNQ1, Kv7.1) är orsaken till LQTS typ 1 och utnyttjas som ett exempel nedan6. Illustrera komplexiteten i variant tolkning, har förekomsten av sällsynta varianter i LQTS-associerade gener, så kallade ”bakgrund genetisk variation” funnits tidigare beskrivna7,8.

Förutom stora kompendium-stil databaser av kända patogena varianter finns flera strategier för att förutsäga effekten olika varianter kommer att producera. Några är baserade på algoritmer, såsom SIFT och Polyphen 2, som kan filtrera ett stort antal nya icke-synonymt varianter att förutsäga deleteriousness9,10. Trots omfattande användning av dessa verktyg begränsar låg specificitet deras tillämplighet när det kommer till ”calling” kliniska VUSs11. ”Signal-brus” analys är ett verktyg som identifierar sannolikheten för en variant som är förknippade med sjukdom baserat på frekvensen av kända patologisk variation på de ifrågavarande loci normaliserade mot sällsynt genetisk variation från en population. Varianter lokalisera till genetiska loci där det finns en hög förekomst av sjukdomsassocierade mutationer jämfört med populationsbaserade variation, en hög signal-brus, är mer benägna att vara sjukdomsassocierade sig själva. Ytterligare, sällsynta varianter hittade för övrigt lokalisera till en gen med en hög frekvens av sällsynta befolkningen varianter jämfört sjukdomsassocierade frekvens, en låg signal-brus, kan vara mindre benägna att vara sjukdomsassocierade. Den diagnostiska nyttan av signal-brus-analys har illustrerats i de senaste riktlinjerna för genetisk testning för kardiomyopatier och channelopathies; dock har det bara varit anställd på hela gennivå eller domän-specifika nivå12. Nyligen har gett ökad tillgänglighet av både patologiska varianter (sjukdom databaser, kohortstudier i litteraturen) och populationsbaserad kontroll varianter (Exome Aggregation Consortium, ExAC och databasen Aggregation genomet, GnomAD13), Detta har tillämpats till enskilda aminosyrapositioner inom primära sekvensen av ett protein. Aminosyra-nivå signal-brus-analys har visat sig användbart kategorisera för övrigt identifierade varianter i gener associerade med LQTS som sannolikt ”bakgrund” genetisk variation snarare än sjukdomsassocierade. Bland de tre stora gener associerade med LQTS, inklusive KCNQ1, saknade dessa för övrigt identifierade varianter en betydande signal-brus-förhållanden, vilket tyder på att frekvensen av dessa varianter på enskilda aminosyrapositioner återspeglar sällsynta befolkningen variation i stället för sjukdomsassocierade mutationer. Dessutom när protein-specifika domäntopologi var övertäckt mot områden av hög signal-brus, patologisk mutation ”hotspots” lokaliserad till viktiga funktionella domäner av proteiner14. Denna metod håller löfte att bestämma 1) sannolikheten att en variant är sjukdom – eller befolkningen-associerade och (2) identifiera roman kritisk funktionella domäner av ett protein som är associerad med mänskliga sjukdomar.

Protocol

1. identifiera genen och specifika Splice isoformen av intresse Obs: Här, vi demonstrera användningen av häckning15 att identifiera sekvensen konsensus för gen av intresse som är knutet till patogenesen av sjukdomen av intresse (dvs. KCNQ1 mutationer är associerade med LQTS). Alternativ till häckning inkluderar RefSeq via National Center for Biotechnology Information (NCBI)16 och University of California, Santa Cruz (UCSC) mänsklig…

Representative Results

Representativa resultat för aminosyra-nivå signal till Brusanalys för KCNQ1 avbildas i figur 6. I det här exemplet sällsynta varianter identifierade i GnomAD kohorten (kontroll-kohort), anses för övrigt identifierade WES varianter (experimental kohort #1) och LQTS fall-associerade varianter sannolikt sjukdomsassocierade (experimental kohort #2) skildras. «««Vidare, signal-brus-analysen jämföra WES och LQTS kohort variant frekvensen normaliserade m…

Discussion

Hög genomströmning genetisk testning har avancerade dramatiskt i dess tillämpning och tillgänglighet under det senaste decenniet. Dock i många sjukdomar med väletablerade genetiska underbyggnad, t ex kardiomyopatier, har utökad testning lyckats förbättra diagnostiska kapacitet21. Vidare finns det betydande osäkerhet beträffande den diagnostiska nyttan av många identifierade varianter. Detta beror delvis på ett växande antal för övrigt identifierade sällsynta varianter upptäckte p…

Declarações

The authors have nothing to disclose.

Acknowledgements

APL stöds av de nationella institut för hälsa K08-HL136839.

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

Referências

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).
check_url/pt/58907?article_type=t

Play Video

Citar este artigo
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video