Her præsenterer vi en protokol til at bruge den nyeste version af US Environmental Protection Agency Sequence Alignment to Predict Across Species Susceptibility (SeqAPASS) værktøj. Denne protokol demonstrerer anvendelsen af onlineværktøjet til hurtigt at analysere proteinbevarelse og give tilpasselige og let fortolkelige forudsigelser af kemisk modtagelighed på tværs af arter.
US Environmental Protection Agency Sequence Alignment to Predict Across Species Susceptibility (SeqAPASS) værktøj er en hurtig, frit tilgængelig, online screeningsapplikation, der giver forskere og regulatorer mulighed for at ekstrapolere toksicitetsoplysninger på tværs af arter. For biologiske mål i modelsystemer såsom humane celler, mus, rotter og zebrafisk er der toksicitetsdata tilgængelige for en række kemikalier. Gennem evaluering af proteinmålbevarelse kan dette værktøj bruges til at ekstrapolere data genereret fra sådanne modelsystemer til tusindvis af andre arter, der mangler toksicitetsdata, hvilket giver forudsigelser af relativ iboende kemisk modtagelighed. De seneste udgivelser af værktøjet (version 2.0-6.1) har indarbejdet nye funktioner, der giver mulighed for hurtig syntese, fortolkning og brug af dataene til offentliggørelse plus grafik i præsentationskvalitet.
Blandt disse funktioner er datavisualiseringer, der kan tilpasses, og en omfattende oversigtsrapport, der er designet til at opsummere SeqAPASS-data for at lette fortolkningen. Dette papir beskriver protokollen til at guide brugerne gennem indsendelse af job, navigering i de forskellige niveauer af proteinsekvenssammenligninger og fortolkning og visning af de resulterende data. Nye funktioner i SeqAPASS v2.0-6.0 fremhæves. Desuden beskrives to brugssager med fokus på transthyretin og opioidreceptorproteinbevarelse ved hjælp af dette værktøj. Endelig diskuteres SeqAPASS ‘styrker og begrænsninger for at definere domænet for anvendelighed for værktøjet og fremhæve forskellige applikationer til ekstrapolering på tværs af arter.
Traditionelt har toksikologiområdet været stærkt afhængig af brugen af forsøg med hele dyr for at tilvejebringe de data, der er nødvendige for kemikaliesikkerhedsvurderinger. Sådanne metoder er typisk dyre og ressourcekrævende. På grund af det store antal kemikalier, der i øjeblikket anvendes, og det hurtige tempo, hvormed nye kemikalier udvikles, er der imidlertid globalt et anerkendt behov for mere effektive metoder til kemisk screening 1,2. Dette behov og det deraf følgende paradigmeskift væk fra dyreforsøg har ført til udviklingen af mange nye tilgangsmetoder, herunder screeningsanalyser med høj kapacitet, transkriptomik med høj kapacitet, næste generations sekventering og beregningsmodellering, som lover alternative teststrategier 3,4.
Evaluering af kemikaliesikkerhed på tværs af mangfoldigheden af arter, der potentielt kan blive påvirket af kemisk eksponering, har været en vedvarende udfordring, ikke kun med traditionelle toksicitetstest, men også med nye tilgangsmetoder. Fremskridt inden for komparativ og prædiktiv toksikologi har givet rammer for forståelse af forskellige arters relative følsomhed, og teknologiske fremskridt inden for beregningsmetoder fortsætter med at øge anvendeligheden af disse metoder. Flere strategier er blevet diskuteret i løbet af det sidste årti, der udnytter eksisterende gen- og proteinsekvensdatabaser sammen med viden om specifikke kemiske molekylære mål til at understøtte forudsigelige tilgange til ekstrapolering på tværs af arter og forbedre kemiske sikkerhedsevalueringer ud over de typiske modelorganismer 5,6,7,8.
For at fremme videnskaben til handling, bygge videre på disse grundlæggende undersøgelser inden for prædiktiv toksikologi, prioritere kemisk testindsats og støtte beslutningstagning, blev US Environmental Protection Agency Sequence Alignment to Predict Across Species Susceptibility (SeqAPASS) værktøj oprettet. Dette værktøj er en offentlig og frit tilgængelig webbaseret applikation, der bruger offentlige lagre af konstant voksende proteinsekvensinformation til at forudsige kemisk modtagelighed på tværs af mangfoldigheden af arter9. Baseret på princippet om, at en arts relative iboende modtagelighed for et bestemt kemikalie kan bestemmes ved at evaluere bevarelsen af de kendte proteinmål for det pågældende kemikalie, sammenligner dette værktøj hurtigt proteinaminosyresekvenser fra en art med kendt følsomhed over for alle arter med eksisterende proteinsekvensdata. Denne evaluering gennemføres gennem tre analyseniveauer, herunder (1) primær aminosyresekvens, (2) funktionelt domæne og (3) kritiske aminosyrerestsammenligninger, der hver kræver mere dybdegående viden om interaktionen mellem kemikalier og protein og giver større taksonomisk opløsning i følsomhedsforudsigelsen. En stor styrke ved SeqAPASS er, at brugerne kan tilpasse og forfine deres evaluering ved at tilføje yderligere bevislinjer mod målbevarelse baseret på, hvor meget information der er tilgængelig vedrørende interaktionen mellem kemisk protein eller protein-protein af interesse.
Den første version blev udgivet i 2016, hvilket gjorde det muligt for brugerne at evaluere primære aminosyresekvenser og funktionelle domæner på en strømlinet måde for at forudsige kemisk modtagelighed og indeholdt minimale datavisualiseringsfunktioner (tabel 1). Individuelle aminosyreforskelle har vist sig at være vigtige determinanter for forskelle på tværs af arter i kemiske proteininteraktioner, hvilket kan påvirke arternes kemiske modtagelighed10,11,12. Derfor blev efterfølgende versioner udviklet til at overveje de kritiske aminosyrer, der er vigtige for direkte kemisk interaktion13. Som svar på feedback fra interessenter og brugere har dette værktøj gennemgået årlige versionsudgivelser med yderligere nye funktioner, der er designet til at imødekomme både forskeres og reguleringssamfunds behov for at tackle udfordringer i ekstrapolering på tværs af arter (tabel 1). Lanceringen af SeqAPASS version 5.0 i 2020 frembragte brugercentrerede funktioner, der indeholder datavisualisering og datasynteseindstillinger, eksterne links, oversigtstabel- og rapportindstillinger og grafiske funktioner. Samlet set forbedrede de nye attributter og muligheder i denne version datasyntese, interoperabilitet mellem eksterne databaser og den lette datafortolkning til forudsigelser af modtagelighed på tværs af arter.
Der er udbredt erkendelse af, at det ikke er muligt empirisk at teste nok arter til at fange den genomiske, fænotypiske, fysiologiske og adfærdsmæssige mangfoldighed af levende organismer, der kan blive udsat for kemikalier af toksikologisk interesse. Målet med SeqAPASS er at maksimere brugen af eksisterende og kontinuerligt voksende proteinsekvens- og strukturdata for at hjælpe og informere ekstrapoleringen af kemiske toksicitetsdata / viden fra testede organismer til hundreder eller tusinder af andre arter gennem …
The authors have nothing to disclose.
Forfatterne takker Dr. Daniel L. Villeneuve (U.S. EPA, Center for Computational Toxicology and Exposure) og Dr. Jon A. Doering (Department of Environmental Sciences, Louisiana State University) for at have givet kommentarer til et tidligere udkast til manuskriptet. Dette arbejde blev støttet af U.S. Environmental Protection Agency. De synspunkter, der udtrykkes i dette papir, er forfatternes og afspejler ikke nødvendigvis synspunkterne eller politikkerne fra US Environmental Protection Agency, og omtalen af handelsnavne eller kommercielle produkter indikerer heller ikke godkendelse fra den føderale regering.
Spreadsheet program | N/A | N/A | Any program that can be used to view and work with csv files (e.g. Microsoft Excel, OpenOffice Calc, Google Docs) can be used to access data export files. |
Basic computing setup and internet access | N/A | N/A | SeqAPASS is a free, online tool that can be easily used via an internet connection. No software downloads are required. |