DNA 시퀀스 데이터와는 달리 epigenomic 데이터 쉽게 텍스트 기반 검색을 복종 하지는. 업그레이드 된 버전의 GeNemo, 웹 기반 생물 정보학 도구를 사용 하 여 유사성 백과 사전의 DNA 요소를 포함 하 여 사용할 수 있는 온라인 데이터베이스를 비교 하는 epigenomic 데이터에 대 한 패턴 기반 검색을 수행 하는 절차는 여기에 제시 된 사용자의 데이터입니다.
강력한 텍스트 기반 검색 도구에 비해 게놈 RNA 시퀀싱 데이터, epigenomic 및 다른 기능 게놈 데이터의 패턴 기반 검색에 대 한 현재 방법론은 매우 제한 된 또는. GeNemo는이 목표를 수행 하는 첫 번째 온라인 검색 도구입니다. 사용자가 브라우저 확장 데이터 (침대), 봉우리, 및 중요 형식, 기능 게놈 데이터를 입력 하 고 세 가지 형식 중 하나에서 데이터를 검색할 수 있습니다. 사용자와는 백과 사전의 DNA 요소 (인코딩) 다른 epigenomic 마크, transcriptional 요소 바인딩 사이트 및 chromatin 대표 온라인 데이터 집합의 다양 한에서 선택 하는 데이터 집합에 대 한, 검색의 유형을 지정할 수 있습니다. hypersensitivities 또는 특정 세포 유형, 발달 단계 또는 종 (마우스 또는 인간)과. GeNemo 수 수는 브라우저에서 볼로 침대 파일 형태로 다운로드 입력된 데이터에 패턴 일치와 게놈 영역의 목록을 반환 합니다. 업그레이드 된 GeNemo 그래픽 디스플레이 개선 하 고 보다 강력한 인터페이스, 캘리포니아 대학, 산타 크루즈 (UCSC) 게놈 브라우저 변경 오류 경향이 더 이상 이다. 일반적인 문제에 대 한 문제 해결 단계를 설명 합니다. 기능 게놈 데이터의 양이 기하급수적으로 확장 하 고, 개발 하 고 데이터 분석 및 해석에 대 한 GeNemo와 같은 새로운 bioinformatic 도구 수정 중요 한 필요가 있다.
최근의 기술 진보는 epigenomic 또는 생물 학적 통찰력을 추출 관련 분석 도구 개발을 능가 하는 기능 게놈 데이터 depositories의 급속 한 확장에 대 한 수 있다. Epigenomic 데이터를 분석 하는 한 가지 중요 한 방법은 데이터 depositories와 새로운 지식으로 이어질 수 있는 패턴 일치에 대 한 백과 사전의 DNA 요소 (인코딩)1 프로젝트에서 특히 그들에 대 한 사용자 생성 데이터를 검색 하는 것입니다. 예를 들어, 게놈 전체 정의 loci에서 두 개의 서로 다른 epigenomic 표시의 패턴에서 유사성을 식별 다른 분자 선수 chromatin 구조 및 transcriptional 규칙2 에 의해 조율 된 행동을 나타낼 수 있습니다. ,34.
기존의 텍스트 기반 검색 엔진 유효 하지 않습니다 이와 DNA 시퀀스와 달리 주로 epigenomic 데이터 농도 또는 기능 게놈 지역의 형태로 존재 하기 때문에. GeNemo, 유전자 Nemo (니 모를 찾아서)로 서5패턴 기반 검색 사용 하 여이 충족 되지 요구를 해결 하기 위해 개발 되었다. 알고리즘의 마르코프 체인 몬테 카를로 극대화 과정5을 이용 한다. 사용자가 자신의 데이터 나 dataset 패턴에서 유사성을 식별 depositories 검색 온라인 epigenomic 데이터의 배열에서 다운로드.
GeNemo의 현재 버전은 업데이트 된 디스플레이, 캘리포니아 대학, 산타 크루즈 (UCSC) 게놈 브라우저6, 더 튼튼하게 인터페이스 이며 후자에 변화에 의해 발생 하는 문제에 덜 취약. 특히, GeNemo의 결과 페이지는 UCSC 게놈 브라우저 인터페이스에 기반 하는 데 사용, GeNemo의 현재 버전 자체 결과 페이지를 지원 하며 결과적으로 더 이상 부정적인 영향을 UCSC 게놈 브라우저 구조 변경. GeNemo 모든 게놈 신호, 등 단백질 바인딩, 히스톤 수정, chromatin 접근성, 토폴로지 도메인, 쿼리 큰 컨소시엄에서 알려진된 데이터 세트 사이 colocalized/비슷한 세그먼트를 찾을 수로 사용할 수 있습니다. 따라서, 관심의 다른 epigenomic 데이터와 대규모 게놈 프로젝트에서 생성 된 알려진된 데이터 사이의 관계를 연구 하는 중요 한 도구입니다.
제공 하는 새로운 생물 학적 통찰력8인간 게놈 시퀀싱의 풍부한 잠재력을 달성 하는 epigenome에 대 한 철저 한 이해가 필요 합니다. 현재 데이터 설명 및 제목 (즉, 메타 데이터)1온라인 epigenomic 데이터 집합을 검색 하는 방법만이 있다. 이 심각 하 게 검색 하나 epigenomic 데이터와 함께 할 수 있는의 유형을 제한 합니다. Epigenomic 데이터에 대 한 패턴 기반 검색 도구 새로운 생물 학적 통찰력으로 이어질 수 있는 다른 epigenomic 마크 사이의 관계를 탐구 하는 것이 필수적입니다. GeNemo, 데이터 및 메타 데이터 하지 내용 검색, 인코딩 데이터베이스 사용자 생성와 같은 게시 된 depositories에서 epigenomic 데이터에서 패턴을 비교 하는 종류의 첫 번째 서비스 또는 데이터 집합5다운로드. 이 텍스트 기반 시퀀스 검색 도구 되었다 1990 년대에 널리 널리 그냥 전세계 연구자에 액세스할 수 있는 epigenomic 검색 도구의 가용성의 시작을 표시 한다. 현재, GeNemo 이외의 epigenomic 데이터에 대 한 온라인 검색 패턴 기반 도구에 대 한 대안입니다.
인간 배아 줄기 세포 (예를 들어 E2F6 바인딩 신호 파일을 또는 인코딩 데이터 포털에서 사용할 수 있는 공동 나타나는 히스톤 수정 transcriptional 요소 E2F6와 다른 후 표시를 검색 하는 GeNemo를 사용 하 여 하나의 잠재적인 예 https://sysbio.ucsd.edu/public/xcao3/ENCODESample/ENCFF001UBC.bed)입니다. H1 hESC에 모든 인코딩 데이터 집합에 대 한 검색 쿼리로이 파일을 사용 하 여 GeNemo E2F6 바인딩 신호 H3K4me1, H3K4me2, H3K4me3, 및 H3K27me3, E2F6를 통해 몇 가지 유전자 조절 보여주는 기존 연구 동의와 농축 심하게 표시 됩니다. H3K279의 메 틸 화입니다. 다른 한편으로, 동일한 가족, E2F710요소와 상호 작용 하는 것으로 알려져 있는 E2F6 CtBP2 바인딩 사이트 colocalization 것 같습니다. 많은 수의 후 성적인 부호, transcriptional 요소 바인딩 신호 및 인코딩에 포함 된 다른 신호에 대 한 전체 게놈에 대 한 이러한 결과 추가 분석에 대 한 모든 잠재적인 목표를 제공할 수 있는 GeNemo로 비교적 쉽게 얻어질 수 있다.
이후 첫 번째 게시5 epigenomic 웹 기반 데이터 검색 도구로 GeNemo의, GeNemo의 결과 섹션 GeNemo의 첫 페이지와 어울리는 모습을 새롭게 했다. 밀접 하 게 이전 결과 섹션 UCSC 게놈 브라우저 결과 섹션을 미러 하 고 디스플레이 대 한 원격 UCSC 서버에 크게 의존 했다. 새로운 인터페이스와 함께 GeNemo는 더 쉽고 UCSC 게놈 서버에 더 이상 의존 (데이터는 여전히 원격으로 인출 됩니다). 이것은 GeNemo 더 강력 하 고 덜 코드 변경 문제에 취약 UCSC 서버에 있습니다. 또한, GeNemo의 새로운, 더 빠른 폴리머 인터페이스 시각화 하 고 데이터에서 패턴 분석 도구를 더 많은 사용자를 제공 합니다.
중요 한 단계는 적절 한 입력된 파일을 제공 하 고 데이터 트랙에 대 한 검색을 선택 하면 포함 됩니다. 사용자가 다양 한 실험 하는 것이 좋습니다 트랙 선택 기능을 어떻게 다른 명령과 선택 과정 원하는 결과 달성 하기 위해 결합 될 수 있다. 특히, “추가” 기능 “필터링” 또는 “제외” 논리 게이트 명령으로 사용할 수 있는 쿼리를 선택 하는 원하는 트랙을 추가 하는 데 필요한는 참고 “AND” 및 “또는”, 각각. “업데이트” 기능 검색을 구현 하기 전에 모든 선택에 영향을 줄 필요 합니다. 결과가 반환 될 때 사용자 수 확인 입력된 데이터 파일, 더 많은 트랙을 검색 하거나 검색 범위를 증가. 오류가 있을 때마다 정확 하 게 오류를 정의 팝업 창이 있을 것입니다. 비록 몇 가지 모호한 오류 있습니다. 예를 들어 윈도우는 ‘파일 업로드 된’ 때, 중 아무 파일을 업로드 또는 업로드 된 파일 허용 형식의 되었고, 결과적으로, 프로그램은 올바르게 읽을 수 있습니다. 파일 업로드 허용 파일 형식 모두 업로드 방법에 대 한 침대와 봉우리 서식 파일 및 온라인 링크 업로드만 중요 포함 됩니다. 이러한 파일 포맷의 압축된 버전도 사용할 수 있습니다.
이 방법의 현재 한계는 아직—최적화 알고리즘 및 기능 GeNemo에 포함 합니다. GeNemo 아직 반환 된 모든 데이터 집합의 해석에 어떤 지침을 제공할 수 없습니다. 이 작업은 상당한 지식과 게놈 epigenome의 생물학에 전문 지식이 필요로 하는 사용자까지 이다. 또한, 또 다른 현재 한계가입니다 사용자 검색의 감도 및 잡음 레벨을 변경할 수 없습니다. 우리는 개선 하 고 GeNemo의 패턴 검색 기능 및 나중에 데이터 집합 컬렉션에 확장을 계속 기대 합니다.
The authors have nothing to disclose.
이 작품은 NIH에 의해 지원 되었다 NICHD NHGRI에서 R01HG008135에서에서 DP1HD087990를 포함 하 여 부여. 우리는 귀중 한 피드백을 위한 종 실험실의 구성원 감사.
작가 기부:
X.C. 및 A.T.Z. 업데이트 GeNemo 코딩 새로운 인터페이스와 기능; A.T.Z. 생산 사내 샘플 비디오; A.T.Z., X.C 및 S.Z.는 종이 썼다.