유전자 온톨로지 기반의 단백질 상호작용 검색 엔진

Title
유전자 온톨로지 기반의 단백질 상호작용 검색 엔진
Authors
박병규
Keywords
유전자온톨로지기반의단백질상호작용검색엔진
Issue Date
2011
Publisher
인하대학교
Abstract
Keyword matching or ID matching is the most common searching method in a large database of protein-protein interactions. They are purely syntactic methods, and retrieve the records in the database that contain a keyword or ID specified in a query. Such syntactic search methods often retrieve too few search results or no results despite many potential matches present in the database. We have developed a new method for representing protein-protein interactions and the Gene Ontology (GO) using modified Godel numbers. This representation is hidden from users but enables a search engine using the representation to efficiently search protein-protein interactions in a biologically meaningful way. Given a query protein with optional search conditions expressed in one or more GO terms, the search engine finds all the interaction partners of the query protein by unique prime factorization of the modified Godel numbers representing the query protein and the search conditions. Representing the biological relations of proteins and their GO annotations by modified Godel numbers makes a search engine efficiently find all protein-protein interactions by prime factorization of the numbers. Keyword matching or ID matching search methods often miss the interactions involving a protein that has no explicit annotations matching the search condition, but our search engine retrieves such interactions as well if they satisfy the search condition with a more specific term in the ontology. To the best of our knowledge, this search engine is the first one that can process queries like “for every protein p with GO g, nd the interaction partners of p” or “for protein p with GO g1, find p’s interaction partners with GO g2”. The search engine is freely available to academics at http://search.hpid.org/.
Description
그림 목차 vi 표 목차 viii 국문 요약 ix 영문 요약 x 제 1 장 서 론 1 1.1 연구 배경 1 1.2 연구 목적과 범위 3 제 2 장 관련 연구 5 2.1 유전자 온톨로지 5 2.2 단백질 상호작용 9 2.3 단백질 상호작용 검색 기법 9 제 3 장 데이터 수집 11 3.1 유전자 온톨로지 데이터 11 3.2 인간 단백질 데이터 12 3.3 바이러스 단백질 데이터 17 제 4 장 연구 방법 24 4.1 괴델 수 (Godel number) 24 4.2 변형된 괴델 수 26 4.3 단백질 상호작용의 추론 30 4.4 알고리즘 32 4.5 변형된 괴델 수를 이용한 단백질 상호작용 검색 35 4.6 연속된 Gene Ontology의 관계에 대한 추론 38 제 5 장 결과 및 고찰 45 5.1 변형된 괴델 수를 이용한 검색 기법의 결과 45 5.2 웹 기반 단백질 상호작용 검색 시스템 53 5.3 인간과 바이러스 사이의 단백질 상호작용 검색 시스템 61 제 6 장 결론 62 6.1 결과 요약 62 6.2 연구의 기여 64 6.3 향후 연구 65 참고 문헌 66 부록 A Biological process term에 속한 인간 단백질 상호작용 72 부록 B Molecular function term에 속한 인간 단백질 상호작용 80 부록 C Cellular component term에 속한 인간 단백질 상호작용 87 부록 D 자바 BigInteger를 이용한 큰 수의 계산 웹 서비스 91
URI
http://dspace.inha.ac.kr/handle/10505/22713
Appears in Collections:
College of Engineering(공과대학) > Information and Communication Engineering (정보통신공학) > Theses(정보통신공학 석박사 학위논문)
Files in This Item:
23725.pdfDownload

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Browse