
국내 연구팀이 암과 유전자의 관계에 대한 기존 연구 결과를 보다 손쉽고 정확하게 찾을 수 있는 특화된 검색 엔진을 개발하는 데 성공했다.
이에 따라 연구자들이 수많은 의학·생물학 관련 문헌에서 유전자와 질병 간의 관계를 명시적으로 기술한 문장을 보다 효율적으로 찾을 수 있게 돼 질병 연구에 기여할 것으로 기대된다.
지스트(GIST·광주과학기술원·총장 김영준) 정보통신공학부 이현주 교수와 김정균 박사과정생(제1저자)은 수 많은 각종 의학·생물학 문헌에서 암 관련 유전자와 그 유전자의 세포내 상태 변화, 유전자와 질병과의 관계를 표현하는 문장들을 찾아내는 검색 엔진 시스템 '디그시(DigSee·Disease Gene Search Engine with Evidence Sentences)'를 개발했다고 5일 밝혔다.

연구팀에 따르면, 암은 수 천 개 이상의 유전자가 변화하는 것과 관련이 있고 이 유전자들은 복합적인 상호 작용을 통해 신호 전달 체계에 영향을 미친다. 따라서 암에 대한 연구는 암 관련 유전자들에 관한 연구 결과들을 종합적으로 분석하는 것이 중요하다.
하지만 암 관련 유전자들에 대한 연구 결과들을 발표한 문헌들이 기하급수적으로 증가해 연구자들이 새로운 연구 결과들을 손쉽게 찾아내고 통합적으로 분석하는 것이 갈수록 힘들어지고 있다. 그만큼 유전자와 질병의 관계에 대한 명시적인 표현을 문헌에서 손쉽고 정확하게 찾을 수 있는 방법이 요구되는 것이다.

또 ▲유전자 발현 및 조절 ▲인산화 ▲단백질의 세포내 위치 확인 ▲단백질 이화 ▲단백질 상호 작용 ▲전사 등 다양한 유전자의 상태 변화에 대한 내용을 검색할 수 있다.
특히 자체적으로 개발한 베이지안 분류기에 기반을 둔 텍스트 마이닝 기법을 통해 사용자의 검색과 가장 관련이 높은 문장을 관련성이 높은 순으로 정렬해 보여준다.
이러한 텍스트 마이닝 기법은 문헌에 기술된 문장의 패턴을 분석해 개발됐으며, 검색의 정확도 면에서 기존의 일반적인 검색 엔진의 성능을 월등히 앞서고 있다.
이현주 교수는 "디그시는 암 연구자들이 필요한 논문을 찾을 때 유용하게 사용할 수 있는 검색 엔진으로서 연구 효율은 물론 연구 결과의 질 향상에도 기여할 것"이라며 "향후 모든 유전 질병에 대해 검색이 가능한 검색 엔진으로 확장시킬 계획"이라고 말했다.
hskim@news1.kr