검색 본문 바로가기 회사정보 바로가기

KISTI, 세계 최대 규모 전장유전체 연관분석 병렬화 달성

병렬컴퓨팅 기술 활용…통계오류 보정계산 최적화 실현

(대전=뉴스1) 심영석 기자 | 2022-03-31 00:00 송고
최적 병렬화 기반의 GWAS 통계 보정 계산모식도(KISTI 제공)© 뉴스1
최적 병렬화 기반의 GWAS 통계 보정 계산모식도(KISTI 제공)© 뉴스1

한국과학기술정보연구원(KISTI)이 전장유전체 연관분석(GWAS)의 통계오류를 보정하기 위해 거대규모 슈퍼컴퓨팅 소프트웨어를 개발했다.

31일 KISTI에 따르면 GWAS의 통계오류는 거대규모 전장 유전체 분석에 따른 통계 유의성 계산 결과가 위양성(False-positive)으로 보고되는 현상을 말한다.

GWAS 분야의 위양성은 대표사례로 질병 연관성이 낮은 유전변이가 질병 발병과 연관성이 높은 것으로 보고되는 것이 있다.
  
KISTI는 국가 슈퍼컴퓨터 5호기 누리온에서 개발된 SW를 활용해 한국인 코호트 7523명과 영국인 코호트 4242명에서 보고된 8만4295개의 유전변이에 따른 당뇨, 고혈압과 연관된 유전변이를 GWAS 계산을 통해 도출했다.

이어 최대 70억 회 이상의 무작위 조합을 수행해 통계오류를 보정할 수 있었다.

이번 슈퍼컴퓨팅 시뮬레이션 SW는 국가 슈퍼컴퓨터 5호기 누리온의 최대 2500 노드를 동시에 사용해 기존 통계 프로그램 대비 약 300% 이상의 계산 가속화가 가능하다.

2500노드는 약 7.5 패타플롭스(1패타플롭스=1초당 1000조회 계산) 정도의 고성능 연산이 가능한 수준으로 KISTI 슈퍼컴퓨터 5호기 성능의 약 25%를 차지하는 규모이다.

GWAS 분석 결과는 표현형(질병 또는 과일의 무게 등)과 연관된 유전변이의 선발을 목표로 하며, 유의미한 질병 연관 유전변이의 발견은 개인 맞춤형 건강 관리 및 농축산 분야의 신품종 개량을 가능하게 하는 중요한 지표로 여겨지고 있다.

따라서 GWAS 분석 결과의 통계오류 보정은 필수적이다.

GWAS 분석의 통계오류 보정은 방대한 계산으로 인해 해당 분야 연구 난제로 남아있었다.

KISTI는 계산 병렬화 기술을 통해 대규모의 슈퍼컴퓨팅 기반 패타플롭스 규모의 계산으로 기존의 통계오류 보정이 가능함을 확인했다.

한편, 이번 연구성과는 국제 저널인 ‘Genomics & Informatics’에 31일 게재됐다.


km5030@news1.kr

이런 일&저런 일

    더보기