'단백질 접힘' 난제 AI가 10분만에 해결…새 AI '로제타폴드' 공개
워싱턴 대학 의과대 연구진, 학계에 AI 공개…이미 140개 연구진 다운로드
연구 결과 사이언스 지 게재
- 김승준 기자
(서울=뉴스1) 김승준 기자 = 단백질의 구조를 예측할 수 있으면, 설계도 쉬워져 신약 개발에 도움이 될 것으로 기대된다. 문제는 단백질의 구조를 예측하는 데는 만만하지 않은 양의 복잡한 계산이 필요하다는 것. 이 분야의 선두주자였던 구글 자회사 딥마인드의 '알파폴드 시리즈'의 경쟁자가 나타났다.
워싱턴 대학 의과대학(University of Washington School of Medicin) 데이비드 베이커 교수 연구진은 16일 사이언스(Science)에 인공지능 '로제타폴드' 연구·개발 성과를 발표했다.
로제타폴드(RoseTTAFold)는 딥 러닝 기반의 단백질 구조 예측·분석 프로그램이다. 거대하고 복잡한 단백질의 분석은 실험적으로는 수년 단위의 시간이 걸리기도 한다. 연구진은 "로제타폴드는 게임용 컴퓨터를 활용해 약 10분만에 구조를 계산할 수 있다"고 밝혔다.
과거 딥마인드에서 개발한 인공지능 '알파폴드 시리즈'는 이 분야 연구에서 혁혁한 성과를 내고 있었지만, 코드와 논문 공개를 미뤄 학계 일부의 비판에 직면하기도 했다. 반면에 '로제타폴드'는 공개됐다. 연구진에 따르면 로제타폴드는 이미 140개 이상의 연구 그룹이 코드 공유 플랫폼 깃허브(GitHub)에서 다운받았다.
◇생명 활동 규명의 중요 미션 '단백질 접힘 예측'…단백질 설계로 다가가기 위한 노력
세포핵 속의 DNA는 RNA 중합 효소를 비롯한 다양한 물질의 작용에 의해 RNA로 바뀐다. 그리고 DNA의 유전정보를 복사한 RNA는 핵에서 나와 세포질에서 번역된다. 세포의 소기관은 RNA의 유전정보를 읽어, 아미노산 사슬로 만들어낸다. 아미노산은 20가지 종류가 있는데, DNA와 RNA에는 이 아미노산들이 어떤 순서로 어떻게 결합하는지 정보가 담겨있다.
20종의 아미노산은 제각기 다른 화학적 특성을 가지고 있다. 여러 아미노산이 배열된 사슬도 복잡한 화학적 특성을 띠게 되고, 그에 따라 사슬이 꼬이고 얽히는 '단백질 접힘'을 통해 복잡한 단백질의 3차원 구조를 만들어낸다.
복잡한 3차원 구조도 단백질의 특성 및 활성에 영향을 끼친다. 구조를 예측할 수 있으면, 생명체를 이루고, 생명 활동을 조절하는 단백질을 다루는 데 큰 진전을 이룰 수 있다. '단백질 설계'를 자유자재로 해, 제약, 바이오산업에서 혁신을 이룬다는 꿈에 성큼 다가가는 셈이다.
한국생명공학연구원 국가생명공학정책연구센터는 2월 '2021년 10대 바이오 미래유망기술'을 선정했다. 센터는 유망기술을 선정하며 "파급효과가 가장 클 것으로 예측된 '인공지능 기반 단백질 모델링'은 아미노산 서열에서 3차원 단백질 구조를 예측할 뿐만 아니라 세포 내 단백질 작용을 예측하는 기술"이라며 "구글의 AI 프로그램인 알파폴드(AlphaFold)는 코로나19 바이러스의 일부 단백질 구조 예측을 통해 백신 및 치료제 개발에 단서를 제공한 바 있다. 해당 기술은 단백질 구조 예측을 넘어서 단백질의 생체 내 작용기작뿐만 아니라 질병과의 연관성, 약물표적 규명 등을 통해 신약개발의 시간과 비용을 크게 절감할 수 있을 것으로 기대된다"고 밝혔다.
◇오래 걸리던 '단백질 구조 예측' 이제는 인공지능으로 빠르게
과학자들은 X선 결정학 방법론, 극저온 전자현미경 등을 이용한 실험으로 단백질 구조 분석을 해내지만 큰 노력과 시간이 들었다. 그래서 계산화학자, 분자 생물학자, 유전학자를 비롯한 다분야의 과학자가 단백질 구조 예측에 뛰어 들었다. 심지어는 연구들은 단백질 접힘을 게임으로 만들어 많은 사람의 도움을 구하기도 했다.
이 분야 과학자들은 경쟁 및 교류의 장으로 '단백질 구조 예측 학술대회'(CASP)를 1990년대부터 개최해오고 있다.
2018년 CASP에는 딥마인드의 '알파폴드1'이 출전했다. 알파폴드는 첫 출전부터 다른 경쟁자들을 멀찍이 따돌리며 가장 좋은 성적을 냈다. 2020년 개최된 CASP에 출전한 '알파폴드2'는 90점을 기록해 역대 최고 기록을 남기기도 했다.
알파폴드2는 코로나19 바이러스의 단백질 일부를 예측하는 등 활약을 펼치기도 했지만, 논문과 코드 비공개 등으로 인해 검증이나 피드백이 불가능하다는 점에서 일부 학계 인사들의 비판을 받기도 했다.
반면 이번에 개발된 로제타폴드는 공개된 상태로 많은 연구 그룹들이 다운받았다.
이번 프로젝트를 주도한 워싱턴 의대 소속 박사후연구원 백민경은 "이번에 개발된 도구(로제타폴드)가 전체 연구계에 도움이 되기를 바란다"고 밝혔다.
seungjun241@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.









