김봉수기자
[아시아경제 김봉수 기자] "과학적 발견의 판도를 바꿨다."
9월 서울대 생명과학부 조교수로 부임하는 백민경(32) 전 미국 워싱턴대 박사후 연구원이 개발한 단백질 구조 예측 인공지능(AI) 프로그램 '로제타폴드(RoseTTAFold)에 대한 평가다. 백 전 연구원은 데이비드 베이커 교수와 함께 구글 자회사 딥마인드가 막대한 컴퓨팅 자원과 인력, 자본을 동원해 만든 같은 종류의 AI 알파폴드2(AlphaFold2)의 성능을 단숨에 능가한 걸작을 만들어 냈다. 세계적 과학전문지 '사이언스(Science)'가 지난해 12월 독자 투표 끝에 올해의 최고 혁신 연구 성과로 뽑힐 정도로 중요한 업적이었다.
백 전 연구원은 아시아경제와의 서면 인터뷰에서 "AI를 통해 단백질 구조를 파악하게 됨으로써 인류의 과학 기술 연구가 한 단계 나아갈 수 있는 기초 토대를 닦았다"고 평가했다. 또 "알파폴드2가 AI와 생명공학을 융합해 획기적인 진전을 이뤄냈듯 현재 학문간 융합연구가 커다란 과학기술 진전의 토대가 되고 있는 만큼 과감한 투자와 안정적인 지원이 필요하다"고 강조하기도 했다.
다음은 백 전 연구원과의 일문 일답.
-단백질 구조 예측이 어떤 의미인지.
△단백질은 거의 모든 생명현상에 관여하고 있는 아주 중요한 생체분자다. 예를 들어 시각, 미각, 후각 등 우리가 외부의 자극을 감지하는 과정이나 음식물을 통해 세포가 사용할 에너지를 얻는 과정에도 다양한 단백질이 관여하고 있다. 요즘 코로나 덕분에 좀 더 친숙해진 항체 역시도 면역반응에 관여하는 아주 중요한 단백질 분자다. 외부 자극 감지, 신호전달, 에너지 조달, 면역반응 등 다양한 생명현상을 이해하는 데 굉장히 필수적인 요소다. 단백질이 이렇게 다양한 기능을 가지는 것은 단백질의 서열(아미노산의 조합)에 따라서 서로 다른 구조를 가지고 이에 따른 기능을 수행하기 때문이다. 즉 우리가 단백질의 서열로부터 구조를 손쉽게 알아낼 수 있다면 이 단백질이 어떻게 생명현상에 관여하는지 그 기능을 이해하는 데 아주 큰 도움이 된다. 뿐만 아니라 이를 바탕으로 다양한 치료제, 백신, 플라스틱 분해효소, 바이오센서 개발 등 다양한 분야에 응용할 수 있다.
-그동안에도 단백질 구조 예측은 가능하지 않았나.
△물론 그렇다. 수많은 실험과학자가 단백질의 구조를 실험적으로 밝히기 위해 많은 노력을 쏟아왔다. 하지만 많은 비용과 짧게는 수개월에서 길게는 수년의 시간이 들었다. 이번에 개발된 AI 기반의 단백질 구조 예측방법을 활용하면, 실험을 통한 구조 결정에 드는 비용과 시간을 줄일 수 있다. 더 중요한 생물학적 문제, 혹은 질병치료제 개발 등의 응용 분야에 집중할 수 있게 된다.
-로제타폴드와 알파폴드2의 차이점은.
△그동안 개발돼온 전통적인 계산방식을 어떻게 하면 AI를 활용해서 더욱 그 성능을 개선시키고 효율적으로 만들 수 있을지에 대한 고민이 있었다. 알파폴드2나 로제타폴드 이전의 전통적인 계산방식 중에서 가장 성능이 좋았던 방식엔 단백질의 진화정보를 활용하는 방법이 있었다. 그러다 단백질 서열모음이라는 주어진 데이터 안에 숨어있는 단백질 구조에 대한 패턴을 찾아낼 수만 있다면 단백질의 구조를 잘 예측할 수 있을 것이라는 아이디어가 나왔다. AI가 가장 잘하는 일이 바로 패턴 인식이지 않은가. 이 지점에서 AI가 단백질 구조 예측에 적용됐다. 알파폴드2나 로제타폴드 모두 그동안 자연에 축적돼온 진화 정보를 활용해 단백질의 구조를 예측한다는 점에서 전체적으로는 유사하다. 하지만 이를 구현하는 단계에서 세부적인 알고리즘이 다르다. 로제타폴드의 경우 단백질의 진화정보를 담고 있는 서열모음으로부터 단백질을 구성하는 아미노산 사이의 상호작용에 대한 정보를 얻는 과정에서 직접 3차원 구조를 만들어보고 이에 대한 피드백을 자주 받는다. 알파폴드2의 경우에는 단백질의 3D 구조는 마지막에만 만들어내기 때문에 상대적으로 AI가 만들어진 구조의 피드백을 받는 횟수가 훨씬 적다. 로제타폴드는 단백질의 서열 진화정보와 3D 구조와의 소통을 자주 하도록 설계되었기 때문에 알파폴드2보다 더 효율적으로 구조를 예측할 수 있다.
-향후 의·생명 공학 등 과학기술에 미칠 영향과 과제는.
△신약 개발을 예로 들어 보자. 새로운 약물을 개발할 때 흔히 사용되는 방법 중에 하나가 구조기반의 신약개발 방법이다. 이때 표적 단백질과 신약후보물질이 어떻게 결합할지 그 결합구조를 예측하는 것이 필수적이다. 기존에는 실험적으로 규명된 단백질의 구조가 없다면 구조기반의 신약개발 방법을 활용하기가 어려웠다. 알파폴드2와 같은 단백질 구조 예측 기술이 그동안 구조를 몰랐던 단백질에 대한 고정확도 모델을 제공해줌으로써 실험구조가 없었던 표적단백질에 대해서도 구조기반의 신약개발을 시도할 수 있게 됐다.
그러나 이것이 신약개발 과정에 존재하는 모든 문제를 해결한 것은 아니다. 표적단백질들이 단백질의 활성도에 따라 여러 가지 구조적인 상태를 가지고, 이 중에서 약물이 어떤 특정 상태에만 결합해야 단백질의 활성도를 조절해 약으로써 작용이 가능한 경우들이 많다. 하지만 현재의 단백질 구조 예측 기술은 단백질이 가질 수 있는 다양한 구조 상태를 예측해주고 있지는 못하다. 단백질의 구조가 약물이 결합하며 살짝 변화하는 경우도 있는데 이런 부분에 대한 예측도 불가능하다. 즉 단순히 단백질의 구조를 아는 것만으로는 충분하지 않고, 이 단백질이 다양한 약물 후보물질들과 어떻게 결합하는지 단백질의 구조 변화까지 고려한 고정확도의 예측과 약물의 결합력과 활성도에 대한 예측이 추가로 필요하다는 얘기다. 앞으로 단백질 구조 예측 기술이 단백질과 다른 분자의 상호작용까지 예측할 수 있다면 우리 실생활에 좀 더 직접적으로 와 닿게 되지 않을까 싶다.
**백민경 박사는?
1990년 광주 출생. 광주과학고ㆍ서울대 화학과(박사) 졸업. 2019년 5~2022년 7월 워싱턴대 박사후연구원으로 근무. 2021년 7월 데이비드 베이커 교수와 함께 단백질 구조 해독 인공지능(AI) 프로그램 '로제타폴드(RoseTTAFold)' 개발. 같은해 12월 국제학술지 '사이언스'로부터 '올해의 최고 혁신 연구'로 선정(한국인 최초). 2022년 9월 서울대 생명과학부 조교수 부임 예정.
김봉수 기자 bskim@asiae.co.kr<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>