암 관련 유전자…빅데이터로 찾아낸다

GIST 연구팀, 분석 알고리즘 개발

▲기존 방법(빨간색, 보라색, 초록색)과 이번에 개발된 알고리즘(파란색). X축은 각각의 방법에서 찾을 수 있는 암 유전자의 개수이고 Y축은 그 유전자를 찾기까지 비용을 조사해야할 유전체의 길이를 LOG 스케일로 표현한 것이다.[사진제공=GIST]

[아시아경제 정종오 기자] 암과 관련된 유전자를 발굴하는 빅데이터 알고리즘이 개발됐다. GIST(광주과학기술원) 전기전자컴퓨터공학부 이현주 교수팀이 암과 연관성이 높은 유전자를 발굴 할 수 있는 빅 데이터 분석알고리즘을 내놓았다. 최근 암 연구에 있어 활용이 급증하고 있는 차세대 염기서열 데이터를 활용해 암과 연관성이 높은 유전변이 영역을 발굴하는 알고리즘이다. 차세대 염기서열 데이터는 유전체를 무수히 많은 짧은 길이의 DNA조각들로 나눈 뒤 병렬적 서열분석을 통해 얻은 정보를 말한다. 연구팀은 웨이블릿 변환기법을 활용해 차세대 염기서열 빅 데이터로부터 암과 연관성이 높은 유전자들을 선별했다. 웨이블릿 변환기법이란 수학적 변환기법의 일종이다. 웨이블릿(wavelet)으로 부르는 특정 패턴의 신호 파형을 축소·확대하고 평행이동 해 원래의 신호를 특수한 형태의 신호로 변환하는 것을 말한다. 웨이블릿 변환은 신호 내 잡음 제거 등 다양한 목적으로 사용된다. 연구팀은 먼저 개별 암 세포들로부터 획득한 차세대 염기서열 데이터를 웨이블릿 변환이라는 수학적 기법을 활용해 데이터에 내재해 있는 노이즈를 제거하고 체세포 유전자의 유전자 개수가 변한 영역을 검출했다.이렇게 얻은 변이 정보들로부터 암과 가장 연관성이 높을 것으로 보이는 유전체 상의 영역들을 선별한 결과 유전자 마이크로어레이 플랫폼을 입력해 사용하는 기존의 알고리즘과 비교했을 때 암과 연관된 유전자를 더 많이 발굴할 수 있었다. 47개의 난소암 샘플에 이번 연구를 통해 만든 알고리즘을 적용했을 경우 기존의 방법론보다 두 배 가까운 수의 암 연관 유전자를 찾아냈다.이현주 교수는 "이번 알고리즘은 바이오 빅 데이터로부터 암과 연관된 유전변이 영역을 찾는 데 널리 활용될 수 있을 것으로 기대된다"고 말했다. 연구 결과는 네이처 자매지인 사이언티픽 리포트(Scientific Reports) 9일자(논문명 : Identification of cancer-driver genes in focal genomic alteration from whole genome sequencing data)에 실렸다. 정종오 기자 ikokid@asiae.co.kr<ⓒ세계를 보는 창 경제를 보는 눈, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

산업2부 정종오 기자 ikokid@asiae.co.krⓒ 경제를 보는 눈, 세계를 보는 창 아시아경제
무단전재, 복사, 배포 등을 금지합니다.

오늘의 주요 뉴스

헤드라인

많이 본 뉴스