Junk DNA 돌연변이 암 유발하는 과정 밝혀져-KAIST 최정균 교수팀, 인공지능 기술로 암 유전체 미개척 영역에 새로운 시각 제공
작성자관리자 작성일2016-11-17
Junk DNA 돌연변이 암 유발하는 과정 밝혀져
KAIST 최정균 교수팀, 인공지능 기술로 암 유전체 미개척 영역에 새로운 시각 제공
한국보건산업진흥원(원장 이영찬)은 국내 연구진이 “인공지능 기계학습 기술을 통해 새로운 암 발생 과정을 밝혀 암 유전체의 미개척 영역에 새로운 시각을 제공할 수 있게 되었다”고 발표했다. ;
이 보건복지부 첨단의료기술개발사업(맞춤의료실용화)의 R&D 지원을 받아 수행된, KAIST 최정균 교수-국립암센터 김연재 박사 공동 연구팀의 성과로서, 세계적 과학저널인 ‘Nature Genetics’ 10월 10일자 온라인 판에 게재되었다.
※ 게재 논문 정보 |
DNA 중 단백질 정보를 직접 담고 있지 않는 비부호화 영역*을 쓰레기(Junk) DNA라고 불리우는데, 인간 게놈 프로젝트를 통해 사람의 전체 DNA의 90% 이상은 이러한 junk DNA라는 것이 밝혀져 충격을 주었고, 최근 이들이 중요한 조절 기능을 가지고 있음이 계속해서 보고되어 왔다.
* 단백질 비부호화 영역(Protein non-coding region) : 유전체 중 단백질로 발현되지 않는 영역 으로 전체 유전체의 약 95%를 차지. 전체 유전체를 해독함으로써만 분석이 가능.
연구팀은 junk DNA에서 발생하는 돌연변이가 복잡한 3차원 DNA 구조를 통해 단백질 정보를 담고 있는 부분과 상호작용함으로써 암의 유발인자가 될 수 있음을 발견하였다.
암 환자의 돌연변이의 대다수가 junk DNA에서 나타나고 있으므로, 중요한 발암인자를 찾는 과정을 통하여 최근 고조되고 있는 암 정밀의료의 수요를 충족하는데 중요한 기여를 할 것으로 기대된다.
이번 연구를 이끈 최정균 교수는 “인공지능 기술을 이용하여 암 유전체의 미개척 영역에 대한 새로운 시각을 제공한 연구”라며, “암 돌연변이의 대다수를 차지하는 junk DNA 돌연변이 중에서 중요한 발암인자를 발굴하는 것을 가능케 함으로써 최근 고조되고 있는 암 정밀의료의 수요를 충족하는데 중요한 기여를 할 것으로 기대된다”고 연구 성과의 의의에 대해 밝혔다.
※ 자료 관련 문의 : 한국과학기술원 최정균 교수 ☎(042)350-4327
<붙임> 1. 논문 주요 연구내용
2. 논문 관련 그림설명
3. 용어설명
(붙임1) 논문의 주요 연구내용
□ 논문의 주요 연구내용
○ 분자생물학의 중심원리 (central dogma)에 의하면 DNA의 주요한 기능은 RNA를 통하여 단백질을 생산하는 데 있으며, 따라서 단백질 정보를 직접 담고 있지 않는 부분은 쓰레기 (junk) DNA라고 불리기도 하였다. 그러나 인간게놈프로젝트 (Human Genome Project)를 통해 사람의 전체 DNA의 90% 이상은 이러한 junk DNA라는 것이 밝혀져 놀라움을 주었고, 최근 이들이 중요한 조절 기능을 가지고 있음이 계속해서 보고되고 있다. 어떤 유전변이가 암을 만드는지에 대한 유전체 수준의 연구가 다각도로 진행되고 있으나, 대다수의 돌연변이가 junk DNA에서 나타나기 때문에 그 해석에 어려움을 겪고 있다.
○ 연구팀은 junk DNA에서 발생하는 돌연변이가 복잡한 3차원 DNA 구조를 통해 단백질 정보를 담고 있는 부분과 상호작용함으로써 암의 유발인자가 될 수 있음을 발견하였다. 이들 중 중요한 발암인자를 찾기 위해서는 여러 환자에서 반복적으로 나타나는 변이를 발굴하여야 하며 전체 유전체 해독에는 많은 시간과 비용이 들어가기 때문에 현재까지 많은 환자의 전체 DNA가 해독되지 못하여, junk DNA에서 나타나는 중요한 발암인자의 발굴에 어려움이 있었다.
○ 연구팀은 이러한 문제를 해결하기 위하여, 인공지능에서 사용되는 기계학습 기술을 도입, 여러 환자에서 반복적으로 나타나는 junk DNA 돌연변이를 예측하는 방법을 개발하였다. 이렇게 개발된 기계학습 방법론은 주어진 환자의 수가 많지 않을 때에도 직접 더 많은 환자의 유전체를 해독하지 않고도 높은 정확도로 중요한 발암인자를 찾을 수 있는 성능을 보인다는 것이 입증됨으로써, 임상적인 활용성을 확보하는데 성공하였다고 볼 수 있다.
(붙임2) 연구 관련 그림 설명
<그림1> 3차원 DNA 구조를 통한 중요 발암인자 발굴
(a) DNA는 복잡한 3차원 구조를 이루고 있어 특히 특정 유전자에 대한 조절 정보를 포함하고 있는 지역들 (그림의 녹색과 파란색) 은 유전체 상에 널리 퍼져 있지만 이 3차원 구조를 통하여 해당 유전자로 수렴한다. 이런 경우 여러 환자에서 발생한 돌연변이는 서로 다른 위치에 나타나지만 궁극적으로는 같은 기능 (동일한 유전자의 조절을 방해)을 가지므로 recurrence가 있는 것으로 볼 수 있다. (b) 전통적인 recurrence의 개념으로서, 중요한 돌연변이들은 동일한 물리적인 위치에서 나타날 것으로 예상할 수 있다. 그러나 본 연구결과에 의하면 이러한 전통적인 recurrence 보다 3차원 구조에 의한 recurrence 가 더욱 중요한 돌연변이임을 알 수 있다.
<그림2> 기계학습에 의해 recurrence를 예측하는 방법
정확한 recurrence를 측정하기 위해서는 많은 환자의 암 유전체 데이터가 필요하다. 그러나 이를 위해서는 많은 시간과 비용이 소요된다. 적은 수의 샘플이 있을 경우, 현재 recurrence 가 있는 돌연변이 (Reference cohort 그림의 파란색 네모)들의 특성을 기계학습을 통해 학습하고, 현재 recurrence 가 관측되지 않는 돌연변이 (파란 테두리의 빨간색 네모)의 특성을 통해 향후 더 많은 환자 샘플이 있을 경우 recurrence 가 보일 것인지를 예측할 수 있다. Rescue cohort 그림의 Gene B 에 해당하는 파란색 네모들이 추가됨으로써 파란 테두리의 빨간색 네모는 recurrence 있는 돌연변이임이 밝혀진다.
(붙임3) 용어설명
1. 유전체 (genome)
하나의 세포에 존재하는 DNA 전체를 의미하며, 한 개체의 DNA는 기본적으로 세포마다 모두 동일하다. 인간의 유전체는 약 30억개의 DNA 문자(nucleotide)로 이루어져 있으며, 여러가지 원인으로 변이가 생길 수 있고, 이것이 누적되어 암이 발병한다.
2. Junk DNA
단백질 비부호화 영역(protein non-coding region) 이라고도 불리우며 유전체 중 단백질로 발현되지 않는 지역으로 전체 유전체의 약 95%를 차지한다. 전체 유전체를 해독함으로써만 분석이 가능하다.
3. Recurrence
여러 암 환자의 DNA를 분석해 보면 반복적으로 발생하는 돌연변이를 찾을 수 있는데 이를 recurrence 라 칭한다. Recurrence 가 높은 돌연변이일수록 암에서 중요한 역할을 하는, 특히 암을 유발하는 원인 인자 (driver) 일 가능성이 높다.
'판교핫뉴스1' 카테고리의 다른 글
KOTRA, “내년 화두는 변화의 흐름을 읽는 안목”- ‘변화의 파도를 향해 노를 저어라 2017 KOTRA 리포트’ 발간 (0) | 2016.11.18 |
---|---|
노화예방하는 생활습관 따로 있다-복지부‧진흥원, 11월 25일(금) 창원컨벤션센터서「2016 헬시에이징 포럼」개최 (0) | 2016.11.18 |
한국판 ´e-health 로드맵´ 마련, 본격 추진한다- ICT 보건의료 중장기 정책로드맵 마련을 위한 전문가 논의 (0) | 2016.11.18 |
한국인 당뇨병 관련 11종 후성유전체 지도 공개 (0) | 2016.11.18 |
「BIG STEP, ICT로 미래로!」 심포지엄, 성황리에 종료 (0) | 2016.11.18 |