하이거

판교핫뉴스1

염기교정 유전자가위의 안전성 높일 실마리 찾아-인공지능 이용 점돌연변이 질환 관련 염기교정 유전자가위의 효율 및 교정결과 예측

하이거 2020. 7. 28. 14:58

염기교정 유전자가위의 안전성 높일 실마리 찾아-인공지능 이용 점돌연변이 질환 관련 염기교정 유전자가위의 효율 및 교정결과 예측

 

등록일 2020.07.13.

 


염기교정 유전자가위의 안전성 높일 실마리 찾아
인공지능 이용 점돌연변이 질환 관련 염기교정 유전자가위의 효율 및 교정결과 예측

□ 국내연구진이 딥러닝기법을 이용해 점돌연변이 교정을 위한 유전자가위의 안전성을 높일 수 있는 실마리를 찾아냈다.
○ 한국연구재단(이사장 노정혜)은 김형범 교수(연세대학교 약리학교실) 연구팀이 염기교정 유전자가위의 염기교정 효율과 교정결과를 예측할 수 있는 인공지능 프로그램을 개발했다고 밝혔다.
* 점돌연변이(point mutation) : 아데닌(A), 구아닌(G), 시토신(C), 티민(T) 등 네 종류의 염기가 특정한 순서로 늘어선 서열, 즉 유전자에 따라 다양한 생물학적 특성이 결정된다. 이 때 특정 위치의 염기 하나에 변이가 일어나면 유전질환으로 연결될 수 있는데 우리 유전질환의 절반 이상이 이러한 점돌연변이 때문인 것으로 알려져 있다.

□ 대를 거듭해 보존되는‘원본’인 유전자에 대한 외부개입인 만큼 유전자가위는 편집효율이 일정 수준 이상이어야 하고, 원치 않는 다른 염기의 편집이 일어나지 않아야 한다. 즉 효율과 정확성, 두 가지 모두를 충족해야 한다.

□ 특정 염기를 바꿔(C->T 혹은 A->G) 주는 염기교정 유전자가위는 유전질환을 일으킬 수 있는 점돌연변이를 바로잡거나 반대로 유전질환을 가진 동물모델을 얻기 위한 매력적인 도구가 될 수 있다.
○ 하지만 고정된 한 자리에서 편집이 일어나는 것이 아니라 일정 범위 안에 같은 종류의 염기가 여럿이 존재한다면, 원하지 않는 염기가 편집될 수 있다. 때문에 위치별 편집빈도를 예측, 가장 안전한 유전자가위를 선별하는 과정이 필수적이었다.

□ 이에 연구팀은 다양한 염기교정 유전자가위를 만들고, 각각의 효율과 결과물의 빈도에 대한 빅데이터를 확보, 딥러닝으로 분석하여 염기교정 결과예측 프로그램(DeepBaseEditor)을 개발하였다.
○ 나아가 이 프로그램을 이용해 23,479개의 점돌연변이 유전질환 가운데 염기교정 범위 내 표적염기가 1개이면서 효율(5%이상)이 높을 것으로 예상되어 염기교정 유전자가위로 유전자편집을 시도해볼 수 있는 질환으로, 낭포성 섬유증(cystic fibrosis) 등 3,058개 가량의 점돌연변이 유전질환을 1차적으로 선별해냈다.

□ 점돌연변이 유전질환 가운데 상당수(약 19,505개)가 염기교정이 일어날 수 있는 범위에 동일 염기(아데닌 또는 시토신)가 2개 이상 자리하고 있어, 원하지 않는 위치에서의 편집확률을 미리 예측하는 것이 중요했다.
○ 연구팀은 이들 19,505개의 유전질환 중 약 4,274개의 유전자에 대해 효율(5%이상)이 높으면서, 다른 염기의 변이가 잘 일어나지 않을 것으로 예측하였다. 선별된 유전질환들은 표적염기가 2개 이상으로 추가적인 변이가 발생할 수 있어 사용이 어려웠던 유전질환들이었다. 본 연구를 통해 위 질환들은 추가적인 변이 가능성이 낮을 것으로 예상되어 염기교정 유전자가위를 사용이 가능할 것으로 기대된다.

□ 연구팀은 향후 본 예측 프로그램을 이용해 선별된 유전자가위를 활용, 질환 동물모델 수립연구를 추진할 계획이다.
○ 과학기술정보통신부와 한국연구재단이 추진하는 중견연구지원사업, 바이오의료기술개발사업, 선도연구센터지원사업 등의 지원으로 수행된 이번 연구성과는 생명공학 분야 국제학술지 네이처바이오 테크놀로지(Nature Biotechnology)에 7월 7일(한국시간)에 게재되었다.

주요내용 설명

<작성자 : 연세대 송명재>
< 논문명, 저자정보 >

키워드
Base editor, CRISPR-Cas, Point mutation
논문명
Sequence-specific prediction of the efficiencies of adenine and cytosine base editors
저 널
Nature Biotechnology
저 자
송명재 박사(공동 제1저자)/연세대학교 의과대학), 김희권 박사, 이성태, 김영광(공동 /연세대학교 의과대학/이하 동일), 서상연, 박진만, 최재우, 장혜원, 신정홍, 민선우 (공동/서울대학교), 전철구 박사(공동/연세의료원/이하 동일), 김지훈, 강훈철 교수, 윤성로 교수(공동/서울대학교), 김형범 교수(교신저자/연세대학교 의과대학)


< 연구의 주요내용 >
1. 연구의 필요성
○ 염기교정 유전자가위는 크리스퍼 유전자가위에서 유래된 새로운 타입의 유전자가위이다. 염기교정 유전자가위는 DNA의 이중가닥을 절단하지 않고, 특정 염기를 치환할 수 있다는 점에서 유용하다. 염기교정 유전자 가위는 아데닌(A; Adenine)을 구아닌(G; Guanine)으로 치환할 수 있는 아데닌 염기교정 유전자가위와 사이토신(C; Cytosine)을 티민(T; Thymine)으로 치환할 수 있는 사이토신 염기교정 유전자가위가 있다.
※ 크리스퍼 유전자가위 : 박테리아의 면역시스템에서 유래된 유전자가위로 게놈상의 특정 위치를 정해주는 단일가닥 RNA(single guide RNA;sgRNA)와 DNA를 절단하는 효소인 Cas9 단백질로 이루어진 유전자가위
○ 염기교정 유전자가위는 크리스퍼 유전자가위에서 유래되었기 때문에 기본 적인 특징(예, 가이드RNA)들은 유사하다. 하지만 유전자교정을 일으키는 효소는 서로 다르기 때문에 동일 가이드RNA을 사용하여도 염기교정 유전자가위와 크리스퍼 유전자가위의 활성이 다를 수 있다.
※ 염기교정 유전자가위(BASE EDITOR) : 기존 유전자가위와 달리 DNA 이중 나선을 절단하지 않고 특정 염기를 치환할 수 있는 유전자가위로 2016년 미국 하버드대학교 연구진이 처음 소개
○ 또 하나의 특징은 가이드RNA가 표적하는 20개의 위치 중 약 4~7개의 위치에서 염기교정이 일어나며, 이러한 염기교정 범위를 윈도우(window)라 칭한다. 윈도우 내에 표적염기가 여러 개 존재할 경우, 다양한 염기교정 결과가 나타날 수 있으며, 이런 염기교정 결과 중 일부는 단백질의 아미노산을 바꿀 수 있어 또 다른 변이 단백질을 만들 수 있다.
※ 가이드RNA : 크리스퍼 유전자가위나 염기교정 유전자가위가 특정 위치에 달라 붙게 가이드 역할을 해주는 RNA.
○ 이런 문제를 극복하려면 염기교정 유전자가위에 적합한 가이드RNA를 선별하고, 선별된 유전자가위가 만들 수 있는 다양한 염기교정 결과물들의 빈도를 예측하는 프로그램이 필요하다.

2. 연구내용
○ 정확한 예측 프로그램을 만들기 위해서는 정확하면서 많은 데이터가 필요하다. 이러한 데이터를 얻기 위해 기존에 개발된 유전자가위 대량검증법(Kim et al, Nat Methods, 2017)을 사용하여 염기교정 유전자가위의 활성 및 교정결과의 빈도를 측정하였다.
○ 생산된 대량의 데이터는 스스로 학습하여 일정한 규칙을 찾아내는 딥 러닝(Deep learning) 기술을 이용하여, 예측모델을 만들었다. 기존의 크리스퍼 유전자가위는 효율만 예측하여도 유전자가위를 선별하는데 문제가 없었으나 염기교정 유전자가위는 염기교정 결과도 예측할 필요가 있었다. 이에 연구진은 새로운 염기교정을 예측이 가능한 다른 모델을 동시에 개발하였다.
○ 연구팀은 두 종류의 염기교정 유전자가위 활성 및 결과 예측모델을 구축하기 위한 첫 단계로서 앞선 연구를 통해 개발한 유전자가위 활성 대량측정법을 이용하여 대량의 유전자가위의 효율 및 교정결과 데이터를 생산하였다. 생산된 데이터는 스스로 학습하고 그 속에서 일정한 규칙성을 찾아 제시할 수 있는 딥러닝 기술을 가진 인공지능을 이용하여 효율과 교정결과를 예측하는 모델을 개발하였다.
○ 활성 예측 모델의 경우 실제 실험 결과 값과 인공지능이 제시한 예측 값의 상관관계가 0.69~0.79 수렴되는 높은 신뢰도를 보여주었으며, 결과 예측 모델의 경우 예측 값의 상관관계가 0.91~0.93으로 매우 높게 나타났다. 상관관계 값이 1에 가까울 수로 보다 큰 정확도와 신뢰도를 보여준다.
○ 이어 연구팀은 알려진 인간 질환 중 염기교정 유전자가위로 질환 모델을 만들거나 치료할 수 있는 질환들의 결과를 예측하였으며, 그 중 일부의 유전자가위를 인간유도만능줄기세포에서 확인하였다.
○ 염기교정 유전자가위는 점돌연변이(point mutation)을 만들거나 교정 하는데 매우 용이하다. 이에 연구진은 기존에 알려진 인간 점돌연변이 질환 중 염기교정 유전자 가위로 질환을 만들거나 교정할 수 있는 경우들의 효율 및 결과 빈도를 전수 예측하였다. 예측결과는 인간유도만능줄기세포에서 그 정확성을 검증하였다.
※ 점돌연변이 질환 : 인간의 대부분의 유전질환의 원인이며 특정 위치의 단일 염기가 변이가 일어남으로써 생기는 질환

3. 연구성과/기대효과
○ 기존에 DNA의 절단을 유도하여 유전자교정을 하던 유전자가위와 달리 염기교정 유전자가위는 DNA 절단에 따른 DNA의 변형이 거의 없고, 염기교정 효율 또한 높아 단일염기변의 교정을 이루는데 용이하다. 하지만 염기교정 범위가 있어 다중 염기가 염기교정 범위에 존재할 경우 사용이 어려웠는데 본 연구에서 개발된 모델을 통해 다양한 염기교정 결과물의 빈도를 예측함으로써 안전한 교정이 가능한 유전자가위를 선별할 수 있다.
○ 인간 점돌연변이 질환 중 염기교정 유전자가위로 질환 모델을 만들거나 교정할 수 있는 경우들이 효율 및 결과 빈도를 전부 예측한 결과를 제공함으로써, 연구자들은 1차적으로 선별된 유전자가위와 질환 정보를 받을 수 있다. 이러한 사전 예측 정보는 연구자들에게 연구의 방향, 전략 등을 세우는데 도움이 될 것이다.

그림 설명

 

 


(그림1) DeepBaseEditor 예측 프로그램의 개략도
교정을 원하는 염기서열을 넣으면 두 가지 예측모델이 각각 염기교정 효율과 가능한 교정결과들의 빈도를 수치화. 이후 두 모델을 결합하여 염기교정 유전자가위가 만들 수 있는 모든 결과물들에 대한 예측을 수행함.
출처 : 연세대학교 의과대학, 김형범 교수

 

 

(그림2) 인간 점돌연변이 질환에 대한 염기교정 유전자가위 효율을 예측
인간 점돌연변이 질환에 대해 염기교정 유전자가위의 염기교정 효율을 예측하여 효율에 따른 분포도. 특히, 예측 프로그램은 진한 빨간 부분(효율 5% 이상, 염기교정 범위 내 2개 이상 A 혹은 C)에 대한 질환에 대한 사용 가능성을 제시, 옅은 파랑(효율 5% 미만, 염기교정 범위 내 단일 A 혹은 C)에 해당하는 질환에는 사용이 어려울 것으로 예측함으로써 염기교정 유전자가위의 대상 질환에 대한 1차적인 선별이 가능함.
출처 : 연세대학교 의과대학, 김형범 교수

 

연구 이야기

<작성자 : 연세대 송명재>
□ 연구를 시작한 계기나 배경은?

유전자가위는 세계적으로 경쟁이 치열한 분야인 만큼 새로운 타입의 유전자가위도 많이 소개되고 있습니다. 그 중 염기교정 유전자가위는 기존 크리스퍼 유전자가위의 낮은 효율 문제를 해결한 유전자 가위로 편집 효율 또한 굉장히 높았습니다. 하지만 염기교정 유전자가위의 정확한 활용을 위해 몇 가지 해결해야 할 문제가 있었습니다. 첫째로, 염기교정 유전자가위의 특성에 대한 정보가 많이 부족했습니다. 이러한 정보 부족은 염기교정 유전자가위를 사용하기 위해 효율이 좋은 가이드RNA를 제작하기 어려웠습니다. 기존 크리스퍼 유전자가위의 예측 프로그램이 하나의 대안이 될 수 있었지만, 실제 사용을 해보니 정확하게 선별하기 어려웠습니다. 둘째로, 염기교정 범위 내에서는 거의 대부분 2개 이상의 표적염기가 있어 사용하기 어려움이 있었습니다. 이는 염기교정 유전자가위를 쓰는 데 가장 큰 문제였습니다. 대부분의 유전자가위는 단백질의 변이를 유도하기 위해서 사용하는데, 2개 이상의 표적염기는 원하는 위치의 아미노산 뿐 아니라 다른 아미노산을 바꿔 또 다른 단백질 변이를 일으켰습니다.


□ 연구 전개 과정에 대한 소개

전체적인 연구는 라이브러리를 이용한 염기교정 유전자가위의 활성 확인 및 염기교정 결과에 대한 대량데이터 확보, 그리고 딥러닝을 이용한 예측모델의 정확성 검증, 총 3단계로 진행되었습니다.


□ 연구하면서 어려웠던 점이나 장애요소는 무엇인지? 어떻게 극복(해결)하였는지?

많은 어려움이 있었습니다. 먼저 대량 데이터를 얻기 위해 염기교정 유전자가위를 렌티바이러스로 전달하는 계획을 세웠었는데, 바이러스가 어떠한 이유에서인지 잘 만들어지지 않았습니다. 유전자가위 분야는 경쟁이 매우 치열하기 때문에 애가 많이 탔습니다. 결국은 플라스미드를 이용해 유전자 가위를 세포내로 전달하였습니다. 또한, 딥러닝을 하는 것도 쉽지 않았습니다. 공동제1 저자인 성태 학생이, 의대공부하면서 틈틈이 연구에 열심히 참여하여, 딥러닝 문제를 풀 수 있었습니다.


□ 이번 성과, 무엇이 다른가?

기존 유전자가위 예측프로그램은 교정효율 예측이 주를 이루었는데 예측결과물까지 예측이 가능하다는 점에서 다르다고 할 수 있습니다. 특히 염기교정 유전자가위의 경우 염기교정이 일어나는 위치가 염기 8개에 해당될 수 있어 최대 256개의 결과가 나올 수 있었습니다. 이러한 결과 하나씩에 대한 빈도를 예측함으로써 단백질을 구성하는 아미노산이 변화하는 변이가 일어나는 빈도를 미리 확인할 수 있다는 점이 다릅니다.

□ 실용화된다면 어떻게 활용될 수 있나? 실용화를 위한 과제는?

첫 번째로 염기교정 유전자가위 선별에 도움을 줄 수 있습니다. 염기교정 결과까지 예측할 수 있어 최적의 유전자가위를 선별할 수 있습니다.


□ 꼭 이루고 싶은 목표나 후속 연구계획은?

예측모델을 통해 선별된 유전자가위를 이용하여 실제 질환에서도 치료가 가능한지 확인하는 연구를 진행하여 많은 유전질환 환자에게 희망을 주고 싶습니다.