하이거

판교핫뉴스1

1월 과학기술인상, 서울대 박태성 교수 - 국제적인 수준의 유전체 빅데이터 분석 방법론 개발

하이거 2017. 1. 26. 10:59

1월 과학기술인상, 서울대 박태성 교수 - 국제적인 수준의 유전체 빅데이터 분석 방법론 개발

 

작성일 : 2017. 1. 25. 미래인재기반과

 










1월 과학기술인상, 서울대 박태성 교수
 - 국제적인 수준의 유전체 빅데이터 분석 방법론 개발 -


□ 미래창조과학부(장관 최양희, 이하 미래부)와 한국연구재단(이사장 조무제, 이하 연구재단)은 이달의 과학기술인상 1월 수상자로 서울대학교 통계학과 박태성 교수를 선정했다고 밝혔다.

□ 미래부와 연구재단은 박태성 교수가 패스웨이* 정보를 바탕으로 대용량 유전체 자료를 빠르게 분석하고 유의미한 생물학적 해석을 할 수 있는 국제적인 수준의 연구방법론을 개발한 점이 높이 평가되었다고 선정 배경을 설명했다.
  *패스웨이(Pathway) : 단백질, 유전자, 세포 등 생체 요소 간의 상호작용과 역학관계를 세밀하게 설명할 수 있는 생물학적 심층지식

□ 생물학 분야에서 빅데이터는 분석보다 해석이 어렵다. 생물학 자료는  생물학적 현상의 일부만을 간접적으로 반영하기 때문이다. 때문에 추가적인 검증작업이 필요하다. 최근 차세대 염기서열 분석기술에 의해 대규모 유전체 자료가 대량으로 생산되고 있지만 체계적 분석 기술 개발은 아주 느린 상태이다. 더구나 분석 결과를 제대로 해석하는 것은 무척 어렵다.

□ 박태성 교수는 복잡한 변수 간 연관성을 살펴볼 수 있는 구조방정식 모형*을 응용하여 생물학적 패스웨이 정보를 통계학적 구조로 변환시키는 새로운 방법론(파라오**, PHARAOH)을 개발했다. 이 방법론은 대규모 유전체 자료를 빠른 속도로 분석하여 유의미한 유전자를 발굴할 수 있는 방법이다. 생물학적 구조 정보를 바로 활용하는 패스웨이 기반 분석 방법이기 때문에 직관적인 생물학적 해석을 바로 할 수 있다. 재현성 확인이 필수인 유전체 연구에서 이 방법론은 쉽게 재현성을 도출할 수 있는 장점이 있다. 세계적인 주목을 받는 이유이다.
  *구조방정식 : 사회과학 분야에서 널리 사용되는 통계모형으로써, 주로 직접 관측할 수 없는 잠재변수를 포함시켜 변수간의 인과관계를 설명하기 위한 통계적 방법론임.
 **파라오(PHARAOH) : 축약된 희소 유전변이의 계층적 성분에 기반한 패스웨이 분석 방법론. 

□ 박태성 교수는 “이 연구는 생물학 빅데이터의 분석과 해석을 위한 핵심 방법론을 개발한 것이다. 복잡하게 얽혀 있는 생물학적인 메커니즘을 쉽게 통합하여 분석하는 것이 가능해졌다. 향후 질병예측과 개인별 맞춤치료 등에 필요한 다양한 오믹스*** 빅데이터 분석모형으로 활용될 수 있을 것으로 기대된다.” 라고 연구의 의의를 설명했다.
  ***오믹스(omics):체학(體學). 유전체, 전사체, 단백체 등의 집합체를 대상으로 생물정보학적 기법을 활용해 대량의 생물정보와 상호관계를 종합적으로 연구하는 학문.

□ 1997년부터 시행된 ‘이달의 과학기술인상’은 과학기술자의 사기 진작과 과학기술 마인드 확산을 위해 우수한 연구개발 성과로 과학기술 발전에 공헌한 연구개발자를 매월 1명씩 선정하여 미래부 장관상과 상금을 수여하고 있다.

<붙임> 1. 2017년 1월 이달의 과학기술자상 수상자 미니인터뷰    
        2. 2017년 1월 이달의 과학기술자상 연구성과 관련 그림   
        3. 2017년 1월 이달의 과학기술자상 연구자 이력사항  

 


참고1
 수상자 미니인터뷰 


‘자료 생산비용은 1000불, 분석 비용은 10만불, 해석 비용은 100만불’, 최근 학자들 사이에 회자되는 이 말은 첨단 바이오 기술을 기반으로 생산되는 대규모 생물학적 빅데이터 정보를 제대로 분석하고 해석하는 일이 얼마나 어렵고 중요한지 함축적으로 보여준다.

생물정보학의 불모지나 다름없었던 우리나라에서 지난 2000년 생물학 빅데이터 자료를 분석하기 위한 새로운 방법과 분석 프로그램 개발에 도전장을 내고 생물통계학자로서의 길을 개척해 온 서울대학교 박태성 교수는 연구결과가 학문에 그치지 않고 실제 환자들의 건강에 기여하고, 나아가 정밀맞춤의학 구현에 기여하는 데 앞장서고 있다. 2017년 연구년을 맞아 재충전의 시간을 계획하고 있는 박태성 교수의 연구 이야기를 소개한다. 

o 이달의 과학기술자상 수상을 진심으로 축하드립니다. 수상 소감 부탁드립니다.
 
 - 이런 큰 상을 수상하게 되어 무척 기쁩니다. 패스웨이 연구에서 중요한 기여를 한 최성경 박사, 이성영 군, 김용강 군 등 우리 연구실 연구원들과 맥길대학의 황흥선교수를 비롯해 이 연구를 지속적으로 수행할 수 있도록 지원해 준 미래창조과학부․한국연구재단에도 감사의 인사를 드리고 싶습니다. 이 상을 계기로 앞으로 더 열심히 연구에 전념하도록 하겠습니다.

o 통계적 방법으로 유전체 빅데이터를 분석할 수 있는 방법을 제시하는 등 생물정보학, 생물통계학 분야의 연구를 선도하셨습니다. 관련 분야에 관심을 갖고 연구를 시작하신 동기는 무엇인지요?

 - 생물정보학 분야에 대한 관심은 지난 2000년 국내에서 최초로 생산된 3,800개의 mRNA의 발현 값을 측정한 마이크로어레이 자료를 접하면서부터 시작되었습니다.

 - 마이크로어레이 자료의 등장은 기존 생물정보학에서의 통계학 패러다임을 바꾸게 되었습니다. 이러한 고차원 빅데이타를 분석하기 위한 새로운 통계 방법론의 개발에 대한 도전 목표가 생기게 되었고, 이 분야에 더 관심을 갖고 연구에 집중하게 된 동기가 되었습니다.
 o 세계적으로 생물정보 분석을 위한 많은 방법론이 제시됐지만 해석이 쉽지 않은 문제점을 갖고 있었는데요. 이러한 한계를 극복하기까지 어려움이 있었다면 무엇이며, 어떻게 극복하셨나요? 

 - 그 동안 저희 연구팀에서도 수많은 자료를 분석했지만, 그 결과를 제대로 해석해서 생물학적 의미를 찾아내는 작업은 쉽지 않았는데요, 자료에 대해 단순하게 통계적인 분석방법을 적용하는 것보다는 기존에 이미 잘 알려진 생물학적 정보를 같이 결합하여 분석하는 것이 타당하다고 생각을 하였고, 그 결합분석의 일환으로 생물학 패스웨이 정보를 활용하는 시도를 하게 되었습니다.

o 교수님이 지난 15년 간 수행해 오신 연구 결과들이 현대 사회와 국민의 삶에 어떤 영향을 미치길 기대하시나요?

 - 지금 현재 제가 수행하고 있는 유전자동의보감사업과 포스트게놈사업은 실제 연구에 관여하고 있는 임상연구자들이 환자들로부터 임상자료와 유전체 자료를 직접 생산하고 있습니다. 이 자료를 분석하면서 실제로 환자들의 삶에 유익한 연구 결과를 얻도록 노력하고 있습니다.

o 21세기는 바이오의 시대라 예상됩니다. 순수학문이라 할 수 있는 수학적 지식을 바이오와 연계하시며 첨단산업과 응용연구의 활성화에 기여하셨는데요. 생물정보(생물통계)학자의 매력은 무엇일까요?

 - 첨단 바이오 기술은 새로운 종류의 빅데이터를 생산합니다. 이러한 새로운 빅데이터는 대부분 기존의 분석방법으로는 분석하기가 쉽지 않습니다. 따라서, 「새로운 첨단기술 - 새로운 빅데이터 - 새로운 분석방법 개발의 연구」 사이클은 앞으로도 계속 될 것입니다. 매일 새로운 종류의 빅데이터를 접할 수 있다는 것이 생물정보학자가 접할 수 있는 가장 큰 매력이 아닐까 생각합니다.

o 연구자로서 많은 성과를 이루셨는데요, 과학 기술인으로서 앞으로 궁극적으로 도전하고 싶은 연구목표는 무엇인가요?

 - 저는 사람들에게 실제적이고 직접적으로 유익한 연구를 하고 싶습니다. 그래서 최근 화두가 되고 있는 정밀맞춤의학을 구현하는데 실질적인 기여를 하고 싶고요. 또 현재 수행하고 있는 유전자동의보감 사업과 췌장암, 간암, 난소암에 대한 조기진단, 맞춤치료 등을 성공적으로 수행하고 싶습니다.
o 연구는 물론 후학 양성을 위해서도 한결같은 열정과 노력을 보여주셨습니다. 학생들 또는 연구실 구성원들에게 어떤 스승이 되고자 하시나요?

 - 제가 이러한 우수한 연구 성과를 얻었던 가장 큰 비결은 우리 연구실의 훌륭한 연구원과 대학원생들의 덕분입니다. 저 혼자 연구해서 이만큼 질적으로 우수하고 양적으로 많은 논문을 게재할 수는 없습니다. ‘1만 스승은 있으되 아비는 많지 않다’는 표현이 있습니다. 지식만을 전달하는 스승이 아니라 아버지 같은 마음으로 학생들을 아끼고 사랑하는 스승이 되려고 노력하고 있습니다.

o 연구자로서 귀감으로 삼으시는 인물이나 스승이 계시면 소개해 주세요.

 - 제가 존경하는 분은 미국 Case Western Reserve 대학교에서 제직하시다가 은퇴하신 로버트 엘스턴(Robert Elston) 교수님입니다. 현재 80세가 넘으셨는데도 여러 국제학술대회에 참석해 논문을 발표하고, 고령의 나이에도 불구하고 변함없는 열정으로 강의를 하고 연구를 하시는 모습을 보고 저도 엘스톤 교수님 열정을 절반이라도 따라간다면 좋겠다는 생각을 합니다. 

o 2017년 역시 바쁜 한해를 보내실 것 같은데요. 새해를 시작하며 세우신 계획이 있나요?

 - 2017년 첫 학기는 연구년 학기라서 강의가 없습니다. 모처럼 좀 여유롭게 생활하며 제 삶을 돌아보는 시간을 갖길 원합니다. 느리게 사는 삶이 어떤 삶인지 좀 배워보고자 합니다. 규칙적인 운동을 통해서 체력도 다지고 외국 대학을 방문해서 시간을 보내며 새롭게 학문적인 분야를 재충전할 기회를 갖고자 합니다.

o 끝으로 과학자를 꿈꾸는 어린 학생들에게, 그 꿈을 이룰 수 있도록 도움 말씀 부탁드립니다.

 - 제자들에게도 늘 하는 말입니다. “연구는‘해야 한다’는 책임감으로 하면 오래 하지 못한다. 그런데‘재미있게’하면 오래 계속할 수 있다. 사람마다 갖고 있는 능력의 그릇은 다르지만, 연구를 즐기면서 계속하면 누구나 그 능력을 키울 수 있다. 누구든지 즐기면서 노력한다면 항상 발전할 수 있다.”과학자를 꿈꾸는 학생들에게도 같은 이야기를 해주고 싶습니다. 본인이 좋아하는 것, 그리고 본인이 재미있어 하는 일을 먼저 찾아보고, 그 일을 즐기면서 하다보면 꿈을 이룰 수 있습니다.

참고2
 연구성과 관련 그림 



     (그림1) 축약된 희소 유전변이의 계층적 성분에 기반한 패스웨이 분석 방법론 요약
     ▶ 생물학적 현상의 알려진 원리를 담고 있는 생물학적 패스웨이 정보를 이용하여, 유전체 빅데이터를 고성능 및 고재현성으로 분석할 수 있는 통계적 방법론을 개발하고 그 효용성을 증명한 연구임(그림 1).
     ▶ 축약된 희소 유전변이의 계층적 성분에 기반한 패스웨이 분석(PHARAOH, Pathway-based approach using HierArchical components of collapsed RAre variants Of High-throughput sequencing data)이라는 분석방법론 개발에 관한 연구로써 유전변이-유전자-패스웨이-표현형으로 연결되는 생물학적 구조를 반영한 분석 방법임. 특히 벌점화 기법 등의 고급 통계적 기법을 적극적으로 활용하고, 계산과정에 대한 최적화를 통해 유전체 빅데이터의 고성능 패스웨이 분석이 가능하게 되었음.




  (그림 2) 두 종류의 한국인 유전체 빅데이터 분석결과

        ▶실제 자료의 분석에서의 효용성을 검증하기 위해 질병관리본부 유전체센터의 두 개 독립된 대규모 한국인 유전체 자료인 KARE(Korean Association REsource) 및 HEXA(Health Examinee shared control study) 제안된 분석방법으로 간 기능과 관련된 유전변이를 찾기 위한 실제 자료를 분석한 결과, 뛰어난 생물학적 설명력을 보여주었을 뿐 아니라 독립된 자료를 이용한 재현 또한 성공하였음.(그림 2).




참고3
 연구자 이력사항



1. 인적사항
  o 성명 : 박 태 성
  o 소속 : 서울대학교 통계학과
 


2. 경력사항
  o 2001 – 현재  서울대학교 자연과학대학 교수
  o 2012 – 2016  미래부 기초연구사업 리더연구사업 고차원생물정보통계 창의연구단 단장
  o 2007 – 2009  서울대학교 통계학과 학과장
  o 2005 – 2010  국가지정연구실(통계학 및 생물정보학 분야) 실장
  o 2005 – 2008  서울대학교 협동과정 생물정보학 전공주임교수

3. 전문분야 정보
  o 생물통계학, 생물정보학 
  o 바이오 빅데이터를 활용한 마커 발굴 및 예측모형 개발
  o 고급통계분석 소프트웨어 및 시각화 프로그램 개발