하이거

판교핫뉴스1

(이달의 과학기술자상) 8월 수상자 한욱신 교수- 세계 최고 수준의 대용량 그래프 데이터 분석기술 개발

하이거 2016. 8. 18. 10:27

(이달의 과학기술자상) 8월 수상자 한욱신 교수- 세계 최고 수준의 대용량 그래프 데이터 분석기술 개발

 

등록일 2016-08-18

 

 

 

8월 과학기술자상, 포항공대 한욱신 교수
- 세계 최고 수준의 대용량 그래프 데이터 분석기술 개발 -


□ 미래창조과학부(장관 최양희, 이하 미래부)와 한국연구재단(이하 연구재단)은 이달의 과학기술자상 8월 수상자로 포항공과대학교 창의IT융합공학과 한욱신 교수를 선정했다고 밝혔다.

□ 미래부와 연구재단은 한욱신 교수가 기존 기술보다 효율성이 최대 수만 배까지 높은 세계 최고 수준의 대용량 그래프 데이터* 분석 기술을 개발하여 우리나라 데이터베이스 분야의 학술적 위상을 높이는 데 기여한 것이 높이 평가되었다고 선정 배경을 설명했다.

   * 그래프 데이터는 SNS에서 사용자간 관계를 나타내는 네트워크 구조 등 인간사회에서 사용되는 복잡한 데이터 구조를 표현하는 방법으로 널리 사용되고 있음

 o 한욱신 교수는 대용량 그래프 데이터에 대한 분석을 효율적으로 지원하는 고성능 그래프 엔진인 터보그래프를 개발하고, 그 동안 수억 원 대의 클러스터 기반 컴퓨터로 계산했던 대용량 그래프 데이터를 일반 컴퓨터 1대로 계산할 수 있는 핀-슬라이드* 라는 새로운 모델을 제시하였다.
 
 * 핀-슬라이드 : 컴퓨터에 장착된 모든 가용 하드웨어를 동시에 작동시켜서 그래프 계산을 최고 효율로 수행시키는 기법
 o 한욱신 교수가 개발한 기술은 고가의 시스템 구매 및 유지비용을 절감하고 에너지를 절약하는 등 경제적 효과가 높으며, 대용량 그래프를 많이 사용하는 페이스북, 트위터 등 소셜 네트워크 서비스를 비롯하여 전산ㆍ의료ㆍ마케팅 등 광범위한 분야에서 적용이 확대될 것으로 기대된다. 

 o 한욱신 교수는 데이터베이스와 데이터마이닝 분야의 최우수 국제 학술대회인 미국컴퓨터학회(ACM) 데이터베이스 분과 국제학술 대회(SIGMOD)에서 많은 논문을 게재하였다.

□ 한욱신 교수는 “세계 최고 효율의 대용량 그래프 데이터 분석기술을 만들고자 노력한 것이 인정받아 매우 기쁘다.”며 “앞으로 대용량 데이터 전반을 효율적으로 분석하는 세계 최고 효율의 분석기술을 개발하여 우리나라가 소프트웨어 강국이 되는데 일조하겠다.”고 수상소감을 밝혔다. 

□ 올해로 20년을 맞이하는 이달의 과학기술자상은 과학기술자의 사기 진작과 과학기술 마인드 확산을 위해 우수한 연구개발 성과로 과학 기술 발전에 공헌한 과학기술자를 매월 선정하여 미래부장관상과 상금을 수여하고 있다.

<붙임>  1. 2016년 8월 이달의 과학기술자상 수상자 미니인터뷰  
        2. 2016년 8월 이달의 과학기술자상 연구성과 관련 그림 
        3. 2016년 8월 이달의 과학기술자상 연구자 이력사항
 


참고1
 수상자 미니인터뷰

 

2016년 8월 이달의 과학기술자상 수상자 미니인터뷰


누구나 한 두 번은 소셜 네트워크(SNS)에서 친구 추천이나 웹 페이지 랭킹, 실시간 금융·보험 정보 등 일상생활에 실시간으로 제공되는 정보에 감탄한 경험을 갖고 있다. 이는 대용량 그래프 데이터 분석기술이 있어 가능한 서비스들이다.

대부분의 과학기술이 그렇지만, IT 분야는 세계적으로 기술개발 속도가 빠르고 경쟁이 치열하다. 이러한 환경에서 포항공대 한욱신 교수는 정직한 연구 자세와  연구 의지, 부단한 노력을 바탕으로 실패를 두려워하지 않고 문제와 정면승부하여 속도 경쟁에서 앞서가고 있다.

앞으로 그래프 데이터뿐만 아니라 모든 대용량 데이터를 효율적으로 분석할 수 있는 세계 최고의 분석 기술을 개발하여 실리콘 밸리에서 그 기술을 상용화하고, 이를 통해 IT 산업에 공헌하고 싶다는 한욱신 교수의 연구 이야기를 들어보았다.
 

o 최근 소셜 네트워크를 비롯해 데이터 분석이 바탕인 전산, 생명, 화학 등 다양한 분야에서 효율적인 대용량 그래프 데이터 분석기술을 필요로 하고 있습니다. 교수님께서는 연구 분야와 어떻게 인연을 맺게 되셨는지요?
 
 “고등학생 때에는 화학을 좋아해서 원자와 원자 간의 연결을 그래프로 표현하는 화합물의 구조식에 관심이 많았습니다. 후에 퍼브챔(PubChem)이라는 화학 데이터베이스를 활용한 그래프 매칭 연구인 아이그래프(iGraph)를 개발하면서 그래프 연구를 본격적으로 수행하게 되었습니다.”

 “그 이후 연구 결과에 대한 학술적인 측면과 실용적인 측면에서 우수성을 인정받아 2014년부터 데이터베이스 분야의 세계 최고 기업인 미국 오라클사의 외부기관 연구프로그램(External Research Office)에 선정되어 응용분야를 소셜 네트워크 등 좀 더 다양한 분야로 확장하려고 노력하고 있습니다.”
o 대용량 그래프 데이터 분석기술의 연구는 어떤 과정을 거쳐 진행되는지요?
  또 연구를 수행하며 어려움이 있었다면 무엇이며, 어떻게 극복하셨나요?

 “대용량 그래프 데이터 분석기술은 고성능의 그래프 분석 엔진을 통해서 소셜 데이터, 웹 데이터, 생물ㆍ화학 데이터, 금융ㆍ보험 트랜잭션 데이터 등의 대용량 그래프 데이터로부터 그래프 사이의 관계를 추출하여 분석하는 과정을 거치게 됩니다. 이를 위해 삼각형 구조 검색, 페이지 랭크, 그래프 매칭 등의 전반적인 그래프 기술이 필요합니다.”

 “분석된 결과는 친구 추천, 웹 페이지 랭킹, 빈발 구조 검색*, 금융ㆍ보험사기 탐지 등과 같이 다양하게 활용될 수 있습니다. 대용량 그래프 데이터를 빠르게 분석하는 것은 실시간으로 의사를 결정해야 하는 금융ㆍ보험사기 탐지 등에서 매우 중요한데, 기존의 분석기술은 속도 측면에서 매우 느린 문제가 있었습니다. 이 문제를 극복하는 것이 연구 수행에서 가장 큰 어려움이었고, 연구원들과 합심하여 포기하지 않고 노력한 결과, 이를 극복할 수 있었습니다.”

 “우리 연구실에서 개발한 기술은 하드웨어 기술인 SSD와 멀티코어 CPU의 병렬 기능을 100% 활용할 수 있도록 설계되어 있어, 다수의 컴퓨터로 구성된 기존의 클러스터 시스템 연구보다 최대 681배까지 빠른 성능을 보입니다. 이는 단일 컴퓨터 기준으로는 6만 배까지 빠른 경우에 해당합니다.”
 
    * 빈발 구조 검색 : 단백질 등의 그래프에서 자주 등장하는 구조를 찾는 과정

o 모든 과학 분야가 그렇겠지만 특히 IT 분야는 세계적으로 기술개발 속도가 빠르고 경쟁이 치열합니다. 속도 경쟁에서 자신만의 연구 분야를 찾고 경쟁할 수 있는 비결은 무엇인가요?

 “가장 중요한 것은 실패를 두려워하지 말고, 어려운 문제와 정면 승부하는 것입니다. 또한 어려움이 있더라도 절대 포기하지 말고 끝까지 노력을 경주하는 것이 중요합니다. 연구를 하는 사람이라면 누구든 난제를 직면하게 됩니다. 이를 정면 승부하지 않고 미봉책으로 피해가려고 하거나 어려움을 이기지 못하고 노력을 포기하면, 장기적으로 시간이 더 오래 걸려서 치열한 속도 경쟁에서 결코 성공할 수 없습니다.”

o 과학기술인으로 살아오시며 가장 기뻤던 일, 기억에 남은 일은 무엇인가요?

 “가장 기억에 남는 일은 제가 배출한 첫 박사인 이진수 박사가 데이터베이스 분야 최고 기업인 미국 오라클 본사에 정식 직원으로 입사하게 된 것입니다.”

 “그리고 최근에 가장 기뻤던 일은 학부생인 김현지 학생과 함께 연구한 듀얼심(DualSim)이라는 서브 그래프 열거 연구를 데이터베이스 분야 최고 학술대회인 ACM SIGMOD 2016에 게재한 것입니다. 참고로 SIGMOD 논문은 박사과정을 마치면서도 게재하기가 매우 어려운 것이라 감회가 새롭습니다.”

o 과학기술인으로서 귀감으로 삼으시는 인물이나 스승이 있으시면 소개해 주세요.

 “박사과정 지도 교수인 KAIST 황규영 특훈교수님 입니다. 황규영 교수님께서는 연구에 대한 열정과 부단한 노력, 그리고 정직이 연구자에게 있어 가장 중요한 요소임을 학생들에게 몸소 보여 주셨습니다. 그 분의 모습을 통해서 연구자의 바른 자세를 배울 수 있었습니다. 또한 황규영 교수님께서도 1998년에 이달의 과학기술자상을 수상하셨는데, 18년이 지난 올해 제가 이 상을 받게 되어 감개무량합니다.”

o 평소 연구실 학생들에게 어떤 스승이신가요?

 “연구자가 되기 위해 갖추어야 할 3가지 요소로 첫째 정직한 연구자세, 둘째 연구에 대한 의지, 셋째 부단한 노력을 학생들에게 늘 강조하고 있습니다. 또한 제 스스로 이를 지키기 위해서 노력하고 있습니다. 그래서 연구실 학생들도 저를 그런 스승으로 바라보고 있기를 기대하고 있습니다.”

o 연구와 수업, 학회 활동 등 바쁜 일정을 효과적으로 진행하기 위한 시간관리 비법이 있으시면 소개해 주세요.

“연구와 관련된 일 외에도 다양한 일들을 처리해야 하기 때문에 스케줄 관리는 매우 중요합니다. 저는 연구적인 일과 연구와 관련되지 않는 행정적인 일을 나눠서 한꺼번에 각각의 일을 처리하는 방법으로 스케줄을 관리하고 있습니다.”

o 과학기술자로서 궁극적으로 이루고 싶은 꿈은 무엇인가요?

 “가장 큰 소망은 지도 학생들이 그래프 데이터 분야를 이끌어 가는 세계 수준의 지도자가 되는 것입니다. 또한 개인적인 소망은 그래프 데이터뿐만 아니라 모든 빅 데이터를 효율적으로 처리하는 세계 최고의 분석기술을 개발하고 그 기술을 실리콘 밸리에서 상용화하여 IT 산업에 공헌하는 것입니다.”

o 끝으로 IT분야의 과학자를 꿈꾸는 어린 학생들에게 그들이 꿈을 이루기 위해 어떤 자세와 덕목을 갖추는 게 좋을지 조언을 부탁드립니다.  

 “앞에서 말씀 드렸지만, 어릴 때 가졌던 꿈을 이루기 위해 열정을 갖고 끝까지 노력하는 자세에 대해서 강조하고 싶습니다. 삶을 살다보면 여러 가지 어려움을 만나게 되겠지만, 이는 어떤 분야에 있든지, 누구든 늘 겪는 일이니 문제에 굴하지 말고 정직한 방법으로 포기하지 말고 정면 돌파하시기 바랍니다. 자기가 힘들면 남도 힘들고, 자기가 포기하고 싶으면 남도 똑같이 포기하고 싶을 것이라는 간단한 진리를 되새기는 사람이 되기를 부탁드립니다.” 

 


참고2
 연구성과 관련 그림

 

      그림1. (a) 터보그래프(TurboGraph)의 소프트웨어 아키텍처
             (b) 터보그래프(TurboGraph)의 성능 평가

      ▶ 터보그래프(TurboGraph)는 대용량 그래프에 대한 효율적인 분석을 지원하는 고성능 그래프 분석기술로서 빠른 그래프 연산을 위해 엔진 수준에서 그래프 연산을 처리하며, 핀-슬라이드라는 새로운 계산모델을 이용한다.

         이로 인해 단 1대의 PC만을 사용하여도 100대의 컴퓨터로 구성된 기존의 클러스터 기반 기술보다 최대 681배까지 빠른 성능을 보인다. 이는 단일 PC 기준으로 비교한다면 터보그래프(TurboGraph)가 6만 배 이상의 빠른 성능을 보인 것이다.

 

      그림2. 대용량 그래프 데이터의 주요 연결 요소인 삼각형 추출 기술, 추천 시스템에 활용되는 고성능의 강인한 행렬 분할 기법, 고성능의 서브 그래프 열거 기술인 듀얼심(DualSim) 개발
       (a) 옵트(OPT)에서 메모리 버퍼 사용 방법
             (b) 옵트(OPT)에서 야후(Yahoo) 데이터에 대한 성능 평가 (sec)
             (c) 넷플릭스(Netflix) 데이터에 대한 행렬 분할 기법의 성능 평가
             (d) 듀얼심(DualSim)의 성능 평가

      ▶ 삼각형 추출 기술인 옵트(OPT)(ACM SIGMOD 2014에 논문 게재)는 소셜 네트워크 그래프로부터 친구 찾기, 커뮤니티 검색, 웹 그래프로부터 스팸 페이지 탐지 등에 활용될 수 있는 유용한 기술이다.

         더불어 그래프 분석기술을 활용한 행렬 분할 기술(ACM KDD 2015에 논문 게재)은 추천 시스템에서 개인 사용자의 숨겨진 선호도를 빠르게 분석할 수 있는 세계 최고 효율의 추천 기술이다.

         마지막으로 듀얼심(DualSim)(ACM SIGMOD 2016에 논문 게재)은 OPT의 삼각형 추출 기술을 임의 질의 그래프에 활용할 수 있도록 일반화한 기술로서, 빈발 구조 찾기, 동적 소셜 네트워크 분석 등의 그래프 마이닝 응용에 활용되는 핵심 기반기술이다.

참고3
 연구자 이력사항

 


1. 인적사항
  o 성명 : 한욱신 (Wook-Shin Han)
  o 소속 : 포항공과대학교 창의IT융합공학과
 


2. 경력사항
  o 2002. 9 ~ 2003. 2   한국과학기술원 첨단정보기술연구센터 연구교수
  o 2005. 7 ~ 2006. 8   아이비엠 알마덴 연구소 포스트닥  
  o 2008. 1 ~ 2012. 8   경북대학교 정보영재교육원 원장   
  o 2003. 3 ~ 2013. 7   경북대학교 부교수      
  o 2013. 7 ~ 2016. 8   포항공과대학교 부교수  
  o 2016. 9 ~ 현재      포항공과대학교 정교수  

3. 전문분야 정보
  o 빅 그래프 데이터 분석 기술
  o 데이터베이스 및 데이터마이닝