College Of Engineering
서울공대 이야기
 

IMT-2000출연금 지원에 의한 생물정보분석 프로그램 개발


생물의 게놈 염기서열을 분석하여 유전체 정보 분석 및 구조를 연구하기 위하여 필수적으로 이용되는 염기서열분석의 핵심 소프트웨어인 “서열단편조립(Fragment Assembly) 프로그램”이 국내 연구진에 의하여 개발되었다.


서울대학교 박근수 교수(컴퓨터공학부) 연구팀은 농촌진흥청이 주관하는 IMT-2000 출연금 농림분야사업(농생물 유전체 자동화 분석 시스템 개발)의 지원에 의하여 서열단편조립 프로그램을 개발하였으며 이 프로그램은 짧은 길이의 DNA 염기서열 조각을 조립(assemble)하여 전체 유전체를 재구성하는 것으로 생물체 게놈의 염기서열 연구를 위해서 필수적인 기본 소프트웨어라 할 수 있다.

서열단편조립 프로그램은 인간 게놈 프로젝트(Human Genome Project)와 셀레라(Celera) 회사에서 인간 유전체의 염기서열을 결정하기 위해 사용한 핵심 소프트웨어로서 현재 국내에서는 염기서열분석을 위해 phrap 등과 같은 외국산 소프트웨어가 주로 이용되어 왔다.


연구팀은 외국에서 개발된 기존 서열단편조립 프로그램들을 분석하여 문제점을 파악하고 이를 개선하여 성능이 월등한 신개념의 새로운 서열단편조립 프로그램을 국내 최초로 개발하였다. 개발된 서열단편조립 프로그램은 국내에서 가장 많이 사용되고 있는 외국산 프로그램과 실험적으로 비교하여 우수성이 입증되었는데, 이는 새로 개발된 서열단편조립 프로그램이 현재 세계적으로 이용되고 있는 phrap을 대체해서 사용될 수 있음을 의미한다.


이번에 개발된 프로그램은 서울대와 농진청 농업생명공학연구원과 공동으로 특허를 출원 중이며 현재 농업생명공학연구원에서 웹 서비스(http://sems.niab.go.kr)가 이루어지고 있다.


개발된 서열단편조립 프로그램은 데이터를 처리함에 있어서 phrap에 비해 탁월한 성능을 보인다. 염기서열에서 서로 다른 위치에 존재하면서 모양이 똑같은 부분을 리피트(repeat)라 부르는데, phrap은 리피트가 많은 데이터를 처리할 때 잘못된 조립을 하는 경우가 많이 발생하는데 비하여 개발된 프로그램은 리피트를 제대로 처리한다.


실험 결과를 보면 리피트가 적은 데이터에 대해서는 개발된 서열단편조립 프로그램과 phrap 모두 비슷한 결과를 얻을 수 있다. 하지만 리피트가 많은 데이터에 대해서는 phrap은 리피트가 하나로 합쳐짐에 따라 원본을 복원하지 못하는 영역이 생기며, 리피트를 전후로 원본에서는 떨어져있는 부분이 연결되는 경우가 발생한다. 이에 비하여 개발된 프로그램에서는 이러한 경우가 발생하지 않는다.

Login
College of Engineering Seoul National University
XE Login