본문 바로가기
STORAGE

질병 바이오마커 후보 발굴을 위한 빅데이터 활용 생물정보 분석 플랫폼

2022. 6. 27. 09:33

바이오마커

바이오마커는 DNA, RNA, 대사 물질, 단백질 및 단백질 조각 등에서 유래된 분자적 정보로써 질병의 발생 등으로 유발된 신체의 변화를 감지할 수 있는 지표로 정의되어 있습니다. 질병의 발생 및 진행, 치료 방법에 대한 약물 반응성을 객관적으로 측정하고 평가할 수 있어 질병의 조기 발견 및 예후 관찰, 개인별 맞춤 의료 기술 등 폭넓게 이용되고 있으며 1990년대 이후 오믹스 기술의 보급으로 바이오마커 개발 연구가 급증하였습니다.

 

질병은 결함이 있는 단백질 하나가 아닌 여러 개 이상의 단백질이 복합적으로 관련되어 있을 수 있으므로 유전자 발현(전사체: Transcriptome) 정보를 활용하여 특정 질환과 관련된 세포, 조직에서의 특정 유전자 발현 패턴 변화를 분석하고 정상 세포, 조직의 패턴으로 전환하기 위한 화합물, regulator 등을 스크리닝할 수 있습니다. 유전체 기술의 급격한 발전으로 최근 많은 연구정보와 데이터들이 공개되어 있어 최근에는 빅데이터를 활용하여 전사체 기반의 바이오마커 발굴을 시도하는 연구를 많이 볼 수 있습니다.

 

전사체, 바이오마커
전사체 기반의 바이오마커 발굴을 위한 접근과 방법

기존 공개된 자료들을 활용하면 새롭게 분석한 결과들의 재검증을 하는 데에도 효과를 볼 수 있고, 공개된 데이터베이스 내의 역학 및 의학 코호트 분석에서 활용되는 메타정보를 이용하여 기존 결과에서도 후보들을 발굴하는데 활용도를 높일 수 있습니다.

그러나 다양한 컨소시엄에서 제공하는 데이터를 통합적으로 분석해야 하는데, 이러한 시도는 방대한 양의 공개 데이터를 서로 비교하기 위한 전처리 과정과 신뢰도를 높이는 큐레이션 과정이 필요하며, 많은 인력과 시간, 고사양의 서버 환경 등 일반적인 연구 환경에서는 굉장히 어려운 문제입니다.

 

타겟 발굴을 위한 고성능 오믹스 데이터 포털

QIAGEN Bioinformatics에 마지막으로 합류한 OmicSoft는 전문가 큐레이션과 생물정보학 처리를 결합하여 질병과 관련된 다양한 공개 데이터베이스의 비교 탐색을 위해 Land 기술을 활용한 공개 및 자체 데이터를 호스팅할 수 있는 포털을 구축하였습니다. 즉 자체적인 큐레이션 기술을 활용하여 공개된 컨소시엄들의 전사체 기반 샘플 세트들을 동일한 방법으로 전처리하였고, 관심 질병 및 유전자의 검색을 통해 기존 연구에서 생산된 데이터를 기반하여 새로운 후보 발굴이 가능하도록 Land 데이터베이스를 구축한 것입니다.

 

OmicSoft Land 특징

  • 50개 이상의 질병 분야 및 1,900개 이상의 특정 질병 콘텐츠
  • 생물정보학자를 포함한 50명 이상의 박사 또는 M.D. 들이 수행한 신뢰도 높은 큐레이션
  • 데이터 통합 작업을 위한 60,000시간 이상의 시간 절약 효과
  • 30여 개의 데이터베이스 소스 활용
  • 1,000여 개의 메타데이터 속성 보유
  • 수십 가지 시각화 툴과 16가지 데이터 유형 분류

 

OmicSoft Land 데이터베이스
OmicSoft의 Land 데이터베이스

OmicSoft Land 종류

OncoLand

  • TCGA, BeatAML, ICGC, TARGET, CGCI와 같은 암 컨소시엄
  • CCLE, GSK 및 NCI와 같은 세포주 프로파일링 컬렉션
  • 혈액 및 고형 종양, 전이, 소아암 등에 초점을 맞춘 수천 건의 종양학 연구
  • 발현, 돌연변이, CNV, 임상 공변량, 생존 곡선 포함

DiseaseLand

  • 수백 가지 질병 상태에 대한 발현 연구
  • 질병 vs. 정상, 치료군 vs. 대조군, 내성 vs. 민감성 및 기타 비교 데이터세트
  • 인간, 마우스 및 랫 모델 RNA-seq, Microarray, NIH LINCS 정보 제공

SingleCellLand

  • 개별 세포 간의 유전자 발현 차이 발견
  • 다양한 플랫폼에서 통합된 단일 세포 전사체 데이터세트를 탐색하여 특정 암세포 유형 또는 하위 집합에서 고유한 패턴 확인

 

OmicSoft Land 데이터 통합
OmicSoft의 Land 데이터 타입 통합

 

왜 Land를 사용해야 하는가?

Features 

  • 자체 데이터와 공개 데이터의 안전한 통합
  • 95,000개 이상의 통계 비교, 데이터세트에 대한 맞춤형 모델링
  • 오믹스 데이터 시각화 및 DNA-seq, RNA-seq, 단백질 발현, CNV, Methylation 등 임상적 속성 분석
  • 최대 규모의 공공 컨소시엄 데이터세트에서 통합적으로 품질 관리된 데이터
  • 16가지 주요 유전체 데이터 유형 및 질병, 조직, 치료, 생존, 인구 통계를 포함한 1,500개 이상의 임상 정보
  • 섬세한 메타데이터 큐레이션

Benefits

  • 약물 표적의 우선순위를 지정하여 복합물에 대한 강력하고 통찰력 있는 Insight를 제공
  • 다양한 연구를 위한 바이오마커와 질병 특징에 대한 통합된 시각화 기능 제공
  • 서로 다른 데이터의 정확한 비교 가능
  • 데이터세트 내 또는 전체에서 차이 비교 및 상호 연관성 파악 가능
  • 서로 다른 질병에 연관된 단일 유전자 또는 여러 유전자의 발현 수준 이해
  • 질병 전반에 걸친 돌연변이 패턴 식별, 변이 및 CNV 변이를 발현과 연관 이해
  • 관심 유전자에 대한 질병 관련 신속한 검색
  • 비교 분석을 위한 사용자 정의 코호트 제공

 

OmicSoft 솔루션 활용 사례

인실리코젠에서는 人CoSEMINAR 프로그램을 통해 생물정보 소프트웨어를 활용한 개요 및 Case study 세미나를 지속적으로 제공하고 있습니다. OmicSoft를 어떠한 연구에서 활용이 가능할 수 있을지 더 알아보고 싶으면 아래 人CoACADEMY에서 세미나 동영상으로 다시 보실 수 있습니다.

 

마치며

앞에서 이야기한 것과 같이 QIAGEN OmicSoft의 고품질의 데이터베이스는 생물학적 질문에 대한 빠른 답을 통해 새로운 발견을 가능하게 하고, 바이오마커 및 타겟 발굴을 위한 시간과 자원을 현저하게 절약할 수 있습니다. 이번 포스팅에서 소개해드린 플랫폼은 인실리코젠의 incoRENTAL 서비스를 통해 연구에 활용할 수 있습니다. incoRENTAL 서비스는 연구자의 요구사항에 따른 사용 기간과 활용 방식 등이 맞춤형으로 조율 가능하도록 새롭게 준비하였으니 빅데이터를 활용한 특정 질병의 바이오마커 후보의 검증, 신규 타겟 발굴 연구에 많은 도움이 될 수 있길 바랍니다.

 

참고자료

 

혈액을 이용한 질병 진단 바이오마커 발굴 동향

바이오마커란 정상 또는 병리적인 상태, 약물에 대한 반응 정도 등을 객관적 견지에서 측정해 줄 수 있는 표지자로 정의된다. 즉, 어떤 특정 질병에 걸렸는지, 걸렸으면 얼마나 심한지를 표현해

www.ibric.org

 

MEDI:GATE NEWS 유전체 빅데이터 마이닝 기술 기반의 신약 개발

사진: 게티이미지뱅크 [메디게이트뉴스 김태형 칼럼니스트] 최근 10년간 많은 스타트업들이 기존의 약물 데이터베이스에서 기존과 다른, 새로운 용도로 사용할 수 있는 약물을 효율적으로 찾기

medigatenews.com


EDITOR

김경윤

iLAB · Deputy Principal Consultant

댓글