바이오마커는 DNA, RNA, 대사 물질, 단백질 및 단백질 조각 등에서 유래된 분자적 정보로써 질병의 발생 등으로 유발된 신체의 변화를 감지할 수 있는 지표로 정의되어 있습니다. 질병의 발생 및 진행, 치료 방법에 대한 약물 반응성을 객관적으로 측정하고 평가할 수 있어 질병의 조기 발견 및 예후 관찰, 개인별 맞춤 의료 기술 등 폭넓게 이용되고 있으며 1990년대 이후 오믹스 기술의 보급으로 바이오마커 개발 연구가 급증하였습니다.
질병은 결함이 있는 단백질 하나가 아닌 여러 개 이상의 단백질이 복합적으로 관련되어 있을 수 있으므로 유전자 발현(전사체: Transcriptome) 정보를 활용하여 특정 질환과 관련된 세포, 조직에서의 특정 유전자 발현 패턴 변화를 분석하고 정상 세포, 조직의 패턴으로 전환하기 위한 화합물, regulator 등을 스크리닝할 수 있습니다. 유전체 기술의 급격한 발전으로 최근 많은 연구정보와 데이터들이 공개되어 있어 최근에는 빅데이터를 활용하여 전사체 기반의 바이오마커 발굴을 시도하는 연구를 많이 볼 수 있습니다.
기존 공개된 자료들을 활용하면 새롭게 분석한 결과들의 재검증을 하는 데에도 효과를 볼 수 있고, 공개된 데이터베이스 내의 역학 및 의학 코호트 분석에서 활용되는 메타정보를 이용하여 기존 결과에서도 후보들을 발굴하는데 활용도를 높일 수 있습니다.
그러나 다양한 컨소시엄에서 제공하는 데이터를 통합적으로 분석해야 하는데, 이러한 시도는 방대한 양의 공개 데이터를 서로 비교하기 위한 전처리 과정과 신뢰도를 높이는 큐레이션 과정이 필요하며, 많은 인력과 시간, 고사양의 서버 환경 등 일반적인 연구 환경에서는 굉장히 어려운 문제입니다.
타겟 발굴을 위한 고성능 오믹스 데이터 포털
QIAGEN Bioinformatics에 마지막으로 합류한 OmicSoft는 전문가 큐레이션과 생물정보학 처리를 결합하여 질병과 관련된 다양한 공개 데이터베이스의 비교 탐색을 위해 Land 기술을 활용한 공개 및 자체 데이터를 호스팅할 수 있는 포털을 구축하였습니다. 즉 자체적인 큐레이션 기술을 활용하여 공개된 컨소시엄들의 전사체 기반 샘플 세트들을 동일한 방법으로 전처리하였고, 관심 질병 및 유전자의 검색을 통해 기존 연구에서 생산된 데이터를 기반하여 새로운 후보 발굴이 가능하도록 Land 데이터베이스를 구축한 것입니다.
OmicSoft Land 특징
- 50개 이상의 질병 분야 및 1,900개 이상의 특정 질병 콘텐츠
- 생물정보학자를 포함한 50명 이상의 박사 또는 M.D. 들이 수행한 신뢰도 높은 큐레이션
- 데이터 통합 작업을 위한 60,000시간 이상의 시간 절약 효과
- 30여 개의 데이터베이스 소스 활용
- 1,000여 개의 메타데이터 속성 보유
- 수십 가지 시각화 툴과 16가지 데이터 유형 분류
OmicSoft Land 종류
OncoLand
- TCGA, BeatAML, ICGC, TARGET, CGCI와 같은 암 컨소시엄
- CCLE, GSK 및 NCI와 같은 세포주 프로파일링 컬렉션
- 혈액 및 고형 종양, 전이, 소아암 등에 초점을 맞춘 수천 건의 종양학 연구
- 발현, 돌연변이, CNV, 임상 공변량, 생존 곡선 포함
DiseaseLand
- 수백 가지 질병 상태에 대한 발현 연구
- 질병 vs. 정상, 치료군 vs. 대조군, 내성 vs. 민감성 및 기타 비교 데이터세트
- 인간, 마우스 및 랫 모델 RNA-seq, Microarray, NIH LINCS 정보 제공
SingleCellLand
- 개별 세포 간의 유전자 발현 차이 발견
- 다양한 플랫폼에서 통합된 단일 세포 전사체 데이터세트를 탐색하여 특정 암세포 유형 또는 하위 집합에서 고유한 패턴 확인
왜 Land를 사용해야 하는가?
Features
- 자체 데이터와 공개 데이터의 안전한 통합
- 95,000개 이상의 통계 비교, 데이터세트에 대한 맞춤형 모델링
- 오믹스 데이터 시각화 및 DNA-seq, RNA-seq, 단백질 발현, CNV, Methylation 등 임상적 속성 분석
- 최대 규모의 공공 컨소시엄 데이터세트에서 통합적으로 품질 관리된 데이터
- 16가지 주요 유전체 데이터 유형 및 질병, 조직, 치료, 생존, 인구 통계를 포함한 1,500개 이상의 임상 정보
- 섬세한 메타데이터 큐레이션
Benefits
- 약물 표적의 우선순위를 지정하여 복합물에 대한 강력하고 통찰력 있는 Insight를 제공
- 다양한 연구를 위한 바이오마커와 질병 특징에 대한 통합된 시각화 기능 제공
- 서로 다른 데이터의 정확한 비교 가능
- 데이터세트 내 또는 전체에서 차이 비교 및 상호 연관성 파악 가능
- 서로 다른 질병에 연관된 단일 유전자 또는 여러 유전자의 발현 수준 이해
- 질병 전반에 걸친 돌연변이 패턴 식별, 변이 및 CNV 변이를 발현과 연관 이해
- 관심 유전자에 대한 질병 관련 신속한 검색
- 비교 분석을 위한 사용자 정의 코호트 제공
OmicSoft 솔루션 활용 사례
인실리코젠에서는 人CoSEMINAR 프로그램을 통해 생물정보 소프트웨어를 활용한 개요 및 Case study 세미나를 지속적으로 제공하고 있습니다. OmicSoft를 어떠한 연구에서 활용이 가능할 수 있을지 더 알아보고 싶으면 아래 人CoACADEMY에서 세미나 동영상으로 다시 보실 수 있습니다.
- [人CoSEMINAR 다시보기] 37회 Day 1 : OmicSoft Overview and core capabilities
- [人CoSEMINAR 다시보기] 37회 Day 2 : Exploring differential expression in human disease in IPA and OmicSoft
- [人CoSEMINAR 다시보기] 38회 : IPA와 OmicSoft Land DB를 활용한 독성 연구
- [人CoSEMINAR 다시보기] 44회 : IPA Analysis Match와 OmicSoft를 활용한 질병 및 약물 치료 메커니즘 관련 케이스 스터디
- [人CoSEMINAR 다시보기] 45회 : OmicSoft Lands 및 IPA를 활용하여 약물 표적 발견을 위한 암 세포주 분석 케이스 스터디
마치며
앞에서 이야기한 것과 같이 QIAGEN OmicSoft의 고품질의 데이터베이스는 생물학적 질문에 대한 빠른 답을 통해 새로운 발견을 가능하게 하고, 바이오마커 및 타겟 발굴을 위한 시간과 자원을 현저하게 절약할 수 있습니다. 이번 포스팅에서 소개해드린 플랫폼은 인실리코젠의 incoRENTAL 서비스를 통해 연구에 활용할 수 있습니다. incoRENTAL 서비스는 연구자의 요구사항에 따른 사용 기간과 활용 방식 등이 맞춤형으로 조율 가능하도록 새롭게 준비하였으니 빅데이터를 활용한 특정 질병의 바이오마커 후보의 검증, 신규 타겟 발굴 연구에 많은 도움이 될 수 있길 바랍니다.
참고자료
- https://www.ibric.org/myboard/read.php?Board=report&id=2767
- https://m.medigatenews.com/news/2320049700
EDITOR
김경윤
iLAB · Deputy Principal Consultant
'STORAGE' 카테고리의 다른 글
HTML에서 실행하는 Python과 PyScript (0) | 2022.07.25 |
---|---|
인실리코젠 프로젝트 : 한우가 당신의 식탁에 오르기까지, 소도체 기계화 품질평가 시스템 (0) | 2022.07.11 |
인공지능 기반 추천 시스템의 모든 것! From A to Z (0) | 2022.05.30 |
인실리코젠 프로젝트 : 실종아동 찾기 (0) | 2022.05.16 |
COVID-19와 임상시험 (0) | 2022.05.02 |
댓글