본문 바로가기
NEWS

NGS 데이터 분석을 위한 솔루션 : CLC Genomics Workbench

2022. 8. 9. 09:49

CLC Genomics Workbench

💡생물학 연구자가 CLC Genomics Workbench를 사용해야 하는 6가지 이유

1. 누구라도 쉽게 사용할 수 있는 사용자 친화적인 인터페이스

2. SIMD 기술을 적용한 초고속 NGS 데이터 분석

3. NGS 응용 연구 분야 분석 수행

4. 다양한 NGS 포맷 지원 (Sanger, Illumina, Ion Torrent, Helicos, PacBio, Roche 등)

5. CLC Main Workbench의 기능을 포함한 솔루션

6. 추가적인 프리미엄 모듈을 통한 metagenome 등의 분석 확장


DNA의 염기서열에는 생물의 형질을 포함하는 다양한 유전적 정보가 저장되어있습니다. 따라서, 염기서열을 분석하는 것은 다양한 생물학적 현상을 밝혀내는 데에 중요하게 작용합니다.

최근 Illumina, PacBio, Nanopore 등과 같은 NGS 플랫폼들을 활용한 시퀀싱을 통해 대용량 유전체 데이터가 계속해서 생산되고 있으며, 이러한 데이터를 다루는 생물정보 분석 기술은 바이오 분야 전반에 필수불가결한 요소가 되었습니다.

 

그러나 NGS 분석은 대용량의 데이터를 처리해야 하므로 커맨드라인 기반의 환경에서 분석을 많이 시도하는데 Linux 운영체제 및 프로그래밍 언어를 습득해야 하며, 데이터 전처리 과정을 비롯하여 오픈 소스를 활용한 분석 파이프라인을 수행하는 것은 일반적인 생물학 연구자들에게는 굉장히 어려운 문제입니다.

 

이러한 생물학 연구자들의 고민을 해결해줄 그래픽한 인터페이스 환경을 가지고 있어 누구라도 쉽고 간편하게 NGS 데이터 분석을 수행할 수 있습니다.

다양한 NGS 장비에서 생산된 데이터들이 호환되며 Genomics, Transcriptomics, Epigenomics 연구 분야의 데이터 분석을 수행할 수 있는 Tool을 제공합니다. NGS 데이터가 아니더라도 Sanger 데이터 분석, Alignment, Tree 분석을 포함한 아미노산, RNA 구조 및 서열분석까지 기본적인 분자생물학 연구실에서 수행하는 Tool도 포함하고 있으며, Heat map, Venn diagram, Genome Browser와 같은 시각화 된 Figure를 만들 수 있도록 설계된 솔루션 CLC Genomics Workbench를 소개해 드릴게요! 

 

CLC Genomics Workbench를 활용한 데이터 분석 예시
(Genomics / Transcriptomics / Epigenomics / Molecular Biology)

 

1. Genomics

(De novo assembly / Reference assembly / Variant detection)

Genomics

NGS 멀티 포맷 데이터의 hybrid assembly를 지원하여 de novo assembly 분석이 가능하며, resequencing을 통한 NGS 데이터를 reference 서열에 NGS 데이터를 mapping 하여 variation 분석을 진행할 수 있는 기초 데이터를 제공하는 reference assembly도 수행할 수 있습니다.

모델 organism의 유전체 데이터는 데이터베이스와 연동되어 쉽게 다운로드 할 수 있고, assembly 결과를 기반으로 연구 목적에 따라 세 가지 variant detector를 통하여 SNP 및 small Indel, structure variation 분석을 수행할 수 있습니다.

 

 

2. Transcriptomics

(RNAseq/DEGs(Differential Expressed Genes)/PCA plot/Heatmap/Venn diagram)

Transcriptomics

NGS 기반 RNA-seq 데이터의 mapping을 통해 발현값을 계산하고 샘플간의 Gene Expression 정도를 비교하여 차등발현 유전자 분석을 수행할 수 있습니다.

발현값 계산에는 RPKM, TPM 등을 선택할 수 있으며, 실험 샘플의 메타데이터 정보를 추가로 입력하여 샘플간의 발현 correlation을 PCA plot으로 확인할 수 있습니다. 또한 발현 정도가 유사한 그룹 간 클러스터링을 지원하고 heatmap 및 venn diagram을 통한 비교 분석 결과의 시각화를 제공합니다.

 

 

3. Epigenomics

(Bisulfite-Seq / Histone ChIP-Seq / Transcripton Factor ChIP-Seq)

Epigenomics

CLC Genomics Workbench를 이용한 ChIP-Seq 분석은 실험적으로 짧은 DNA 절편에 binding 하는 특성 때문에 antibody만을 사용한 대조군을 설정하여 비교 및 통계적인 확률 등의 계산이 가능합니다.

또한 binding site 근처에 존재하는 유전자의 정보도 제공하며, consensus binding 서열을 도출하고, Histone ChIP-Seq / Transcripton Factor ChIP-Seq를 수행할 수 있으며 Bisulfite-Seq 분석을 통해 methylation 분석까지 수행할 수 있습니다.

 

 

4. Molecular Biology

(Sanger sequencing data assembly/Alignment & tree/BLAST/Primer design/insilico Cloning)

Molecular Biology

CLC Genomics Workbench 내에는 NGS 분석 모듈 외에 CLC Main Workbench에서 제공하는 기능이 모두 포함되어 있습니다. *.ABI *.AB1 과 같은 sanger sequencing 데이터의 import를 통해 크로마토그램을 확인하고 assembly를 수행할 수 있고, 비교하고자 하는 서열을 정렬하여 유사도 분석과 이후 tree를 그려 유연관계를 확인할 수 있습니다. 또한 PCR을 위한 primer 디자인, 클로닝 실험을 위한 벡터 맵 설계, NCBI BLAST 분석을 수행할 수 있습니다.

 

 

CLC Genomics Workbench 활용 예시 확인하기

인실리코젠에서는 人CoSEMINAR를 통해 생물정보 소프트웨어를 활용한 개요 및 Case study 세미나를 지속적으로 제공하고 있는데요! CLC Genomic Workbench를 어떻게 활용할 수 있을지 아래 人CoACADEMY의 온라인 세미나 다시보기를 통해 확인해 보세요.

 

 

마치며

앞에서 이야기한 것과 같이 CLC Genomics Workbench는 그래픽 인터페이스 환경으로 인해 NGS 데이터의 분석을 누구라도 쉽고 간편하게 수행할 수 있고, 여러 NGS 플랫폼의 데이터 포맷 호환성은 분석 전략에 따라 다양한 연구를 가능하게 합니다.

NGS 뿐만 아니라 기본적인 분자생물학 연구에 필요한 서열 분석 툴을 통해 실험 진행에도 도움이 될 CLC Genomics Workbench에 많은 관심 부탁드립니다.

 

또한, 한참 바쁠 8월 연구 시즌을 위해 인실리코젠이 준비한 “슬기로운 연구생활 프로모션”도 많은 관심 부탁드립니다.

 

>> 8월 한정 프로모션, 연구 버닝 시즌 인실리코젠이 도와드려요!

 


인실리코젠

iLab · 컨설팅

댓글