STORAGE
NGS 데이터 파일 형식 및 파일 형식 검증툴 소개
NGS 데이터는 처리하는 과정에서 다양한 형식의 파일이 생성됩니다. 그리고 각각의 분석 과정에서 지정된 데이터 포맷의 파일만 입력 파일로 활용할 수 있고 분석 결과는 지정된 포맷의 파일이 생성됩니다. 예를 들면 위의 분석 과정 중 alignment to genome 단계에서 자주 사용되는 bwa 이라는 분석 툴은 FASTQ 형식 파일을 입력 파일로 받아서 SAM 형식의 결과 파일을 출력합니다. 이렇게 분석 단계별로 입출력 파일 형식이 지정되어 있습니다. 대용량의 NGS 데이터를 분석하다 보면 예기치 못한 오류메시지를 보게 되는 경우가 종종 있습니다. 이런 때 의외로 데이터 파일 포맷이 올바르지 않아 프로그램에서 인식할 수 없다는 로그를 종종 보게 됩니다. 원인은 다양합니다. 우선 연구자가 임의로 만든 파..
2022. 11. 28.