시퀀스 파일 형식

다양한 데이터 분석 옵션을 위한 시퀀스 파일 형식

시퀀싱 데이터의 다운스트림 분석을 위해 선호하는 형식을 선택하세요.

Illumina 시퀀싱을 위한 파일 형식

데이터를 FASTQ 파일과 같은 호환 가능한 시퀀스 파일 형식으로 변환하고 차세대 시퀀싱(NGS) 데이터의 다운스트림 분석을 수행하는 데 다양한 옵션을 사용할 수 있습니다. Illumina 시퀀싱 시스템은 데이터 관리, 분석 및 협업을 위해 데이터를 클라우드 기반 Illumina 인포매틱스 플랫폼으로 쉽게 스트리밍할 수 있도록 설계되었습니다.

원시 데이터 파일은 대규모 코호트의 간소화된 집계와 마이닝을 위해 표준화된 데이터 형식과 호환되거나 쉽게 변환되는 시퀀스 파일 형식으로 제공됩니다.

FASTQ 시퀀스 파일 형식

FASTQ 파일 형식

FASTQ는 원시 시퀀스 데이터와 품질 점수를 모두 저장하는 텍스트 기반 시퀀싱 데이터 파일 형식입니다. FASTQ 파일은 Illumina 시퀀싱 시스템의 NGS 데이터를 저장하기 위한 표준 형식이 되었으며 다양한 보조 데이터 분석 솔루션의 입력으로 사용할 수 있습니다.

FASTQ 파일에는 최대 수백만 개의 항목이 포함될 수 있으며 크기가 수 메가바이트 또는 기가바이트일 수 있으므로 일반 텍스트 편집기에서 열 수 없을 정도로 큰 경우가 많습니다. 일반적으로 FASTQ 파일은 다운스트림 데이터 분석을 수행하는 도구의 입력으로 사용되는 중간 생성 파일이므로 직접 볼 필요가 없습니다.

FASTQ 파일에 대해 더 알아보기

FASTQ ORA 파일 형식

FASTQ 원본 읽기 아카이브(ORA) 파일은 대용량 NGS 데이터 파일을 쉽게 저장, 관리 및 공유할 수 있는 무손실 데이터 압축 파일입니다. 이 파일 형식은 파일 크기, 전송 시간 및 데이터 스토리지 비용을 줄입니다. FASTQ ORA 파일은 무결성을 손상시키지 않으며 기존 fastq.gz 형식의 FASTQ 파일보다 최대 5배 작은 파일입니다. FASTQ ORA 파일은 Illumina DRAGEN 2차 분석 소프트웨어로 생성할 수 있습니다.

모든 fastq.ora 파일 형식은 Illumina에서 제공하는 무료 DRAGEN ORA 감압 소프트웨어를 사용하여 읽을 수 있습니다. 설치가 완료되면 간단한 명령을 사용하여 압축 해제 생성 데이터를 BWA 1 STAR2 및 Bowtie3와 같은 인기 있는 매핑 도구로 처리할 수 있습니다.

DRAGEN 2차 분석에 대해 더 알아보기

DRAGEN ORA 감압 소프트웨어 다운로드

BCL 시퀀스 파일 형식

Binary base call(BCL) 파일은 Illumina 시퀀싱 시스템으로 생성한 raw data를 포함하고 있습니다. BCL 시퀀스 파일 형식은 사용자가 개발한 데이터 분석 도구 또는 타사 데이터 분석 도구와 함께 사용하기 위해 FASTQ 형식으로 변환해야 합니다.

DRAGEN 2차 분석은 파이프라인 제품군의 일부로 BCL을 FASTQ 파일로 신속하게 변환합니다. Illumina는 BCL 파일을 FASTQ 파일로 변환하는 BCL Convert 소프트웨어도 제공합니다. BCL Convert는 다운스트림 분석을 위해 데이터를 디멀티플렉싱하고 BCL 파일을 표준 FASTQ 파일 형식으로 변환하는 독립형 소프트웨어 솔루션입니다.

BCL Convert 소프트웨어 다운로드

기타 시퀀스 파일 형식

FASTQ 파일은 시퀀싱 데이터 분석을 위한 일반적인 시작 형식입니다. 그러나 BaseSpace Sequence Hub는 2차 및 3차 분석 프로그램에 공통적인 다른 파일 형식을 생성할 수 있습니다.

NGS 데이터의 2차 또는 3차 분석 중에 Illumina 소프트웨어 플랫폼과 앱은 종종 분석 워크플로우의 일환으로 FASTQ 파일의 원시 시퀀스 파일을 다른 시퀀스 파일 형식(예: .vcf, .bam)으로 변환합니다.

BaseSpace Sequence Hub에 대해 더 알아보기

추가 자원

개발자 포털

사용자 가이드, 릴리즈 노트 및 추가 기술 정보를 열람해 보세요.

NGS 교육

전문 강사의 NGS 실습 교육을 받으세요. 실시간 또는 자기 주도 온라인 과정 및 기타 교육 자료도 제공합니다.

Illumina DRAGEN secondary analysis 파이프라인

DRAGEN 2차 분석 파이프라인은 유전체, 엑솜, 전사체, 메틸롬 연구 등 다양한 NGS 실험 유형을 지원합니다.

유전체 데이터 보관 및 보안

속도, 보안성 및 확장성이 뛰어난 클라우드로 대규모 유전체 및 NGS 데이터 세트를 보관, 처리, 공유하세요.

참고 문헌(References)
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25
소식지, 사례 연구 및 유전체 분석 기법에 대한 정보를 받고 싶으신가요?

이메일 주소를 입력해 주세요.

추가 자료

개발자 포털

사용자 가이드, 릴리즈 노트 및 추가 기술 정보를 열람해 보세요.

온라인 교육

이러한 무료 온라인 과정은 라이브러리 준비, 시퀀싱 및 데이터 분석에서 공통 주제를 다룹니다.

Illumina DRAGEN Bio-IT Platform 교육

정확하고 매우 신속한 2차 분석 플랫폼 및 동반 파이프라인에 대해 더 알아보세요.

엔터프라이즈급 보호

가장 엄격한 보안 요구 사항을 충족하기 위해 Illumina Connected Analytics Platform 구축의 핵심을 보안과 규정 준수에 두었습니다.

참고 문헌
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25