The Variant Call Format (VCF) specifies the format of a text file used in bioinformatics for storing gene sequence variations.

VCF文件

Variant Call Format(VCF)文件是存储序列变异信息的文本文件,可以表示SNP,插入/缺失,CNV和结构变异。

VCF文件可分为两部分:

vcf-format.png

头文件注释信息

##开头,以key-value键值对的形式记录版本,参考基因组,标签意义等信息

变异位点信息

含义
#CHROM 参考基因组染色体
POS 变异位置,1-based
ID 变异ID,如dbSNP中的rs number
REF 参考序列
ALT 变异序列
QUAL 变异质量,Phread-scaled,-10 * log prob (ALT is wrong)
FILTER 过滤状态
INFO 变异的详细信息,其TAG在头注释文件有说明
FORMAT GT:DP

INFO

FORMAT

Reference

  1. https://samtools.github.io/hts-specs/VCFv4.2.pdf
  2. https://vip.biotrainee.com/d/164-vcf
  3. https://zhuanlan.zhihu.com/p/36289359