VCF文件结构解剖:图解版
一、VCF文件全景图
二、核心结构解析
数据行字段图解
三、关键字段速查表
字段 | 示例值 | 说明 | 必需 |
---|---|---|---|
CHROM | chr1 | 染色体名称 | ✓ |
POS | 1001 | 变异位置(1-based) | ✓ |
REF | A | 参考基因组碱基 | ✓ |
ALT | T, | 变异碱基/SV类型 | ✓ |
QUAL | 50 | Phred质量值(越高越好) | ✗ |
FILTER | PASS | 过滤状态 | ✗ |
INFO | DP=30;AF=0.2 | 附加信息键值对 | ✗ |
FORMAT | GT:DP | 样本字段格式定义 | ✗ |
四、基因型(GT)编码表
五、vcf/Excel转换
1 访问官方下载页,下载安装sunVCF通讯录转换器
2 点击添加文件
3 选择目标格式
1 将vcf文件转换为Excel
若存在多个vcf文件,可以选择将所有vcf文件合并为一个Excel表格
误点合并表格后支持取消合并操作
2 将Excel文件转换为vcf
第一步,添加文件后点击自定模板
第二步,选择从表格的第几行开始转换
第三步,选择对应数据
第四步,点击应用模板
4 导出结果
操作流程:
点击"开始转换"按钮
选择保存位置(推荐桌面或U盘)
前往输出位置查看文件
六、高级应用速览
场景 | 关键语法 | 说明 |
---|---|---|
多等位基因 | ALT=T,C | 逗号分隔多个变异 |
结构变异 | ALT= | 定义删除区域 |
肿瘤样本 | FORMAT=AF; SAMPLE=0.4 | 添加等位基因频率 |
注释字段 | ##INFO= | 添加自定义注解 |
七、避坑指南
通过图表快速掌握VCF核心结构后,可进一步查阅[VCFv4.3规范]了解细节。实际应用推荐使用PyVCF、BCFtools等工具库处理VCF文件。
访问官方下载页,下载安装sunVCF通讯录转换器
离线转换+加密配置模板+隐私安全保护