VCF文件结构解剖:图解版
VCF(Variant Call Format)是用于存储基因序列变异信息的文本格式。它包含元信息、标题行和数据行。本文将科普VCF文件结构解剖:图解版。通过深入理解VCF结构,可灵活应用于变异分析流程开发、数据转换工具实现(如BED/VCF互转)及可视化系统开发。
一、VCF文件全景图

二、核心结构解析
数据行字段图解

三、关键字段速查表
| 字段 | 示例值 | 说明 | 必需 |
|---|---|---|---|
| CHROM | chr1 | 染色体名称 | ✓ |
| POS | 1001 | 变异位置(1-based) | ✓ |
| REF | A | 参考基因组碱基 | ✓ |
| ALT | T, | 变异碱基/SV类型 | ✓ |
| QUAL | 50 | Phred质量值(越高越好) | ✗ |
| FILTER | PASS | 过滤状态 | ✗ |
| INFO | DP=30;AF=0.2 | 附加信息键值对 | ✗ |
| FORMAT | GT:DP | 样本字段格式定义 | ✗ |
四、基因型(GT)编码表

五、vcf/Excel转换
1 访问官方下载页,下载安装sunVCF通讯录转换器
2 点击添加文件

3 选择目标格式
1 将vcf文件转换为Excel
若存在多个vcf文件,可以选择将所有vcf文件合并为一个Excel表格

误点合并表格后支持取消合并操作

2 将Excel文件转换为vcf
第一步,添加文件后点击自定模板

第二步,选择从表格的第几行开始转换

第三步,选择对应数据

第四步,点击应用模板

4 导出结果
操作流程:
点击"开始转换"按钮

选择保存位置(推荐桌面或U盘)
前往输出位置查看文件

六、高级应用速览
| 场景 | 关键语法 | 说明 |
|---|---|---|
| 多等位基因 | ALT=T,C | 逗号分隔多个变异 |
| 结构变异 | ALT= | 定义删除区域 |
| 肿瘤样本 | FORMAT=AF; SAMPLE=0.4 | 添加等位基因频率 |
| 注释字段 | ##INFO= | 添加自定义注解 |
七、避坑指南

通过图表快速掌握VCF核心结构后,可进一步查阅[VCFv4.3规范]了解细节。实际应用推荐使用PyVCF、BCFtools等工具库处理VCF文件。
访问官方下载页,下载安装sunVCF通讯录转换器
离线转换+加密配置模板+隐私安全保护








