同城医药问答网

 找回密码
 立即注册
查看: 105|回复: 0

肿瘤外显子基本分析流程

[复制链接]

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2023-1-8 12:52:38 | 显示全部楼层 |阅读模式
写在开头

2022年年底有幸参加了生信技能树肿瘤外显子数据分析课程,故想把学习所得记录下来,作为2023年一个新的专刊
但是由于本人不是相关专业的,所以肯定难免会有不足或者错误的地方,还请各位包涵,小谢提前谢谢大家hhhh
肿瘤生物学相关概念

肿瘤定义:

多数起源于单个突变的前体细胞,绝大部分发生在外显子上,可能由DNA复制错误、双螺旋断裂或者环境因素引起,需要去找到某些单碱基或者多位点的突变
基因突变的类型:

按变异大小分类

  • 点突变SNV、小片段Indel:包括无义突变、错义突变和移码突变(后面两种为重点)
  • 大片段的拷贝数变异CNV:扩增或者缺失
正常是两个拷贝,分别来自父母亲 有可能两个拷贝都缺失、或者一个拷贝缺失、或者出现扩增

  • 染色体结构变异SV
序列的结构比对到染色体上之后可能出现比对到不同染色体上的现象,包括染色体易位、倒位、重复/缺失和非整倍性变异



可以通过测序数据比对到参考基因组上,根据其差异来判断是正常片段还是突变片段及位点
从遗传类型分类

  • 生殖突变——会遗传
不一定是致病的,大部分是良性的变异。

  • 体细胞突变
很多的肿瘤都是体细胞突变,大部分的体细胞突变也是良性的,找到变异位点后需要和前人的研究进行比对确定是否是有害突变



生殖/体细胞突变

根据位置分类
发生在不同功能原件上的突变,会着重分析在外显子上的突变,内含子上的突变会在转录的时候被剪切掉,可能不会影响后续的蛋白质表达



基本分析流程




基本分析流程简介

1. 测序数据质控

测序得到的原始序列含有接头序列或者低质量的序列,为了保证后续分析的准确性需要对下机数据进行一个质量控制
2. BWA比对

主要是将reads比对到参考基因组上 需要先使用bwa index为参考基因组构建索引,方便我们后续查找,可以提高比对的速度
比对常用的是常用的是bwa mem ,适用于短序列的比对
3. 去除重复序列

测序过程中会引入PCR和光学重复——测序的时候有时候基因簇分的比较开会导致记录下来多个碱基,这部分的reads会放大假阳性的信号,就需要去除掉。
可使用GATK(picard)的MarkDuplicates(占用的计算资源较大),sambamba(较推荐)、samtools
4. 碱基质量重新校正BQSR

碱基的质量值有测序仪和测序系统产生,及其带俩的系统误差和噪声是避免不了的,只可能尽可能的去掉。
使用GATK BaseRecalibrator和ApplyBQSR进行碱基质量重新校正
5. 生殖突变germline/体细胞突变

生殖突变germline变异检测:正常的人之间的基因组相似性是99.9%,有3GX1%=3M左右的差别,所以也是我们差异的原因。如果用到的是WES测序,那可能会得到3-6万的变异数据
常用的germline mutation检测工具是GATK的HaplotypeCaller
体细胞somatic变异检测 对于肿瘤样本来说,Somatic是比较关注的突变信息
突变信息的检测工具是:Mutect2、VarScan2、Strelka2、SomaticSniper等,比较推荐Mutect2和Strelka2组合分析
后记

这个专刊个人打算是按照课程的内容,加上自己的理解整理肿瘤外显子分析流程的具体分析流程和用到的软件和代码
那今天就祝大家元旦快乐,2023年顺顺利利
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|同城医药问答网

GMT+8, 2025-3-16 01:26 , Processed in 0.156847 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表