基于PacBio三代测序平台的全长转录组测序(Iso-Seq),可直接获得mRNA的全长序列,可更为准确地解读mRNA的结构信息。通过全长转录组测序,可克服无参考基因组物种转录本拼接短、信息不完整的难题,获取全长mRNA序列,实现同源异构体分析,单碱基变异检测, 可变剪接分析,同源基因识别及等位基因识别。
方案设计
全长转录组实验设计思路可以是单个样品进行测序,与参考基因组进行比较进行结构分析,亦可以对多个样品进行基因结构方面的差异比较分析。
基于 Pacbio Iso-Seq 的转录本表征
差异基因染色体分布
融合基因圈图
Q:全长转录组为什么推荐“三+二”?
A:目前已报道全长转录组文章大都采用“三+二”的模式,三代建库测序以检测更准确的结构变异为主,对于有参考基因组物种可以准确检测可变剪切,融合基因,新基因的预测,对于无参考基因组物种提供准确的参考序列,有助于后期差异分析;二代测序转录组研究可以实现较三代更准确的定量。此外“三+二”模式可以利用二代的数据对三代进行校正。
Q:全长转录组是否需要打断,拼接?
A:全长转录组是基于PacBio Sequel三代测序平台,无需打断拼接,直接获得包含5’,3’UTR,poly A tail的完整转录本,从而准确分析有参考基因组物种可变剪切及融合基因等结构信息,克服无参考基因组物种转录本拼接较短、信息不完整的难题。
Q:如何选择全长转录组测序数据量?
A:基于PacBio Sequel平台,如果是想获得转录组中高表达基因,可选择1个文库测1-3个Cell (5~15G数据),如果想获得更多低丰度基因,建议1个文库测3个Cell以上。同时,也需要参考研究物种转录组复杂性,如多倍体物种,基因数量一般相对较多,在参考上述情况后,需适量增加数据量。
Q:什么物种适合全长转录组测序?
A:参考基因组和无参考基因组的物种均适合。
Q:全长转录组测序如何取样?
A:主要依据研究目的而定。通常,如果想获得某物种比较多的转录本信息,建议采集不同组织样本提取RNA,等量混合测序,得到尽可能多的表达转录本。如植物,建议取根、茎、叶、花、果实等;如动物,建议取肝脏、肾脏、肠、皮肤等部位;如果只针对某个组织部位进行组织特异性全长转录组分析,则可只对该组织取样,也可以取该组织不同的发育时期样品提取RNA,等量混合分析。