无障碍 关怀版
评论

STAR-Fusion带你深入了解融合基因

1、融合基因介绍

融合基因(fusion gene),是指两个基因的部分序列发生融合形成的嵌合基因,一般由于染色体易位、缺失等原因所致。这种嵌合基因会在后续的生物学过程中形成异常转录本或蛋白质,进而导致或者促进肿瘤的发生。举个例子,《我不是药神》中描述的慢性粒细胞白血病,其分子生物学特征就是检测到BCR-ABL融合基因;该融合基因翻译出的融合蛋白具有很强的酪氨酸激酶活性,会导致细胞过度增殖、细胞凋亡受抑制,进而出现各种病症。

因此,准确检测出融合基因/转录本,对于这类肿瘤疾病的预防、治疗和全面理解有重要的意义。在实际分析中,我们通过预测的融合基因位点信息,对“表达外显子组”的转录活性区域进行筛选,获取涉及转录序列突变和结构重排的证据,进而找到与其功能相关的癌症基因组的变化。

常规融合基因分析中,有下图两种常见策略[1]:

图1 融合基因分析策略

1. 左侧步骤,识别基因组不一致的比对信息

将测序reads与基因组进行比对定位,从中寻找Junction/Spanning_reads;JunctionReadsCount指一条read覆盖在假定的融合连接位点处,可以拆分匹配到融合位点两侧基因的reads数目;

SpanningFragsCount指包含融合连接位点的reads数目,一对reads片段R1,R2两端对应的基因不同。

2. 右侧步骤,组装转录本

直接组装成更长的转录物序列,然后鉴定与染色体重排一致的融合转录本;可能大部分reads比对到融合位点的两侧,而没有直接覆盖到融合位点本身。

2、STAR-Fusion软件

目前已经有很多检测融合基因的软件,大都是基于以上两种方案进行预测分析。今天我们分享的是NCIP(美国国家癌症研究所癌症研究中心)推荐的STAR-Fusion。STAR-Fusion是利用STAR比对的融合输出结果来检测融合转录本的软件,在NCIP开发的分析流程中,通过该软件在第一步获取预测融合转录本。分析流程主要包括以下三部分:

1. 将reads通过STAR比对到参考基因组,筛选出Junction reads(1条read含有两个基因融合断点的read )和Spanning reads (R1,R2比对到不同基因上的reads)作为候选融合基因序列。

2. 将候选融合基因与参考基因组注释文件比对,再根据overlap预测融合基因。根据最少reads支持准则以及利用校验工具FusionInspector进行进一步的矫正分析的结果。

3. 过滤预测结果,去除假阳性。

2.1 前期准备

除了二代测序reads,分析前还需要准备好CTAT的 人参考基因组数据库比对文件(也可根据物种生成比对数据库)。由于数据库一直在更新,数据库版本需和STAR软件的版本匹配。

图2 参考基因组信息

2.2 从FASTQ文件开始STAR-Fusion

准备好基因组数据库和二代测序文件后,我们便可以通过STAR-Fusion,来进行融合基因的预测(策略1)。

分析中通过STAR,将reads比对到基因组,并通过各项硬指标筛选获取最合适的分析结果,例如剔除MT信息,限制FFPM最小值,剪接异构体分为多个条目等。输出结果为一个表格文件,示例如下:

图3 融合基因分析结果

StarFusion 结果说明:

  • FusionName:融合基因名称;
  • JunctionReadsCount:包含在假定的融合连接位点处,一条read可以拆分匹配到两侧融合基因的reads数目;
  • SpanningFragsCount:包含融合连接的reads数目,reads片段的R1,R2两端对应的基因不同;
  • SpliceType:融合基因断点位置是否出现在参考转录本结构注释(例如gencode)所提供的参考外显子连接处;
  • Left/RightGene:融合基因左侧/右侧基因;
  • Left/RightBreakpoint:融合基因断点左/右侧染色体位置信息;
  • LargeAnchorSupport:在假定断点的两侧是否有reads的较长碱基序列(>=25bp)匹配,缺乏LargeAnchorSupport的融合基因通常是假阳性。
  • FFPM:支持融合的reads的标准化结果,即每百万总reads数的融合量;
  • Left/RightBreakEntropy:位于断点两侧的15个外显子碱基的“香农熵”。最大熵为2,最低为零,低熵位结果通常应被认为低可信度。

2.3 circlized 绘制圈图

结果表格内容太多,如何更直观的查看融合基因的分布呢?这里,我们可以使用R软件绘制染色体融合基因的circos图,其中红色连线指同一染色体的基因融合;蓝色连线指不同染色体的基因融合。

图4 融合基因 染色体圈形图

3、进阶分析

分析结果这么多当然不够,我们还需要通过PCR、qPCR来进一步验证融合基因/融合序列在样本中的表达情况,那么如何获取融合序列呢?

3.1 FusionInspector 融合序列可视化

FusionInspector是STAR-Fusion高级分析的第一步,通过对融合基因的序列进行监督分析,拼接比对,进而协助分析人员发现可信度更高的融合转录本。

FusionInspector分析首先会提取融合基因的基因组信息,构建新的候选融合基因组;然后将测序reads与候选融合基因组比对,识别融合断点处的覆盖情况。分析结果有很多,我们只需将以下文件导入IGV软件,即可进行可视化分析。文件如下,

1. finspector.fa:候选融合基因组序列

2. finspector.gtf:候选融合基因组注释文件

3. junction.reads.bam & spanning.reads.bam:候选融合reads比对结果

以下是FusionInspector分析结果的IGV展示。可以看到,融合位点的覆盖情况,融合基因的左/右侧信息都展示在图中。JunctionReads可以完整覆盖融合位点的左右侧,SpanningReads则是不同方向reads覆盖不同的基因。

图5 融合基因 IGV 可视化结果

3.2 Trinity重建融合转录本

获得候选基因组后,就可以重新构建融合转录本。Trinity软件将比对上候选融合基因组的reads重新组装,获得候选融合转录本,然后再使用gmap软件把候选转录本与候选融合基因组进行比对,优化候选转录本的位置信息,提取出最合适的融合转录本(策略2)。得到的结果主要包括以下文件,

1. finspector.gmap_trinity_GG.fusions.fasta:融合转录本序列fa文件

2. finspector.gmap_trinity_GG.fusions.gff3:融合转录本gff3注释文件

这样,我们就得到了一套完整的融合基因分析结果,以便进行后续的分析和验证

1. 融合基因位点信息;

2. 融合基因/转录本序列信息和注释信息;

3. 融合基因可视化结果。

当然,我们也可以从fasta中选取一条序列,通过NCBI进行blast比对。

示例结果我觉得很OK,您意下如何?

图6 融合转录本比对结果示例

目前,ATLAS数据库[2]已经收录了一万多个融合基因位点,除了部分白血病相关的融合基因,其它融合基因在肿瘤发生过程中的功能和作用,我们知之甚少。基因的融合机理、融合基因是否可做为潜在的药物靶点、相关疾病的检测、治疗以及预后,作为医学和生命科学研究方向的热点,具有很大的发展潜力。

参考文献

1. Haas B J , Dobin A , Li B , et al. Accuracy assessment of fusion transcript detection via read-mapping and de novo fusion transcript assembly-based methods[J]. Genome Biology, 2019, 20(1):1-16.

2. http://atlasgeneticsoncology.org/返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读

深圳SEO优化公司海南设计网站绵阳网站设计公司宁德模板推广哪家好梅州设计公司网站吉祥网站建设设计推荐连云港百度关键词包年推广推荐衡水SEO按效果付费价格坪地企业网站设计报价渭南关键词排名公司泰州网站建设公司坪山关键词按天扣费推荐天门至尊标王多少钱东莞营销型网站建设推荐永湖网站搭建报价广元企业网站设计价格东营SEO按天收费推荐阜新百姓网标王推广报价鹤岗seo网站推广价格辽源网络推广推荐临夏网站排名优化价格宜宾关键词按天收费公司驻马店网站优化软件价格甘南推广网站晋中网站关键词优化公司长春营销型网站建设多少钱观澜网络推广价格大同网站优化按天扣费丽江百姓网标王推广公司中卫网站搜索优化报价长春网站推广方案多少钱歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化