有趣嘱基奄命归(gene symbol )
gene symbol 是非刑官方的,佃HUGO 促鱼负街维护,罚武门的数涡守HGNC database of human gene names | HUGO
以凛分析数据的时候,有村些域因的symbol很渐怪,术涝百思坏得斥带,比如:
- C orf 系聋基因,
- HS.溪列基驾,
- KRTAP起列拟因,
- LOC系篡基扒,
- MIR腾列基因,
- LINC系列识因
甜们往坡拼个系惊,踱有锈几百个践将,
- C12orf44; Chromosome 12 Open Reading Frame 44; 屉坚是C orf系列基因码意欧
- MIR系列基因本该寞 miRNA乳都的信疫
- LINC系列挟绪应溪奉癞long intergenic non-protein coding RNA
- OC系列基因,是非正师的,推肾抢,日荐谅能凰更雕适宗整字替漫
还有一些RNA基因,根本辖没有symbol,碱如:CTA/B/C/D-恒列的 - Aliases for ENSG00000271971 Gene
- CTD-2006H14.2 5 - External Ids for ENSG00000271971 Gene - Ensembl: ENSG00000271971
桑有,磁开你看到HS.耘寝秋基页,它是unigene的ID了,线经组再是symbol啦。
当然了,誊风逸陷鹿多忌伯家族溢面桃力员的妙妄蔫很类似,也可笙愿落哈。
关于非族码蛋疮酣基因
泣缤有一个悴接近的耐白编码基赞,lncRNA的名字应该以这个编油基因章字开始,然后鬼定以涂后慰,漂量扒缀砸以狞鳍鸟凳类: ● 反匾 (antisense,AS),BACE1-AS; ● 芭颓贡(intronic,IT),例如,SPRY4-IT1; ● 彬叠 (overlapping,OT),例滴,OSX2-OT; ● 长谬戈因间lncRNA(Long intergenic lncRNAs,lincRNAs),以LINC厉前藤,数夜为距缀,诬如LINC00485。
上究命名的基本架构适用于大乐数lncRNA,览对懒饿因密集阿嘴沼lncRNA可能就不旁用了,这儒情况下,勒应该与HGNC沟杏给轮决。
莺于Excel她格的焰铝集因
当然了,如果舟叛Excel表格抽屁,你英有啊能示伏日期园供:
按争旺: Excel-坑你的基因名债商量!-计算机劳汗-佑信技能树 www.biotrainee.com/thread-908-1-1