之前小编曾给大家推送过一篇lncRNA的高分文章, 发表在Cancer cell , 影响因子23, 结合了当前3个研究热点—外泌体、lncRNA和ceRNA,主要讲述肾癌细胞中以外泌体形式转运的lncARSR通过ceRNA的方式调控舒尼替尼耐药性。
整篇文章的研究思路如下:
在lncRNA的一般研究思路中,对lncRNA本身的表达、结构及分布研究极为重要,是后期功能机制研究的基础。其中,lncRNA的编码性预测是很多客户愿意做或者希望做的一部分,它能够进一步确认该lncRNA属于非编码的真实性!
今天小编围绕“如何预测lncRNA的编码性?”这个问题和小伙伴们掰一掰!
首先,小编浏览了几篇lncRNA高分文章,发现关于这个问题,大牛们都是这样做的:
1. Cell Stem Cell + 肝癌干细胞 + 自我更新 + lncTCF7
2. Cancer Cell + 肾癌 + 耐药性 + lncARSR
看完这几个例子,觉得也是蛮简单的,主要有两种方法:基于开放阅读框(ORF)的方法和基于比较基因组分析的方法(CSF/PhyloCSF)。只要学会如何使用ORF Finder、CSF和PhyloCSF,不就OK了。ORF Finder比较简单,也比较常用,这里就不赘述啦。PhyloCSF是在CSF的基础上引入进化模型的值。目前主要以PhyloCSF值来评估lncRNA的编码性,今天主要来看看PhyloCSF是如何操作的。
那什么是PhyloCSF?
PhyloCSF是一种区分蛋白质编码区和非编码区的比较基因组学方法。它基于系统发生密码子模型的一个正式统计比较, 分析一个多物种核苷酸序列比对以确定它是否可能代表了一个保守的蛋白质编码区。
那么复杂!!听不懂呐!!简单点,说话的方式简单点!说人话!
额…….....就是PhyloCSF可以用于开放阅读框(ORF)和外显子的比对。PhyloCSF输出值为正则表示保守编码区,若为否则表示非编码区。具体见网站:https://github.com/mlin/PhyloCSF/wiki 。
那到底该如何使用呢?网站提供两种方法:
1. 第一种:软件常用模式,下载安装使用。但PhyloCSF只适用于Linux 和 Mac OS X系统,安装及操作过程繁琐,适合部分有生信计算机基础的人群使用。
2. 第二种:一种替代性方法,借助于UCSC直观查看lncRNA的编码性情况,适用于大部分人群,操作简单方便。
接下来,咱们就以上文中lncTCF7为例,来看一下具体如何操作………..
lncRNA名称:WSPAR(WNT signaling pathway activating non-coding RNA)或lncTCF7或TCONS_00009511-XLOC_004555(同一个lncRNA往往有多个名称)
lncRNA大小:683nt
lncRNA位置:Chr5: 133,913,677-133,917,269
操作过程:
1. 首先,打开UCSC(http://genome.ucsc.edu/),选择人的基因组(hg38),
2. 后下拉鼠标,点击“Track hubs”按钮,
3. 进去之后,选择“My Hubs”,
4. 在URL框内输入http://www.broadinstitute.org/compbio1/PhyloCSFtracks/trackHub/hub.txt,然后点击add hub,
5. 然后,1-2秒后会自动弹出UCSC主页,选择hg38,点击GO,
6. 在搜索框内输入WSPAR(也可以输入该lncRNA的位置),然后点击GO,
7. 弹出如下页面,选择第一条点击进入,
8. 点击完成后,网页会显示WSPAR的PhyloCSF值,大家可以看出来,在WSPAR上所有的值都是小于0的,即没有编码保守型。
此外,除了lncRNA外,还有另一种长链非编码RNA——circRNA,它和lncRNA不同,有研究表明部分circRNA是具有编码功能的,那如何查看具有编码性功能的circRNA,可在circRNAdb(http://reprod.njmu.edu.cn/circrnadb)中查看,但只限于人这个物种。以hsa-circ_00001为例查阅,会得到整体信息和细节信息,细节中包括对该circRNA编码性情况。
第一部分:整体信息
第二部分:细节信息(核酸序列、IRES序列元件、ORF等信息)
好啦,今天关于lncRNA编码性的问题就介绍到这儿,有兴趣的小伙伴可以试一试非常简单!当然,可以借助多种方法评估lncRNA的编码性,得到的结论更可靠!