2018年6月Nature Methods上发表了一篇关于机器学习分析特定基因集内部关系工具的文章,简单来说就是,通常我们做了差异基因分析得到一个基因集合,然后会用GO/KEGG富集进行进一步分析,但是该工具给我们提供了另一种可能,通过对差异基因集进行机器学习训练最终得到部分关键的基因以及基因间相互作用。该工具以网站的形式方便大家使用,目前只支持人的基因集输入,笔者输入数据后的运行结果如下图所示,如果大家感兴趣,下面笔者对文章进行了简单的讲解和对网站平台的使用进行了说明。
image.png
文章名为:《GeNets: a unified web platform for network-based genomic analyses》
该工具源代码github地址:https://github.com/lagelab/quack
网站工具地址:http://apps.broadinstitute.org/genets
GeNets网站平台的框架如下图所示,1.上传数据和训练集;2.训练模型;3.模型比较;4.选择最优模型;5.数据管理、存储、分享等。
image.png
几个不同network的ROC曲线显示,InWeb3的AUC值最大,为0.92,效果很好。
image.png
更加详细的AUC图谱显示,InWeb3相比于其他四个network在730个pathway里效果最好,AUC更靠近1。
image.png
使用神经元相关的pathways更进一步的分析发现,InWeb3的结果相较于其他四个network表现更加突出。
image.png
在专门训练的neurodevelopmental-specific Quack model中,输入的65个ASD相关基因有31个被预测出来有protein–protein interactions,为绿色标识。
image.png
下面来看看该工具的使用方法:
1.首先注册一个账号并登陆,点击下图中间的Start New Gene Set Analysis开始一个分析;
image.png
2.在下图中的①处有两个选择,一个是快速可视化,另一个是需要好费点时间的Pathway分析,这里我们先选择简单的快速可视化;②处选择黏贴基因;③处选择文中AUC最大的InWeb;然后选择开始分析:
image.png
结果如下图所示,少部分有蛋白互作的重要基因被标注出来,点击基因或者两个基因的连线会有相关的信息展示。
image.png
下图部分可以调整基因网络的展示,具体的参数设置读者可以自行更改看看效果;值得一提的是,部分更改时效果过程图非常有趣,笔者单纯为了这个过程动画玩好久!
image.png
在开始的①选择Pathway Analysis时可以进行更复杂的预测,不但会对输入的基因进行打分,并且会建议出新的基因,这些信息同时将会发送到账号绑定的邮箱里。
参考:
https://www.sohu.com/a/240253016_99971433