GEO生信数据挖掘(十)肺结核数据-差异分析-WGCNA分析(900行代码整理注释更新版本)

通过 前面十篇文章的学习,我们应该已经可以获取到一个”心仪的基因列表“了,相较于原始基因数量,这个列表的数量已经有了明显的缩小,为了进一步确定Hub gene 需要借助两个工具。

使用STRING在线数据库进行PPI分析。

使用Cytoscape本地客户端进行蛋白互作关系图绘制。

视频讲解

STRING在线数据库进行PPI分析

https://cn.string-db.org/

STRING在线数据库(STRING: functional protein association networks:https://cn.string-db.org/)

准备好自己感兴趣的gene list 整个这列复制一下,STRING也支持导入文件。

STRING 操作第一步界面

看图有操作说明

也可以选择自动(auto-select),数量多的话,点击SEARCH后,第二步也会提示,选择物种。

第二步的界面

可以看看基因,没问题,点击CONTINUE

第三步界面 出现结果

一般会用到 Settings 和Exports

Setting设置看图,调整完毕后,点击UPDATE更新结果。

结果导出

用Cytoscape自己调整图 导出TSV数据文件

使用Cytoscape本地客户端进行蛋白互作关系图绘制

TSV文件已经从STRING数据库中下载保存完毕。

安装Cytoscape 需要配置java环境

不同版本对应的java版本有要去(本文使用Cytoscape3.10,jdk-17_windows-x64_bin,总计369M的压缩包,链接: https://pan.baidu.com/s/19gjKs9w6TM2ylXxupA5ykw” />

导入文件

设置列

初步图形生成

先删除孤立节点(可以配合Ctrl 键进行操作)

首先进行数据网络分析

选中数据,Tool,analyze Network,

可以再次观察,下方的数据区域(Node Table),增加很多信息,我们最关心的是degree列,degree数据列值越大,那么说明,对应基因越重要,有更多的基因连接到了目标基因。

基因样式设置

style -> shape -> 圆形

设置圆形的样式,并勾选,锁定节点的长宽

节点的大小设置

让节点的大小和degree 关联起来。

观察TP53基因,大小明显改变,且是最大的。

节点的形状太小,把size 的下限提高。

节点的颜色设置

让节点的颜色和degree 关联起来。

设置Fill Color

degre越大则颜色越深,反之,则越浅。(设置方法,同理)

基因选择

可以鼠标选择图中的节点,配合快捷键

还可以在Node Table 列表中进行选择基因名称,然后右击鼠标,功能菜单中选择图中的节点。

基因节点的排列样式

目前,节点已经设置完毕,边可以根据需要继续设置,方法类似。

现在图形的样式排布比较随意,可以将节点按照环形,或者方形进行排列。

Layout ->Grid layout

可以选择部分节点,也可以直接对所有节点进行操作。

设置环形结构

复杂的环形结构排列

上面形状有了,但是由于本例中节点的数量的太多,还可以继续美化。

选择degree前10个基因先绘制一个圆形,再绘制其他基因。可以迭代多个圆形。

选择了三组degree 分段后的基因,生成了三个圆形,下面进行排列

使用 Layout Tool 进行图形排列

打开layout Tool

调整scale 放大缩小,可以调整圆环的距离。

如果缩小至最测了,仍然需要缩小,可以点击重置比例。比例又会回到1。

最终调整完毕

导出文件

可以导出session项目文件,后续可以继续编辑,可以导出图片,再论文中使用。

视频讲解

以上绘图共做就完成了,SCI 指日可待。