1. 软件下载和安装(略)

2.准备数据集

 使用excel准备数据集(这里用的是R语言对芯片数据或者测序数据进行差异分析的结果),如下

DEG数据集

 左边为基因转化好的基因symbol,右边一列为排序的值,这里为基因差异分析的log2FoldChange值,然后另存为制表符分隔的文本文件。保存后,将其后缀改为**.rnk**这样数据就准备完毕。

3. Load data

 将准备好的preranked数据集以及下载好的.gmt文件(也可以用在线的)加载到软件。

4. GSEA分析

 使用Run GSEAPreranked 工具进行分析。如果数据集有正常载入,就可以在Ranked List中找到准备好的排序的数据集了,然后选择其他参数,点击下方的三角形run按钮,就可以开始分析了。在软件左侧的GSEA reports栏中出现success,表示运行结束,点击success可以查看结果报告了。

结果报告

5. 与使用R语言分析的结果比较

结果比较

ID enrichmentScore NES pvalue Qvalue
R HALLMARK_P53_PATHWAY -0.3621396 -1.574098 0.00152439 0.00441898
GSEA软件 HALLMARK_P53_PATHWAY -0.373905 -1.6437526 0.0 0.007029339

从图和数据结果来看,两者都是比较一致的。

备注:
 R语言的代码学习于jimmy老师github以及b站视频,感谢!

(代码: [https://github.com/jmzeng1314/GSE76275-TNBC/blob/master/step4-anno.R;

视频学习:https://www.bilibili.com/video/BV1dy4y1C7jz)