一、数据下载
打开GEO,选择GSE17538 数据,然后下载MINiML。
二、格式转化
然后导入GEO_Convert.exe 工具。
导出样本信息数据和数据矩阵。
三、格式修改(可以防止踩大坑)
利用excel打开样本信息文本。
坑1:建议将将要用到的时间列和状态列名字改短。否则在工具中打不开。overall_event、overall survival follow-up time。
坑2:GEO的数据中一般是利用0代表 生存,1代表死亡。但是有些数据不是这样的,所以这里需要对death和no death 进行替换。否则会报错。
坑3:最大的坑就是某些特殊符号。这个时间列和状态列存在特殊符号比如;、,等。这些都是特殊符号需要替换掉。建议如果没有多次随访信息,直接替换掉全部特殊字符。
最后处理之后的表格:
然后保存,进入最后的生存分析部分。
四、生存分析
打开生信人小工具生存分析
导入表达数据和样本信息。
选择数据来源为GEO(默认也是GEO,请忽略截图)
然后选择状态列为stat列(0,1)
时间列选择为os-time(主要选择时间单位年、月、日)
然后点击导出结果。
然后导出表格如下,看到是不是很亲切,是的,这个表格可以放在文章里的。然后细心的童鞋会
发现这里已经按照P值进行过排序了(拿走,不写)。
另外软件中可以交互的看每个基因生存分析的关系。
这个图同样可以导出矢量图,可以自主调整颜色放在文章里的。