通过bioconductor包来获取所有的芯片探针与gene的对应关系

现有的基因芯片种类不要太多了!

但是重要而且常用的芯片并不多!

一般分析芯片数据都需要把探针的ID切换成基因的ID,我一般喜欢用基因的entrez ID。一般有三种方法可以得到芯片探针与gene的对应关系。

金标准当然是去基因芯片的厂商的官网直接去下载啦!!!

一种是直接用bioconductor的包

一种是从NCBI里面下载文件来解析好!

首先,我们说官网,肯定可以找到,不然这种芯片出来就没有意义了!

然后,我们看看NCBI下载的,会比较大

http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL6947

这两种方法都比较麻烦,需要一个个的来!

所以我接下来要讲的是用R的bioconductor包来批量得到芯片探针与gene的对应关系!

一般重要的芯片在R的bioconductor里面都是有包的,用一个R包可以批量获取有注释信息的芯片平台,我选取了常见的物种,如下:

  1. gpl organism bioc_package
  2. 1 GPL32 Mus musculus mgu74a
  3. 2 GPL33 Mus musculus mgu74b
  4. 3 GPL34 Mus musculus mgu74c
  5. 6 GPL74 Homo sapiens hcg110
  6. 7 GPL75 Mus musculus mu11ksuba
  7. 8 GPL76 Mus musculus mu11ksubb
  8. 9 GPL77 Mus musculus mu19ksuba
  9. 10 GPL78 Mus musculus mu19ksubb
  10. 11 GPL79 Mus musculus mu19ksubc
  11. 12 GPL80 Homo sapiens hu6800
  12. 13 GPL81 Mus musculus mgu74av2
  13. 14 GPL82 Mus musculus mgu74bv2
  14. 15 GPL83 Mus musculus mgu74cv2
  15. 16 GPL85 Rattus norvegicus rgu34a
  16. 17 GPL86 Rattus norvegicus rgu34b
  17. 18 GPL87 Rattus norvegicus rgu34c
  18. 19 GPL88 Rattus norvegicus rnu34
  19. 20 GPL89 Rattus norvegicus rtu34
  20. 22 GPL91 Homo sapiens hgu95av2
  21. 23 GPL92 Homo sapiens hgu95b
  22. 24 GPL93 Homo sapiens hgu95c
  23. 25 GPL94 Homo sapiens hgu95d
  24. 26 GPL95 Homo sapiens hgu95e
  25. 27 GPL96 Homo sapiens hgu133a
  26. 28 GPL97 Homo sapiens hgu133b
  27. 29 GPL98 Homo sapiens hu35ksuba
  28. 30 GPL99 Homo sapiens hu35ksubb
  29. 31 GPL100 Homo sapiens hu35ksubc
  30. 32 GPL101 Homo sapiens hu35ksubd
  31. 36 GPL201 Homo sapiens hgfocus
  32. 37 GPL339 Mus musculus moe430a
  33. 38 GPL340 Mus musculus mouse4302
  34. 39 GPL341 Rattus norvegicus rae230a
  35. 40 GPL342 Rattus norvegicus rae230b
  36. 41 GPL570 Homo sapiens hgu133plus2
  37. 42 GPL571 Homo sapiens hgu133a2
  38. 43 GPL886 Homo sapiens hgug4111a
  39. 44 GPL887 Homo sapiens hgug4110b
  40. 45 GPL1261 Mus musculus mouse430a2
  41. 49 GPL1352 Homo sapiens u133x3p
  42. 50 GPL1355 Rattus norvegicus rat2302
  43. 51 GPL1708 Homo sapiens hgug4112a
  44. 54 GPL2891 Homo sapiens h20kcod
  45. 55 GPL2898 Rattus norvegicus adme16cod
  46. 60 GPL3921 Homo sapiens hthgu133a
  47. 63 GPL4191 Homo sapiens h10kcod
  48. 64 GPL5689 Homo sapiens hgug4100a
  49. 65 GPL6097 Homo sapiens illuminaHumanv1
  50. 66 GPL6102 Homo sapiens illuminaHumanv2
  51. 67 GPL6244 Homo sapiens hugene10sttranscriptcluster
  52. 68 GPL6947 Homo sapiens illuminaHumanv3
  53. 69 GPL8300 Homo sapiens hgu95av2
  54. 70 GPL8490 Homo sapiens IlluminaHumanMethylation27k
  55. 71 GPL10558 Homo sapiens illuminaHumanv4
  56. 72 GPL11532 Homo sapiens hugene11sttranscriptcluster
  57. 73 GPL13497 Homo sapiens HsAgilentDesign026652
  58. 74 GPL13534 Homo sapiens IlluminaHumanMethylation450k
  59. 75 GPL13667 Homo sapiens hgu219
  60. 76 GPL15380 Homo sapiens GGHumanMethCancerPanelv1
  61. 77 GPL15396 Homo sapiens hthgu133b
  62. 78 GPL17897 Homo sapiens hthgu133a

这些包首先需要都下载

  1.  

下载完了所有的包, 就可以进行批量导出芯片探针与gene的对应关系!

  1.  

参考:http://blog.sina.com.cn/s/blog_62b37bfe0101jbuq.html

原文来自:http://www.bio-info-trainee.com/1399.html

 

发表评论

匿名网友

拖动滑块以完成验证
加载失败