温馨提醒:如需查询既往“豪斯医生基因数据挖掘专题”推文及视频,请关注“医学方”公众号后点击“精品专题”进入 今天,我们要介绍一个全新的、大名鼎鼎的数据库 Oncomine
为了更加形象地帮大家理解这个词,我们不妨解释为Oncology Mining,顾名思义,就是挖掘肿瘤方面的生物学信息。它结合了TCGA、GEO、ArrayExpress等数据库,经过一系列加工、标准化和分析后汇集而成。这有什么好处?我们平时做的芯片数据往往来自于一个或两个数据集,偶尔会因为样本的批次、平台的差异、实验的条件等因素使结果与我们预期的不一样。而这个数据库,可以让我们站在更高的一个位置来观察所有相关研究的芯片结果,这一点会在这一节讲课中会为大家展示。 另外,据统计,该数据库收集了约500种肿瘤的基因表达和样本数据。意味着无论你是研究什么方向,只要是肿瘤方面的,在这里都能找到属于你自己的菜。最后的最后,告诉大家的是,oncomine可以进行在线分析,这对于我们一些非生物信息学专业的同志们来说是个极好的消息。那废话不多说,我们还是来点实实在在的干货。 首先打开主页: https://www.oncomine.org/resource/login.html 第一步我们就需要进行账号注册,这里需要提醒大家的是,注册过程中需要非营利性机构的邮箱(大学或研究机构),类似QQ、新浪邮箱是不接受的。其他步骤大家只要按照说明依次操作既可。 注册成功后,我们就输入账号和密码,进入下面这个界面。 在页面的左侧红色方框内是我们进行筛选的地方,主要的操作就是在这里完成的。 接下来,我们假设想验证一下EGFR这个因子在脑膜瘤中的表达情况。这时,我们得在下面的红色框内输入EGFR,并点击旁边的“放大镜”。 此时就会跳出右侧这张图,它反应了EGFR在各种肿瘤内的一个表达情况,其中红色代表高表达,颜色越深,则表达越高。蓝色就代表低表达。这个就有点类似我们之前在GEO里面学的热图。但是第一行分别表示的是不同研究中的组织对照的情况,这里分别是癌灶Vs.正常组织,癌灶Vs.癌症,癌灶亚型分析等等。 接下来我们点击上图中箭头所指的地方。得到下面这个界面。表示EGFR在神经系统肿瘤与正常组之间的一个表达情况。 方框一指的是我们的过滤条件,一般默认既可。第二个红色方框表示的是不同神经系统肿瘤与正常组的研究,按照generank由大到小排列。什么是generank?比方说第一个研究的generank为24,也就意味着在该项研究中有23个其他基因比EGFR更具有显著性。 这里由于有很多类型的肿瘤,我们假设只考虑神经胶质瘤,那么我们把所有的GlionlastomaVs. Normal都选上,进行综合分析,如下图。 然后点击compare即可。 可以很容易看到之前我们选的7个研究,EGFR都是表现为高表达的。同样地,我们可以去考察其他的亚型是否能得到相似的结果。 这里小编索性将所有神经系统的肿瘤都纳入进来,可以发现有的研究EGFR表达无明显的统计学差异,颜色上表现为白色。其他则表现为高表达。 好了,今天的内容先介绍到这里。大家是不是觉得非常简单呢?但是由于操作的界面有很多选项,所以建议大家还是自己操作一遍会印象深刻。接下去,小编还会继续跟大家分享这个数据库的其他功能,希望大家再接再厉! 温馨提醒:如需查询既往“豪斯医生基因数据挖掘专题”推文及视频,请关注“医学方”公众号后点击“精品专题”进入 期待下期 医学方已推出“国自然基金申请”“临床数据挖掘”、“基因数据挖掘”、“R语言教程”、“医学统计学”、“微创动物实验培训”等多个专题课程,如需了解课程详细推文,可关注“医学方”公众号,点击“精品专题”进入 想了解“医学方”最新视频课程动态?可登陆腾讯课堂或网易云课堂收看 目前已有课程: (1)医学方|医学统计学公开课|石小白老师教您轻松学统计(公益免费课程) (2)医学方|医学数据挖掘精品课程|豪斯医生手把手教您如何数据挖掘 网易云课堂:http://study.163.com/u/ykt1467466791112 客服电话:15821255568 客服微信:yixuefang1234 温馨提示:医学方还设有专门的讨论群哦~各位明星导师都在群中,可以解答各位的遇到的问题,如有兴趣,可以加客服微信后加入群聊~ 微信公众号: 如果你觉得文章还不错,就请点击右上角选择发送给朋友或者转发到朋友圈。您的支持和鼓励是我们最大的动力。喜欢就请关注我们吧~ 长按二维码 关注我们 本文转载于微信公众号: 基金那点事(jijinnadianshi),更多微信文章请扫描关注公众号: |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|