技术资料

IPA--Analysis Match 模块说明

2019-01-20

IPA于近年新增的Analysis Match模块可能很少有人知晓。在当前组学数据越来越多，而IPA的条目摘取主要基于验证性的实验结果，其数据库增长速度远跟不上组学数据的产生速度。Analysis Match模块便是利用来自SRA，GEO，Array express，TCGA等大规模基因组学数据库数据协助IPA分析的新利器，当然由于这些数据的可靠性尚无法和validation实验相提并论，因此暂时还是只能作为一个单独的模块使用。它能够自动发现你提交的IPA Core Analyses是否在生物学结论上和这些数据集相似/相反，从而帮助你通过了解这些研究的背景及其结论协助分析您的实验结果。其方法主要是通过分析结果中的Canonical Pathways, Upstream Regulators, Causal Networks和 Diseases and Functions这些模块结果与数据库中数以千计的实验数据集的Core analysis结果进行相似性比对得到的。

数据来源

Analysis Match约有49000套，来自于SRA, GEO, Array Express, TCGA, LINCS等数据库并进行良好的背景注释的人和小鼠疾病和肿瘤数据集。

结果查看方式

Analysis Match结果以表格形式呈现，并以一个总体相似度分数从高到低排列。

如下图举例

结果表格的最后10列，依次列出了CP（canonical pathway）、UR（upstream regulator）、（Causal Networks）和DE（Downstream effect也就是disease or function）的z-score，4个分析模块综合z-score，以及p-value，4个分析模块综合p-value的结果。

前面的各列则依次列举了相应数据集的来源及实验设计。

在选择感兴趣的数据集（可多选）后，上方工具栏按钮的view as heatmap和view comparison，则可以查看具体各个分析结果的相似性。