MetDNA -基于代谢反映网络的大规模代谢物结构鉴定新算法
2021-09-10

解决库和数据质量不足的难题

    利用KEGG数据库提供的代谢物反应对(RP,reaction pair)构建网络,对标准二级谱图库进行递归式的二级谱图外延。



获得反应对(rp

    直接从KEGG数据库中检索所有的rp(9603个rp和7639个代谢物。

image.png

构建反应物网络 (MRN)

    提取反应对两端的代谢物信息,进一步生成代谢反应网络(MRN)。在MRN中,一个节点代表一个代谢物,通过一条线连接的两个代谢物代表反应配对的邻近代谢物。

基于代谢物反应网络进行二级谱图外延

image.png

    处于同一反应对两端的代谢物具有类似的结构其二级谱图也会有一定的相似性同时,反应的存在对结构相似的代谢物做了进一步限制。

    基于自建库、METLINNIST公共库,对其二级谱图进行分析得出在代谢物反应网络(MRN)中相邻的代谢物(即属于同一反应对RP)的二级谱图相似性大于等于0.5的数量超过了50%。表明反映对中相邻代谢物的二级谱图具有相似性。

image.png


基于代谢物反应网络(MRN)的递归算法

第一轮匹配

    利用样本中已经鉴定出的代谢物作为种子。将采集到的二级谱图与标椎二级谱图进行匹配(匹配时需同时考虑:母离子m/z、保留时间RT和二级谱图),构成种子库

第一轮外延

    根据第一轮匹配结果,将第一轮匹配到标准二级谱图的实验二级谱图作为标准二级谱图外延给其在代谢物网络中相邻代谢物。同时,根据相邻代谢物的信息理论预测其母离子m/z,色谱保留时间RT,以实现区分同一已匹配代谢物的不同相邻代谢物。

image.png

。。。递归。。。

image.png

metDNA进行代谢物注释的工作流程

随着二级谱图的外延,匹配代谢物数量逐渐放缓增长,即可终止递归。

image.png

该算法的最大特点是可以通过代谢反应网络去鉴定没有标准MS/MS谱图的代谢物,使得代谢物的结构鉴定并不依赖很大规模的标准MS/MS数据库


MetDNA分析的准确性验证

    采用化合物标准品对MetDAN的鉴定结果进行验证,TOP3的注释正确率皆可达到75%以上。(TOP3的注释正确率意为:对未知代谢物给出的前三可能性的候选注释中存在正确注释的概率)

image.png


参考文献:

Shen X, Wang R, Xiong X, et al. Metabolic reaction network-based recursive metabolite annotation for untargeted metabolomics[J]. Nature communications, 2019, 10(1): 1-14.