自我们首次发布MetMap分析以来,已经过去将近9个月的时间啦,那么在这过去的一年时间里面,KEGG有什么新变化呢?MetMap又有哪些变化呢?接下来,我们来给大家仔细盘点一下。
本篇文章核心内容如下:
1.KEGG数据库截止到2024年7月23日数据库物质增加,植物代谢通路无新增;
2.NCBI上2024年植物代谢通路文章达到6000+篇,但是未登记入KEGG数据库,使用受限;
3.植物广泛靶向®代谢组2024年上半年升级完成检出突破新高,最高检出达到4000个物质;
4.MetMap通路条数新增30条,目前已累计有60条,物质总数达到2800+,相当于KEGG目前通路物质数的43.7%,是KEGG数据库2023-2024年一年新增的11倍以上;
5.MetMap的两种应用方案获认可,通路中虚线不用担忧,可为基因筛选提供思路;
1.KEGG数据库最新情况分析
截至到7月23日,KEGG在过去的一年内对数据库内的物质以及通路等均进行了更新,对于更新我们的重点主要放在植物相关通路。对KEGG官方网站上展示出来的更新记录进行分析,我们发现KEGG在过去一年内数据库内物质数量增加248个物质,但是在植物代谢通路上没有新增。
过去一年新增的代谢通路情况如下(KEGG官方更新记录):
我们可以看到新增的通路主要偏向于人、微生物类型的较多,其中涉及到植物的通路主要是今年6月份更新的两条,但是这两条的更新记录为更名(这里也可以说明,老师如果前后两次做分析刚好卡在更新的时间节点上,也会出现不同通路名的情况属于正常情况),而没有相关通路新增。
2.NCBI植物通路研究文章
我们以关键词“plant pathway”在NCBI上面进行相关文章检索,在2024年所有涉及到该关键词的文章总共包含6774篇。这些文章中包含综述、研究性、评论等类型的文章。
从中筛选一篇研究型文章进行分析,研究结果绘制了番茄中生物碱合成的部分通路,我们将通路中的所有物质在KEGG中进行检索,无法找到任何一个物质的记录,而这篇文章发表的时间为2023年,这也表明虽然KEGG目前包含了很多通路,但是对于植物通路的记录比较有限,这也会限制我们拿到代谢组和转录组学多组学或单一组学结果的分析。
3.植物广泛靶向代谢组数据库和检出物质数5年更新情况
今年上半年,我们再次完成对植物广泛靶向®代谢组数据库的升级,本次数据库升级至35000+个物质,其中超过33000+种均为次生代谢物。
数据库的升级必然会伴随着检出的增加,利用最新版本的数据库对不同类型的样本进行检测,检出的物质范围在1000-4000种,相较于去年,我们的检出又有了提升;除了检出以外,在鉴定准确性高的物质数量方面,我们也有了显著的提升,Level1(检测准确性90%以上)的物质平均检出可以达到600+种,最高可以达到900+种。
那么对于每年在数据库扩大和物质数检出提升的植物广靶®来说,目前的KEGG数据库显然已经无法满足物质注释和通路富集分析的需求了。
4.MetMap通路图现状
迈维在2023年10月份首次发布了自主建立的特色分析内容MetMap,在过去的这9个月了,这项工作的升级也一直在进行中。而于7月5日,迈维再次对通路图进行升级,后续结果交付中老师们会拿到更多的通路图。本次新增的通路也扩大了物质类型,覆盖黄酮、萜类、生物碱、香豆素等物质类型,为物种专属通路的绘制提供了便利。
除了通路图条数的增加很重要以外,更加重要的是通路上新增物质数的多少,因为如果通路图条数很多,但是各条通路图之间的交集也非常多的话,利用起来也是非常有限的,截至到目前为止,MetMap在KEGG现有通路物质的基础上新增超过2800种物质,占2024年KEGG通路物质数量的比例超过43.7%,是KEGG数据库2024年新增物质数的11倍以上。
5.MetMap在文章中的应用方式
虽然通路图千种好,但是不能利用起来就是没有任何价值的,那么我们如何在分析或文章中利用这个分析内容呢?
1.这张图的形式与KEGG通路图较为类似,因此可以直接将这张图替代原本的KEGG通路图直接放入文章,然后参照我们之前分享过的关于通路图的描述方式进行描述即可。
可以达到给文章新增亮点:物质更新颖,通路更新颖。
2.作为我们自己绘图的模板:将重点关注的物质提取出来,可以极大程度的减少复杂通路的构建工作。
也可以达到物质注释更多、物质注释更特异、基因注释更丰富,一次解决多组学研究三大难题。
老师拿到图形可能会有点疑问,通路图上面有存在虚线,这些怎么用?其实我们在文章阅读的过程中会发现,很多文章的通路图都同时包括实线和虚线,因为虚线并不代表不具有参考性,虚线的物质推测也非常有助于我们对于参与功能的基因进行筛选。例如,2024年5月11日发表在Nature Communication上面一篇关于茶枝柑中黄酮合成的研究文章中也同样存在非常多的虚线,而这些虚线则恰恰给了下一步研究的基因筛选思路。
Wen et al. Nat Commun. 2024 May 11;15(1):3991.
那么有的老师可能就会问了,要做这个分析内容,有什么要求吗?目前我们针对新项目不加收任何费用,在交付数据的同时已经完成此项分析,是不是很心动?迈维基于代谢(Metabolic)和通路(Map)自主创新构建的新一代通路MetMap,欢迎您来咨询。