晶莱生物之DAVID分析
时间:2019-01-25 阅读:2127DAVID(the Database for Annotation, Visualization and Integrated Discovery)(网址http://david.abcc.ncifcrf.gov/) 是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。
在使用DAVID提供的分析工具时,用户需提供基因列表,选择基因背景文件,使用适当的分析工具,提取该列表中含有的生物信息。
对于富集分析而言,一般情况下,含大量基因的列表有更高的统计意义,对富集程度高的特殊terms有更高的敏感度,富集分析产生的p-value在相同或数量相同的基因列表中具有可比性。DAVID为实现各项功能分析,提供了4个分析模块:
1. Functional Annotation:DAVID最核心的分析内容,包含了三个子工具。
①Functional Annotation Chart,提供gene-term富集分析,注释范围包括GO、KEGG,蛋白相互作用、蛋白功能区域、疾病相关、生物代谢通路等超过40种,结果中以基因列表中富集的Terms为对象,按照p-value排列,同时链接指向更多信息。
②Functional Annotation Clustering,基于注释共同出现的程度作聚类,对被注释上的Terms作聚类。分值越高代表该组内的基因在基因列表中越重要。
③Functional Annotation Table实现基因的功能注释,将输入列表中的每个基因在选定数据库中的注释以表格形式呈现。
2.Gene Functional Classification: 基于基因共同的注释信息,采用全新的模糊聚类算法,能够实现将功能相关的基因聚到一起作为一个单元,在生物学网络水平上去研究这些基因群。对聚类结果打分,分值越高,代表该组内的基因在基因列表中越重要。同时还提供了2D View,以热图形式展现聚类到同一组的基因和该组内各个Term之间的关系。
3.Gene ID conversion:实现将不同数据库的基因标识间的转换,包含NCBI,PIR和Uniprot/Swissprot等重要数据库的基因标识信息。
4. Gene Name Batch Viewer:这个工具能够实现将基因ID迅速翻译成基因名称,从而给研究者对于基因ID列表一个直观印象,初步判断基因列表是否符合要求目的。