您当前的位置:
首页 > 文献资料
所属专业:
图心文献资料
-
对基因组内不同序列分布差异进行量化的探讨
目的 针对DNA词频分析中序列分布问题,探讨对基因组内不同序列的分布差异进行量化的可行性.方法 该研究采用数值模拟的方法对Kolmogorov-Smirnov检验的统计量和累积概率曲线下图形的图心进行了比较.结果 随着样本含量的增加,两个指标的离散趋势逐渐减小,但其集中趋势并没有受到明显影响,且不同的分布集中于不同的位置;当样本含量为100时,所能判别的小统计量差异约为0.1,图心差异约为0.02;使用统计量指标时,需采用两个基准分布才能将5个待测分布分开,而图心指标可以直接将5个待测分布分开.结论 两个指标都可以看作分布差异的量化指标,但在大多数情况下样本含量应该大于100;当需要在同一坐标系表示不同分布时,图心可能是一个较好的选择.
关键词: 基因组序列 分布差异 Kolmogorov-Smirnov检验 图心 数值模拟