您当前的位置:
首页 > 文献资料
所属专业:
k-d树文献资料
-
一种快速自动分析流式数据方法研究
目的:流式数据分析的主要过程是对样本数据中的细胞进行类群划分。针对传统人工分析数据方式的缺点,提出一种快速自动数据分析方法。方法不同于人工二维逐次投影设门分析方法,该方法基于冗余的K-means聚类结果,通过同类细胞亚群合并方式实现多维流式数据直接分析。针对流式数据的特点,提出核密度估计初始化类群数目和k-d树优化算法效率。对冗余的聚类结果,提出两段回归拟合算法确定优分类。结果分析实验1数据的误判率为0.0736,分析时间为2 s;分析实验2数据误判率为0.0805,分析时间为1 s。结论相比基于概率聚类方法和非概率聚类方法,该法不仅能快速对多维流式数据进行直接分析,且分析结果更准确,误判率更低。