现代电子技术

2018, v.41;No.504(01) 117-119+124

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

一种基于Hadoop架构的并行挖掘算法研究
A parallel mining algorithm based on Hadoop architecture

曾俊

摘要(Abstract):

基于Hadoop架构,提出一种并行的决策树挖掘算法实现大数据集间的知识挖掘。通过MapReduce并行编程模式实现Hadoop架构下SPRINT并行挖掘算法的频繁项集,解决了大数据集挖掘效率低下,时间消耗量大的问题。SPRINT算法通过对原始数据集进行划分,并将分块数据发给不同Map进程并行计算,使系统存储和计算资源得到有效利用,运用MapReduce各计算节点将挖掘结果数据汇聚,减少中间结果数据量,使并行挖掘时间显著减少。SPRINT算法并行化实验表明,Hadoop架构下的SPRINT并行挖掘算法具有良好的可扩展性和集群加速比。

关键词(KeyWords): 挖掘算法;Hadoop架构;SPRINT;并行化;决策树;MapReduce

Abstract:

Keywords:

基金项目(Foundation): 重庆市教委科技项目:Hadoop架构下大数据的并行挖掘研究(KJ15012021);; 春晖计划项目:物联网智能农业平台下大数据的初步应用(S2016038)~~

作者(Author): 曾俊

DOI: 10.16652/j.issn.1004-373x.2018.01.026

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享