现代电子技术

2018, v.41;No.521(18) 88-91+95

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

一种行业领域词库标识树的正确性检测算法研究
Research on correctness detection algorithm for thesaurus identification tree in profession domain

张志强,王伟钧,杨晋浩,周晓清,郑加林

摘要(Abstract):

在知识挖掘应用中,行业领域数据识别是知识挖掘的重要过程。对大量的行业领域数据进行数据识别需要借助领域词库标识树来完成,而影响数据识别准确率的重要因素是领域词库标识树构建的正确性。领域词库数据量一般很大,以其构建的领域词库标识树结构复杂,在复杂结构的标识树中通过已有的检测方法判断其正确性往往很困难。为了解决这个问题,提出一种词库标识树的正确性检测算法。该算法通过构建词库特征向量空间矩阵,计算树节点的相关性系数来自动检测树节点构建的正确性,同时可以根据判定阈值来确定正确性判定范围。实验结果表明,无论树结构如何复杂,该算法都能高效准确地实现标识树的正确性检测和发现错误。

关键词(KeyWords): 词库标识树;正确性检测;特征向量空间矩阵;相关性系数;知识挖掘;数据识别

Abstract:

Keywords:

基金项目(Foundation): 四川省教育厅理科项目(15ZB0390);; 成都市科技局项目(2015-RK00-00201-ZF;2015-RK00-00202-ZF)~~

作者(Author): 张志强,王伟钧,杨晋浩,周晓清,郑加林

DOI: 10.16652/j.issn.1004-373x.2018.18.020

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享