kl800.com省心范文网

基于粗糙集的属性约简优化算法研究


维普资讯 http://www.cqvip.com 第2 4卷第 2期  20 0 8年 4月   苏 州 大 学 学 报( 自然 科 学 版 )   Vo. 4 No 2 12   .  Ap . 0 8 r20  J UR LO  UZ O   N V R IY( A U A  CE C   DTO   O NA   FS H U U I E ST N T R LS I N E E II N) 基 于 粗糙 集 的属 性 约 简优 化 算 法 研 究  丁卫平  邓  伟  管致锦  , , (. 1 南通大 学 计算机科学与技术 学院, 江苏 南通 2 6 1 ;. 2 0 92 苏州大学 计算机科 学与技术学院 , 江苏 苏州 2 50 ; 10 6  3 南京航空航 天大 学 信息科学与计算机 学院, . 江苏 南京 2 00 ) 10 3  摘 一 要: 属性约简是粗糙集理论 中一个核心研究 问题 , 在对粗糙集 中属性约简相关理论研究 的基础上 , 出了  提 种新 的基 于属性重要性和依赖性相结合 的 G N E — R WT E R D G O H属性 约简算法. 通过 C I 并 U 机器学习数据集  测试实验 , 验证 了该算法的有效性 .   关 键 宇 :粗 糙 集 ; 性 约 简 ; 性 重 要度 ; 据 挖 掘  属 属 数 中图分类号 : P 0 .  T 3 16 文献标识码 :   A 文章编号 : 00— 0 3 20 )2— 0 2— 5 10 2 7 (0 8 0 0 5 0  0 引  言    粗糙 集 ( og e ) 论 由波 兰数 学家 Pwa R uhSt 理 s al k于 18 首 先提 出 , 9 2年 由于其 思想 新颖 、 方法 独 特 , 已成 为  近 年来获 得飞速 发展 的数据 挖掘有 力工具 , 它提 供 了一套严 格 处理 知识 发现 中基 本 分类 问题 的数学 方法  .   粗糙 集理 论不需 要先 验知识 , 即可 发现数据 中蕴 涵 的知识模式 , 在保 持分类 能力 的前提 下 , 通过 对属性 和属性  值 约简获 取最小 的规 则集 , 获取 的规则 易于被 专家解 读说 明 j 且 .   所谓 属性 约简 , 是在保 证属性 库分 类能力 不变 的条件 下 删除 其 中不相 关或 不 重要 的冗 余属 性  . 就 它不  仅不会改 变决 策表 的分类或 决策能 力 , 而会提 高系统 潜 在属 性 的清 晰度 . 反 它不 但能 处理 模 糊类 的数 据 和不  完整数据 , 而且 也能从 数据 库 中发 现异常 , 排除 噪声 干扰 , 是粗糙 集 中重要 的约简算 法往往无 法保证 约简结  但 果 的完备 性和 最小 约简集 , 在数据 挖掘 时空 间开销较 大和 时间复杂 度较 高 , 简效率不 高  j 约 .   本 文在对 粗糙集 属性 约简相关 理论 研究 的基 础上 , 出 了一种 新 的基 于属 性 重要 性 和 依赖 性 相结 合 的  提 GENRED — G O H属性 约简 算法 , 通过 C I 器学 习数据 库 中相关 属性 约简实 验 , 该算法 的有效性 . R WT 并 U机 验证   1 粗 糙 集 基本 理论  1 1 基 本 定 义  . 定 义 1 信息 系统 ) 信息 系统是 有序对 S=( ,  d} , 中  是 非 空有 限集 合 , 为全 域.A是非

赞助商链接