kl800.com省心范文网

基于粗糙集的属性约简优化算法研究


维普资讯 http://www.cqvip.com 第2 4卷第 2期 20 0 8年 4月  苏 州 大 学 学 报( 自然 科 学 版 )  Vo. 4 No 2 12  . Ap . 0 8 r20 J UR LO UZ O  N V R IY( A U A CE C  DTO  O NA  FS H U U I E ST N T R LS I N E E II N) 基 于 粗糙 集 的属 性 约 简优 化 算 法 研 究 丁卫平 邓 伟 管致锦 , , (. 1 南通大 学 计算机科学与技术 学院, 江苏 南通 2 6 1 ;. 2 0 92 苏州大学 计算机科 学与技术学院 , 江苏 苏州 2 50 ; 10 6 3 南京航空航 天大 学 信息科学与计算机 学院, . 江苏 南京 2 00 ) 10 3 摘 一 要: 属性约简是粗糙集理论 中一个核心研究 问题 , 在对粗糙集 中属性约简相关理论研究 的基础上 , 出了 提 种新 的基 于属性重要性和依赖性相结合 的 G N E — R WT E R D G O H属性 约简算法. 通过 C I 并 U 机器学习数据集 测试实验 , 验证 了该算法的有效性 .  关 键 宇 :粗 糙 集 ; 性 约 简 ; 性 重 要度 ; 据 挖 掘 属 属 数 中图分类号 : P 0 . T 3 16 文献标识码 :  A 文章编号 : 00— 0 3 20 )2— 0 2— 5 10 2 7 (0 8 0 0 5 0 0 引 言  粗糙 集 ( og e ) 论 由波 兰数 学家 Pwa R uhSt 理 s al k于 18 首 先提 出 , 9 2年 由于其 思想 新颖 、 方法 独 特 , 已成 为 近 年来获 得飞速 发展 的数据 挖掘有 力工具 , 它提 供 了一套严 格 处理 知识 发现 中基 本 分类 问题 的数学 方法 .  粗糙 集理 论不需 要先 验知识 , 即可 发现数据 中蕴 涵 的知识模式 , 在保 持分类 能力 的前提 下 , 通过 对属性 和属性 值 约简获 取最小 的规 则集 , 获取 的规则 易于被 专家解 读说 明 j 且 .  所谓 属性 约简 , 是在保 证属性 库分 类能力 不变 的条件 下 删除 其 中不相 关或 不 重要 的冗 余属 性 . 就 它不 仅不会改 变决 策表 的分类或 决策能 力 , 而会提 高系统 潜 在属 性 的清 晰度 . 反 它不 但能 处理 模 糊类 的数 据 和不 完整数据 , 而且 也能从 数据 库 中发 现异常 , 排除 噪声 干扰 , 是粗糙 集 中重要 的约简算 法往往无 法保证 约简结 但 果 的完备 性和 最小 约简集 , 在数据 挖掘 时空 间开销较 大和 时间复杂 度较 高 , 简效率不 高 j 约 .  本 文在对 粗糙集 属性 约简相关 理论 研究 的基 础上 , 出 了一种 新 的基 于属 性 重要 性 和 依赖 性 相结 合 的 提 GENRED — G O H属性 约简 算法 , 通过 C I 器学 习数据 库 中相关 属性 约简实 验 , 该算法 的有效性 . R WT 并 U机 验证  1 粗 糙 集 基本 理论 1 1 基 本 定 义 . 定 义 1 信息 系统 ) 信息 系统是 有序对 S=( , d} , 中 是 非 空有 限集 合 , 为全 域.A是非

赞助商链接