粗糙集理论的最新应用_王宗军

统计与决策!""#年$$月(下)

!引言粗糙集%&’(理论是一种刻划不完整性和不确定性的数学工具)能有效地分析和处理不精确、不一致、不完整等各种不完备信息)并从中发现隐含的知识)揭示潜在的规律。$*+!年,以波兰数学家,-./-0为代表的研究者在研究不精确、不确定性及不完全知识表示和分类的基础上首次提出了粗糙集理论。$**$年,-./-0教授出版的第一本关于粗糙集的专著1$2和$**!年’/3.45604&主编论文集1!2的出版)推动了国际上对粗糙集理论与应用的深入研究。$**!年在波兰74809:召开了第一届国际粗糙集合研讨会)这次会议着重讨论了集合近似定义的基本思想及其应用和粗糙集合环境下的机器学

习基础研究)从此每年都会召开一次以粗糙集理论为主题的

国际研讨会。从而推动了粗糙集理论的拓展和应用。另外,国际上还成立了粗糙集学术研究会)参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家。目前粗糙集理论已成为人工智能领域中一个较新的学术热点)引起了越来越多科研人员的关注。

"粗糙集理论的最新应用

粗糙集理论具有较强的实用性)从诞生到现在虽然只有

十几年的时间)但已经在许多领域取得了较好的成果。文献1;2曾介绍了粗糙集理论在股票数据分析,

模式识别,地震预报,冲突分析,知识发现,粗糙控制,医疗诊断,专家系统,人

普通参数方法时&!值为"<=>=,而使用半参数方法时&!值为"<++>)即半参数方法的拟合度更好,另外根均方误差从普通参数方法的"<$!=降到了半参数方法中的"<">+,由此更能够看出半参数方法相对于普通半参数方法的优势。

#$$结论

在?8@354A 价格方程的估计中,由于普通参数方法的限制,许多相关属性变量不能够被很好地拟合,如文中参数方法中直接将函数线性化处理,这是一种很粗糙的近似,势必会造成对原方程估计的不精确,而半参数方法则能比较好地解决这些问题。本文使用参数和半参数两种方法对“亿房网”中的数据进行了实证分析,从得出的结果可以看出半参数方法的优势性,比如&!

值的提高,

说明半参数方法比普通参数方法对数据的拟合度更好,另外根均方误差也下降了;+B ,说明了参数方法的精确性。因此,对?8@354A 价格方程来说,使用半参数估计效果更好,另外,对经济学中其它一些耐用品的估计计算,用这种方法也同样适用。

参考文献:

1$2C948/,-086

@4A86.4G?-5CLL/4A-G435G3,M<’1N2

!""!<1!2S4//85)7<)T

98/-G43545I3E645W ,94A86D3E95-/3H &8-/Q6G-G8X45-5A8-5@QA353R4A6)!""$,

!;($)Y#Z;"<1;2,-[/3[)C<\<’L-A8Z]-9F45W &8W9866435M38H4A485G6Y C ’8R4Z

L-9-R8G94A CLL93-A?CLL/48@G3&8-/Q6G-G8^-908G61D2<&8-/

Q6G-G8QA353R4A6)!""",

!+(!):!_*Z!+;<1_2I393.4G:)D<‘<)-5@V

3H ’45W/8ZJ5@8a ^3@8/6.4G?\46A98G8M3[-94-G861D2<

D3E95-/3H

G?8CR894A-5’G-G46G4A-/C663A4-G435)$**=,

*$:$=;!Z$=_"<1#2胡舒合)潘光明等<误差为线性过程时回归模型的估计问题1D2<

高校应用数学学报)!"";)$+%$(<

1=2陶本藻<自由网平差与变形分析1^2<武汉:

武汉测绘科技大学出版社)!""$<

1>2柴根象,

洪圣岩<半参数回归模型1^2<合肥:安徽教育出版社,$**#<

(责任编辑b 亦

民)

摘要:粗糙集理论是一种较新的软计算方法,是分析和处理不完备信息的一种有效工具。结

合最新文献分析了粗糙集理论的最新应用情况)并对粗糙集理论今后的研究方向进行了展望。

关键词:粗糙集;属性约简;规则提取;数据挖掘中图分类号:c!*

文献标识码:C

文章编号:$""!Z=_+>(!""#)$$Z""!>Z";

粗糙集理论的最新应用

王宗军,李红侠,邓晓岚

(华中科技大学管理学院,武汉_;"">_)

基金项目:国家自然科学基金(>"!>!";;)资助项目!>

工神经元网络,决策分析等中的具体应用,目前有关粗糙集理论的最新应用主要包括以下几个方面。

$%$数据挖掘与规则生成

数据挖掘与规则生成是粗糙集理论在实际中最主要的应用。由于粗糙集理论能够搜索数据的最小集合&可以使用定性与定量的数据&并从数据中产生决策规则集合等优点而在这方面得到了广泛的应用。最新文献中介绍这方面应用的文章很多,主要包括网络应用方面、管理科学领域的应用方面、医疗诊断等等,其具体应用情况如下页表$所示。

$%!决策评价

利用粗糙集理论还可以进行决策评价,以给决策者提供正确的决策意见。文’$()、’$*)介绍了有关绿色评价的理论。文’$()应用粗糙集原理&提出了粗糙集综合绿色度评价法,以提高零件制造工艺绿色度评价的客观性,并阐述了该方法的原理及运用该方法进行综合评价的步骤&给出了求评价指标权

重的+,实现;文’$*)则提出了基于粗糙集的

供应商绿色评价理论,在该理论指导下对贯

穿于供应商评价与选择全过程的评价指标进

行“绿化”,运用粗糙集理论细化并量化供应

商绿色评价体系中的评价准则和评价指标,

将复杂的、模糊的、主观的推理评价过程转换

为一连串客观的、量化的、程式化的问题求解

活动,实现对供应商的科学评价和正确选择。

文’$-)则介绍了应用粗糙集理论对烟草化学

性质进行的评价。该文借助于粗糙集理论研

究了烟草主要化学成分对烟草品质的影响程

度&该方法计算简单&结果明了&并且能用数值

形式直接给出各烟草化学成分对品质的影响

程度&达到了直接判别的目的。

$%.故障诊断

故障诊断是一个涉及到有效决策制定的

复杂而困难的问题。根据随时监测到的故障

症状进行及时的系统诊断可以帮助降低系统

停机时间并提高总的生产力。由于错误诊断

知识和经验的本性,诊断结果大部分取决于

决策者在可能错误及现有症状之间潜在关系

的偏好。换句话说,故障诊断就是把可能的错

误按照是否能给工程师提供有效有序完成维

修工作实际优先权的大小进行排序。以前介

绍粗糙集理论在故障诊断中应用的文献很

多,这里不再罗列。目前最新的文献介绍了对

故障诊断可能错误进行排序的基于粗糙集理

论的原型系统’$/)。该新方法利用粗糙集理论

作为过去诊断记录的知识提取工具,目的是

找出一套由该领域专家编码的决策者优先权

的最小诊断规则。通过使用获得的知识,可以

确定故障症状可能错误的顺序。该原型系统

还有积聚诊断知识、自我学习的能力,并且实

证研究也验证了对可能错误排序结果的合理

正确性。

$%0模式识别

粗糙集理论的另一个主要应用就是模式识别功能。文’!")、’!$)介绍了粗糙集理论在该方面的最新应用情况。文’!")介绍了一种粗糙集混合变量的特征选择技术——

—模糊粗糙集,从而可以避免信息丢失并解决数据集的维度问题。该方法可以保持数据集的语义,建立清晰、易读的模糊模型。该工作在复杂系统监测中的应用实验结果表明模糊粗糙选择比常规的熵,123及基于随机的方法更为有效。文’!$)针对在机器视觉应用中比较难以选择模板的问题,介绍了一种构建解决基于相互关系匹配的布尔图像的灰色(或模糊)模板算法,该算法可以为基于相互关系匹配及基于偶然转化的匹配自动构建模板。实验表明该技术具有计算有效性而且优于基于相关关系的方法。

另外还有粗糙集理论在网络用户归类’!!),税务系统决策分析’!.),混合多属性数据中支配属性的确定’!0)等中的应用介绍。

应用

网络应用方面

管理科学领域的应用

医疗诊断文献序号

#

(

*

-

/

$"

$$

$!

$.

$0

$#

主要内容

介绍数据挖掘技术在网络数

据仓库中的应用,并分析了基

于粗糙近似的串联网络转换

器在网络接口中的应用

提出4566算法&实现了不一

致情况下的规则获取和学习

样本的净化处理

介绍粗糙集理论在金融市场

建立交易系统中的应用案例

研究,以帮助投资者找到买卖

股票的最佳时机

介绍了粗糙集理论在财务危

机预测中的应用

应用粗糙集理论分析房产定

价中的一批历史数据,以得出

决策规则

介绍粗糙集理论在实例推理

中的应用

利用粗糙集理论提出一种经

济系统中的相关关系预测法,

并提取出基本相关规则

介绍粗糙集理论在挖掘机动

车辆保单数据中风险规则的

应用

构建了一个基于粗糙集理论

的续保规则挖掘模型

构建了一个基于粗糙集理论

的客户分类规则挖掘模型

介绍粗糙集理论在基于活动

类型选择中的应用,并进行分

类及机会选择预测

通过对专家规则特征的详细

调查分析,得出了诊断规则的

新方法

优缺点

用户利用网络页码接口的类

型可快速找到网络仓库中的

记录

简化样本、适应性强、容错性

高和不易陷入局部最小点等&

能有效处理网络故障诊断中

噪声或不相容的信息,提高诊

断准确率和诊断速度

从数据库中发现了一些潜在

的规则

筛选出了具有较好预测能力

的财务指标,构成了一个财务

预测指标体系

得出了有效的决策规则

可改进传统代表的无效率及

弱点,得出的规则可快速有效

的分析实例问题

不需进行相关性判断、模型识

别和检验&直接从数据出发约

简冗余因素&不会损失信息&可

同时处理定性、定量因素及不

确定因素

可挖掘出其中的风险规则&以

便保险公司针对低风险的顾

客进行营销和服务&从而留住

这些顾客

挖掘出了隐含在这些数据中

的续保规则&找到了续保客户

的描述性特征

挖掘出了隐含在数据中的分

类规则&找到了客户分类的特

征描述

有较高的目标分类能力,可消

去大量的规则,但只能产生一

些很分散的规则,且有可能导

致预测能力的降低

最后得出的归纳规则能准确

代表专家的决策过程

表$粗糙集理论在数据挖掘与规则生成中的具体应用情况!-

统计与决策!""#年$$月(下)

!发展前景

粗糙集理论以其独特的优势正在赢得越来越多研究者的关注%然而它仍是一门十分年轻的学科%还有很多不完善的地方。今后的研究热点主要包括以下几个方面。

!&$大数据集问题

现实中的数据库已经越来越大%如何降低算法的执行效率和复杂度%从众多数据中寻找最有用的数据,是粗糙集理论需要应对的一个挑战。虽然目前这方面已有了一些研究成果,但是还不完善,仍需要进一步研究。

!&!缺失值处理方法

在对样本数据进行处理时%往往会遇到数据丢失的问题%一般把含有丢失数据的信息系统称为不完备的信息系统。造成数据丢失的原因很多%如对数据测量的误差、数据处理和数据获取的限制等等。由于经典粗糙集理论是基于完备信息系统的%为了使这一理论适合于不完备信息系统的处理%需要采用某种方法对缺失值进行处理%建立处理不完备信息系统的扩展粗糙集模型。

!&’高效的约简算法

约简的求解是一个()困难问题%导致()问题的主要原因是属性的组合爆炸。高效的约简算法是粗糙集应用于知识发现的基础%要在令人可接受的时间内获得约简的通常做法是基于启发式知识的约简方法%国内外学者在这方面做了大量的研究%现在尚不存在一种非常有效的方法%因此寻求快速的约简算法及其增量版本这一问题仍是粗糙集理论的研究热点之一。

!&*多方法融合

由于粗糙集在处理数据时存在一定的缺点,因此有必要把粗糙集和其他不确定方法结合起来。目前比较常用的作法是粗糙集和神经网络及模糊集的结合应用。虽然在这方面已经取得了一定的成绩,但是还有很多难点并没有解决,仍需进一步的研究。

!&#连续数据的离散化

因为粗糙集只能处理离散化的数据,而现实中存在的一般是连续型的数据,因此,连续数据的离散化变得极为重要。目前已经有了一些这方面的相关研究,但是这些方法或多或少的都存在一定的缺陷,还没有一种比较公理化的方法。因此该方面的研究仍是今后研究的热点。

"结束语

虽然粗糙集理论产生至今只有十几年的发展历史%但取得的研究成果却令人瞩目。它是一种较有前途的软计算方法%为处理不确定性信息提供了有力的分析手段。粗糙集理论具有广阔的发展空间%今后会在更多的实际领域中发挥作用。

参考文献:

+$,)-./-01&23456789:9683;89<=-/-7>8=973?;8-73@<@5-A349B-9-+C,&D3;B;8=69EF/4.8;G=-B8H<=)4A/<768;7,$II$&

+!,J/3.<@70<2&K@98//<58@9B8=<7<3@74>>3;9:6-@BA3303?->>/<=-9<3@7 -@B-BL-@=873?9682347678979683;M+N,&D3;B;8=69EF/4.8;G=-O

B8H<=)4A/<768;7,$II!&

+’,J4>;>;3P

+*,李千目,戚,张宏,刘凤玉&基于粗糙集神经网络的网络故障诊断新方法+Q,&计算机研究与发展,!""*,*$($")&

+#,U>/M<@5;3456789793H-;0899>3;9JM798H7,!""*,’X:#T’:#IX&

+Y,肖智,张志恒,黄海生&粗糙集理论在企业财务危机预测中的应用+Q,&决策参考,!""*,(’)&

+X,吴国芳&粗糙集理论在房产定价决策中的应用+Q,&技术经济,!""*,(Y)&

+T,N64@:N68V4-@5%WS4:U<-@5Z[>;3-=693 =-78:A-78B;8-73@<@5->>/<=-9<3@+Q,&]P>8;9JM798H7.<96G>>/<=-O 9<3@7,!""*,!Y:’YI:’T#&

+I,刘云忠%宣慧玉%林国玺&粗糙集理论在我国税收预测中的应用+Q,&系统工程理论与实践,!""*,($")&

+$",黄沛%李剑&基于粗糙集的保险风险规则挖掘模型+Q,&系统工程,!""!,!"(#)&

+$$,黄沛%李剑&基于粗糙集理论的续保规则挖掘模型+Q,&上海交通大学学报,!""*,’T(*)&

+$!,刘嘉%梁勇勇&基于粗糙集理论的客户分类规则挖掘模型+Q,&甘肃科技,!""*,!"($")&

+$’,R;-@0^<9/3P%V-@7W<@B8H-@7&W68->>/<=-9<3@3?;34567897 -@-/M7<7<@-=9>3;94@<9<87-@B=3@O 79;-<@97+Q,&]P>8;9JM798H7.<96G>>/<=-9<3@7,!""*,!X:#T#:#I!&

+$*,J647-04W74H393&C<@<@5B<-5@379<=;4/87?;3H=/<@<=-/B-9-A-787 47<@5;34567897-@B H8B<=-/B<-5@379<=H3B8/+Q,&K@?3;H-9<3@ J=<8@=87,!""*,$Y!:Y#:T"&

+$#,魏彩乔%焦满囤&基于粗糙集的绿色度评价方法及实现技术+Q,&计算技术与自动化,!""*,!’(’)&

+$Y,孙国梓,吴志军,郁鼎文,刘嘉&基于粗糙集的供应商绿色评价体系研究+Q,&计算机工程与应用,!""*,’!&

+$X,殷勇&烟草成分对其品质影响程度的粗糙集判别方法+Q,&农业机械学报,!""*,’#(*)&

+$T,‘<@5V4<^-@5%Q<@523@5U<&G;3456789:A-78B?-4/9;-@0<@5 >;3939M>87M798H?3;?-4/9B<-5@37<7+Q,&]@5<@88;<@5G>>/<=-9<3@7 3?G;9

+$I,‘<-@5J68@%2<=6-;B Q8@78@&J8/8=9<@5<@?3;H-9>/<=-9<3@?3;=3H>/8P7M798H7H3@

+!",DU->/-@98&G;3456789:A-78B->>;3-=693 6-@B/<@57>-9<-/4@=8;9-<@9M<@A<@-;M

G>>/<=-9<3@73?G;9

+!$,J&G76-;-?%C&(-;-7>;3-=693.8A 47-58=-9853;

+!!,曹宇蓉%帅典勋&基于粗糙集理论的税务系统分析模型研+Q,&微型电脑应用,!""*,!"(I)&

+!’,F-S>;3P;8?8;8@=8;8/-9<3@ AM-H4/9<:-99;;3A/8H7+Q,&]4;3>8-@Q34;@-/3?_>8;-9<3@-/28O 78-;=6,!""*,$#I:$IY:!"Y&

(责任编辑a李友平)

!I

统计与决策!""#年$$月(下)

相关文档
最新文档