一、研究目的意义: 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。数据挖掘最吸引人的地方是它能建立预侧模型而不是回顾型的模型。 Apriori算法是最经典的挖掘关联规则算法,在发现关联规则领域有很大的影响力。 此外,通过使用eclipse对关联规则算法的实现,不但能增强我对JAVA技术的理解与应用,在设计的过程中也能对让我各方面的能力得到一定的锻炼,为以后的学习和工作积累经验。 二、国内外研究状况和应用前景: 在国外,数据挖掘技术已被广泛的应用于各个领域,如在天文学和空间科学上的成功应用;生物学研究中用数据挖掘技术对DNA进行分析;利用数据挖掘技术识别顾客的购买行为模式,对客户进行了分析;对银行或保险公司经常发生的诈骗行为进行预测等。在学术研究上,数据库、人工智能、信息处理、知识工程等领域的国际学术刊物也纷纷开辟了数据挖掘专题或专刊。 与国外相比,国内对数据挖掘的研究稍晚,没有形成整体力量。1993年国家自然科学基金首次支持数据挖掘领域的研究项目。目前,国内的许多科研单位和高等院校竞相开展数据挖掘和知识发现的基础理论及其应用研究。国内比较重要的会议有全国数据库学术会议(National DataBase Academic Conference,简称NDBC),权威的杂志有《计算机学报》、《软件学报》和《计算机研究与发展》。 当前,数据研究研究正方兴未艾,预计研究焦点可能会集中到以下几个方面:研究专门用于知识发现的数据挖掘语言;寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户理解,也便于在知识发现过程中的人机交互;研究在网络环境下的数据挖掘技术;加强对各种非结构化数据的挖掘,如文本数据、图形图像数据、多媒体数据。 参考文献:《数据挖掘(第二版)》朱明 中国科学技术大学出版社 《数据挖掘原理与算法(第2版) 》毛国君、段立娟 清华大学出版社 |