【网学提醒】:本文主要为网上学习者提供数据挖掘语言研究,希望对需要数据挖掘语言研究网友有所帮助,学习一下吧!
资料包括: 论文(38页18583字) 图纸
说明:摘要:该论文介绍了数据挖掘有关理论,数据挖掘技术、软件、数据挖掘有关语言分类探讨,国内外的研究现状、进展与应用成果。在此基础上,介绍了数据挖掘的实现流程和主要步骤方法,并对其中的聚类算法演示了应用实例。
关键词:数据挖掘 查询语言 建模语言 XML
Abstract: The article introduces some research work about some kinds of data mining languages and standardization, presents a kind of classification of data mining language. Then the article states structure and compose of the data mining languages. On this basis, this paper carries on the discussion and research to the data structure and composition of mining language, and introduces the procedure the data mining and key step. At last, listing the algorithm the data mining, this paper gathers and fulfils concrete application to a kind of algorithm among them.
Key Words: Data mining Query language Modeling language XML
引言
什么是数据挖掘?数据挖掘又有什么用呢?举一个例子来说明:在美国或世界其他国家,超市的管理者常津津乐道“啤酒搭着尿布卖”这样一个故事。啤酒?尿布?风马牛不相及的两件物品,能有什么样的联系呢?沃尔玛利用自动数据挖掘工具对数据仓库中各个商店一年多的详细原始数据进行分析和挖掘,一次分析之后惊奇的发现:跟尿布一起购买的最多的商品竟是啤酒!经过市场调查,真相大白:原来美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买完尿布后又随手带回两瓶啤酒。既然尿布与啤酒一起购买的机会最多,沃尔玛就在它的各个商店里将它们并排摆放,结果是尿布与啤酒的销售量双双增长。这个故事仅仅是沃尔玛借助数据挖掘受益的一连串成功故事的一个花絮而已。
数据挖掘到底是什么?数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息。从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着计算机应用的越来越广泛,每年都要积累大量的数据,运用数据挖掘技术在这些数据当中我们可以找出“金子”来。数据挖掘技术主要又分成“关联规则”,“时间序列”、“聚集”,“分类”,“估值”等这几类。
目录:引言1
1 数据挖掘方法2
2 数据挖掘软件功能的分类3
3 数据挖掘语言的分类6
3.1 数据挖掘
查询语言7
3.2 数据挖掘建模语言9
3.3 通用数据挖掘语言10
3.3.1 数据挖掘模型(Data Mining Model,DMM)11
3.3.2 预言联接操作(Predication Join Operation)11
3.3.3 OLE DB for DM模式行集合(Schema Rowsets)11
4 数据挖掘的流程12
5 数据挖掘算法12
5.1 算法实现:17
5.2 算法运行的一个实例:25
6 分析与评价27
7 数据挖掘应用现状[27
8 总结31
参 考 文 献33
致 谢34
参考文献: 王军.数据挖掘技术[M].北京:中国科学院计算技术研究所,2000年.
陈宁,周龙骧.数据采掘技术[M].北京:中国科学院数学研究所,1999年.
郑纬民,黄刚.数据挖掘纵览[M].北京:清华大学
计算机,1998年.
藤田宏一.基础信息论.魏鸿骏,陈尚勤译.武汉:国防工业出版社,1982年.
朱廷劭.数据挖掘--极具发展前景的新领域.上海:中国科学院计算技术研究所,1998年.
朱扬勇,周欣,施伯乐.规则型数据采掘工具集AMINER.高技术通讯Vol.12 No.5, 2001.
数据采掘工具的研制及其应用研制报告.国家863高技术项目863-306-02-05.2000.
朱扬勇.数据挖掘入门[J].1998,15(6).
朱建秋,周皓峰,朱扬勇,施伯乐.一个基于关联规则的数据采掘工具的设计和实现[M].北京:清华大学出版社,1999年.
朱扬勇.“规则型数据采掘工具集”[J] .北京:“高技术通讯” .Vol.10,No.3,P.19-22,2000.
Jiawei Han, Yongjian Fu, Wei Wang, Krzysztof Koperski, Osmar Zaiane.“DMQL:A Data Mining Query Language for Relational Database”[J].VLDB’96.
Jiawei Han, Micheline Kamber. “Data Mining:Concepts and Techniques”[J]. 97-116.Morgan Kaufmann Publishers. August 2000.
Robert Grossman, Stuart Bailey, Ashok Ramu, Balinder Malhi, Michael Cornelison, Philip Hallstrom, and Xiao Qin. “The Management and Mining of Multiple Predictive Models Using the Predictive Modeling Markup Language (PMML)”[J].AFCEA’99.
作者点评:本文介绍了数据挖掘语言及其标准化方面的研究进展,分析并比较了几种商用数据挖掘语言的特点,结论是标准化是数据挖掘语言发展的趋势,开发一种全面的开放的数据挖掘语言标准,必然将是各公司和研究机构的核心课题。
数据挖掘是一个崭新的
计算机应用领域,它将极大地促进信息对于人类社会进步所起的作用。在对大量的已知信息进行知识发现和整理的过程中,数据挖掘可以提供一定程度的决策支持,在生产、销售、保险和事故分析等领域创造巨大的经济和社会效益。