以下是网学网为您推荐的毕业论文提纲- 数据挖掘技术及其在中药分析中的应用 ,希望本篇文章对您学习有所帮助。
1 数据挖掘技术1.1 数据挖掘的概念数据挖掘是一个集统计学、人工智能、模式识别、并行计算、机器学习、数据库等技术于一体的交叉性学科研究领域。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、有用的信息和知识的过程。通过数据挖掘可以帮助决策者寻找规律,发现被忽略的要素,预测趋势,进行决策。它涉及对数据库中的大量数据进行抽取、转换、分析以及模型化处理,从中提取辅助决策的关键性数据。因此,数据挖掘就是深层次的数据信息分析方法。
1.2 数据挖掘的基本过程数据挖掘的基本过程包括数据收集、数据整理、数据挖掘、结果评估、分析决策等,其基本过程与步骤如图1所示。从图1可以看出,数据挖掘的各过程不是一次就能完成的,其中某些步骤或者全过图1 数据挖掘的基本过程与步骤程可能需要多次的循环反复,才有可能达到预期的效果。1.2.1 数据收集 大量全面丰富的数据是数据挖掘的前提,没有数据,数据挖掘也就无从谈起。因此,数据收集是数据挖掘的首要步骤。在开始数据挖掘之前,首先要消除噪声或不一致数据,广泛收集用户的各种信息,建立数据库与数据表,为数据挖掘做准备。数据可以来自于现有事务处理系统,也可以从数据仓库中得到。
1.2.2 数据整理 数据整理是数据挖掘的必要环节。由数据收集阶段得到的数据可能有“污染”,表现在可能存在自身的不一致性,或者有缺失数据的存在等,从数据库中检索与分析任务相关的数据,确保数据能够真实反映待挖掘的对象,因此,数据的整理是必需的。数据挖掘通过汇总或聚集操作将数据变换或统一成适合挖掘的形式,可单独利用也可综合利用各种数据挖掘方法对数据进行分析,挖掘用户所需要的各种规则、趋势、类别、模型等。