网学网为广大网友收集整理了,CART算法在客户分类中的应用,希望对大家有所帮助!
论文编号:XXLW052 论文字数:13212,页数:29
摘 要
基于数据仓库和数据挖掘技术的快速发展,电子商务平台中的客户日趋增加,针对电子商务平台的客户管理成为首要解决的问题。
本文基于数据挖掘的理论方法和技术,以分类树为建模的主要思想。把电子商务平台客户信息转换成属性-结论式形式,采用分类树中基于最小基尼指数的CART算法,通过构建树、修剪树、评估三步骤,把客户进行分类,快速准确地区分目标客户和非目标客户。
在数据挖掘模型建立的基础上,结合企业发展的实际情况和各区域的自身特点,针对电子商务平台的目标客户寻找模型做部分的调整,最终得到最优模型。该模型结合数据仓库,运用到实际生活中可以大幅度地提高企业效率。
关键词:目标客户寻找 数据挖掘 分类树 CART
Abstract
Based on the rapid development of the data warehouse and data mining tachnoligy, customers in e-commerce platform increase day by day. So customer management become the most important issues.
This paper , based on the theory and methods of data mining and get classification tree for the main ideas of the modeling. Made the customer information of e-commerce platform into the properties - the Conclusion form, Using the CART algorithm of classification tree which based on the smallest of Gini index. By building the tree, pruning the tree and assess the tree to classify the customer. At last ,distinguish target and non-target customers rapidly and accurately .
Based on the data mining , combined with the actual situation of enterprise development and regional characteristics, the objectives of e-commerce platform for customers looking for models to do some adjustments. The combination of data warehouse model, applied to real life can greatly improve efficiency.
Key words: seach for Target customers Data Mining Classification Tree CART
目 录
摘 要 I
Abstract II
目 录 III
第一章 绪论 1
1.1 引言 1
1.2 研究背景 1
1.2.1电子商务的客户特征 1
1.2.2电子商务客户操作流程 2
1.3 需求分析 3
1.3.1客户现状及问题描述 3
1.3.2研究目标 3
1.3.3研究方法 3
第二章 数据挖掘与分析理论简介 5
2.1 数据挖掘与分析理论与技术简介 5
2.1.1数据挖掘概念 5
2.1.2 数据挖掘流程 5
2.1.3 数据挖掘方法 7
2.2 CART算法简介 8
2.2.1 CART 算法概念 8
2.2.2构建树 9
2.2.3数据预处理 9
2.2.4树的生成 9
2.2.5修剪(Pruning) 10
2.3 CART算法的优缺点及适用性 12
第三章 目标客户寻找模型的实现 13
3.1问题定义 13
3.2 数据准备 13
3.3 数据重构 14
3.3.1数据字段符号化 14
3.3.2数据符号化判断规则 15
3.4 CART 算法的模型建立 16
3.4.1建立模型 16
3.4.2.评估 17
第四章 结论及建议 23
4.1模型实现结构分析 23
4.2 CART算法的不足 23
4.3进一步工作 23
致 谢 24
参考文献 25