网站导航免费论文 原创论文 论文搜索 原创论文 网学软件 学术大家 资料中心 会员中心 问题解答 原创论文 大学论文导航 设计下载 最新论文 下载排行 原创论文
返回网学首页
网学联系
最新论文 推荐专题 热门论文 素材专题
当前位置: 网学 > 网学资源大全 > 计算机 > 正文

浙江省制造业注销企业特征分析

来源:http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 来源: 网络 发布时间: 15/07/16

【编者按】网学网计算机频道为大家收集整理了“浙江省制造业注销企业特征分析“提供大家参考,希望对大家有所帮助!

论文编号:XXLW071 论文字数:18247,页数:52

摘  要
 在全球经济危机的背景下,洞察当今经济的潜在关系,对企业进行特征分析,可以清楚的了解企业当前状况,是否面临被注销的风险,从而对有注销特征的企业进行重点关注。
 本文从浙江省工商行政管理局数据库中获取企业数据,利用ETL(数据仓库中的操作)对数据进行抽取、转化以及装载,从而得到年检年份为2005至2007的浙江省企业数据。为进一步提高数据的有效性及真实性,文中利用SPSS Clementine 10.0工具,对数据进行进一步的筛选及清洗。本文基于数据挖掘理论,选择C5.0 算法、C&R Tree两种算法进行分析及比较,并结合浙江省企业数据的特征属性,最终采用C5.0 算法建立的注销企业特征分析模型。通过对模型求解及分析,结果表明浙江省制造业企业发生注销主要由经营年限,登记机关,企业规模等9个特征因素决定,其准确率达到95.81%,误差率为4.29%。通过对误差数据进行分析,得出模型产生误差的主要原因是原始数据的缺失,这使得某些影响因素不能在模型中体现出来,使模型没有达到最优,但评估指标整体较好,对使用者能提供一定得支持。
 通过分析企业的特征,可以使决策者对企业的当前状况了然于心,从而提出正确的,有利于各方面发展的信息。
 
关键词:浙江工商;注销企业;数据挖掘;C5.0 算法;C&R Tree

Abstract
 In the background of global economic crisis, Insight into the potential relationship between today''''s economy, analyze the features of enterprise, has a clear understanding of the current situation of the enterprise, Thereby determine whether the risk of being written off, and focus on the enterprise with the feature of written off.
 This article gain enterprise data from the database of Zhejiang Administration for Industry and Commerce, distill transform and load the data by ETL to gain zhejiang enterprise data between 2005 and 2007. In order to improve the Validity and authenticity of the data, filter the data using SPSS Clementine 10.0。The article is based on Data Mining Theory, analyze and compare C5.0 with C&R Tree algorithm , finally establish the feature analysis model of written_off enterprise using C5.0 algorithm . By answer and analyze the model,the results shows that  the appearance Manufacturing enterprises are written off depends on the operating life cycle, registration bodies and other nine factors. the accuracy rate up to 95.81%, the error rate up to 4.29%. By analyzing Error Data, we come to the result the main reason of error is lack of raw data,which makes some of the impact factor can not be reflected in the model, so that the model did not meet the best, but the overall evaluation are better, this may provide support to the users.
 By analyzing the characteristics of enterprises, the decision-makers can understand the current status clearer, thereby raise the right information which is benefit to all aspects of development.

Keywords:Zhejiang industrial and commercial, written_off enterprise, Data Mining, C5.0 algorithm, C&R Tree

目  录
中文摘要  i
英文摘要  ii
目录 iii
第一章  引  言 1
第二章  业务分析 2
2.1  理论基础 2
2.1.1  数据仓库 2
2.1.2  商业智能 3
2.1.3  BusinessObjects Enterprise 3
2.2  数据条件 4
2.2.1  需求分析 4
2.2.2  对象选择 4
第三章  数据处理 7
3.1  理论基础 7
3.1.1  PL/SQL工具 7
3.1.2  数据挖掘 7
3.1.3  SPSS  Clementine 工具 8
3.2  数据准备 8
3.2.1  影响因素 8
3.2.2  数据选取 9
3.3  数据清洗 11
第四章  模型实现 14
4.1  理论基础 14
4.1.1  决策树概述 14
4.1.2  决策树算法 14
4.1.3  决策树优势 15
4.2  建立模型 15
4.2.1  C5.0模型 16
4.2.2  C&R Tree模型 17
第五章  模型分析 18
5.1  模型对比 18
5.2  C5.0模型分析 19
5.2.1  模型评价 19
5.2.2  结果分析 19
第六章  总结 24
6.1  论文主要工作总结 24
6.2  模型的改进 24
致  谢 25
参考文献 26
附录 27

浙江省制造业注销企业特征分析......
版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号