网站导航免费论文 原创论文 论文搜索 原创论文 网学软件 学术大家 资料中心 会员中心 问题解答 原创论文 大学论文导航 设计下载 最新论文 下载排行 原创论文
返回网学首页
网学联系
最新论文 推荐专题 热门论文 素材专题
当前位置: 网学 > 论文模板 > 计算机论文 > 正文

数据挖掘在银行个人客户信用等级分类中的应用分析

来源:http://myeducs.cn 联系QQ:点击这里给我发消息 作者: 用户投稿 发布时间: 10/01/29
的分类能力,所以是冗余属性。而属性1,5,6去掉后,系统地分类能力发生了改变,所以是核属性。将冗余属性去掉,约简得到表3.

  首先采用CAAI算法,对决策数属性进行度量.

  针对表3,论域U={1,2,3,4,5},条件属性C={1,5,6},决策属性D={X}。没有不相容的规则,采用CAAI算法继续处理.

  首先计算各条件属性的重要性.

  Posc(D)={1,2,3,4,5}针对条件属性1:U/ind(C-1)={(1,5),(2),(3),(4)};Posc-1(D)={2,3,4};Γc-1(D)=card(Posc-1(D))/card(U)=3/5SGF(1,C,D)=Γc(D)-Γc-1(D)=1-3/5=2/5同理,针对条件属性5,6,可分别得出:Γc-5(D)=3/5SGF(5,C,D)=2/5Γc-6(D)=3/5SGF(6,C,D)=2/5由此看出,条件属性中属性1,5,6同等重要。因为各个属性的重要性相同,可以根据信息增益的大小作为属性选择度量,从而对属性进行分类。根据表3中类别属性的取值,分为两类,C1,C2,m=3。样本数据集S中,C1类所对应的子集R1中原组个数为r1=1,C2类子集R2元组个数为r2=4.

  集合S关于分类的期望信息量为:I(r1,r2)=I(1,4)=-15log215-45log245≈0.722同理计算每个属性的熵值,得出:E(1)=35×(-13log213-23log223)+25×(-22log222-02log202)≈0.551Gain(1)=I(r1,r2)-E(1)≈0.171同样得出:E(5)=E(6)=35×(-13log213-23log223)+25×(-22log222-02log202)≈0.551Gain(5)=Gain(6)=Gain(1)这时候由于属性值分类出现特殊性,无法通过常规的属性选择度量方法确定决策树.

  通过对现有客户信息进一步调查,抽取500个有效完整数据,形成训练集。对属性1、5、6和客户的还款记录进行训练分析,采用贝叶斯分类方法计算,得出:P(属性1=1|还款记录良好)≈92.73%P(属性5=1|还款记录良好)≈88.4%P(属性6=1|还款记录良好)≈85.3%故在此例中选择属性1作为根节点,当属性1为0时,它的分类集合中的决策属性为一类,就停止选择属性。对于另一类,继续选择属性分类。以此类推,得到整个决策树,如下图所示.

  图1   提取规则,得到规则集,如下表所示.

  表4   分项序号  IFTHEN1属性1=0X=02属性1=1&属性5=0X=03属性1=1&属性5=1&属性6=0X=04属性1=1&属性5=1&属性6=1X=1  这样,通过基于粗糙集的数据挖掘技术和针对特殊问题采取的数理统计理论,挖掘出了对我们有用的客户分类评价规则,以后再进行客户信用分类评价选择以及专家库改进完善时,可以直接将申请贷款客户的各个方面的情况与规则相匹配,并将之作为决策的参考依据。可初步判定客户是否有资质获得贷款,保证风险控制。对于在规则提取应用之前已获得贷款的客户,银行也可导入相关数据,重新评估。对于信用等级为B类的客户,可以重点跟踪,及时催缴利息贷款,降低信用风险.

  4 结论

  本文利用数据挖掘方法,对某商业银行历史客户信息汇总整理并进行了分析,找出了这些银行在对客户进行信用评级时的一些共有的评价规则,这些规则的得出可以在银行对未来新系统的设计实施中提供有效的决策支持.

  参考文献

  [1]Pitt,B.andD.Kirchen,ApplicationsofDataMiningTechniquestoLoadProfiling,inProc.IEEEPICA,SantaClara,CA,

  May,1999.

  [2]Chicco,G,Napoli,R.,Postulache,P.,Scutariu,M.AndToaderC.,CustomerCharacterizationOptionsforImprovingthe

  TariffOffer,IEEETransactionsonPowerSystems,Vol.18,No1,Feb-ruary,pp.381-387,2003.

  [3]MehmerKantardzic著,闪四清译.数据挖掘-概念、模型、方法和算法[M].北京:清华大学出版社,2003:171-217.

  [4]于研.信用风险的测定与管理[M].上海:上海财经大学出版社,2003:189-228.

  [5]王聪生.资产管理系统在发电企业的应用[J].电力信息化,2004,2(11).

  [6]邓乃扬,田英杰.数据挖掘中的新方法———支持向量机[M].北京:科学出版社,2004.

  [7]侯惠芳,刘素华.基于支持向量机的商业银行信用风险评估[J].

  计算机工程与应用,2004,40(31):176-192.

  [8]艾迪·凯德著,王松奇译.银行风险管理[M].北京:中国金融出版社,2004:79-97.

  [9]胡光杰.数据挖掘在供应商评价中的应用[D].安徽大学硕士学位论文,2006.

网学推荐

免费论文

原创论文

设为首页 | 加入收藏 | 论文首页 |原创论文 | 论文专题 | 设计下载 | 网学软件 | 论文模板 | 论文资源 | 程序设计 | 关于网学 | 站内搜索 | 网学留言 | 友情链接 | 资料中心
版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
Copyright 2008-2020 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号 常年法律顾问:王律师