数据仓库分析系统整体设计方案.doc
《数据仓库分析系统整体设计方案.doc》由会员分享,可在线阅读,更多相关《数据仓库分析系统整体设计方案.doc(80页珍藏版)》请在沃文网上搜索。
1、目 录一、概述2二、四科室需求31、风险科需求32、市场科需求133、业务管理科需求144、计划资金科需求15三、需求分析231、维表232、事实表233、事务业务处理过程及业务术语234、主键245、外键24四、系统结构图及业务数据流图251、系统结构图252、数据流图26五、源数据表结构271、BCS系统272、Cardpool系统343、NAS系统364、BCS系统报表37六、生成表结构39七、码表结构43八、结果表结构50九、数据表创建方法511、BCS系统512、Cardpool系统573、NAS系统584、生成表585、码表62十、数据处理过程681、目录结构682、流程说明68十
2、一、问题及处理方法80一、概述Bill Inmon(数据仓库之父)在Building the Data Warehouse (John Wiley & Sons Inc., 1996)书中把数据仓库描述为一个“面向主题的、完整的、非易失的、不同时间的、用于支持决策管理的数据集合”。数据仓库是只用于制作报表的数据库。对我们而言,数据仓库是某个“宽广”的数据仓储。它包括许多的主题领域。而一个数据集市,恰恰相反,它把眼睛盯在商业活动的某个非常有限的部分上。它往往涉及某个单独主题或单个类型的分析。在日常工作中,IT人员经常听到这样的抱怨:“我要求的报表怎么还没出来?”或者是“我要对XX报表做些修改,怎
3、么还没结果?”等等。在IT飞速发展的最近几年里,银行信用卡部先后针对业务上了一些计算机系统。这些系统的特点是:信息量规模小、数据经常实时更新、适用于业务人员快速录入数据、使用模式相对来说是可以预测的、模式很复杂、业务流程难以更改、数据在线保存的时间较短及各系统之间缺乏必要的联系等。这样的系统被称之为OLTP系统。OLTP系统的这些特点也就决定了有如此抱怨。如何解决这些问题呢?我们首先想到的是:把数据集中、完整地存储在中心数据库中。所有的业务处理在中心数据库上进行。所有的报表工作脱离数据库。这听起来难道不是有点像一个数据仓库吗?我们为什么不在OLTP的业务系统数据库的基础上生成报表呢?答案很简单
4、:因为报表经常需要大量的、长时间的数据做依据,然后经过大量的运算,才能得出你想要的结论。这对业务系统的正常运转影响很大,以至于业务系统无法正常运转。当然,不是什么时候都需要一个数据仓库的。正如数据仓库的定义:是用于支持决策管理的数据集合。中国银行北京分行从1986年6月1日发行第一张人民币长城卡到现在拥有将近20万的持卡人。从过去手工处理业务到现在拥有几个OLTP业务系统。信用卡业务有了飞速的发展。但也应看到信用卡市场的激烈竞争。如何给决策者及时提供决策支持信息,是在激烈的市场竞争中立于不败之地的关键。二、四科室需求1、风险科需求表1北京市分行/(XX支行)信用卡透支利息统计表年 月 日金卡普
5、通卡比例合计自年初累计户数金额户数金额户数金额户数金额户数金额应收透支利息本月实收透支利息透支30天内应收息透支30天内本月实收息透支30-60天内应收息透支30-60天内本月实收息透支60-90天内应收息透支60-90天内本月实收息透支90-180天内应收息透支90-180天内本月实收息透支180-360天内应收息透支180-360天内本月实收息透支360-720天内应收息透支360-720天内本月实收息透支720天以上应收息透支720天以上本月实收息注:第一列的时间段缺省设置是表中值,但应允许人为修改各时间段的取值及范围。表2北京市分行/( XX支行)信用卡透支还款分析表年 月 日金卡普通
6、卡比例合计自年初累计户数金额户数金额户数金额户数金额户数金额全辖透支数额本月实收透支额30天内透支额本月30天内透支户还款数30-60天内透支额本月30-60天内透支户还款数60-90天内透支额本月60-90天内透支户还款数90-180天内透支额本月90-180天内透支户还款数180-360天内透支额本月180-360天内透支户还款数360-720天内透支额本月360-720天内透支户还款数720天以上透支额本月720天以上透支户还款数注:上月付100,本月付80,虽还欠款,但算还款户。还款数额包括结息数额,由结息带来的实际还款也算还款户。第一列的时间段应允许人为调整,时间的累计是以某一天开始
7、,倒推统计数据。表3XXXX年第X季度关于信用卡透支情况的报告(每季一份)总行:根据人总行银管1997185号文件,关于调整银行卡报表制度的通知精神,现统计数字如下:六个月以上透支余额二年以上透支余额已确认的损失金额已处理的损失金额其中呆帐核销其中保险赔偿其他情况注:第一、二项可由机器系统提供,其它项需手工填入。表4 中国银行人民币长城卡业务统计表风险统计表(月报)填报单位:(0142)北京市分行表号:CCTAB5填报时间:0000年00月00日0000年00月金额单位:人民币、元(需取二个月的数据做统计)金卡普通卡合计机器可出数据善意透支(60天以内普通5000以下金卡2万以下)户数收回增加
8、转出金额收回增加转出恶意透支户数收回转入金额收回转入一年以上恶意透支户数收回转入金额收回转入一年以上恶意透支收回户数金额机器不可出数据内部作案笔数金额内外勾结作案笔数金额遗失卡、被盗卡的冒用笔数金额伪造信用卡笔数金额涂改信用卡笔数金额假身份办卡笔数金额持卡人丧失偿还能力笔数金额本月公司卡止付数:(机器可出此数据)本月个人卡止付数:(机器可出此数据)注:户数收回是指已全部还清的;户数增加是指新增的透支户;“金额增加”是指以往透支户新增透支额和新增透支户全部透支额之和;转出户数是指到本月累计数超出60天的或超过普通卡、金卡限额的透支户;转出金额是转出户数金额之和;转出应与邻近项的转入相对应。表5分
9、行及各支行透支状况(全部按户数/金额统计)(按各发卡单位统计)年 月 日分支行名称透支金额上月透支增长率上月还款(包括还清)自年初累计还款本月新增透支自年初累计增加恶意透支180天以上恶意透支占总透支比例当前有效卡数量交易数量息存数量户数金额户数金额户数金额户数金额户数金额户数金额户数金额户数金额户数 金额海淀朝阳西城崇文宣武机场办昌平顺义通县怀柔平谷密云大兴房山门头沟石景山丰台延庆东城前门支行原总行天马天马(吉亚)京分合计注:此表中的恶意透支是指超出180天以上的透支户概念:普通卡透支5000以上;金卡透支20000以上,透支天数超过60天。公式:(本月 上月)/上月例:本月透支150万;上
10、月透支100万(150-100)/100=50%表6 信用卡风险资产分类汇总表 填表单位(公章):填表日期: 年 月 日单位:千元分类结果卡类笔 数(1)(所有透支户)金 额(2)(所有透支金额)正 常(3)关 注(4)不良资产应计利息(10)笔数金额笔数金额笔数(5)小计金额(6)次级(7)可疑(8)损失(9)笔数金额笔数金额笔数金额单 位 卡个 人 卡合 计制表人:审核人:负责人:注:(1)为五类风险资产的总笔数。(2)为五类风险资产的总金额,即(2)=(3)+(4)+(7)+(8)+(9)。(5)为(7)、(8)、(9)、的笔数合计。(6)为(7)、(8)、(9)、的金额合计。(10)为
11、透支日至分类日应计利息。正常:金卡2万以内、普通卡5000以内,透支天数不足60天,均属正常范围。关注:透支额在善意透支额以内的,但透支天数在6090天以内的,属关注范围。不良资产:无论金额多少,只要天数超出90天的均属不良资产范畴。次级:是指透支天数在90180天以内的不良资产。可疑:是指透支天数在180360天以内的不良资产。损失:是指透支天数超出360天以上的不良资产。表7长城人民币信用卡持卡人消费/取现/存款/转帐状况统计表(月报)/(季报) 年 月 日月消费50006000元月消费600010000元月消费10000元以上卡 号金额笔数平均卡 号金额笔数平均卡 号金额笔数平均合计:注
12、:卡号栏需按类别分别统计,如个人卡、单位卡、普通卡、金卡等,金额范围应允许人为调整。卡号按升序排列金额按降序排列同类卡按金额降序排列表8长城人民币信用卡持卡人消费状况统计表(年报) 年 月 日消费6万元7.2 万元消费7.2万元12 万元消费12 万元以上卡 号金额笔数平均卡 号金额笔数平均卡 号金额笔数平均合计:表9NAS系统授权业务量统计(月报)(来源于NAS数据、自动授权语音系统,仅对长城卡进行统计)成功交易本行卡笔数外地卡笔数取现点笔数商户笔数发卡行授权笔数总行代授权笔数分代授权笔数转入手工授权联 行 号笔 数联 行 号笔 数联 行 号笔 数合计注:转入手工授权的统计数来源于自动授权语
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 分析 系统 整体 设计方案