当前位置: 网学 > 网上挣钱 > 学生天下 > 正文

数据加载技术:数据仓库数据加载技术

来源:Http://myeducs.cn 联系QQ:点击这里给我发消息 作者: Admin 发布时间: 13/01/08

  作者:熊忠阳 张玉芳 吴中福 

    1 数据仓库

  数据仓库是一个为决策支持系统提供支撑的数据集合,这些数据具有面向对象性、集成性、与时间相关性等特点。通过查询数据仓库获得的信息可以指导管理者做出决策,这些信息通常被认为具备商业智能。从数据仓库中提取和获取信息的过程称为数据挖掘,因此数据仓库是决策支持系统和数据(知识)挖掘系统的基础,数据仓库中的数据可信度将直接影响后续系统的工作。简而言之,数据仓库具有以下几个特点:其结构具有开放性,是企业信息资源按某种方式的聚合;同时具备一致的、可重复使用的加载数据接口,并提供将数据转化为信息的工具。

  从数据仓库的特点可以看出:数据仓库中的数据不是简单的传统数据库中的数据堆积,也不是简单地选择一个工具下载数据的过程,它是一个复杂的容纳数据集成的系统工程。虽然数据仓库不同于传统的数据库,但是其数据仍然由传统数据库中的数据组成,因此研究如何从现有数据库中有效地将数据引导至数据仓库的方法和策略就显得非常必要。

  2 数据仓库中的数据

  数据仓库中的主要操作对象是多维数据。维度是数据仓库数据的一个重要物理特性,是访问和表达商务信息的一个基本途径,如时间、位置或产品。维度一般作为识别数据的索引,每一维包括很多层次,而多维则表示按多维访问信息的一个术语,如三维立方体。任何数据脱离其可能的维度都没有存在的价值,例如某公司的销售值,若脱离时间、区域、产品这3个基本维度则没有任何实际意义。多维数据具体体现在用户需求的多维映射上,同时商务数据本质也是多维的,因此有时又将数据仓库称为多维数据库。

  今天的数据库技术发展到了数据仓库技术的水平,数据仓库把企业中分散的原始传统数据库和来自外部的数据汇集和整理成一个单一的关系数据库,为企业提供完整、及时、准确的信息,使用户可以直接从数据仓库中提取信息,从而进行各种决策分析。因此在数据集成时可能涉及数据类型、实体和属性之间的不一致,数据仓库将排除各种不一致的数据,对装入的数据进行集成和聚集。数据的聚集过程不是在特定用户查询时才进行,而是在查询之前发生的。因此需要为数据仓库选取一个恰当的模型和体系结构,对于不同的应用提取不同的数据,这也充分体现了数据仓库的面向主题特征。

  数据仓库设计完毕,需要装入面向商业目标的数据。由于不存在一个特定的一成不变的系统,设计人员必须根据存取和查询的需要设计变迁数据,同时保证装入的数据满足数据仓库的面向主题特性。根据应用的需要数据仓库可能包含以下几类数据:

  1)从传统数据库中下载的历史数据(如发票、账单等);

  2)表示事件的主实体数据(如客户、产品、制造商数据等);

  3)主实体列表信息(即:主实体包含的明细项);

  4)历史数据摘要(如某地区某产品的月销售额等)。

  如果不考虑存储的容量及访问效率,在理论上构成数据仓库的一种最简单方法是将历史事件(发票、账单)直接形成“仓库”数据,由这些事件形成大批数据,但是由于各种因素和技术的制约,实际上是不可行的。首先需要针对商业目标识别需要的数据,这里的识别包括识别各种数据的各种约束、控制、安全、一致性等内容,然后在分解与合成的指导思想下,帮助用户进一步分析详细信息或者进行数据的集成和聚集,消除数据间存在的不一致,最终构成满足应用需要的数据仓库数据。

  实现一个成功数据仓库的关键是:自始至终理解系统需要,围绕商业目标主题进行搜集、存储所需要的数据;同时在存储过程中考虑客户对信息访问效率的优化。笔者认为:数据仓库存储的数据应体现唯一的面向主题的功能特性,同时在构建过程中确保关键

  • 上一篇资讯: qq空间留言符号大全
  • 下一篇资讯: 新婚贺词祝词大全
  • 网学推荐

    免费论文

    原创论文

    浏览:
    设为首页 | 加入收藏 | 论文首页 | 论文专题 | 设计下载 | 网学软件 | 论文模板 | 论文资源 | 程序设计 | 关于网学 | 站内搜索 | 网学留言 | 友情链接 | 资料中心
    版权所有 QQ:3710167 邮箱:3710167@qq.com 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
    Copyright 2008-2015 myeducs.Cn www.myeducs.Cn All Rights Reserved
    湘ICP备09003080号