一、数据仓库是什么? 数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。?为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。 二、数据仓库有哪些特点? 1、效率高 数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,客户能看到昨天的数据分析。 2、扩展性 之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。 3、面向主题 操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。主题是与传统数据库的面向应用相对应的,是一个抽象概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。每一个主题对应一个宏观的分析领域。数据仓库排除对于决策无用的数据,提供特定主题的简明视图。 4、集成性 面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 5、反映变化 操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 三、数据仓库的一些常见认识误区 1、数据仓库的建设是一次性工程。数据仓库实际上需要每年、每月、每周甚至每日都要进行更新,不是说一次性录入了历史的数据就可以完成的工作。 2、数据仓库是一个很大的仓库。其实衡量一个数据仓库的质量如何,并不是用数据量来衡量的,有一些优质的数据仓库项目,数据量并不是很大。 3、只要数据仓库建立和使用了,问题就解决了。 4、聚焦于内部的档案型数据,而忽视了外部数据以及图象、音频和视频文件的潜在价值。 5、数据仓库是将所有的业务数据存在一起的。数据仓库的一个目标是将分散的业务整合在一起的,但它往往是有目的地按分析需去实施的,并不是将全部的业务数据统统都集成在一起。 —- 编译者/作者:思迈特软件Smartb 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
数据分析师必备的数据仓库相关知识——Smartbi
2021-06-08 思迈特软件Smartb 来源:区块链网络
LOADING...
相关阅读:
- 喜报连连天玑数据受邀加入边缘计算产业联盟(ECC)2021-06-08
- 将引爆增量盈利点?携旅优场加入存量博弈2021-06-08
- 大利空将再度来袭?一数据表明近期不乐观2021-06-08
- Good Health Pass 发布健康凭证互操作性蓝图 – Ledger Insights2021-06-08
- 美国大哥已经很好奇媒体消费者的私人数据2021-06-07