0
数据仓库是一个面向主题的、集成的、随时间变化的、稳定的用于支持组织决策的数据集合
面向主题的数据。主题对应企业中某一宏观分析领域所涉及的分析对象,例如,对于保险公司,客户、保单、索赔、产品、销售等都可以作为一个主题。面向主题的数据需要将与一个主题有关的各方面的数据进行集成,提供有关该主题的一个完整的统一的数据及其之间联系的描述。
集成:为提供有关一个主题的完整信息,需要从企业内部(操作型系统)及外部抽取数据并进行综合。需解决的问题:数据的编码、命名等在不同的数据源中各不相同;集成到数据仓库中时需要进行转换
随时间变化:操作型系统中的数据通常存储的是当前的数据或少量历史数据。数据仓库需要存储当前以及过去的一段时间内的历史数据。数据仓库中的数据通常都有一个时间维度
稳定:操作型环境的数据通常要进行频繁地数据更新操作 数据仓库中的数据通常是稳定的,定期进行分批载入或刷新,不进行数据库环境中一般意义上的增、删、改。由于数据仓库中的数据通常只是被读取,因此不需要复杂的事务处理
收藏