引荐课程:MySQL教程。
数据仓库可以经由过程集成种种多样的数据完成信息的一致,这些数据泉源包括现行的事件操纵和治理信息体系,以及外部种种信息源。这些源数据将被整合,洗濯,转换,假如须要直接从这些数据泉源读取数据的话,该数据将会在数据仓库中以更有利于操纵的体式格局存储。
数据仓库的数据构造体式格局使你可以存储当前和汗青的数据。当前数据是现实事件操纵运动必要的,平常是按期的硬拷贝(比方打印出的报表)或者是联机报表。而汗青数据,每每不是那末轻易运用,可以供应基于时刻点剖析的贸易信息,比方:追踪、推论剖析,以及对照,这些关于历久设计和战略性的市场决议计划都是很主要的。
怎样从多个信息源整合信息,按期蕴蓄存储,有效的需求设想和生长手艺,一切这些都和事件型治理信息体系所运用的手艺有很大的差别。本书都是关于数据仓库的设想和开辟手艺,它涵盖了大部份竖立数据仓库所触及到的大部份手艺题目。更为主要的是,本书供应了一个易懂的操纵指南,便于开辟一个现实的数据仓库。
本书的适用范围
mysql多维数据仓库指南是一个实战的书本。你将运用mysql数据库,但该书不是关于mysql的。本书不触及任何硬件架构方面的题目。
本书主要体贴数据仓库的设想和开辟手艺。它不触及开辟项目的治理,理论,以及怎样指点开辟等相干的手艺题目。
本书用一个数据仓库开辟的例子来展现手艺怎样运用。供应数据模型和sql剧本,将可以适用于现实的数据仓库开辟。这些剧本已经在Windows xp professional sp2 平台上用mysql 5。0。21 版本测试经由过程。
别的,本书不再对以下的几个主题举行迥殊的叙述:
数据仓库的观点
Sql
MySQL数据库
合适浏览本书的人:
数据仓库运用于种种构造和贸易机构,从政府部门,非盈利构造到学校,从制造业到零售店,从金融机构到医疗机构,从传统公司到互联网商家。
本书起首面向数据仓库开辟人员。然则,it 司理和其他it职业,迥殊是那些对mis(运营报告)和dss(决议计划支持运用)感兴趣的人将发明本书一样有效。总的说来,本书是给那些为剖析运用准备数据事情相干的人,以及那些须要递交信息的人,比方打印报表,联机报表。
本书一样适用于那些数据仓库初学者。它将直接疾速的为那些正在准备开辟他们第一个数据仓库的人供应协助。
西席和门生可以将该书作为教科书,以便于明白他们关于数据仓库道理,观点的明白。大部份章节可以被定制用于试验演习。
准备的妙技
本书不是面向it新人,为了更有效的运用本书,读者必须有一些体系开辟履历。然则,不请求先有数据仓库的建立履历。
须要实践操纵本书例子的人须要有rdbms(关联数据库治理体系)和sql的现实操纵妙技。
你可以从本书获得
你将可以仅仅用一个示例,一个最早存储贸易贩卖相干数据的数据仓库,而且举行实践操纵,就可以考验你的数据仓库学问和现实妙技。该示例是一个精简版的现实数据仓库,可以在很多种贸易范例中找到它的原型。
你将基于mysql数据库用本书引见的手艺一步步的开辟该示例中贩卖相干数据仓库。这些手艺是在一般数据仓库开辟中将遇到的题目的剖析技能。经由过程完成本文的进修而且完成一切的演习,你将获得相干事情履历并可认为担任第一个现实数据仓库项目做好准备。
章节总览
本书包括25个章节和一个附录。一切章节构造为四个部份。第一部份涵盖数据仓库基础。第二部份形貌从原始数据到数据仓库的迁徙。第三部份议论怎样掌握数据仓库的生长演变。第四部份触及到一些高等的多维手艺。接下来的部份将给出每一个章节的预览。
第一篇 基础道理
第一篇,涵盖多维数据仓库的基础道理,有四个章节。
第1章,“基础构成”,引见星型情势(一种数据库情势,有一个现实表,四周围绕着多个维表)以及诠释该情势的基础构成。
第2章,”维度汗青“ 引见用代办健来保护维成员的汗青记录。
第3章,“器量可加性”,包括维度数据仓库中最主要的特征之一,也就是存储在数据仓库现实表中的器量的可加性。
第4章,“维度查询”,引见最合适运用于星型情势的一种sql查询,维度查询可以用来证实一个维度数据仓库是不是具有两个最基础的设想目的:简朴和高效。
第二篇: 提取、转换和加载
该篇的一切5个章节触及了数据集成,现实表,维表。
第5章,“源数据提取”引见了差别范例数据的提取。
第6章“导入时刻维”涵盖了三种最通用的加载时刻维的手艺。
第7章 “初始化导入“和第8章,“按期导入”触及到两种范例的导入手艺,初始化和周期性。
第9章,“周期导入设计”,作为第二篇的总结,供应一个进阶式的指点,关于怎样运用Windows的使命治理器完成按期导入设计。
第三篇:生长
第三篇引见了差别的处置惩罚手艺,这些手艺主要处置惩罚一个胜利的多维数据仓库生长过程当中遇到的相干题目。该部份有十个章节。
第10章,“增添字段”议论关于向现有数据仓库中的表增添一个字段的手艺题目。
第11章,“按需载入”触及按需载入的手艺。
第12章,“维表子集”,引见相干手艺以协助用户处置惩罚维表子集题目。
第13章,“维度角色扮演”,关于在一个现实表中屡次运用同一个维度的题目。
第14章,“快照”让你在须要作出汇总数据的时刻,能供应疾速机能的查询。
第15章,“唯度条理”和第16章“多路径和不划一的维度条理”是关于简朴和多路径维度手艺,响应的,这些手艺协助人们举行会聚和钻取剖析。
第17章,“维度退步”,展现了怎样用维度退步手艺去削减一个数据仓库情势的复杂性。
第18章,“垃圾维”,是关于垃圾维的手艺,行将表面上不相干的然则常常会被用户举行请求剖析的数据,用维的体式格局构造起来。
第19章,“多星型情势”展现了怎样在情势中增添多个星型情势。
第四篇:高等手艺
包括六个章节。
第20章,“不划一数据源”,引见怎样在数据仓库中处置惩罚那些构造没法直接映射到目的表的数据源。
第21章,“无现实的现实表”,协助你为客户竖立一种可供剖析的辅佐数据,一种无现实字段的现实表,该数据没法从数据源直接获得器量。
第22章,“迟来的现实”,包括一个手艺,用于处置惩罚当数据源中某个特别的现实没有在设计载入时刻之前发生的状况。
第23章,“外部数据源和维度兼并“,包括两个主题:处置惩罚外部数据源和怎样将多个维中疏散的属性兼并到一个维的手艺。
第24章,“积累器量”,议论两个相干的题目:盘算器量和积累器量的不可相加性。
第25章,“分段维度”,论述一种手艺,可以协助运用者针对那些有一连值的属性举行数据剖析。
附录
附录a,“格式文件数据源”,引见怎样运用本书例子中的格式文件数据源。
将Mysql这个最盛行的开源数据库软件举行数据仓库运用,在本书之前还从来没有被在建立多维数据仓库方面用这类入门指南的体式格局举行引见。主题包括 星型情势建模,数据载入(数据的提取、转换和加载:etl),测试磨练,以及多维查询。本书由始至终运用一个可实践,相对精简的实在的项目。其周全,易于接收的写作情势使得那些须要竖立数据仓库的程序员可以获得相干的示例和材料。
关于作者
Djoni Darmawikarta 曾就任于ibm,现在是一个加拿大保险公司的数据仓库、贸易智能团队中的手艺专家。现在生活在Toronto, Ontario
以上就是mysql多维数据仓库指南的细致内容,更多请关注ki4网别的相干文章!