九九二区三区,年年操一区

數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)（Data Warehouse）是一個(gè)面向主題的（Subject Oriented）、集成的Integrate）、相對(duì)穩(wěn)定的（Non-Volatile）、反映歷史變化（Time Variant）
的數(shù)據(jù)集合，用于支持管理決策。

數(shù)據(jù)倉(cāng)庫(kù)是在企業(yè)管理和決策中面向主題的、集成的、與時(shí)間相關(guān)的、不可修改的數(shù)據(jù)集合?！獢?shù)據(jù)倉(cāng)庫(kù)之父--Bill Inmon

數(shù)據(jù)倉(cāng)庫(kù)基本特性
面向主題性
面向主題性表示了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)組織的基本原則，數(shù)據(jù)倉(cāng)庫(kù)中的所有數(shù)據(jù)都是圍繞著某一主題組織的。
確定主題以后，需要確定主題應(yīng)該包含的數(shù)據(jù)。
不同的主題之間可能會(huì)出現(xiàn)相互重疊的信息。
主題在數(shù)據(jù)倉(cāng)庫(kù)中可以用多維數(shù)據(jù)庫(kù)方式進(jìn)行存儲(chǔ)。
主題的劃分中，必須保證每一個(gè)主題的獨(dú)立性。

一個(gè)主題領(lǐng)域的表來(lái)源于多個(gè)操作型應(yīng)用（如：客戶(hù)主題，來(lái)源于：定單處理；應(yīng)收帳目；應(yīng)付帳目；…）；
典型的主題領(lǐng)域：客戶(hù)；產(chǎn)品；交易；帳目；
主題領(lǐng)域以一組相關(guān)的表來(lái)具體實(shí)現(xiàn)；
相關(guān)的表通過(guò)公共的鍵碼聯(lián)系起來(lái)（如：顧客標(biāo)識(shí)號(hào)Customer ID）；
每個(gè)鍵碼都有時(shí)間元素（從日期到日期；每月累積；單獨(dú)日期…）；
主題內(nèi)數(shù)據(jù)可以存儲(chǔ)在不同介質(zhì)上（綜合級(jí)，細(xì)節(jié)級(jí)，多粒度）；

數(shù)據(jù)集成性
根據(jù)決策分析的要求，將分散于各處的源數(shù)據(jù)進(jìn)行抽取、篩選、清理、綜合等工作，最終集成到數(shù)據(jù)倉(cāng)庫(kù)中。

image.png

數(shù)據(jù)的時(shí)變性
數(shù)據(jù)應(yīng)該隨著時(shí)間的推移而發(fā)生變化，不斷地生成主題的新快照。

image.png

數(shù)據(jù)的非易失性
數(shù)據(jù)的相對(duì)穩(wěn)定性。
數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)只進(jìn)行刷新，從不進(jìn)行更新處理。
反映歷史變化。

image.png

商務(wù)智能
簡(jiǎn)單定義：綜合企業(yè)所有沉淀下來(lái)的信息，用科學(xué)的分析方法，為企業(yè)領(lǐng)導(dǎo)提供科學(xué)決策信息的過(guò)程。
完整定義：基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的決策支持系統(tǒng)(DSS)。它以數(shù)據(jù)倉(cāng)庫(kù)（DW）技術(shù)為基礎(chǔ)，通過(guò)抽取、轉(zhuǎn)換和清洗將分散在企業(yè)各處的數(shù)據(jù)整合在一起，轉(zhuǎn)化為信息；進(jìn)而以聯(lián)機(jī)分析處理（OLAP）工具、數(shù)據(jù)挖掘（DM）工具、報(bào)表工具為手段將信息提升為知識(shí)；最后運(yùn)用可視化技術(shù)以快捷直觀的方式將探察分析結(jié)果呈現(xiàn)給最終用戶(hù)，為管理決策層提供量化依據(jù)的過(guò)程。

數(shù)據(jù)挖掘
數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測(cè)規(guī)則的模型，以便應(yīng)用于關(guān)系數(shù)據(jù)庫(kù)或多維 OLAP 數(shù)據(jù)集中的數(shù)據(jù)。之后，這些預(yù)測(cè)模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析，以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢(shì)。

聯(lián)機(jī)事務(wù)處理(OLTP)
OLTP系統(tǒng)是設(shè)計(jì)用來(lái)允許高并發(fā)性的，這樣很多用戶(hù)就能夠訪(fǎng)問(wèn)同一個(gè)數(shù)據(jù)源并進(jìn)行所需的處理。
OLTP系統(tǒng)是面向在數(shù)據(jù)庫(kù)上進(jìn)行事務(wù)處理的理念的。而事務(wù)則進(jìn)一步蘊(yùn)含著發(fā)生在表中數(shù)據(jù)上的受控的變更，這些變更包括在商務(wù)運(yùn)作過(guò)程中發(fā)生的插入、更新和刪除操作。通常，一個(gè)OLTP系統(tǒng)將會(huì)有大量的客戶(hù)端應(yīng)用程序通過(guò)各種各樣的方式(插入、更新、刪除--實(shí)際上可以是任何操作)訪(fǎng)問(wèn)數(shù)據(jù)庫(kù)以查詢(xún)一小塊信息。
OLTP系統(tǒng)的實(shí)例包括數(shù)據(jù)輸入程序，如銀行處理、訂票、聯(lián)機(jī)銷(xiāo)售和庫(kù)存管理系統(tǒng)。

聯(lián)機(jī)分析處理(OLAP)
聯(lián)機(jī)分析處理(或OLAP)是一種廣義上的決策支持系統(tǒng)(DSS)，或者最近越來(lái)越流行的商業(yè)智能(BI)。BI系統(tǒng)的目標(biāo)是分析海量數(shù)據(jù)，然后以很多不同的方式(包括每天、每周、每季和年度報(bào)告)生成小結(jié)和總結(jié)以把精力高度集中在記分卡和儀表盤(pán)上，它們通常用于幫助那些準(zhǔn)備好根據(jù)這些數(shù)據(jù)采取一定的措施的特定用戶(hù)來(lái)獲取競(jìng)爭(zhēng)優(yōu)勢(shì)。
一旦數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之后就很少會(huì)發(fā)生變化。數(shù)據(jù)被保存在那里用于查詢(xún)和生成報(bào)表，以便幫助決策者規(guī)劃企業(yè)的未來(lái)。它不需要關(guān)心插入、更新和刪除操作。因此與高度規(guī)范的事務(wù)數(shù)據(jù)庫(kù)不同，在這種情況下通常會(huì)使用所謂的維度數(shù)據(jù)庫(kù) (dimensional database)，它將遵循特定的結(jié)構(gòu)或模式。
維度數(shù)據(jù)庫(kù)可以用來(lái)構(gòu)建數(shù)據(jù)立方體，數(shù)據(jù)立方體是數(shù)據(jù)的多維表示，用來(lái)方便聯(lián)機(jī)業(yè)務(wù)分析和提高查詢(xún)性能。立方體中的每一維都表示業(yè)務(wù)數(shù)據(jù)中的一個(gè)不同的分析類(lèi)別。

維度數(shù)據(jù)庫(kù)
在OLTP系統(tǒng)中進(jìn)行復(fù)雜查詢(xún)存在一些固有的問(wèn)題，對(duì)這些問(wèn)題的解決方案是構(gòu)建一個(gè)單獨(dú)的數(shù)據(jù)庫(kù)來(lái)更簡(jiǎn)潔地表示業(yè)務(wù)事實(shí)(fact)。這個(gè)數(shù)據(jù)庫(kù)的結(jié)構(gòu)不是關(guān)系型的，相反，它是維度化的。

ETL
數(shù)據(jù)抽?。‥xtract）、轉(zhuǎn)換（Transform）、清洗（Cleansing）、裝載（Load）的過(guò)程。是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的重要一環(huán)，用戶(hù)從數(shù)據(jù)源抽取出所需的數(shù)據(jù)，經(jīng)過(guò)數(shù)據(jù)清洗，最終按照預(yù)先定義好的數(shù)據(jù)倉(cāng)庫(kù)模型，將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。

元數(shù)據(jù)（Meta Data）
關(guān)于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)，指在數(shù)據(jù)倉(cāng)庫(kù)建設(shè)過(guò)程中所產(chǎn)生的有關(guān)數(shù)據(jù)源定義，目標(biāo)定義，轉(zhuǎn)換規(guī)則等相關(guān)的關(guān)鍵數(shù)據(jù)。同時(shí)元數(shù)據(jù)還包含關(guān)于數(shù)據(jù)含義的商業(yè)信息，所有這些信息都應(yīng)當(dāng)妥善保存，并很好地管理。為數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展和使用提供方便。
關(guān)于數(shù)據(jù)的數(shù)據(jù)，用于構(gòu)造、維持、管理、和使用數(shù)據(jù)倉(cāng)庫(kù)，在數(shù)據(jù)倉(cāng)庫(kù)中尤為重要。
不同 OLAP 組件中的數(shù)據(jù)和應(yīng)用程序的結(jié)構(gòu)模型。元數(shù)據(jù)描述 OLTP 數(shù)據(jù)庫(kù)中的表、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市中的多維數(shù)據(jù)集這類(lèi)對(duì)象，還記錄哪些應(yīng)用程序引用不同的記錄塊。

數(shù)據(jù)集市（Data mart）
** **數(shù)據(jù)集市 -- 小型的，面向部門(mén)或工作組級(jí)數(shù)據(jù)倉(cāng)庫(kù)。
即”小數(shù)據(jù)倉(cāng)庫(kù)”。如果說(shuō)數(shù)據(jù)倉(cāng)庫(kù)是建立在企業(yè)級(jí)的數(shù)據(jù)模型之上的話(huà)。那么數(shù)據(jù)集市就是企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)子集，他主要面向部門(mén)級(jí)業(yè)務(wù)，并且只是面向某個(gè)特定的主題。數(shù)據(jù)集市可以在一定程度上緩解訪(fǎng)問(wèn)數(shù)據(jù)倉(cāng)庫(kù)的瓶頸。

ODS
Operation Data Store，操作數(shù)據(jù)存儲(chǔ) — ODS是能支持企業(yè)日常的全局應(yīng)用的數(shù)據(jù)集合,是不同于DB的一種新的數(shù)據(jù)環(huán)境, 是DW 擴(kuò)展后得到的一個(gè)混合形式。四個(gè)基本特點(diǎn)：面向主題的(Subject -Oriented)、集成的、可變的、當(dāng)前或接近當(dāng)前的。

主題（SUBJECT）
是一個(gè)在較高層次將數(shù)據(jù)歸類(lèi)的標(biāo)準(zhǔn)，每一個(gè)主題對(duì)應(yīng)一個(gè)宏觀的分析領(lǐng)域，針對(duì)具體決策需求可細(xì)化為多個(gè)主題表，具體來(lái)說(shuō)就是確定決策涉及的范圍和所要解決的問(wèn)題。

多維數(shù)據(jù)集
多維數(shù)據(jù)集是聯(lián)機(jī)分析處理 (OLAP) 中的主要對(duì)象，是一項(xiàng)可對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行快速訪(fǎng)問(wèn)的技術(shù)。多維數(shù)據(jù)集是一個(gè)數(shù)據(jù)集合，通常從數(shù)據(jù)倉(cāng)庫(kù)的子集構(gòu)造，并組織和匯總成一個(gè)由一組維度和度量值定義的多維結(jié)構(gòu)。

維度(DIMENSION）
是人們觀察數(shù)據(jù)的特定角度，是考慮問(wèn)題時(shí)的一類(lèi)屬性，屬性集合構(gòu)成一個(gè)維(時(shí)間維、地理維等)。
是多維數(shù)據(jù)集的結(jié)構(gòu)性特性。它們是事實(shí)數(shù)據(jù)表中用來(lái)描述數(shù)據(jù)的分類(lèi)的有組織層次結(jié)構(gòu)(級(jí)別)
。這些分類(lèi)和級(jí)別描述了一些相似的成員集合，用戶(hù)將基于這些成員集合進(jìn)行分析。
這詞，英國(guó)著名物理學(xué)家史蒂芬·霍金教授有這樣的解釋?zhuān)哼@就像一根頭發(fā)，遠(yuǎn)看是一維的線(xiàn)，在放大鏡下，它確實(shí)是三維的；如果面對(duì)時(shí)空，如果有足夠高倍的放大鏡的話(huà)，也應(yīng)該能揭示出其它可能存在的4維、5維空間，直至11維空間。因此，維度是指一種視角，而不是一個(gè)固定的數(shù)字；是一個(gè)判斷、說(shuō)明、評(píng)價(jià)和確定一個(gè)事物的多方位、多角度、多層次的條件和概念

事實(shí)表
每個(gè)數(shù)據(jù)倉(cāng)庫(kù)都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表。事實(shí)數(shù)據(jù)表可能包含業(yè)務(wù)銷(xiāo)售數(shù)據(jù)，如現(xiàn)金登記事務(wù)
所產(chǎn)生的數(shù)據(jù)，事實(shí)數(shù)據(jù)表通常包含大量的行。事實(shí)數(shù)據(jù)表的主要特點(diǎn)是包含數(shù)字?jǐn)?shù)據(jù)(事實(shí))，并且這些數(shù)字信息可以匯總，以提供有關(guān)單位作為歷史的數(shù)據(jù)，每個(gè)事實(shí)數(shù)據(jù)表包含一個(gè)由多個(gè)部分組成的索引，該索引包含作為外鍵的相關(guān)性緯度表的主鍵，而維度表包含事實(shí)記錄的特性。事實(shí)數(shù)據(jù)表不應(yīng)該包含描述性的信息，也不應(yīng)該包含除數(shù)字度量字段及使事實(shí)與緯度表中對(duì)應(yīng)項(xiàng)的相關(guān)索引字段之外的任何數(shù)據(jù)。
包含在事實(shí)數(shù)據(jù)表中的“度量值”有兩中：一種是可以累計(jì)的度量值，另一種是非累計(jì)的度量值。最有用的度量值是可累計(jì)的度量值，其累計(jì)起來(lái)的數(shù)字是非常有意義的。用戶(hù)可以通過(guò)累計(jì)度量值獲得匯總信息，例如?？梢詤R總具體時(shí)間段內(nèi)一組商店的特定商品的銷(xiāo)售情況。非累計(jì)的度量值也可以用于事實(shí)數(shù)據(jù)表，單匯總結(jié)果一般是沒(méi)有意義的，例如，在一座大廈的不同位置測(cè)量溫度時(shí)，如果將大廈中所有不同位置的溫度累加是沒(méi)有意義的，但是求平均值是有意義的。
一般來(lái)說(shuō)，一個(gè)事實(shí)數(shù)據(jù)表都要和一個(gè)或多個(gè)緯度表相關(guān)聯(lián)，用戶(hù)在利用事實(shí)數(shù)據(jù)表創(chuàng)建多維數(shù)據(jù)集時(shí)，可以使用一個(gè)或多個(gè)維度表。
從用途的不同來(lái)說(shuō)，事實(shí)表可以分為三類(lèi)，分別是原子事實(shí)表，聚集事實(shí)表和合并事實(shí)表。

原子事實(shí)表（Atom Fact Table）是保存最細(xì)粒度數(shù)據(jù)的事實(shí)表，也是數(shù)據(jù)倉(cāng)庫(kù)中保存原子信息的場(chǎng)所。
聚集事實(shí)表（Aggregated Fact Table）是原子事實(shí)表上的匯總數(shù)據(jù)，也稱(chēng)為匯總事實(shí)表。即新建立一個(gè)事實(shí)表，它的維度表是比原維度表要少，或者某些維度表是原維度表的子集，如用月份維度表代替日期維度表；事實(shí)數(shù)據(jù)是相應(yīng)事實(shí)的匯總，即求和或求平均值等。在做數(shù)據(jù)遷移時(shí)，當(dāng)相關(guān)的維度數(shù)據(jù)和事實(shí)數(shù)據(jù)發(fā)生變化時(shí)，聚集事實(shí)表需要做相應(yīng)的刷新。物化視圖是實(shí)現(xiàn)聚集事實(shí)表的一種有效方式，可以設(shè)定刷新方式，具體功能由DBMS來(lái)實(shí)現(xiàn)。
合并事實(shí)表（Consolidated Fact Table）是指將位于不同事實(shí)表中處于相同粒度的事實(shí)進(jìn)行組合建模而成的一種事實(shí)表。即新建立一個(gè)事實(shí)表，它的維度是兩個(gè)或多個(gè)事實(shí)表的相同維度的集合；事實(shí)是幾個(gè)事實(shí)表中感興趣的事實(shí)。在Kimball的總線(xiàn)架構(gòu)中，由合并事實(shí)表為主組成的合并數(shù)據(jù)集市稱(chēng)為二級(jí)數(shù)據(jù)集市。合并事實(shí)表的粒度可以是原子粒度也可以是聚集粒度。在做數(shù)據(jù)遷移時(shí)，當(dāng)相關(guān)的原子事實(shí)表的數(shù)據(jù)有改變時(shí)，合并事實(shí)表的數(shù)據(jù)需要重新刷新。合并事實(shí)表和交叉探察是兩個(gè)互補(bǔ)的操作。
聚集事實(shí)表和合并事實(shí)表的主要差別是合并事實(shí)表一般是從多個(gè)事實(shí)表合并而來(lái)。但是它們的差別不是絕對(duì)的，一個(gè)事實(shí)表既是聚集事實(shí)表又是合并事實(shí)表是很有可能的。因?yàn)橐话愫喜⑹聦?shí)表需要按相同的維度合并，所以很可能在做合并的同時(shí)需要進(jìn)行聚集，即粒度變粗。

維度表
維度表可以看作是用戶(hù)來(lái)分析數(shù)據(jù)的窗口
，緯度表中包含事實(shí)數(shù)據(jù)表中事實(shí)記錄的特性，有些特性提供描述性信息，有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù)，以便為分析者提供有用的信息，維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。例如，包含產(chǎn)品信息的維度表通常包含將產(chǎn)品分為食品、飲料、非消費(fèi)品等若干類(lèi)的層次結(jié)構(gòu)，這些產(chǎn)品中的每一類(lèi)進(jìn)一步多次細(xì)分，直到各產(chǎn)品達(dá)到最低級(jí)別。
在維度表中，每個(gè)表都包含獨(dú)立于其他維度表的事實(shí) 特性，例如，客戶(hù)維度表包含有關(guān)客戶(hù)的數(shù)據(jù)。維度表中的列字段可以將信息分為不同層次的結(jié)構(gòu)級(jí)。
結(jié)論:
1、事實(shí)表就是你要關(guān)注的內(nèi)容;
2、維度表就是你觀察該事務(wù)的角度，是從哪個(gè)角度去觀察這個(gè)內(nèi)容的。
例如，某地區(qū)商品的銷(xiāo)量，是從地區(qū)這個(gè)角度觀察商品銷(xiāo)量的。事實(shí)表就是銷(xiāo)量表，維度表就是地區(qū)表。

度量值
在多維數(shù)據(jù)集中，度量值是一組值，這些值基于多維數(shù)據(jù)集的事實(shí)數(shù)據(jù)表中的一列，而且通常為數(shù)字
。此外，度量值是所分析的多維數(shù)據(jù)集的中心值。即，度量值是最終用戶(hù)瀏覽多維數(shù)據(jù)集時(shí)重點(diǎn)查看的數(shù)字?jǐn)?shù)據(jù)。您所選擇的度量值取決于最終用戶(hù)所請(qǐng)求的信息類(lèi)型。一些常見(jiàn)的度量值有 sales、cost、expenditures 和 production count 等。
“度量值”是來(lái)自事實(shí)數(shù)據(jù)表的值
，也稱(chēng)為“事實(shí)數(shù)據(jù)”。度量值維度的值有時(shí)也通稱(chēng)為“成員”。度量值通常是數(shù)值，但也可以是字符串值。

Measures 維度 (Measures dimension)
“度量值維度”是包含多維數(shù)據(jù)集中所有度量值的維度。度量值維度是一種特殊的維度，其中的成員通常是根據(jù)各個(gè)維度屬性（存在指定的度量值）的當(dāng)前成員（通常采用求和或計(jì)數(shù)方式）進(jìn)行聚合。

度量值組 (Measure Group)
“度量值組”是 SQL Server 2005 Analysis Services 多維數(shù)據(jù)集中的相關(guān)度量值集合（通常是來(lái)自同一事實(shí)數(shù)據(jù)表的度量值）。在 SQL Server 2005 Analysis Services 中，一個(gè)多維數(shù)據(jù)集可包含多個(gè)度量值組。

級(jí)別
級(jí)別是維度層次結(jié)構(gòu)的一個(gè)元素。級(jí)別描述了數(shù)據(jù)的層次結(jié)構(gòu)，從數(shù)據(jù)的最高(匯總程度最大)級(jí)別直到最低(最詳細(xì))級(jí)別。

多維 OLAP (MOLAP)：MOLAP 存儲(chǔ)模式使得分區(qū)的聚合和其源數(shù)據(jù)的復(fù)本以多維結(jié)構(gòu)存儲(chǔ)在分析服務(wù)器計(jì)算機(jī)上。根據(jù)分區(qū)聚合的百分比和設(shè)計(jì)，MOLAP 存儲(chǔ)模式為達(dá)到最快查詢(xún)響應(yīng)時(shí)間提供了潛在可能性?？偠灾?，MOLAP 更加適合于頻繁使用的多維數(shù)據(jù)集中的分區(qū)和對(duì)快速查詢(xún)響應(yīng)的需要。

關(guān)系 OLAP (ROLAP)：ROLAP 存儲(chǔ)模式使得分區(qū)的聚合存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)的表(在分區(qū)數(shù)據(jù)源中指定)中。但是，可為分區(qū)數(shù)據(jù)使用 ROLAP 存儲(chǔ)模式，而不在關(guān)系數(shù)據(jù)庫(kù)中創(chuàng)建聚合。

混合 OLAP (HOLAP)：HOLAP 存儲(chǔ)模式結(jié)合了 MOLAP 和 ROLAP 二者的特性。

粒度
數(shù)據(jù)匯總的層次或深度。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。細(xì)化程度越高，粒度越小。

聚合|聚集：聚合是預(yù)先計(jì)算好的數(shù)據(jù)匯總，由于在問(wèn)題提出之前已經(jīng)準(zhǔn)備了答案，聚合可以改進(jìn)查詢(xún)響應(yīng)時(shí)間。

分割
數(shù)據(jù)分散到各自的物理單元中去，它們能獨(dú)立地處理。

切塊：由多個(gè)維的多個(gè)成員限定的分區(qū)數(shù)據(jù)，稱(chēng)為一個(gè)切塊。

切片：由一個(gè)維的一個(gè)成員限定的分區(qū)數(shù)據(jù)，稱(chēng)為一個(gè)切片。

數(shù)據(jù)鉆取：最終用戶(hù)從常規(guī)多維數(shù)據(jù)集、虛擬多維數(shù)據(jù)集或鏈接多維數(shù)據(jù)集中選擇單個(gè)單元，并從該單元的源數(shù)據(jù)中檢索結(jié)果集以獲得更詳細(xì)的信息，這個(gè)操作過(guò)程就是數(shù)據(jù)鉆取。

數(shù)據(jù)挖掘模型：數(shù)據(jù)挖掘使您得以定義包含分組和預(yù)測(cè)規(guī)則的模型，以便應(yīng)用于關(guān)系數(shù)據(jù)庫(kù)或多維 OLAP 數(shù)據(jù)集中的數(shù)據(jù)。之后，這些預(yù)測(cè)模型便可用于自動(dòng)執(zhí)行復(fù)雜的數(shù)據(jù)分析，以找出幫助識(shí)別新機(jī)會(huì)并選擇有獲勝把握的機(jī)會(huì)的趨勢(shì)。

數(shù)據(jù)庫(kù)維度 (Database dimension)
“數(shù)據(jù)庫(kù)維度”是與某個(gè)鍵屬性相關(guān)的維度屬性的集合，而該鍵屬性又與度量值維度中的事實(shí)數(shù)據(jù)相關(guān)。

維度屬性 (Dimension attribute)
“維度屬性”被綁定到維度表中的一個(gè)或多個(gè)列并包含成員。維度屬性可以包含客戶(hù)名稱(chēng)、月份名稱(chēng)和產(chǎn)品名稱(chēng)。

成員 (Member)
“成員”是維度屬性（包括度量值維度）的值。層次結(jié)構(gòu)中的成員可以是葉成員、父成員、數(shù)據(jù)成員或“(全部)”成員。

“(全部)”成員 ((All) member)
“(全部)”成員是屬性層次結(jié)構(gòu)或用戶(hù)定義的層次結(jié)構(gòu)中的所有成員的計(jì)算值。

計(jì)算成員 (Calculated member)
“計(jì)算成員”是在查詢(xún)時(shí)定義和計(jì)算的維度成員?？梢栽谟脩?hù)查詢(xún)或 MDX 計(jì)算腳本中定義計(jì)算成員，并將其存儲(chǔ)在服務(wù)器上。一個(gè)計(jì)算成員對(duì)應(yīng)于定義它們的維度中的多個(gè)維度表行。

數(shù)據(jù)成員 (Data member)
“數(shù)據(jù)成員”是在父子層次結(jié)構(gòu)中與父成員相關(guān)聯(lián)的子成員。數(shù)據(jù)成員包含其父成員的數(shù)據(jù)值，而不是該父成員的子級(jí)的聚合值。

父成員 (Parent member)
“父成員”是父子層次結(jié)構(gòu)中的成員，包含其子級(jí)的聚合值。

葉成員 (leaf member)
“葉成員”是層次結(jié)構(gòu)中不包含子級(jí)的成員。

子成員 (Child member)
“子成員”是層次結(jié)構(gòu)中位于頂層下面的成員。

鍵屬性 (Key attribute)
數(shù)據(jù)庫(kù)維度的“鍵屬性”是維度中的所有非鍵屬性（以直接或間接方式）所鏈接到的屬性。鍵屬性通常也是粒度屬性。

粒度屬性 (Granularity attribute)
多維數(shù)據(jù)集維度的屬性，它將維度鏈接到度量值維度內(nèi)度量值組中的事實(shí)數(shù)據(jù)。如果粒度屬性和鍵屬性為不同的屬性，則非鍵屬性必須直接或間接地鏈接到粒度屬性。在多維數(shù)據(jù)集中，粒度屬性定義維度的粒度。

多維數(shù)據(jù)集維度 (Cube dimension)
“多維數(shù)據(jù)集維度”是多維數(shù)據(jù)集中的數(shù)據(jù)庫(kù)維度實(shí)例。

屬性層次結(jié)構(gòu) (Attribute hierarchy)
“屬性層次結(jié)構(gòu)”是包含以下級(jí)別的屬性成員層次結(jié)構(gòu)：

數(shù)據(jù)倉(cāng)庫(kù)建模 — 星型模式
Example of Star Schema
在多維分析的商業(yè)智能解決方案中，根據(jù)事實(shí)表和維度表的關(guān)系，又可將常見(jiàn)的模型分為星型模型和雪花型模型。在設(shè)計(jì)邏輯型數(shù)據(jù)的模型的時(shí)候，就應(yīng)考慮數(shù)據(jù)是按照星型模型還是雪花型模型進(jìn)行組織。
當(dāng)所有維表都直接連接到“ 事實(shí)表”上時(shí)，整個(gè)圖解就像星星一樣，故將該模型稱(chēng)為星型模型，星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu)，多維數(shù)據(jù)集的每一個(gè)維度都直接與事實(shí)表相連接，不存在漸變維度，所以數(shù)據(jù)有一定的冗余，如在地域維度表中，存在國(guó)家 A 省 B 的城市 C 以及國(guó)家 A 省 B 的城市 D 兩條記錄，那么國(guó)家 A 和省 B 的信息分別存儲(chǔ)了兩次，即存在冗余。

數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)

數(shù)據(jù)倉(cāng)庫(kù)建模 — 雪片模式
Example of Snowflake Schema
當(dāng)有一個(gè)或多個(gè)維表沒(méi)有直接連接到事實(shí)表上，而是通過(guò)其他維表連接到事實(shí)表上時(shí)，其圖解就像多個(gè)雪花連接在一起，故稱(chēng)雪花模型。雪花模型是對(duì)星型模型的擴(kuò)展。它對(duì)星型模型的維表進(jìn)一步層次化，原有的各維表可能被擴(kuò)展為小的事實(shí)表，形成一些局部的 " 層次 " 區(qū)域，這些被分解的表都連接到主維度表而不是事實(shí)表。將地域維表又分解為國(guó)家，省份，城市等維表。它的優(yōu)點(diǎn)是 : 通過(guò)最大限度地減少數(shù)據(jù)存儲(chǔ)量以及聯(lián)合較小的維表來(lái)改善查詢(xún)性能。雪花型結(jié)構(gòu)去除了數(shù)據(jù)冗余。

數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)

星型模型因?yàn)閿?shù)據(jù)的冗余所以很多統(tǒng)計(jì)查詢(xún)不需要做外部的連接，因此一般情況下效率比雪花型模型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素，設(shè)計(jì)與實(shí)現(xiàn) 都比較簡(jiǎn)單。雪花型模型由于去除了冗余，有些統(tǒng)計(jì)就需要通過(guò)表的聯(lián)接才能產(chǎn)生，所以效率不一定有星型模型高。正規(guī)化也是一種比較復(fù)雜的過(guò)程，相應(yīng)的數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)、數(shù) 據(jù)的 ETL、以及后期的維護(hù)都要復(fù)雜一些。因此在冗余可以接受的前提下，實(shí)際運(yùn)用中星型模型使用更多，也更有效率。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)

數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí)

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av