數(shù)據(jù)庫技術(shù)發(fā)展概述
數(shù)據(jù)庫是管理數(shù)據(jù)的技術(shù),發(fā)展了以數(shù)據(jù)建模和數(shù)據(jù)庫管理系統(tǒng)核心技術(shù)為主,內(nèi)容豐富、領域?qū)拸V的一門學科,帶動了一類巨大的軟件產(chǎn)業(yè)---數(shù)據(jù)庫管理系統(tǒng)(DBMS)產(chǎn)品及其相關的工具和解決方案。
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎。
1.數(shù)據(jù)庫技術(shù)的發(fā)展階段
- 第一代數(shù)據(jù)庫系統(tǒng)
- 層次模型數(shù)據(jù)庫管理系統(tǒng)
- 層次模型(網(wǎng)狀模型的特例)
- 代表:1969年IBM公司研制的層次模型數(shù)據(jù)庫管理系統(tǒng)IMS
- 網(wǎng)狀模型數(shù)據(jù)庫管理系統(tǒng)
- 網(wǎng)狀模型
- 代表:DBTG所提議的方法是基于網(wǎng)狀結(jié)構(gòu)的,是網(wǎng)狀模型數(shù)據(jù)庫系統(tǒng)的典型代表
- 共同特點
- 支持三級模式(外模式、模式、內(nèi)模式)的體系結(jié)構(gòu)。
- 用存取路徑來表示數(shù)據(jù)之間的聯(lián)系。
- 獨立的數(shù)據(jù)定義語言。
- 導航的數(shù)據(jù)操縱語言。
- 層次模型數(shù)據(jù)庫管理系統(tǒng)
- 第二代數(shù)據(jù)庫系統(tǒng)
- 關系數(shù)據(jù)庫系統(tǒng)
- 關系數(shù)據(jù)庫是以關系模型為基礎
- 關系模型是由數(shù)據(jù)結(jié)構(gòu)、關系操作和數(shù)據(jù)完整性三部分組成。
- 關系代數(shù)作為語言基礎,由關系數(shù)據(jù)理論作為理論基礎。
- 20世紀70年代是關系數(shù)據(jù)庫理論研究和原型開發(fā)的時代,其主要成果有:
- 奠定了關系模型的理論基礎,給出了人們一致接受的關系模型的規(guī)范說明。
- 研究了關系數(shù)據(jù)語言,有關系代數(shù)、關系演算、SQL語句及QBE等。
- 研制了大量的RDBMS的原型,攻克了系統(tǒng)實現(xiàn)中查詢優(yōu)化、并發(fā)控制、故障恢復等一系列關鍵技術(shù)。
- 特點
- 模型簡單清晰
- 理論基礎好
- 數(shù)據(jù)獨立性強
- 數(shù)據(jù)庫語言非過程化
- 標準化
- 關系數(shù)據(jù)庫系統(tǒng)
- 新一代數(shù)據(jù)庫系統(tǒng)
2.第三代數(shù)據(jù)庫系統(tǒng)的特征
- 應支持數(shù)據(jù)管理、對象管理和知識管理
- 必須保持或繼承第二代數(shù)據(jù)庫系統(tǒng)的技術(shù)
- 必須對其他系統(tǒng)開放
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘
數(shù)據(jù)倉庫及其特征
計算機數(shù)據(jù)處理工作的類型:
- 操作型處理:也稱為聯(lián)機事務處理(OLTP),針對具體業(yè)務在數(shù)據(jù)庫聯(lián)機的日常操作。
- 分析型處理:也稱為聯(lián)機分析處理(OLAP),通常是對海量的歷史數(shù)據(jù)查詢和分析。
- 傳統(tǒng)的數(shù)據(jù)庫技術(shù)--->操作型處理
- 數(shù)據(jù)倉庫----------->分析型處理
數(shù)據(jù)倉庫(Data Warehouse,DW)是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用以支持管理決策的過程。
數(shù)據(jù)倉庫不是可以買到的產(chǎn)品,而是一種面向分析的數(shù)據(jù)存儲方案。

數(shù)據(jù)倉庫的特征
數(shù)據(jù)倉庫的三個概念

數(shù)據(jù)倉庫的三個概念
什么是數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中發(fā)現(xiàn)并提取隱藏在其中的、人們事先不知道的,但又是潛在有用的信息和知識的一種技術(shù)。又被稱為知識發(fā)現(xiàn)。
| OLAP | VS | 數(shù)據(jù)挖掘 |
|---|---|---|
| 數(shù)據(jù)匯總/聚集工具,可簡化數(shù)據(jù)分析 | 自動的發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中隱含模式和有趣知識 | |
| 簡化和支持交互式數(shù)據(jù)分析 | 盡可能自動處理 |
數(shù)據(jù)挖掘的功能
- 數(shù)據(jù)挖掘的功能
- 概念描述
- 關聯(lián)分析
- 分類與預測
- 聚類
- 孤立點檢測
- 趨勢和演變分析
- 數(shù)據(jù)挖掘的步驟
- 確定業(yè)務對象
- 數(shù)據(jù)的選擇
- 數(shù)據(jù)的預處理
- 建模
- 模型評估
- 模型部署
大數(shù)據(jù)及其特征
大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用現(xiàn)有信息技術(shù)和軟、硬件工具對其進行感知、獲取、管理、處理的服務的數(shù)據(jù)集合。

大數(shù)據(jù)特征
大數(shù)據(jù)管理技術(shù)
大數(shù)據(jù)管理技術(shù)典型代表

大數(shù)據(jù)管理技術(shù)典型代表