八、數(shù)據(jù)庫管理技術(shù)的發(fā)展

數(shù)據(jù)庫技術(shù)發(fā)展概述

數(shù)據(jù)庫是管理數(shù)據(jù)的技術(shù),發(fā)展了以數(shù)據(jù)建模數(shù)據(jù)庫管理系統(tǒng)核心技術(shù)為主,內(nèi)容豐富、領域?qū)拸V的一門學科,帶動了一類巨大的軟件產(chǎn)業(yè)---數(shù)據(jù)庫管理系統(tǒng)(DBMS)產(chǎn)品及其相關的工具和解決方案。
數(shù)據(jù)模型是數(shù)據(jù)庫系統(tǒng)的核心和基礎。

1.數(shù)據(jù)庫技術(shù)的發(fā)展階段

  • 第一代數(shù)據(jù)庫系統(tǒng)
    1. 層次模型數(shù)據(jù)庫管理系統(tǒng)
      1. 層次模型(網(wǎng)狀模型的特例)
      2. 代表:1969年IBM公司研制的層次模型數(shù)據(jù)庫管理系統(tǒng)IMS
    2. 網(wǎng)狀模型數(shù)據(jù)庫管理系統(tǒng)
      1. 網(wǎng)狀模型
      2. 代表:DBTG所提議的方法是基于網(wǎng)狀結(jié)構(gòu)的,是網(wǎng)狀模型數(shù)據(jù)庫系統(tǒng)的典型代表
    3. 共同特點
      1. 支持三級模式(外模式、模式、內(nèi)模式)的體系結(jié)構(gòu)。
      2. 用存取路徑來表示數(shù)據(jù)之間的聯(lián)系。
      3. 獨立的數(shù)據(jù)定義語言。
      4. 導航的數(shù)據(jù)操縱語言。
  • 第二代數(shù)據(jù)庫系統(tǒng)
    1. 關系數(shù)據(jù)庫系統(tǒng)
      1. 關系數(shù)據(jù)庫是以關系模型為基礎
      2. 關系模型是由數(shù)據(jù)結(jié)構(gòu)、關系操作數(shù)據(jù)完整性三部分組成。
      3. 關系代數(shù)作為語言基礎,由關系數(shù)據(jù)理論作為理論基礎。
    2. 20世紀70年代是關系數(shù)據(jù)庫理論研究和原型開發(fā)的時代,其主要成果有:
      1. 奠定了關系模型的理論基礎,給出了人們一致接受的關系模型的規(guī)范說明。
      2. 研究了關系數(shù)據(jù)語言,有關系代數(shù)、關系演算、SQL語句及QBE等。
      3. 研制了大量的RDBMS的原型,攻克了系統(tǒng)實現(xiàn)中查詢優(yōu)化、并發(fā)控制、故障恢復等一系列關鍵技術(shù)。
    3. 特點
      1. 模型簡單清晰
      2. 理論基礎好
      3. 數(shù)據(jù)獨立性強
      4. 數(shù)據(jù)庫語言非過程化
      5. 標準化
  • 新一代數(shù)據(jù)庫系統(tǒng)

2.第三代數(shù)據(jù)庫系統(tǒng)的特征

  • 應支持數(shù)據(jù)管理、對象管理和知識管理
  • 必須保持或繼承第二代數(shù)據(jù)庫系統(tǒng)的技術(shù)
  • 必須對其他系統(tǒng)開放

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

數(shù)據(jù)倉庫及其特征

計算機數(shù)據(jù)處理工作的類型:

  1. 操作型處理:也稱為聯(lián)機事務處理(OLTP),針對具體業(yè)務在數(shù)據(jù)庫聯(lián)機的日常操作。
  2. 分析型處理:也稱為聯(lián)機分析處理(OLAP),通常是對海量的歷史數(shù)據(jù)查詢和分析。

  • 傳統(tǒng)的數(shù)據(jù)庫技術(shù)--->操作型處理
  • 數(shù)據(jù)倉庫----------->分析型處理

數(shù)據(jù)倉庫(Data Warehouse,DW)是面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)集合,用以支持管理決策的過程。
數(shù)據(jù)倉庫不是可以買到的產(chǎn)品,而是一種面向分析的數(shù)據(jù)存儲方案

數(shù)據(jù)倉庫的特征

數(shù)據(jù)倉庫的三個概念

數(shù)據(jù)倉庫的三個概念

什么是數(shù)據(jù)挖掘

數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中發(fā)現(xiàn)并提取隱藏在其中的、人們事先不知道的,但又是潛在有用的信息和知識的一種技術(shù)。又被稱為知識發(fā)現(xiàn)。

OLAP VS 數(shù)據(jù)挖掘
數(shù)據(jù)匯總/聚集工具,可簡化數(shù)據(jù)分析 自動的發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中隱含模式和有趣知識
簡化和支持交互式數(shù)據(jù)分析 盡可能自動處理

數(shù)據(jù)挖掘的功能

  • 數(shù)據(jù)挖掘的功能
    • 概念描述
    • 關聯(lián)分析
    • 分類與預測
    • 聚類
    • 孤立點檢測
    • 趨勢和演變分析
  • 數(shù)據(jù)挖掘的步驟
    1. 確定業(yè)務對象
    2. 數(shù)據(jù)的選擇
    3. 數(shù)據(jù)的預處理
    4. 建模
    5. 模型評估
    6. 模型部署

大數(shù)據(jù)及其特征

大數(shù)據(jù)是指無法在可容忍的時間內(nèi)用現(xiàn)有信息技術(shù)和軟、硬件工具對其進行感知、獲取、管理、處理的服務的數(shù)據(jù)集合

大數(shù)據(jù)特征

大數(shù)據(jù)管理技術(shù)

大數(shù)據(jù)管理技術(shù)典型代表

大數(shù)據(jù)管理技術(shù)典型代表
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容