OLTP與OLAP的介紹
數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務處理OLTP(on-line transaction processing)、聯(lián)機分析處理OLAP(On-Line Analytical Processing)。OLTP是傳統(tǒng)的關系型數(shù)據(jù)庫的主要應用,主要是基本的、日常的事務處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應用,支持復雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。
OLTP系統(tǒng)強調(diào)數(shù)據(jù)庫內(nèi)存效率,強調(diào)內(nèi)存各種指標的命令率,強調(diào)綁定變量,強調(diào)并發(fā)操作;
OLAP系統(tǒng)則強調(diào)數(shù)據(jù)分析,強調(diào)SQL執(zhí)行市場,強調(diào)磁盤I/O,強調(diào)分區(qū)等。
OLTP與OLAP之間的比較:

OLTP,也叫聯(lián)機事務處理(Online Transaction Processing),表示事務性非常高的系統(tǒng),一般都是高可用的在線系統(tǒng),以小的事務以及小的查詢?yōu)橹?,評估其系統(tǒng)的時候,一般看其每秒執(zhí)行的Transaction以及Execute SQL的數(shù)量。在這樣的系統(tǒng)中,單個數(shù)據(jù)庫每秒處理的Transaction往往超過幾百個,或者是幾千個,Select 語句的執(zhí)行量每秒幾千甚至幾萬個。典型的OLTP系統(tǒng)有電子商務系統(tǒng)、銀行、證券等,如美國eBay的業(yè)務數(shù)據(jù)庫,就是很典型的OLTP數(shù)據(jù)庫。
OLTP系統(tǒng)最容易出現(xiàn)瓶頸的地方就是CPU與磁盤子系統(tǒng)。
(1)CPU出現(xiàn)瓶頸常表現(xiàn)在邏輯讀總量與計算性函數(shù)或者是過程上,邏輯讀總量等于單個語句的邏輯讀乘以執(zhí)行次數(shù),如果單個語句執(zhí)行速度雖然很快,但是執(zhí)行次數(shù)非常多,那么,也可能會導致很大的邏輯讀總量。設計的方法與優(yōu)化的方法就是減少單個語句的邏輯讀,或者是減少它們的執(zhí)行次數(shù)。另外,一些計算型的函數(shù),如自定義函數(shù)、decode等的頻繁使用,也會消耗大量的CPU時間,造成系統(tǒng)的負載升高,正確的設計方法或者是優(yōu)化方法,需要盡量避免計算過程,如保存計算結(jié)果到統(tǒng)計表就是一個好的方法。
(2)磁盤子系統(tǒng)在OLTP環(huán)境中,它的承載能力一般取決于它的IOPS處理能力. 因為在OLTP環(huán)境中,磁盤物理讀一般都是db file sequential read,也就是單塊讀,但是這個讀的次數(shù)非常頻繁。如果頻繁到磁盤子系統(tǒng)都不能承載其IOPS的時候,就會出現(xiàn)大的性能問題。
OLTP比較常用的設計與優(yōu)化方式為Cache技術與B-tree索引技術,Cache決定了很多語句不需要從磁盤子系統(tǒng)獲得數(shù)據(jù),所以,Web cache與Oracle data buffer對OLTP系統(tǒng)是很重要的。另外,在索引使用方面,語句越簡單越好,這樣執(zhí)行計劃也穩(wěn)定,而且一定要使用綁定變量,減少語句解析,盡量減少表關聯(lián),盡量減少分布式事務,基本不使用分區(qū)技術、MV技術、并行技術及位圖索引。因為并發(fā)量很高,批量更新時要分批快速提交,以避免阻塞的發(fā)生。
OLTP 系統(tǒng)是一個數(shù)據(jù)塊變化非常頻繁,SQL 語句提交非常頻繁的系統(tǒng)。 對于數(shù)據(jù)塊來說,應盡可能讓數(shù)據(jù)塊保存在內(nèi)存當中,對于SQL來說,盡可能使用變量綁定技術來達到SQL重用,減少物理I/O 和重復的SQL 解析,從而極大的改善數(shù)據(jù)庫的性能。
這里影響性能除了綁定變量,還有可能是熱快(hot block)。 當一個塊被多個用戶同時讀取時,Oracle 為了維護數(shù)據(jù)的一致性,需要使用Latch來串行化用戶的操作。當一個用戶獲得了latch后,其他用戶就只能等待,獲取這個數(shù)據(jù)塊的用戶越多,等待就越明顯。 這就是熱快的問題。 這種熱快可能是數(shù)據(jù)塊,也可能是回滾端塊。 對于數(shù)據(jù)塊來講,通常是數(shù)據(jù)庫的數(shù)據(jù)分布不均勻?qū)е?,如果是索引的?shù)據(jù)塊,可以考慮創(chuàng)建反向索引來達到重新分布數(shù)據(jù)的目的,對于回滾段數(shù)據(jù)塊,可以適當多增加幾個回滾段來避免這種爭用。
OLAP,也叫聯(lián)機分析處理(Online Analytical Processing)系統(tǒng),有的時候也叫DSS決策支持系統(tǒng),就是我們說的數(shù)據(jù)倉庫。在這樣的系統(tǒng)中,語句的執(zhí)行量不是考核標準,因為一條語句的執(zhí)行時間可能會非常長,讀取的數(shù)據(jù)也非常多。所以,在這樣的系統(tǒng)中,考核的標準往往是磁盤子系統(tǒng)的吞吐量(帶寬),如能達到多少MB/s的流量。
磁盤子系統(tǒng)的吞吐量則往往取決于磁盤的個數(shù),這個時候,Cache基本是沒有效果的,數(shù)據(jù)庫的讀寫類型基本上是db file scattered read與direct path read/write。應盡量采用個數(shù)比較多的磁盤以及比較大的帶寬,如4Gb的光纖接口。
在OLAP系統(tǒng)中,常使用分區(qū)技術、并行技術。
分區(qū)技術在OLAP系統(tǒng)中的重要性主要體現(xiàn)在數(shù)據(jù)庫管理上,比如數(shù)據(jù)庫加載,可以通過分區(qū)交換的方式實現(xiàn),備份可以通過備份分區(qū)表空間實現(xiàn),刪除數(shù)據(jù)可以通過分區(qū)進行刪除,至于分區(qū)在性能上的影響,它可以使得一些大表的掃描變得很快(只掃描單個分區(qū))。另外,如果分區(qū)結(jié)合并行的話,也可以使得整個表的掃描會變得很快??傊謪^(qū)主要的功能是管理上的方便性,它并不能絕對保證查詢性能的提高,有時候分區(qū)會帶來性能上的提高,有時候會降低。
并行技術除了與分區(qū)技術結(jié)合外,在Oracle 10g中,與RAC結(jié)合實現(xiàn)多節(jié)點的同時掃描,效果也非常不錯,可把一個任務,如select的全表掃描,平均地分派到多個RAC的節(jié)點上去。
在OLAP系統(tǒng)中,不需要使用綁定(BIND)變量,因為整個系統(tǒng)的執(zhí)行量很小,分析時間對于執(zhí)行時間來說,可以忽略,而且可避免出現(xiàn)錯誤的執(zhí)行計劃。但是OLAP中可以大量使用位圖索引,物化視圖,對于大的事務,盡量尋求速度上的優(yōu)化,沒有必要像OLTP要求快速提交,甚至要刻意減慢執(zhí)行的速度。
綁定變量真正的用途是在OLTP系統(tǒng)中,這個系統(tǒng)通常有這樣的特點,用戶并發(fā)數(shù)很大,用戶的請求十分密集,并且這些請求的SQL 大多數(shù)是可以重復使用的。
對于OLAP系統(tǒng)來說,絕大多數(shù)時候數(shù)據(jù)庫上運行著的是報表作業(yè),執(zhí)行基本上是聚合類的SQL 操作,比如group by,這時候,把優(yōu)化器模式設置為all_rows是恰當?shù)摹?而對于一些分頁操作比較多的網(wǎng)站類數(shù)據(jù)庫,設置為first_rows會更好一些。 但有時候?qū)τ贠LAP 系統(tǒng),我們又有分頁的情況下,我們可以考慮在每條SQL 中用hint。 如:
Select a.* from table a;
分開設計與優(yōu)化
在設計上要特別注意,如在高可用的OLTP環(huán)境中,不要盲目地把OLAP的技術拿過來用。
如分區(qū)技術,假設不是大范圍地使用分區(qū)關鍵字,而采用其它的字段作為where條件,那么,如果是本地索引,將不得不掃描多個索引,而性能變得更為低下。如果是全局索引,又失去分區(qū)的意義。
并行技術也是如此,一般在完成大型任務時才使用,如在實際生活中,翻譯一本書,可以先安排多個人,每個人翻譯不同的章節(jié),這樣可以提高翻譯速度。如果只是翻譯一頁書,也去分配不同的人翻譯不同的行,再組合起來,就沒必要了,因為在分配工作的時間里,一個人或許早就翻譯完了。
位圖索引也是一樣,如果用在OLTP環(huán)境中,很容易造成阻塞與死鎖。但是,在OLAP環(huán)境中,可能會因為其特有的特性,提高OLAP的查詢速度。MV也是基本一樣,包括觸發(fā)器等,在DML頻繁的OLTP系統(tǒng)上,很容易成為瓶頸,甚至是Library Cache等待,而在OLAP環(huán)境上,則可能會因為使用恰當而提高查詢速度。
對于OLAP系統(tǒng),在內(nèi)存上可優(yōu)化的余地很小,增加CPU 處理速度和磁盤I/O 速度是最直接的提高數(shù)據(jù)庫性能的方法,當然這也意味著系統(tǒng)成本的增加。
比如我們要對幾億條或者幾十億條數(shù)據(jù)進行聚合處理,這種海量的數(shù)據(jù),全部放在內(nèi)存中操作是很難的,同時也沒有必要,因為這些數(shù)據(jù)快很少重用,緩存起來也沒有實際意義,而且還會造成物理I/O相當大。 所以這種系統(tǒng)的瓶頸往往是磁盤I/O上面的。
對于OLAP系統(tǒng),SQL 的優(yōu)化非常重要,因為它的數(shù)據(jù)量很大,做全表掃描和索引對性能上來說差異是非常大的。
Oracle 11g的版本建庫過程中可供選擇的模板有:
一般用途或事務處理
定制數(shù)據(jù)庫
數(shù)據(jù)倉庫
個人對這些模板的理解為:
聯(lián)機分析處理(OLAP,On-line Analytical Processing),數(shù)據(jù)量大,DML少。使用數(shù)據(jù)倉庫模板
聯(lián)機事務處理(OLTP,On-line Transaction Processing),數(shù)據(jù)量少,DML頻繁,并行事務處理多,但是一般都很短。使用一般用途或事務處理模板。
決策支持系統(tǒng)(DDS,Decision support system),典型的操作是全表掃描,長查詢,長事務,但是一般事務的個數(shù)很少,往往是一個事務獨占系統(tǒng)。
轉(zhuǎn)自:http://blog.csdn.net/rfb0204421/article/details/6873284
http://76287.blog.51cto.com/66287/885475