關(guān)系型數(shù)據(jù)庫
關(guān)系 的個(gè)人理解:關(guān)系就是表內(nèi)數(shù)據(jù)之間的、表之間的關(guān)系。表內(nèi)數(shù)據(jù)是嚴(yán)格的對(duì)應(yīng)關(guān)系,字段缺一不可,值缺一不可,也就是一致的數(shù)據(jù)結(jié)構(gòu),這也就是 django 新增字段時(shí),需要?jiǎng)h掉數(shù)據(jù),重新 migrate。表之間的關(guān)系三種:一對(duì)一、一對(duì)多、多對(duì)多。關(guān)系模型指的就是二維表格模型;
- 關(guān)系型數(shù)據(jù)庫以行和列的形式存儲(chǔ)數(shù)據(jù),行和列的形式被稱為表,表是由一組相關(guān)實(shí)體組成的集合。一組表組成了數(shù)據(jù)庫。
- 表中的一行稱為關(guān)系的一個(gè)元組,用來存儲(chǔ)事物的一個(gè)實(shí)例;
- 表中的一列稱為關(guān)系的一個(gè)屬性,用來描述實(shí)體的某一特征。
- 表內(nèi)字段的組成一樣,即便某個(gè)數(shù)據(jù)不需要某個(gè)字段,系統(tǒng)也會(huì)強(qiáng)加上這個(gè)字段及默認(rèn)值,這種結(jié)構(gòu)便于表與表之間進(jìn)行操作,但它也是關(guān)系數(shù)據(jù)庫性能瓶頸的一個(gè)因素。
1.關(guān)系型數(shù)據(jù)庫理論 - ACID
ACID,是指數(shù)據(jù)庫管理系統(tǒng)(DBMS)在寫入或更新資料的過程中,為保證事務(wù)(transaction)是正確可靠的,所必須具備的四個(gè)特性:原子性(atomicity,或稱不可分割性)、一致性(consistency)、隔離性(isolation,又稱獨(dú)立性)、持久性(durability)。
- A – Atomicity – 原子性
一個(gè)事務(wù)(transaction)中的所有操作,要么全部完成,要么全部不完成,不會(huì)結(jié)束在中間某個(gè)環(huán)節(jié)。事務(wù)在執(zhí)行過程中發(fā)生錯(cuò)誤,會(huì)被回滾(Rollback)到事務(wù)開始前的狀態(tài),就像這個(gè)事務(wù)從來沒有被執(zhí)行過一樣。 - C – Consistency – 一致性
在事務(wù)開始之前和事務(wù)結(jié)束以后,數(shù)據(jù)庫的完整性沒有被破壞。這表示寫入的資料必須完全符合所有的預(yù)設(shè)規(guī)則,這包含資料的精確度、串聯(lián)性以及后續(xù)數(shù)據(jù)庫可以自發(fā)性地完成預(yù)定的工作。 - I – Isolation – 隔離性
數(shù)據(jù)庫允許多個(gè)并發(fā)事務(wù)同時(shí)對(duì)其數(shù)據(jù)進(jìn)行讀寫和修改的能力,隔離性可以防止多個(gè)事務(wù)并發(fā)執(zhí)行時(shí)由于交叉執(zhí)行而導(dǎo)致數(shù)據(jù)的不一致。事務(wù)隔離分為不同級(jí)別,包括讀未提交(Read uncommitted)、讀提交(read committed)、可重復(fù)讀(repeatable read)和串行化(Serializable)。 - D – Durability – 持久性
事務(wù)處理結(jié)束后,對(duì)數(shù)據(jù)的修改是永久的,即便系統(tǒng)故障也不會(huì)丟失。
2.優(yōu)缺點(diǎn)
關(guān)系型數(shù)據(jù)庫的優(yōu)勢(shì):
- 容易理解:二維表結(jié)構(gòu)是非常貼近邏輯世界一個(gè)概念,關(guān)系模型相對(duì)網(wǎng)狀、層次等其他模型來說更容易理解;
- 保持?jǐn)?shù)據(jù)的一致性(事務(wù)處理)
- 由于以標(biāo)準(zhǔn)化為前提,數(shù)據(jù)更新的開銷很?。ㄏ嗤淖侄位旧隙贾挥幸惶帲?/li>
- 支持SQL,可以進(jìn)行Join等復(fù)雜查詢(幾張表之間)
關(guān)系型數(shù)據(jù)庫的不足:
不擅長(zhǎng)的處理
大量數(shù)據(jù)的寫入處理
為有數(shù)據(jù)更新的表做索引或表結(jié)構(gòu)(schema)變更
字段不固定時(shí)應(yīng)用
對(duì)簡(jiǎn)單查詢需要快速返回結(jié)果的處理
非關(guān)系數(shù)據(jù)庫
結(jié)構(gòu)不固定,集合內(nèi)數(shù)據(jù)字段可以不一樣,自由度高,可以減少一些時(shí)間和空間的開銷。
四大類型:
鍵值對(duì)存儲(chǔ)(key-value),文檔存儲(chǔ)(document store:mongodb),基于列的數(shù)據(jù)庫(column-oriented),還有就是圖形數(shù)據(jù)庫(graph database)
主流的非關(guān)系型數(shù)據(jù)庫有 NoSql、MongoDB、Cloudant、
特征:
1、使用鍵值對(duì)存儲(chǔ)數(shù)據(jù);
2、分布式;
3、一般不支持ACID特性;
4、非關(guān)系型數(shù)據(jù)庫嚴(yán)格上不是一種數(shù)據(jù)庫,應(yīng)該是一種數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)方法的集合。
優(yōu)點(diǎn):
1、無需經(jīng)過sql層的解析,讀寫性能很高;
2、基于鍵值對(duì),數(shù)據(jù)沒有耦合性,容易擴(kuò)展;
3、存儲(chǔ)數(shù)據(jù)的格式:nosql的存儲(chǔ)格式是key,value形式、文檔形式、圖片形式等等,文檔形式、圖片形式等等,而關(guān)系型數(shù)據(jù)庫則只支持基礎(chǔ)類型。
缺點(diǎn):
1、不提供sql支持,學(xué)習(xí)和使用成本較高;
2、無事務(wù)處理,附加功能bi和報(bào)表等支持也不好;
[關(guān)系與非關(guān)系型數(shù)據(jù)庫]
(http://www.cnblogs.com/monion/p/5520945.html)
NoSQL,指的是非關(guān)系數(shù)據(jù)庫。由上面的敘述可以看到關(guān)系型數(shù)據(jù)庫中的表都是存儲(chǔ)一下格式化的數(shù)據(jù)結(jié)構(gòu),每個(gè)元組字段的組成都是一樣的,即使不是每個(gè)元組都需要所有的字段,但數(shù)據(jù)庫會(huì)為每個(gè)元組都分配所有的字段,這樣的結(jié)構(gòu)可以便于表與表之間進(jìn)行連接等操作,但從另一個(gè)角度來說它也是關(guān)系數(shù)據(jù)庫性能瓶頸的一個(gè)因素。而非關(guān)系數(shù)據(jù)庫以鍵值對(duì)存儲(chǔ),它的結(jié)構(gòu)不固定,每一個(gè)元組可以有不一樣的字段,每個(gè)元組可以根據(jù)需要增加或減少一些自己的鍵值對(duì),這樣就不會(huì)局限于固定的結(jié)構(gòu),可以減少一些時(shí)間和空間的開銷。
關(guān)系型數(shù)據(jù)庫以行和列的形式存儲(chǔ)數(shù)據(jù),以便于用戶理解。這一系列的行和列被稱為表,一組表組成了數(shù)據(jù)庫。用戶用查詢(Query)來檢索數(shù)據(jù)庫中的數(shù)據(jù)。一個(gè)Query是一個(gè)用于指定數(shù)據(jù)庫中行和列的SELECT語句。關(guān)系型數(shù)據(jù)庫通常包含下列組件:
客戶端應(yīng)用程序(Client)
數(shù)據(jù)庫服務(wù)器(Server)
數(shù)據(jù)庫(Database)
Structured Query Language(SQL)Client端和Server端的橋梁,Client用SQL來象Server端發(fā)送請(qǐng)求,Server返回Client端要求的結(jié)果?,F(xiàn)在流行的大型關(guān)系型數(shù)據(jù)庫有IBM DB2、IBM UDB、Oracle、SQL Server、SyBase、Informix等。
關(guān)系型數(shù)據(jù)庫管理系統(tǒng)中儲(chǔ)存與管理數(shù)據(jù)的基本形式是二維表。
關(guān)系型數(shù)據(jù)庫是一組已經(jīng)被組織為表結(jié)構(gòu)的信息的集合。這些信息以表的形式被存儲(chǔ)于磁盤、磁帶等物理介質(zhì)中。每個(gè)表可以有多行,而每行又被拆分成多列。
關(guān)系型數(shù)據(jù)庫一整套數(shù)學(xué)理論基礎(chǔ),例如關(guān)系代數(shù)和關(guān)系運(yùn)算是關(guān)系型數(shù)據(jù)庫的只要理論基礎(chǔ)。
日常生活中我們對(duì)表結(jié)構(gòu)非常熟悉,例如學(xué)生的成績(jī)表,課程表等,這些表格都是以行和列的二維方式來將信息組織在一起。這些信息可以以各種形式存在,例如打印在紙上,顯示在電腦的屏幕上,記錄在人們的腦海里,存在服務(wù)器的磁盤里等等。
現(xiàn)在需要一種方便的手段來管理這些信息,最好是隨時(shí)能查詢,新增,刪除和更新的,這就是數(shù)據(jù)
關(guān)系:
·關(guān)系是滿足一定條件的二維表,表中的一行稱為關(guān)系的一個(gè)元組,用來存儲(chǔ)事物的一個(gè)實(shí)例;表中
的一列稱為關(guān)系的一個(gè)屬性,用來描述實(shí)體的某一特征。表是由一組相關(guān)實(shí)體組成的集合。所以表和
實(shí)體集這兩個(gè)詞常??梢越惶媸褂?。
·關(guān)系是一個(gè)行與列交叉的二維表,每一列(屬性)的所有數(shù)據(jù)都是同一種數(shù)據(jù)類型,每一列都有唯
一的列名,列在表中的順序無關(guān)緊要;表中的任意兩行(元組)不能相同,行在表中的順序也無關(guān)緊
要
關(guān)系的特征:
·關(guān)系的每一行定義實(shí)體集的一個(gè)實(shí)體,每一列定義實(shí)體的一個(gè)屬性
·每一行必須有一個(gè)主碼,主碼是一個(gè)屬性組(可以是一個(gè)屬性),它能唯一標(biāo)識(shí)一個(gè)實(shí)體
·每一列表示一個(gè)屬性,且列名不能重復(fù)
·列的每個(gè)值必須與對(duì)應(yīng)屬性的類型相同
·列有取值范圍,稱為域
·列是不可分割的最小數(shù)據(jù)項(xiàng)
·行、列的順序?qū)τ脩魺o關(guān)緊要
關(guān)系型數(shù)據(jù)庫把所有的數(shù)據(jù)都通過行和列的二元表現(xiàn)形式表示出來。
關(guān)系型數(shù)據(jù)庫的優(yōu)勢(shì):
1. 保持?jǐn)?shù)據(jù)的一致性(事務(wù)處理)
2.由于以標(biāo)準(zhǔn)化為前提,數(shù)據(jù)更新的開銷很?。ㄏ嗤淖侄位旧隙贾挥幸惶帲?/p>
3. 可以進(jìn)行Join等復(fù)雜查詢
其中能夠保持?jǐn)?shù)據(jù)的一致性是關(guān)系型數(shù)據(jù)庫的最大優(yōu)勢(shì)。
關(guān)系型數(shù)據(jù)庫的不足:
不擅長(zhǎng)的處理
1. 大量數(shù)據(jù)的寫入處理
2. 為有數(shù)據(jù)更新的表做索引或表結(jié)構(gòu)(schema)變更
3. 字段不固定時(shí)應(yīng)用
4. 對(duì)簡(jiǎn)單查詢需要快速返回結(jié)果的處理
- 大量數(shù)據(jù)的寫入處理
讀寫集中在一個(gè)數(shù)據(jù)庫上讓數(shù)據(jù)庫不堪重負(fù),大部分網(wǎng)站已使用主從復(fù)制技術(shù)實(shí)現(xiàn)讀寫分離,以提高讀寫性能和讀庫的可擴(kuò)展性。
所以在進(jìn)行大量數(shù)據(jù)操作時(shí),會(huì)使用數(shù)據(jù)庫主從模式。數(shù)據(jù)的寫入由主數(shù)據(jù)庫負(fù)責(zé),數(shù)據(jù)的讀入由從數(shù)據(jù)庫負(fù)責(zé),可以比較簡(jiǎn)單地通過增加從數(shù)據(jù)庫來實(shí)現(xiàn)規(guī)?;?,但是數(shù)據(jù)的寫入?yún)s完全沒有簡(jiǎn)單的方法來解決規(guī)?;瘑栴}。
第一,要想將數(shù)據(jù)的寫入規(guī)?;梢钥紤]把主數(shù)據(jù)庫從一臺(tái)增加到兩臺(tái),作為互相關(guān)聯(lián)復(fù)制的二元主數(shù)據(jù)庫使用,確實(shí)這樣可以把每臺(tái)主數(shù)據(jù)庫的負(fù)荷減少一半,但是更新處理會(huì)發(fā)生沖突,可能會(huì)造成數(shù)據(jù)的不一致,為了避免這樣的問題,需要把對(duì)每個(gè)表的請(qǐng)求分別分配給合適的主數(shù)據(jù)庫來處理。

第二,可以考慮把數(shù)據(jù)庫分割開來,分別放在不同的數(shù)據(jù)庫服務(wù)器上,比如將不同的表放在不同的數(shù)據(jù)庫服務(wù)器上,數(shù)據(jù)庫分割可以減少每臺(tái)數(shù)據(jù)庫服務(wù)器上的數(shù)據(jù)量,以便減少硬盤IO的輸入、輸出處理,實(shí)現(xiàn)內(nèi)存上的高速處理。但是由于分別存儲(chǔ)字不同服務(wù)器上的表之間無法進(jìn)行Join處理,數(shù)據(jù)庫分割的時(shí)候就需要預(yù)先考慮這些問題,數(shù)據(jù)庫分割之后,如果一定要進(jìn)行Join處理,就必須要在程序中進(jìn)行關(guān)聯(lián),這是非常困難的。


- 為有數(shù)據(jù)更新的表做索引或表結(jié)構(gòu)變更
在使用關(guān)系型數(shù)據(jù)庫時(shí),為了加快查詢速度需要?jiǎng)?chuàng)建索引,為了增加必要的字段就一定要改變表結(jié)構(gòu),為了進(jìn)行這些處理,需要對(duì)表進(jìn)行共享鎖定,這期間數(shù)據(jù)變更、更新、插入、刪除等都是無法進(jìn)行的。如果需要進(jìn)行一些耗時(shí)操作,例如為數(shù)據(jù)量比較大的表創(chuàng)建索引或是變更其表結(jié)構(gòu),就需要特別注意,長(zhǎng)時(shí)間內(nèi)數(shù)據(jù)可能無法進(jìn)行更新。

- 字段不固定時(shí)的應(yīng)用
如果字段不固定,利用關(guān)系型數(shù)據(jù)庫也是比較困難的,有人會(huì)說,需要的時(shí)候加個(gè)字段就可以了,這樣的方法也不是不可以,但在實(shí)際運(yùn)用中每次都進(jìn)行反復(fù)的表結(jié)構(gòu)變更是非常痛苦的。你也可以預(yù)先設(shè)定大量的預(yù)備字段,但這樣的話,時(shí)間一長(zhǎng)很容易弄不清除字段和數(shù)據(jù)的對(duì)應(yīng)狀態(tài),即哪個(gè)字段保存有哪些數(shù)據(jù)。
- 對(duì)簡(jiǎn)單查詢需要快速返回結(jié)果的處理 (這里的“簡(jiǎn)單”指的是沒有復(fù)雜的查詢條件)
這一點(diǎn)稱不上是缺點(diǎn),但不管怎樣,關(guān)系型數(shù)據(jù)庫并不擅長(zhǎng)對(duì)簡(jiǎn)單的查詢快速返回結(jié)果,因?yàn)殛P(guān)系型數(shù)據(jù)庫是使用專門的sql語言進(jìn)行數(shù)據(jù)讀取的,它需要對(duì)sql與越南進(jìn)行解析,同時(shí)還有對(duì)表的鎖定和解鎖等這樣的額外開銷,這里并不是說關(guān)系型數(shù)據(jù)庫的速度太慢,而只是想告訴大家若希望對(duì)簡(jiǎn)單查詢進(jìn)行高速處理,則沒有必要非使用關(guān)系型數(shù)據(jù)庫不可。
NoSQL數(shù)據(jù)庫
關(guān)系型數(shù)據(jù)庫應(yīng)用廣泛,能進(jìn)行事務(wù)處理和表連接等復(fù)雜查詢。相對(duì)地,NoSQL數(shù)據(jù)庫只應(yīng)用在特定領(lǐng)域,基本上不進(jìn)行復(fù)雜的處理,但它恰恰彌補(bǔ)了之前所列舉的關(guān)系型數(shù)據(jù)庫的不足之處。
優(yōu)點(diǎn):
易于數(shù)據(jù)的分散
各個(gè)數(shù)據(jù)之間存在關(guān)聯(lián)是關(guān)系型數(shù)據(jù)庫得名的主要原因,為了進(jìn)行join處理,關(guān)系型數(shù)據(jù)庫不得不把數(shù)據(jù)存儲(chǔ)在同一個(gè)服務(wù)器內(nèi),這不利于數(shù)據(jù)的分散,這也是關(guān)系型數(shù)據(jù)庫并不擅長(zhǎng)大數(shù)據(jù)量的寫入處理的原因。相反NoSQL數(shù)據(jù)庫原本就不支持Join處理,各個(gè)數(shù)據(jù)都是獨(dú)立設(shè)計(jì)的,很容易把數(shù)據(jù)分散在多個(gè)服務(wù)器上,故減少了每個(gè)服務(wù)器上的數(shù)據(jù)量,即使要處理大量數(shù)據(jù)的寫入,也變得更加容易,數(shù)據(jù)的讀入操作當(dāng)然也同樣容易。
典型的NoSQL數(shù)據(jù)庫
臨時(shí)性鍵值存儲(chǔ)(memcached、Redis)、永久性鍵值存儲(chǔ)(ROMA、Redis)、面向文檔的數(shù)據(jù)庫(MongoDB、CouchDB)、面向列的數(shù)據(jù)庫(Cassandra、HBase)
一、 鍵值存儲(chǔ)
它的數(shù)據(jù)是以鍵值的形式存儲(chǔ)的,雖然它的速度非???,但基本上只能通過鍵的完全一致查詢獲取數(shù)據(jù),根據(jù)數(shù)據(jù)的保存方式可以分為臨時(shí)性、永久性和兩者兼具 三種。
(1)臨時(shí)性
所謂臨時(shí)性就是數(shù)據(jù)有可能丟失,memcached把所有數(shù)據(jù)都保存在內(nèi)存中,這樣保存和讀取的速度非??欤钱?dāng)memcached停止時(shí),數(shù)據(jù)就不存在了。由于數(shù)據(jù)保存在內(nèi)存中,所以無法操作超出內(nèi)存容量的數(shù)據(jù),舊數(shù)據(jù)會(huì)丟失??偨Y(jié)來說:
。在內(nèi)存中保存數(shù)據(jù)
。可以進(jìn)行非??焖俚谋4婧妥x取處理
。數(shù)據(jù)有可能丟失
(2)永久性
所謂永久性就是數(shù)據(jù)不會(huì)丟失,這里的鍵值存儲(chǔ)是把數(shù)據(jù)保存在硬盤上,與臨時(shí)性比起來,由于必然要發(fā)生對(duì)硬盤的IO操作,所以性能上還是有差距的,但數(shù)據(jù)不會(huì)丟失是它最大的優(yōu)勢(shì)。總結(jié)來說:
。在硬盤上保存數(shù)據(jù)
??梢赃M(jìn)行非??焖俚谋4婧妥x取處理(但無法與memcached相比)
。數(shù)據(jù)不會(huì)丟失
(3) 兩者兼?zhèn)?/p>
Redis屬于這種類型。Redis有些特殊,臨時(shí)性和永久性兼具。Redis首先把數(shù)據(jù)保存在內(nèi)存中,在滿足特定條件(默認(rèn)是 15分鐘一次以上,5分鐘內(nèi)10個(gè)以上,1分鐘內(nèi)10000個(gè)以上的鍵發(fā)生變更)的時(shí)候?qū)?shù)據(jù)寫入到硬盤中,這樣既確保了內(nèi)存中數(shù)據(jù)的處理速度,又可以通過寫入硬盤來保證數(shù)據(jù)的永久性,這種類型的數(shù)據(jù)庫特別適合處理數(shù)組類型的數(shù)據(jù)??偨Y(jié)來說:
。同時(shí)在內(nèi)存和硬盤上保存數(shù)據(jù)
??梢赃M(jìn)行非??焖俚谋4婧妥x取處理
。保存在硬盤上的數(shù)據(jù)不會(huì)消失(可以恢復(fù))
。適合于處理數(shù)組類型的數(shù)據(jù)
二、面向文檔的數(shù)據(jù)庫
MongoDB、CouchDB屬于這種類型,它們屬于NoSQL數(shù)據(jù)庫,但與鍵值存儲(chǔ)相異。
(1)不定義表結(jié)構(gòu)
即使不定義表結(jié)構(gòu),也可以像定義了表結(jié)構(gòu)一樣使用,還省去了變更表結(jié)構(gòu)的麻煩。
(2)可以使用復(fù)雜的查詢條件
跟鍵值存儲(chǔ)不同的是,面向文檔的數(shù)據(jù)庫可以通過復(fù)雜的查詢條件來獲取數(shù)據(jù),雖然不具備事務(wù)處理和Join這些關(guān)系型數(shù)據(jù)庫所具有的處理能力,但初次以外的其他處理基本上都能實(shí)現(xiàn)。
三、 面向列的數(shù)據(jù)庫
Cassandra、HBae、HyperTable屬于這種類型,由于近年來數(shù)據(jù)量出現(xiàn)爆發(fā)性增長(zhǎng),這種類型的NoSQL數(shù)據(jù)庫尤其引入注目。
普通的關(guān)系型數(shù)據(jù)庫都是以行為單位來存儲(chǔ)數(shù)據(jù)的,擅長(zhǎng)以行為單位的讀入處理,比如特定條件數(shù)據(jù)的獲取。因此,關(guān)系型數(shù)據(jù)庫也被成為面向行的數(shù)據(jù)庫。相反,面向列的數(shù)據(jù)庫是以列為單位來存儲(chǔ)數(shù)據(jù)的,擅長(zhǎng)以列為單位讀入數(shù)據(jù)。

面向列的數(shù)據(jù)庫具有搞擴(kuò)展性,即使數(shù)據(jù)增加也不會(huì)降低相應(yīng)的處理速度(特別是寫入速度),所以它主要應(yīng)用于需要處理大量數(shù)據(jù)的情況。另外,把它作為批處理程序的存儲(chǔ)器來對(duì)大量數(shù)據(jù)進(jìn)行更新也是非常有用的。但由于面向列的數(shù)據(jù)庫跟現(xiàn)行數(shù)據(jù)庫存儲(chǔ)的思維方式有很大不同,故應(yīng)用起來十分困難。
總結(jié):關(guān)系型數(shù)據(jù)庫與NoSQL數(shù)據(jù)庫并非對(duì)立而是互補(bǔ)的關(guān)系,即通常情況下使用關(guān)系型數(shù)據(jù)庫,在適合使用NoSQL的時(shí)候使用NoSQL數(shù)據(jù)庫,讓NoSQL數(shù)據(jù)庫對(duì)關(guān)系型數(shù)據(jù)庫的不足進(jìn)行彌補(bǔ)。