2016 年開(kāi)發(fā)者應(yīng)該掌握的十個(gè) Postgres 技巧

【編者按】作為一款開(kāi)源的對(duì)象—關(guān)系數(shù)據(jù)庫(kù),Postgres 一直得到許多開(kāi)發(fā)者喜愛(ài)。近日,Postgres 正式發(fā)布了9.5版本,該版本進(jìn)行了大量的修復(fù)和功能改進(jìn)。而本文將分享10個(gè) Postgres 使用技巧,旨在讓開(kāi)發(fā)者能更加靈活和高效地使用這個(gè)數(shù)據(jù)庫(kù)。

放假期間,很多人會(huì)選擇去閱讀一些新書(shū)或者學(xué)一些新技術(shù)來(lái)充實(shí)自己。下面筆者將推薦一些Postgres技巧和技能給大家,這些技巧會(huì)幫助你更加靈活方便地使用 Postgres。如果你覺(jué)得這些技巧會(huì)對(duì)你產(chǎn)生幫助,你可以選擇訂閱 Postgres weekly,本周都會(huì)發(fā)布一些Postgres最新的資訊和技術(shù)干貨。

1.CTEs——Common Table Expressions

CTE 允許你做一些很棒的事情,比如遞歸查詢(xún),即使是用在一些最簡(jiǎn)單的語(yǔ)句操作上,CET 都會(huì)有很出色的表現(xiàn)。 CTE 可以認(rèn)為是在單個(gè) SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 語(yǔ)句的執(zhí)行范圍內(nèi)定義的臨時(shí)結(jié)果集。CTE 與派生表類(lèi)似,具體表現(xiàn)在不存儲(chǔ)為對(duì)象,并且只在查詢(xún)期間有效。與派生表的不同之處在于,CTE 可自引用,還可在同一查詢(xún)中引用多次。這樣開(kāi)發(fā)者就可以更容易地創(chuàng)建可讀查詢(xún)。

開(kāi)發(fā)者在創(chuàng)建 SQL 語(yǔ)句的時(shí)候,往往會(huì)有很多行,有的甚至超過(guò)上百行,而通過(guò)使用4-5個(gè) CETs 后,語(yǔ)句會(huì)縮短很多,這樣就很容易提高語(yǔ)句的可讀性,尤其是對(duì)于新人來(lái)說(shuō)。

2.安裝一個(gè).psqlrc

如果安裝了 bashrc、vimrc 等文件,那為什么不對(duì) Postgres 做些同樣的操作呢?下面這些設(shè)置都非常棒,你不妨試試:

通過(guò)默認(rèn)來(lái)獲得更好的格式;

使用\pset null ¤,讓 null 更形象化;

默認(rèn)設(shè)置\timing on來(lái)顯示 SQL 執(zhí)行時(shí)間;

自定義提示\set PROMPT1'%[3[33;1m%]%x%[3[0m%]%[3[1m%]%/%[3[0m%]%R%# ';

根據(jù)名稱(chēng)來(lái)保存你常用的運(yùn)行語(yǔ)句。

下面是筆者的 psqlrc 設(shè)置:

\set QUIET 1
\pset null '¤'

-- Customize prompts
\set PROMPT1 '%[3[1m%][%/] # '
\set PROMPT2 '... # '

-- Show how long each query takes to execute
\timing

-- Use best available output format
\x auto
\set VERBOSITY verbose
\set HISTFILE ~/.psql_history- :DBNAME
\set HISTCONTROL ignoredups
\set COMP_KEYWORD_CASE upper
\unset QUIET

3. 通過(guò) pg_stat_statements 來(lái)查看需要進(jìn)行索引的地方

pg_stat_statements 可能是開(kāi)發(fā)者提高數(shù)據(jù)庫(kù)性能最有價(jià)值的工具。一旦啟用(還有extension pg_stat_statements),它便會(huì)自動(dòng)記錄數(shù)據(jù)庫(kù)的所有查詢(xún)記錄以及它們所花費(fèi)的時(shí)間。這樣,你就很容易優(yōu)化查詢(xún)語(yǔ)句,提高性能。

SELECT 
(total_time / 1000 / 60) as total_minutes, 
(total_time/calls) as average_time, 
query 
FROM pg_stat_statements 
ORDER BY 1 DESC 
LIMIT 100;

當(dāng)然,會(huì)因此付出一些性能代價(jià),但對(duì)比其所帶來(lái)的性能提升簡(jiǎn)直微乎其微。在這篇文章里可以讀到更多關(guān)于 Postgres 性能方面的東西。

4. ETL 有點(diǎn)慢,用 FDWs

如果有大量的微服務(wù)或不同的應(yīng)用程序,那么可能需要很多不同的數(shù)據(jù)庫(kù)來(lái)支持它們。默認(rèn)情況是創(chuàng)建一些數(shù)據(jù)倉(cāng)庫(kù)并通過(guò) ETL 連接,但是這樣做有時(shí)候太重度了。這時(shí)候,你只需要將數(shù)據(jù)庫(kù)一次性集中在一起,或者在少數(shù)情況下,外部數(shù)據(jù)封裝器可以允許你跨多個(gè)數(shù)據(jù)庫(kù)查詢(xún),比如 Postgres 到Postgres,或者是 Postgres 到 Mongo 或 Redis 數(shù)據(jù)庫(kù)之類(lèi)。

5. array和array_agg

在開(kāi)發(fā)應(yīng)用程序時(shí),很少會(huì)完全不用 arrays,而在數(shù)據(jù)庫(kù)中同樣如此。Arrays 可以看作是 Postgres 里的另一個(gè)數(shù)據(jù)類(lèi)型,并擁有一些殺手級(jí)應(yīng)用,比如博文標(biāo)簽這些。

但是,即使你不把 arrays 當(dāng)做數(shù)據(jù)類(lèi)型使用,也常常需要像一個(gè) array 那樣匯總一些數(shù)據(jù),中間用逗號(hào)隔開(kāi)。類(lèi)似下面這樣,你可以輕松匯總用戶清單:

SELECT 
users.email,
array_to_string(array_agg(projects.name), ',')) as projects
FROM
projects,
tasks,
users
WHERE projects.id = tasks.project_id
AND tasks.due_at > tasks.completed_at
AND tasks.due_at > now()
AND users.id = projects.user_id
GROUP BY 
users.email

6.慎重使用 materialized views

你可能不熟悉 materialized views(物化視圖),materialized views 是包括一個(gè)查詢(xún)結(jié)果的數(shù)據(jù)庫(kù)對(duì)像。所以,它是一些查詢(xún)或「view」的一個(gè)物化的或基本的快照版本。在最開(kāi)始的物化版本中,會(huì)在 Postgres 建立一個(gè)常請(qǐng)求,但整體是不可用的。那是因?yàn)楫?dāng)你鎖定事務(wù)的時(shí)候,有可能會(huì)阻礙一些其它讀取和活動(dòng)。

現(xiàn)在已經(jīng)好很多,但仍然缺乏一些開(kāi)箱即用的工具來(lái)進(jìn)行刷新。這也就意味著你必須安裝一些調(diào)度任務(wù)或 cron 作業(yè)來(lái)定期刷新物化視圖。如果你目前正在開(kāi)發(fā)一些報(bào)告或者 BI 應(yīng)用程序,那么你還是需要使用物化視圖的。它們的可用性正在不斷提升,所以,Postgres 已經(jīng)知道如何自動(dòng)化刷新它們。

7.窗口函數(shù)

窗口函數(shù)(Windows fuction)可能仍然是 SQL 中較復(fù)雜且很難理解的東西。總之,它們會(huì)讓你排序一個(gè)查詢(xún)結(jié)果,然后進(jìn)行一行到玲一行的計(jì)算,如果沒(méi)有 SQL PL,這些東西會(huì)很難做。不過(guò),你可以做一些非常簡(jiǎn)單的操作,比如排名,基于某些值對(duì)結(jié)果進(jìn)行排序;復(fù)雜些的,比如計(jì)算環(huán)比增長(zhǎng)數(shù)據(jù)。

8.針對(duì)數(shù)據(jù)透視表的一個(gè)更簡(jiǎn)單方法

在 Postgres 中,Table_func 通常是作為計(jì)算一個(gè)數(shù)據(jù)透視表的引用方式。不幸地是,這個(gè)使用起來(lái)相當(dāng)困難的,更為基礎(chǔ)的用法是與原始 SQL 一起使用。在 Postgres 9.5 中已經(jīng)進(jìn)行了改進(jìn),用起來(lái)會(huì)方便很多。但在此之前,你匯總每個(gè)條件的結(jié)果不是 false 就是 true ,最后合計(jì)為更簡(jiǎn)單的推理:

select date,
   sum(case when type = 'OSX' then val end) as osx,
   sum(case when type = 'Windows' then val end) as windows,
   sum(case when type = 'Linux' then val end) as linux
from daily_visits_per_os
group by date
order by date
limit 4;

大家可以前往Dimitri Fontaine博客查看具體示例。

9.PostGIS

PostGIS 可以說(shuō)是所有 GIS 數(shù)據(jù)庫(kù)中最好的一個(gè)了。事實(shí)上,開(kāi)發(fā)者獲得的所有 Postgres 標(biāo)準(zhǔn)會(huì)使它更加強(qiáng)大——一個(gè)最好的例子是來(lái)自 Postgres 近年來(lái)的 GiST 索引,它給 PostGIS 提供了極大的性能提升。 如果你現(xiàn)在正在做一些與地理空間數(shù)據(jù)有關(guān)的事情,并且需要一些比 earth_distance 擴(kuò)展更好用的工具,那么 PostGIS 就是你最佳選擇。

10.JSONB

從 Postgres 9.2 開(kāi)始,Postgres 的每個(gè)版本中都有 JSON 的身影,在每個(gè)新版本功能都有所提升,并且正在逐步完善成一個(gè)更加完美的庫(kù)。在最新發(fā)布的9.5版本中,JSONB在psql中的輸出也更具可讀性。

原文地址:http://www.craigkerstiens.com/2015/12/29/my-postgres-top-10-for-2016/

本文系國(guó)內(nèi) ITOM 行業(yè)領(lǐng)軍企業(yè) OneAPM 工程師編譯整理。我們致力于幫助企業(yè)用戶提供全棧式的性能管理以及IT運(yùn)維管理服務(wù),通過(guò)一個(gè)探針就能夠完成日志分析、安全防護(hù)、APM 基礎(chǔ)組件監(jiān)控、集成報(bào)警以及大數(shù)據(jù)分析等功能。想閱讀更多技術(shù)文章,請(qǐng)?jiān)L問(wèn) OneAPM 官方技術(shù)博客

本文轉(zhuǎn)自 OneAPM 官方博客

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容