相關(guān)概念
一、用法
比較兩個(gè)定量變量用散點(diǎn)圖
比較定量變量和定性變量用小提琴圖,箱線圖
比較兩個(gè)定性變量用簇狀柱形圖(集群條形圖)
二、定量變量和定性變量
定量變量也就是通常所說的連續(xù)量,如長度、重量、產(chǎn)量、人口、速度和溫度等,它們是由測量或計(jì)數(shù)、統(tǒng)計(jì)所得到的量,這些變量具有數(shù)值特征,稱為定量變量。
定性[變量]又名分類變量 ( categorical variable ): 觀測的個(gè)體只能歸屬于幾種互不相容類別中的一種時(shí),一般是用非數(shù)字來表達(dá)其類別,這樣的觀測數(shù)據(jù)稱為定性變量。定性變量 這些量并非真有數(shù)量上的變化,而只有性質(zhì)上的差異。這些量還可以分為兩種,一種是有序變量,它沒有數(shù)量關(guān)系,只有次序關(guān)系,如某種產(chǎn)品分為一等品、二等品、三等品等,礦石的質(zhì)量分為貧礦和富礦;另一種是名義變量,這種變量既無等級關(guān)系,也無數(shù)量關(guān)系,如天氣(陰、晴)、性別(男、女)、職業(yè)(工人、農(nóng)民、教師、干部)和產(chǎn)品的型號等。
三、皮爾遜相關(guān)系數(shù)
皮爾遜相關(guān)系數(shù)( Pearson correlation coefficient),又稱皮爾遜積矩相關(guān)系數(shù)(Pearson product-moment correlation coefficient,簡稱 PPMCC或PCCs),是用于度量兩個(gè)變量X和Y之間的相關(guān)線性相關(guān)),其值介于-1與1之間,并且只能表示線性關(guān)系。
兩個(gè)變量之間的皮爾遜相關(guān)系數(shù)定義為兩個(gè)變量之間的協(xié)方差和標(biāo)準(zhǔn)差的商,

上式定義了總體相關(guān)系數(shù),常用希臘小寫字母p作為代表符號。估算樣本的協(xié)方差和標(biāo)準(zhǔn)差,可得到皮爾遜相關(guān)系數(shù),常用英文小寫字母r表示

等價(jià)于

散點(diǎn)圖
plt.scatter
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None,
cmap=None, norm=None, vmin=None, vmax=None, alpha=None,
linewidths=None, verts=None, edgecolors=None, hold=None,
data=None, **kwargs)
參數(shù)data:dataframe等等所有數(shù)據(jù)集
x:坐標(biāo)軸x的數(shù)據(jù)
y:坐標(biāo)軸y的數(shù)據(jù)
c:顏色,可以設(shè)置顏色列表
marker:形狀,很多很好玩的,大家可以自己查一下
alpha:marker圖片的透明度0.3就是30%透明度
s:圖片縮放比例
cmap 可以用默認(rèn)顏色庫出來漸變色,很漂亮
其他參數(shù)參考文檔
來個(gè)例子:
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
# Fixing random state for reproducibility
np.random.seed(19680801)
x = np.arange(0.0, 50.0, 2.0)
y = x ** 1.3 + np.random.rand(*x.shape) * 30.0
s = 500
plt.scatter(x, y, s, c="g", alpha=0.3, marker=r'$\clubsuit$',
label="Luck")
plt.xlabel("Leprechauns")
plt.ylabel("Gold")
plt.legend(loc=2) #就是那個(gè)小窗體,并且設(shè)置了位置
plt.show()

seaborn.regplot
seaborn.regplot(x, y, data=None, x_estimator=None, x_bins=None,
x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None,
order=1, logistic=False, lowess=False, robust=False, logx=False,
x_partial=None, y_partial=None, truncate=False, dropna=True,
x_jitter=None, y_jitter=None, label=None, color=None, marker='o',
scatter_kws=None, line_kws=None, ax=None)
跟之前一樣,seaborn的散點(diǎn)圖有高端了一點(diǎn),包含了可以繪制擬合線和置信區(qū)間等額外功能。
data,x,y,marker同plt.scatter一樣,顏色是color
fit_reg:是否繪制擬合線和執(zhí)行區(qū)間,注意并非課程中的reg_fit哦。
scatter:是否顯示散點(diǎn)
ci:執(zhí)行區(qū)間大小 [0, 100]
x_jitter, y_jitter 圖片的抖動(dòng)范圍(類似添加了噪聲),不會(huì)影響回歸擬合線
其他參數(shù)參考文檔
matplotlib.pyplot.scatter
seaborn.regplot
熱圖

如果散點(diǎn)太離散,或者數(shù)據(jù)點(diǎn)的數(shù)據(jù)量太密集,透明度已經(jīng)不足以使用的情況下,可以用熱圖。
熱圖
matplotlib.pyplot.hist2d
matplotlib.pyplot.hist2d(x, y, bins=10, range=None, normed=False, weights=None, cmin=None, cmax=None, hold=None, data=None, **kwargs)
整體用法跟hist很像啊,只是它是熱圖。
重點(diǎn)控制x,y, bins(設(shè)置方式也跟hist一致,只是是二維,因?yàn)橐O(shè)置x和y的bins)
cmin:設(shè)置多少count以下記為空,那么就不會(huì)被填充顏色
同樣cmax就是大于多少就會(huì)被記為空,不填充顏色
其他參數(shù)參考文檔
matplotlib.pyplot.colorbar
matplotlib.pyplot.colorbar(mappable=None, cax=None, ax=None, **kw)
只對當(dāng)前圖表生效,所以要想多個(gè)生效就得每個(gè)圖表下跟一個(gè)
參數(shù)不太用的,有興趣可以看下
一個(gè)圖例代碼:
cm = plt.cm.get_cmap('RdYlBu')
xy = range(20)
z = xy
sc = plt.scatter(xy, xy, c=z, vmin=0, vmax=20, s=35, cmap=cm)
plt.colorbar()
plt.show()
看例子能看懂的對不對,我們要先得到顏色映射表,然后將顏色映射表賦值給圖表中的cmap參數(shù),最后調(diào)用colorbar,調(diào)用colorbar只是顯示出旁邊的小窗體,某某顏色是指哪個(gè)范圍。
其中g(shù)et_cmap中取值可為:Possible values are: Accent, Accent_r, Blues, Blues_r, BrBG, BrBG_r, BuGn, BuGn_r, BuPu, BuPu_r, CMRmap, CMRmap_r, Dark2, Dark2_r, GnBu, GnBu_r, Greens, Greens_r, Greys, Greys_r, OrRd, OrRd_r, Oranges, Oranges_r, PRGn, PRGn_r, Paired, Paired_r, Pastel1, Pastel1_r, Pastel2, Pastel2_r, PiYG, PiYG_r, PuBu, PuBuGn, PuBuGn_r, PuBu_r, PuOr, PuOr_r, PuRd, PuRd_r, Purples, Purples_r, RdBu, RdBu_r, RdGy, RdGy_r, RdPu, RdPu_r, RdYlBu, RdYlBu_r, RdYlGn, RdYlGn_r, Reds, Reds_r, Set1, Set1_r, Set2, Set2_r, Set3, Set3_r, Spectral, Spectral_r, Wistia, Wistia_r, YlGn, YlGnBu, YlGnBu_r, YlGn_r, YlOrBr, YlOrBr_r, YlOrRd, YlOrRd_r...其中末尾加r是顏色取反。
既然扯到顏色,就多提一句:
Seaborn 還增加了以下多個(gè)調(diào)色板:
定性(全部多達(dá) 6 種顏色):'deep’、’pastel’、’dark’、’muted’、’bright’、’colorblind'
有序:’rocket' (white-orange-red-purple-black)、’mako' (mint-green-blue-purple-black)
發(fā)散:’vlag' (blue-white-red)、’icefire' (blue-black-orange)
可以使用seaborn.palplot和seaborn.color_palette來顯示一下seaborn圖標(biāo)的顏色
seaborn.palplot:將顏色調(diào)色板中的值繪制為水平數(shù)組
seaborn.color_palette:返回一個(gè)列表,表示顏色調(diào)色板
比如sb.palplot(sb.color_palette('viridis', 9))
使用在圖表中的話只要c=sb.color_palette('Blues')[2]類似這種就可以了
matplotlib.pyplot.hist2d
matplotlib.pyplot.colorbar
顏色列表
seaborn.heatmap
seaborn.heatmap(data, vmin=None, vmax=None, cmap=None,
center=None, robust=False, annot=None, fmt='.2g', annot_kws=None,
linewidths=0, linecolor='white', cbar=True, cbar_kws=None,
cbar_ax=None, square=False, xticklabels='auto', yticklabels='auto',
mask=None, ax=None, **kwargs)
annot = True 顯示統(tǒng)計(jì)標(biāo)號
fmt 標(biāo)號格式,比如"d"就是整數(shù)的形式
data:dataframe
vmin, vmax:界限,決定不被標(biāo)注顏色的部分
cmap:老樣子,選顏色映射表
centor:改變顏色映射的趨勢
linewidths linecolor :格子的分割線的顏色和寬度
還有很多參數(shù),請查看api文檔
箱線圖

箱形圖于1977年由美國著名統(tǒng)計(jì)學(xué)家約翰·圖基(John Tukey)發(fā)明。它能顯示出一組數(shù)據(jù)的最大值、最小值、中位數(shù)、及上下四分位數(shù),還有異常值。
箱線圖是側(cè)重于數(shù)據(jù)的摘要,主要報(bào)告每個(gè)分類級別數(shù)字值的一組描述統(tǒng)計(jì)學(xué)信息。
在箱線圖中,方框的中間線條表示分布的中值,方框的頂部和底部分別表示數(shù)據(jù)的第三四分位數(shù)和第一四分位數(shù)。因此,方框的高度是四分位差 (IQR)。從方框的頂部和底部,須線表示從第一四分位數(shù)或第三四分位數(shù)到最低值或最大值的范圍。通常,須線長度會(huì)設(shè)置最大范圍;默認(rèn)情況下,設(shè)為 1.5 乘以 IQR。對于 γ 級別,底部須線下方有數(shù)據(jù),表示在第一四分位數(shù)下方有大于 1.5x IQR 的單個(gè)離群值(異常值)。
seaborn.boxplot(x=None, y=None, hue=None,
data=None, order=None, hue_order=None,
orient=None, color=None, palette=None,
saturation=0.75, width=0.8, dodge=True,
fliersize=5, linewidth=None, whis=1.5,
notch=False, ax=None, **kwargs)
x y hue是選定的數(shù)據(jù)列,x一般是定性變量,y一般是定量變量,hue一般是另外一個(gè)分割x的定性變量
比如,什么學(xué)歷x大概賺多少錢y,那么想觀察什么學(xué)歷下,性別分類大概賺多少錢,Hue就是性別(是不是有點(diǎn)groupby的意思呀),當(dāng)然,xy可以顛倒,那么圖像就是橫著的。
data老樣子是dataframe
color是設(shè)置所有圖案的顏色
palette是seaborn.color_palette得來的,有很多特定字符串,有興趣可以查api哈,常用的“muted”,有點(diǎn)類似之前看到的map那個(gè)配色的方法。
linewidth:線的寬度
orient:也可以直接調(diào)整繪圖方向。"h"和“v”
dodge:默認(rèn)是True,設(shè)置為False的話,hue的圖形就不會(huì)調(diào)整順序和寬度跑到對比格子旁邊去了。
order, hue_order 是決定小提琴圖的輸出順序,一般是以一個(gè)列表作為排序
其余參數(shù)看文檔測試學(xué)習(xí)
集群圖
seaborn.swarmplot(x=None, y=None, hue=None,
data=None, order=None, hue_order=None,
dodge=False, orient=None, color=None,
palette=None, size=5, edgecolor='gray',
linewidth=0, ax=None, **kwargs)
可以用這個(gè)方法來顯示所有數(shù)據(jù)點(diǎn)。
舉個(gè)例子
>>> ax = sns.boxplot(x="day", y="total_bill", data=tips)
>>> ax = sns.swarmplot(x="day", y="total_bill", data=tips, color=".25")

seaborn.swarmplot
小提琴圖

【小提琴圖】其實(shí)是【箱線圖】與【核密度圖】的結(jié)合,【箱線圖】展示了分位數(shù)的位置,【小提琴圖】則展示了任意位置的密度,通過【小提琴圖】可以知道哪些位置的密度較高。
seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True,
gridsize=100, width=0.8, inner='box', split=False, dodge=True,
orient=None, linewidth=None, color=None, palette=None,
saturation=0.75, ax=None, **kwargs)
x y hue是選定的數(shù)據(jù)列,x一般是定性變量,y一般是定量變量,hue一般是另外一個(gè)分割x的定性變量
比如,什么學(xué)歷x大概賺多少錢y,那么想觀察什么學(xué)歷下,性別分類大概賺多少錢,Hue就是性別(是不是有點(diǎn)groupby的意思呀),當(dāng)然,xy可以顛倒,那么圖像就是橫著的。
data老樣子是dataframe
color是設(shè)置所有圖案的顏色
palette是seaborn.color_palette得來的,有很多特定字符串,有興趣可以查api哈,常用的“muted”,有點(diǎn)類似之前看到的map那個(gè)配色的方法。
split如果設(shè)定為True,hue對比的那兩個(gè)小提琴圖就會(huì)合并成一個(gè)小提琴圖,好做對比
order, hue_order 是決定小提琴圖的輸出順序,一般是以一個(gè)列表作為排序
inner有以下幾種選擇 {“box”, “quartile”, “point”, “stick”, None}
小提琴內(nèi)部數(shù)據(jù)點(diǎn)的表示。 如果是box,會(huì)畫一個(gè)小型長方形。 如果quartile四分位數(shù),繪制分布的四分位數(shù)。 如果point或stick,顯示每個(gè)基礎(chǔ)數(shù)據(jù)點(diǎn)。
剩下參數(shù),不太講了,大家可以自行看api文檔測試學(xué)習(xí)哈。
分面
分面:把數(shù)據(jù)分成多個(gè)子集并用同一個(gè)圖表分別繪制的技術(shù)
1、class seaborn.FacetGrid
class seaborn.FacetGrid(data, row=None,
col=None, hue=None, col_wrap=None,
sharex=True, sharey=True, size=3, aspect=1,
palette=None, row_order=None, col_order=None,
hue_order=None, hue_kws=None, dropna=True,
legend_out=True, despine=True,
margin_titles=False, xlim=None, ylim=None,
subplot_kws=None, gridspec_kws=None)
他是一個(gè)類,你創(chuàng)建facetgrid的時(shí)候,會(huì)初始化一個(gè)matplotlib對象和一個(gè)facetgrid對象。
而這個(gè)facetgrid對象,建立一個(gè)特殊的鏈接,連接了dataframe和matplotlib。你就當(dāng)打了個(gè)組合拳吧。
創(chuàng)建分面數(shù)據(jù)有兩個(gè)步驟
1、需要?jiǎng)?chuàng)建一個(gè) FacetGrid 對象的實(shí)例,并指定要分面的特征
g = sns.FacetGrid()
2、對 FacetGrid 對象使用 map 方法,指定在每個(gè)子集中要繪制的圖形類型和變量
g.map()
那么對應(yīng)上面步驟的詳細(xì)描述呢:
1、創(chuàng)建FacetGrid 常用參數(shù)的解釋如下:
data:往常一樣,dataframe
row, col, hue : 不是會(huì)建立幾個(gè)小圖表嗎,row就是行拆分是拆分了什么分類,col就是列拆分拆分了什么,hue就是一個(gè)表內(nèi)部的分類(常用不同顏色區(qū)分不同分類)
col_wrap:在每行的分類下,來決定一列放幾個(gè)
size,aspect,又看到這兩了,還是同樣,每個(gè)子圖表高度和寬高比,
col,row,hue_order 決定了圖表輸出中列,行,hue的順序,所以一般是列表形式
palette:老樣子,不想再解釋了
其他還有很多啊,去api測試了解
2、使用g.map()方法
第一個(gè)參數(shù)就是plt下的圖表方法,hist啊,scatter啊,plot啊等等等等,從第二個(gè)參數(shù)開始就是跟前面那個(gè)圖表方法后面跟的參數(shù)規(guī)范一樣了,比如以scatter為例,x,y是必需參數(shù),那么第二個(gè)參數(shù)就是我們需要傳進(jìn)去的x的列的名字(定量數(shù)據(jù)),注意不需要寫x=什么什么,直接寫字符串,描述列名的那個(gè)(因?yàn)槭潜仨殔?shù)),第三個(gè)就是我們需要傳入的y,同樣,也是一樣,字符串,不用寫y=什么
其他參數(shù)就是plt圖表方法的參數(shù)內(nèi)容了,都是可選了,那就需要***=***了。
如果描述的話,g.map就有點(diǎn)像實(shí)現(xiàn)了一個(gè)callback的映射函數(shù)。
當(dāng)然,既然作為callback,那就不可能緊緊映射官方函數(shù)了,也可以自己寫函數(shù)作為map第一個(gè)函數(shù)來進(jìn)行調(diào)用。
選做3,可以調(diào)用add_legend,來標(biāo)識每條曲線或顏色與那個(gè)級別相關(guān)。當(dāng)然還有很多其他FacetGrid的方法,可以查閱官方文檔來學(xué)習(xí)。
舉個(gè)例子吧:
>>> import seaborn as sns; sns.set(style="ticks", color_codes=True)
>>> tips = sns.load_dataset("tips")
>>> g = sns.FacetGrid(tips, col="time", row="smoker")

>>> import matplotlib.pyplot as plt
>>> g = sns.FacetGrid(tips, col="time", row="smoker")
>>> g = g.map(plt.hist, "total_bill")

2、seaborn.factorplot
它是seaborn下的一個(gè)方法,有點(diǎn)類似FacetGrid,它合并了FacetGrid和定性-定量的圖表(柱狀,小提琴,箱線等),使用上,比FacetGrid方便點(diǎn)。
seaborn.factorplot(x=None, y=None, hue=None,
data=None, row=None, col=None,
col_wrap=None, estimator=<function mean>,
ci=95, n_boot=1000, units=None, order=None,
hue_order=None, row_order=None,
col_order=None, kind='point', size=4, aspect=1,
orient=None, color=None, palette=None,
legend=True, legend_out=True, sharex=True,
sharey=True, margin_titles=False,
facet_kws=None, **kwargs)
基于FacetGrid的,一種非常好用的能添加多分類的方法。
除了x,y,hue,這三個(gè)是每個(gè)表中都有的,另外會(huì)通過col,row來繪制第三或第四個(gè)分類(假設(shè)x和hue是前兩種分類)。
kind:{point, bar, count, box, violin, strip}
能畫點(diǎn)圖。
size:決定高度,inch單位。
aspect 決定縱橫比(其實(shí)就是跟size相乘決定寬度)。
order,color,orient,palette,dodge都跟上面實(shí)現(xiàn)的功能一致。
其余參數(shù)不講了,自行學(xué)習(xí)。
舉個(gè)例子
>>> g = sns.factorplot(x="sex", y="total_bill",
... hue="smoker", col="time",
... data=tips, kind="box",
... size=4, aspect=.7);

3、seaborn.lmplot
seaborn.lmplot(x, y, data, hue=None, col=None,
row=None, palette=None, col_wrap=None, size=5,
aspect=1, markers='o', sharex=True, sharey=True,
hue_order=None, col_order=None,
row_order=None, legend=True, legend_out=True,
x_estimator=None, x_bins=None, x_ci='ci',
scatter=True, fit_reg=True, ci=95, n_boot=1000,
units=None, order=1, logistic=False,
lowess=False, robust=False, logx=False,
x_partial=None, y_partial=None, truncate=False,
x_jitter=None, y_jitter=None, scatter_kws=None,
line_kws=None)
跟上面的factorplot很相似,不過組合的是FacetGrid和 seaborn.regplot散點(diǎn)圖(定量-定量)。
參數(shù)都差不太多就不詳細(xì)講了,想研究就看文檔吧
>>> import seaborn as sns; sns.set(color_codes=True)
>>> tips = sns.load_dataset("tips")
>>> g = sns.lmplot(x="total_bill", y="tip", col="smoker", data=tips)

帶誤差線的各種圖
長條高度表示數(shù)字變量的均值,并繪制誤差條,表示基于方差和樣本大小的均值不確定性,又稱潛在誤差量。
簡單的說,代表各組件數(shù)據(jù)的整齊度,也就是個(gè)體差異度,如果誤差線很長,有的夸張的快趕上下面的柱子了,那說明一是數(shù)據(jù)量小,沒幾個(gè)樣本,而是個(gè)體差異度大。
1、seaborn.barplot
seaborn.barplot(x=None, y=None, hue=None, data=None, order=None,
hue_order=None, estimator=<function mean>, ci=95, n_boot=1000,
units=None, orient=None, color=None, palette=None, saturation=0.75,
errcolor='.26', errwidth=None, capsize=None, dodge=True, ax=None,
**kwargs)
將點(diǎn)估計(jì)和置信區(qū)間顯示為柱形。
參數(shù)中有很多我們講過的
x=None, y=None, hue=None, data=None, order=None,
hue_order=None,orient=None, color=None, palette=None, saturation=0.75,dodge=True這些都講過了,參數(shù)功能不再贅述
講點(diǎn)沒講過的
ci: float 或者 “sd” or None,float就是設(shè)定置信區(qū)間,sd就是描繪標(biāo)準(zhǔn)誤差,如果為none就不會(huì)繪制誤差線
capsize:誤差線上的橫線的寬度
errcolor :誤差線顏色
errwidth:誤差線寬度
estimator:估計(jì)誤差的方法,默認(rèn)是平均數(shù)+方差,也可以設(shè)置為中位數(shù)+方差
其他不講了。
2、 seaborn.pointplot
使用散點(diǎn)圖顯示點(diǎn)估計(jì)和置信區(qū)間,跟上面相比是將平均值繪制為點(diǎn),而不是長條。
seaborn.pointplot擅長總結(jié)定量變量和定性變量之間的關(guān)系。
seaborn.pointplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, estimator=<function mean>, ci=95, n_boot=1000, units=None, markers='o', linestyles='-', dodge=False, join=True, scale=1, orient=None, color=None, palette=None, errwidth=None, capsize=None, ax=None, **kwargs)
跟上面的參數(shù)差不多,特別講幾個(gè):
join:如果設(shè)為True,就會(huì)畫那個(gè)點(diǎn)和點(diǎn)之間的估計(jì)線,設(shè)為False就不畫
linestyles:設(shè)置線的格式,可以設(shè)置為虛線等等"- -",當(dāng)然設(shè)置為" "空格的話就是沒有線。
其他沒啥了。
seaborn.pointplot
一些誤差線的知識點(diǎn)
一些誤差線的知識點(diǎn)
一些誤差線的知識點(diǎn)
折線圖
折線圖用于描繪一個(gè)數(shù)字變量相對于第二個(gè)變量的值的變化趨勢。在散點(diǎn)圖中,所有數(shù)據(jù)點(diǎn)都會(huì)繪制出來,而在折線圖中,每個(gè)唯一 x 值或 x 值的分箱僅繪制一個(gè)點(diǎn)(就像柱狀圖一樣)。如果 x 分箱中有多個(gè)觀測值,那么該點(diǎn)在折線圖中繪制的 y 值將為該數(shù)據(jù)點(diǎn)在分箱中的摘要統(tǒng)計(jì)值(例如均值或中值)。繪制的點(diǎn)用線條連接起來,表示 x 值的序列或相連特性。
它跟柱狀圖相比主要關(guān)注兩點(diǎn)
1、對相對變化更感興趣,折線圖的y軸不一定從0開始
2、折線圖強(qiáng)調(diào)了x軸各值的聯(lián)系
如果x 變量表示時(shí)間,則數(shù)據(jù)折線圖通常稱之為時(shí)間序列圖,我們使用seaborn.tsplot可以表示時(shí)間序列數(shù)據(jù)
也可使用matplotlib.pyplot.errorbar來做折線圖。
seaborn.tsplot
seaborn.tsplot(data, time=None, unit=None,
condition=None, value=None, err_style='ci_band',
ci=68, interpolate=True, color=None, estimator=
<function mean>, n_boot=5000, err_palette=None,
err_kws=None, legend=True, ax=None, **kwargs)
參數(shù),常用不再介紹
err_style: {ci_band, ci_bars, boot_traces, boot_kde, unit_traces, unit_points}
err的圖樣,默認(rèn)就是一個(gè)曲線,常用還有ci_bars表示誤差線
ci: float or list of floats in [0, 100] or “sd” or None
跟上面的誤差線很像,要么表示置信區(qū)間,要么表示標(biāo)準(zhǔn)差,None就是沒有誤差線
interpolate :True或者False
表示兩點(diǎn)間是否畫上插值的線
condition :大概就是說會(huì)根據(jù)不同條件來繪制不同的折線,具體可以測試看看
其他參數(shù)不講了。
matplotlib.pyplot.errorbar
將y與x繪制成帶有誤差線的折線。
matplotlib.pyplot.errorbar(x, y, yerr=None, xerr=None, fmt='', ecolor=None, elinewidth=None, capsize=None, barsabove=False, lolims=False, uplims=False, xlolims=False, xuplims=False, errorevery=1, capthick=None, hold=None, data=None, **kwargs)
x, y定義數(shù)據(jù)位置
xerr, yerr定義了errorbar的size大小
fmt
uplims,lolims,xuplims,xlolims,決定了y軸方向上的誤差線范圍,和x軸上的誤差線范圍
可以直接設(shè)定為True徹底限死,也可以像xerr yerr那樣設(shè)定大小
errorbar
pandas.DataFrame.rolling
pandas.cut
pandas.DataFrame.sort_values
jointGrid類
*class *`seaborn.``JointGrid`(*x*, *y*, *data=None*, *size=6*, *ratio=5*, *space=0.2*, *dropna=True*, *xlim=None*, *ylim=None*)[?](https://seaborn.pydata.org/generated/seaborn.JointGrid.html#seaborn.JointGrid "Permalink to this definition")
用邊緣單變量圖繪制二元圖的網(wǎng)格。
具體的參數(shù),和類方法不詳細(xì)講了。
大概步驟如下:
第一步:
生成一個(gè)jointGrid對象g = sns.JointGrid()
第二步:
在生成的對象上添加一個(gè)圖標(biāo)類型
可以用g.plot_joint()設(shè)置主圖是什么
可以用g = g.plot()直接設(shè)置主圖和軸圖的不同圖表
也可以使用g = g.plot_marginals()方法來組合圖表,課程中就是組合seaborn.rugplot軸須圖來畫圖表的。
舉例:
>>> import seaborn as sns; sns.set(style="ticks", color_codes=True)
>>> tips = sns.load_dataset("tips")
>>> g = sns.JointGrid(x="total_bill", y="tip", data=tips)
>>> g = g.plot(sns.regplot, sns.distplot)
