美日韩精品一区二区三,久久首页这里只有精品

不管是為Pandas對(duì)象應(yīng)用自定義函數(shù)，還是應(yīng)用第三方函數(shù)，都離不開以下幾種方法。用哪種方法取決于操作的對(duì)象是DataFrame，還是Series；是行、列，還是元素。

1.表現(xiàn)級(jí)函數(shù)應(yīng)用：pipe()

2.行列級(jí)函數(shù)應(yīng)用：apply()

3.聚合API：agg()與transform()

4.元素級(jí)函數(shù)應(yīng)用：applymap()

表現(xiàn)級(jí)函數(shù)應(yīng)用

雖然可以把DataFrame與Series傳遞給函數(shù)，不過鏈?zhǔn)秸{(diào)用函數(shù)時(shí)，最好使用pipe()方法。對(duì)比以下兩種方式：

下列代碼與上述代碼是等效的：

Pandas建議使用第二種方式，即鏈?zhǔn)椒椒?。在鏈?zhǔn)椒椒ㄖ姓{(diào)用自定義函數(shù)或第三方支持庫函數(shù)時(shí)，用pipe更容易，與用Pandas自身方法一樣。

上述示例中，f、g與h這幾個(gè)函數(shù)都把DataFrame當(dāng)作首位參數(shù)。要是想把數(shù)據(jù)作為第二個(gè)參數(shù)，我們可以怎么做呢？本例中，pipe為元組（callable，data_keyword）形式。.pipe把DataFrame作為元組里指定的參數(shù)。

下面示例用statmodels擬合回歸，該API先接收一個(gè)公示，DataFrame是第二個(gè)參數(shù)，data。要傳遞函數(shù)，則要用pipe接收關(guān)鍵詞對(duì)（sm.ols,’data’）。

unix的pipe與后來出現(xiàn)的dplyr及magrittr帶動(dòng)了pipe方法，在此，引入了R語言里用于讀取pipe的操作符（%>%）。pipe的實(shí)現(xiàn)思路非常清晰，仿佛跟Python源生的一樣。

行列級(jí)函數(shù)應(yīng)用

apply()方法沿著DataFrame的軸應(yīng)用函數(shù)，比如，描述性統(tǒng)計(jì)方法，該方法支持axis參數(shù)。

apply()方法還支持通過函數(shù)名字符串調(diào)用函數(shù)。

默認(rèn)情況下，apply()調(diào)用的函數(shù)返回的類型會(huì)影響DataFrame輸出結(jié)構(gòu)的類型。

函數(shù)返回的是Series時(shí)，最終輸出結(jié)果是DataFrame。輸出的列與函數(shù)返回的Series索引相匹配。

函數(shù)返回其它任意類型時(shí)，輸出結(jié)果是Series。

result_type會(huì)覆蓋默認(rèn)行為，該參數(shù)有三個(gè)選項(xiàng)：reduce、broadcast、expand。

這些選項(xiàng)決定了列表型返回值是否擴(kuò)展為DataFrame。

我們用好了apply()的話，可以了解數(shù)據(jù)集的很多信息。比如可以提取每列的最大值對(duì)應(yīng)的日期：

還可以向apply()方法傳遞額外的參數(shù)與關(guān)鍵字參數(shù)。比如下面示例中要應(yīng)用的這個(gè)函數(shù)：

可以用以下方式應(yīng)用該函數(shù)：

為每行或每例執(zhí)行Series方法的功能也非常的實(shí)用：

apply()有一個(gè)參數(shù)raw，默認(rèn)值為False，再應(yīng)用函數(shù)前，使用該參數(shù)可以將每行或列轉(zhuǎn)換為Series。該參數(shù)為True時(shí)，傳遞的函數(shù)接收ndarray對(duì)象，若不需要索引功能，這樣操作能夠顯著的提高性能。