R 中的 do.call() 是我極少用到的一個函數(shù),不過它在很多情況下是蠻有用的,之前我也做過簡單的介紹。
它可以在實際調用函數(shù)時將參數(shù)以列表的形式傳入,下面是一個簡單的函數(shù):
f <- function(x) print(x^2)
我們可以用下面的方式調用 do.call():
do.call(f, list(x = 4))
#> [1] 16
大部分情況下這樣的用法是啰嗦的,直接 f(4) 其實已經(jīng)解決上面的問題了。
最近我需要批量更新參數(shù)時發(fā)現(xiàn)了 do.call() 的好用之處。
在批量建模時可能需要比較對建模函數(shù)設定不同的參數(shù),我們以求和函數(shù)作為建模函數(shù)舉例。
假設建模需要 4 個參數(shù),造一個類似的求和函數(shù):
Sum <- function(a = 1, b = 2, c = 3, d = 4) {
return(sum(a, b, c, d))
}
而我們需要批量運行這個函數(shù),而且只修改其中 3 個參數(shù),另外參數(shù)是外部定義的,比如說其他使用這個函數(shù)的人。
有可能只使用 a, b, c:
Sum(a = 1, b = 3, c = 5)
#> [1] 13
也可能使用 b, c, d。
Sum(d = 1, b = 3, c = 5)
#> [1] 10
這并不能直接通過 for 循環(huán)、apply 之類的操作進行批量調用。我們來看看 do.call() 如何解決這個問題。
我們構建一個參數(shù)矩陣:
Args <- expand.grid(
c(1, 2),
c(3, 4, 5),
c(6, 7, 8, 9)
)
Args
#> Var1 Var2 Var3
#> 1 1 3 6
#> 2 2 3 6
#> 3 1 4 6
#> 4 2 4 6
#> 5 1 5 6
#> 6 2 5 6
#> 7 1 3 7
#> 8 2 3 7
#> 9 1 4 7
#> 10 2 4 7
#> 11 1 5 7
#> 12 2 5 7
#> 13 1 3 8
#> 14 2 3 8
#> 15 1 4 8
#> 16 2 4 8
#> 17 1 5 8
#> 18 2 5 8
#> 19 1 3 9
#> 20 2 3 9
#> 21 1 4 9
#> 22 2 4 9
#> 23 1 5 9
#> 24 2 5 9
假設現(xiàn)在是使用 a, b, c 3 個參數(shù):
colnames(Args) <- c("a", "b", "c")
head(Args)
#> a b c
#> 1 1 3 6
#> 2 2 3 6
#> 3 1 4 6
#> 4 2 4 6
#> 5 1 5 6
#> 6 2 5 6
創(chuàng)建批處理函數(shù):
batchSum <- function(ArgsMat) {
args <- list()
for (i in 1:nrow(ArgsMat)) {
args_update <- c(args, ArgsMat[i, , drop = FALSE])
do.call(Sum, args = args_update)
}
}
為了查看調用效果,我們修改下 Sum() 函數(shù):
Sum <- function(a = 1, b = 2, c = 3, d = 4) {
message("a:", a, " b:", b, " c:", c, " d:", d)
return(sum(a, b, c, d))
}
調用參數(shù)矩陣試試:
batchSum(Args)
#> a:1 b:3 c:6 d:4
#> a:2 b:3 c:6 d:4
#> a:1 b:4 c:6 d:4
#> a:2 b:4 c:6 d:4
#> a:1 b:5 c:6 d:4
#> a:2 b:5 c:6 d:4
#> a:1 b:3 c:7 d:4
#> a:2 b:3 c:7 d:4
#> a:1 b:4 c:7 d:4
#> a:2 b:4 c:7 d:4
#> a:1 b:5 c:7 d:4
#> a:2 b:5 c:7 d:4
#> a:1 b:3 c:8 d:4
#> a:2 b:3 c:8 d:4
#> a:1 b:4 c:8 d:4
#> a:2 b:4 c:8 d:4
#> a:1 b:5 c:8 d:4
#> a:2 b:5 c:8 d:4
#> a:1 b:3 c:9 d:4
#> a:2 b:3 c:9 d:4
#> a:1 b:4 c:9 d:4
#> a:2 b:4 c:9 d:4
#> a:1 b:5 c:9 d:4
#> a:2 b:5 c:9 d:4
可以看出來整個過程中 d 是沒有變的。我們再修改參數(shù)矩陣:
colnames(Args) <- c("a", "c", "d")
再次調用函數(shù):
batchSum(Args)
#> a:1 b:2 c:3 d:6
#> a:2 b:2 c:3 d:6
#> a:1 b:2 c:4 d:6
#> a:2 b:2 c:4 d:6
#> a:1 b:2 c:5 d:6
#> a:2 b:2 c:5 d:6
#> a:1 b:2 c:3 d:7
#> a:2 b:2 c:3 d:7
#> a:1 b:2 c:4 d:7
#> a:2 b:2 c:4 d:7
#> a:1 b:2 c:5 d:7
#> a:2 b:2 c:5 d:7
#> a:1 b:2 c:3 d:8
#> a:2 b:2 c:3 d:8
#> a:1 b:2 c:4 d:8
#> a:2 b:2 c:4 d:8
#> a:1 b:2 c:5 d:8
#> a:2 b:2 c:5 d:8
#> a:1 b:2 c:3 d:9
#> a:2 b:2 c:3 d:9
#> a:1 b:2 c:4 d:9
#> a:2 b:2 c:4 d:9
#> a:1 b:2 c:5 d:9
#> a:2 b:2 c:5 d:9
此時 b 是沒有變的。
以上我們通過 do.call() 實現(xiàn)了內部函數(shù)對外部輸入的自動匹配。
該操作我把它實際用在了批量 Keras 模型的調用上:https://github.com/ShixiangWang/sigminer.prediction/blob/f64bcdf7bc8d5d819d48edc4344ed9af8b984738/R/batch_modeling_and_fitting.R#L37-L63,有興趣的讀者可以看一下。
