本文提供一個基于PySyft和Torch的聯(lián)邦學習案例,使用自編碼器(AE)來進行圖像重建任務(wù)。我們將使用Federated Average算法來合并每個客戶端的AE權(quán)重,并保護每個客戶端的隱私。下面是實現(xiàn)該案例的代碼:
首先,我們導入必要的庫。
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import torchvision.transforms as transforms
from torchvision.datasets import MNIST
import syft as sy
然后,我們定義自編碼器的模型類。
class AE(nn.Module):
def __init__(self):
super(AE, self).__init__()
# 編碼器
self.encoder = nn.Sequential(
nn.Conv2d(1, 16, kernel_size=3, stride=2, padding=1),
nn.ReLU(),
nn.Conv2d(16, 32, kernel_size=3, stride=2, padding=1),
nn.ReLU(),
nn.Conv2d(32, 64, kernel_size=7)
)
# 解碼器
self.decoder = nn.Sequential(
nn.ConvTranspose2d(64, 32, kernel_size=7),
nn.ReLU(),
nn.ConvTranspose2d(32, 16, kernel_size=3, stride=2, padding=1, output_padding=1),
nn.ReLU(),
nn.ConvTranspose2d(16, 1, kernel_size=3, stride=2, padding=1, output_padding=1),
nn.Sigmoid()
)
def forward(self, x):
x = self.encoder(x)
x = self.decoder(x)
return x
接下來,我們定義訓練和測試函數(shù)。在訓練函數(shù)中,我們使用PySyft在每個客戶端上訓練AE,并使用Federated Average算法在每個輪次結(jié)束時加權(quán)平均客戶端權(quán)重。在測試函數(shù)中,我們使用聯(lián)邦學習的模型進行圖像重建,并計算測試損失。
# 訓練函數(shù)
def train(model_ptr, optimizer, criterion, data_loader, device):
model_ptr.train()
for batch_idx, (data, _) in enumerate(data_loader):
# 發(fā)送數(shù)據(jù)到客戶端
data = data.send(model_ptr.location)
target = data.clone().detach()
# 在客戶端上進行訓練
optimizer.zero_grad()
output = model_ptr(data)
loss = criterion(output, target)
loss.backward()
optimizer.step()
# 獲取客戶端權(quán)重并加權(quán)平均
model_ptr.weight.data = model_ptr.weight.data.get() + model_ptr.weight.grad.data
model_ptr.weight.grad.data.zero_()
# 將客戶端權(quán)重加權(quán)平均
model_ptr.weight.data /= len(data_loader)
接著上面的代碼,我們可以在測試函數(shù)中使用聯(lián)邦學習的模型進行圖像重建,并計算測試損失。
# 測試函數(shù)
def test(model_ptr, data_loader, device):
model_ptr.eval()
test_loss = 0
with torch.no_grad():
for data, _ in data_loader:
# 發(fā)送數(shù)據(jù)到客戶端
data = data.send(model_ptr.location)
target = data.clone().detach()
# 使用聯(lián)邦學習的模型進行圖像重建
output = model_ptr(data)
test_loss += F.mse_loss(output.get(), target, reduction='sum').item()
# 計算平均測試損失
test_loss /= len(data_loader.dataset)
return test_loss
現(xiàn)在,我們可以開始構(gòu)建聯(lián)邦學習環(huán)境并進行訓練了。首先,我們創(chuàng)建虛擬工人,并將其分配給不同的客戶端。
# 創(chuàng)建虛擬工人
hook = sy.TorchHook(torch)
workers = [sy.VirtualWorker(hook, id="worker{}".format(i)) for i in range(3)]
# 將數(shù)據(jù)分配給不同的客戶端
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
train_data = MNIST(root='./data', train=True, download=True, transform=transform)
federated_train_loader = sy.FederatedDataLoader(train_data.federate(workers), batch_size=64, shuffle=True, num_workers=0, drop_last=True)
然后,我們在每個客戶端上訓練AE,并使用Federated Average算法進行加權(quán)平均客戶端權(quán)重。我們訓練10輪,并在每輪結(jié)束時計算并輸出平均測試損失。
# 初始化模型指針
model = AE().to(device)
model_ptr = model.send(workers[0])
# 設(shè)置超參數(shù)
criterion = nn.MSELoss()
learning_rate = 0.01
optimizer = optim.Adam(model.parameters(), lr=learning_rate)
# 訓練模型
num_epochs = 10
for epoch in range(num_epochs):
train(model_ptr, optimizer, criterion, federated_train_loader, device)
test_loss = test(model_ptr, federated_train_loader, device)
print('Epoch [{}/{}], Test Loss: {:.4f}'.format(epoch+1, num_epochs, test_loss))
# 獲取加權(quán)平均模型并在本地進行測試
avg_model_ptr = model_ptr.copy().move(workers[0])
avg_model_ptr.weight.data = torch.zeros_like(avg_model_ptr.weight.data)
avg_model_ptr.weight.requires_grad = False
for ptr in model_ptr.pointers():
avg_model_ptr.weight.data += ptr.weight.data / len(workers)
test_loss = test(avg_model_ptr, federated_train_loader, device)
print('Final Test Loss: {:.4f}'.format(test_loss))
這樣,我們就成功地完成了一個基本的聯(lián)邦學習案例,使用PySyft模擬了一個簡單的圖像重建任務(wù)。
本文由mdnice多平臺發(fā)布