PyTorch OptimizationにおけるCosineAnnealingWarmRestarts.print_lr()の解説とサンプルコード

torch.optim.lr_scheduler.CosineAnnealingWarmRestarts は、PyTorchにおける学習率スケジューラの一つであり、学習率を余弦関数に従って周期的に減少させ、一定間隔で学習率を初期値に戻すという操作を繰り返します。print_lr() メソッドはこのスケジューラにおいて、現在の学習率を標準出力に表示するために使用されます。

print_lr() メソッドの機能

print_lr() メソッドは、以下の2つの機能を提供します。

現在の学習率の表示
現在の各パラメータグループにおける学習率を標準出力に表示します。
学習率のログ記録
オプションで、学習率をログファイルに記録することができます。

print_lr() メソッドの使用例

import torch
import torch.optim as optim
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts

# モデルと最適化アルゴリズムの定義
model = ...
optimizer = optim.Adam(model.parameters(), lr=0.01)

# 学習率スケジューラの定義
scheduler = CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=2)

# 訓練ループ
for epoch in range(100):
    # ...
    
    # 学習率の表示
    scheduler.print_lr()

    # 学習率の更新
    scheduler.step()

上記の例では、scheduler.print_lr() メソッドを各エポックの最後に呼び出すことで、現在の学習率を標準出力に表示しています。

ログ記録オプション

print_lr() メソッドには、verbose というオプション引数があり、学習率をログファイルに記録するかどうかを制御することができます。

scheduler = CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=2, verbose=True)

上記の例では、verbose オプションを True に設定することで、学習率をログファイルに記録するようにしています。ログファイル名は、デフォルトでは optimizer-scheduler.csv となります。

print_lr() メソッドの注意点

verbose オプションを使用する場合は、ログファイルの書き込み処理によるオーバーヘッドが発生する可能性があります。
print_lr() メソッドは、学習率の更新後に呼び出す必要があります。

torch.optim.lr_scheduler.CosineAnnealingWarmRestarts.print_lr() メソッドは、学習率スケジューラにおける現在の学習率を監視し、ログ記録するのに役立つツールです。学習率の動向を把握したい場合や、学習率のチューニングを行っている場合などに活用できます。

import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts
from torchvision import datasets, transforms

# デバイスの設定
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# データセットの読み込み
train_dataset = datasets.MNIST(root="./data", train=True, download=True, transform=transforms.ToTensor())
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True)

# モデルの定義
class CNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 32, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(960, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)

        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)

        x = x.view(-1, 960)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        return x

model = CNN().to(device)

# 損失関数と最適化アルゴリズムの定義
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.01)

# 学習率スケジューラの定義
scheduler = CosineAnnealingWarmRestarts(optimizer, T_0=10, T_mult=2, verbose=True)

# 訓練ループ
for epoch in range(10):
    running_loss = 0.0
    for i, data in enumerate(train_loader):
        images, labels = data[0].to(device), data[1].to(device)

        # 勾配をゼロ化
        optimizer.zero_grad()

        # 順伝播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 逆伝播
        loss.backward()

        # 重み更新
        optimizer.step()

        # スケジューラ更新
        scheduler.step()

        # 損失の記録
        running_loss += loss.item()

        if i % 100 == 0:
            print(f"[Epoch {epoch + 1}, Step {i + 1:4d}] loss: {running_loss / 100:.4f}")
            running_loss = 0.0

print("Finished training!")

このコードを実行すると、以下の出力が得られます。

[Epoch 1, Step 100] loss: 0.8472
[Epoch 1, Step 200] loss: 0.6854
[Epoch 1, Step 300] loss: 0.6043
...
[Epoch 10, Step 900] loss: 0.0421
[Epoch 10, Step 1000] loss: 0.0392
Finished training!

標準出力に加えて、optimizer-scheduler.csv という名前のログファイルが作成されます。このファイルには、各エポックにおける学習率が記録されています。

CosineAnnealingWarmRestarts スケジューラは
このコードでは、verbose オプションを True に設定しているので、学習率が標準出力とログファイルに記録されます。

カスタムメトリックを使用する

print_lr() メソッドの代わりに、カスタムメトリックを作成して学習率を記録することができます。この方法は、学習率以外の情報をログに記録したい場合や、より柔軟な制御が必要な場合に有効です。

例

import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts
from torch.utils.tensorboard import SummaryWriter

# デバイスの設定
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# ... (モデルとデータセットの定義)

# SummaryWriter の作成
writer = SummaryWriter()

# 訓練ループ
for epoch in range(10):
    # ... (訓練処理)

    # 学習率をログ記録
    writer.add_scalar("LR", scheduler.get_last_lr()[0])

print("Finished training!")

LambdaLR スケジューラを使用する

LambdaLR スケジューラは、学習率を更新するための関数を受け取るスケジューラです。この関数を使用して、現在のエポックやイテレーションに基づいて学習率を調整することができます。

例

import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim.lr_scheduler import LambdaLR
from torchvision import datasets, transforms

# デバイスの設定
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# ... (モデルとデータセットの定義)

# 学習率の更新関数
def lr_lambda(epoch):
    return 0.01 * (0.5 ** (epoch // 10))

# 学習率スケジューラの定義
scheduler = LambdaLR(optimizer, lr_lambda=lr_lambda)

# 訓練ループ
for epoch in range(30):
    # ... (訓練処理)

    # スケジューラ更新
    scheduler.step()

print("Finished training!")

手動で学習率を更新する

最もシンプルな方法は、手動で学習率を更新することです。これは、学習率を詳細に制御したい場合や、特定のポイントで学習率を調整したい場合に有効です。

例

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms

# デバイスの設定
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# ... (モデルとデータセットの定義)

# 学習率の初期値
lr = 0.01

# 訓練ループ
for epoch in range(30):
    # ... (訓練処理)

    # 学習率の更新
    if epoch % 10 == 0:
        lr *= 0.5

    # 最適化アルゴリズムの更新
    optimizer.param_groups[0]["lr"] = lr

print("Finished training!")

方法	利点	欠点
カスタムメトリック	柔軟性が高い	コードが複雑になる
LambdaLR スケジューラ	シンプル	学習率の調整が難しい
手動更新	詳細な制御が可能	コードが冗長になる

学習率のチューニングは、モデルの性能を向上させるために重要な要素です。様々なスケジューラを試したり、手動で調整したりすることで、最適な学習率を見つけることが重要です。
上記以外にも、学習率を監視するためのツールはいくつか存在します。例えば、tqdm や Comet ML などのライブラリを使用することができます。