PyTorchで事前トレーニング済みのモデルを簡単に利用：torch.utils.model_zoo徹底解説

仕組み

モデルの選択: torch.utils.model_zoo には、ResNet、VGG、Inceptionなどの様々なアーキテクチャのモデルが用意されています。モデルは、model_name 引数を使用して選択できます。
モデルのダウンロード: 選択したモデルがローカルに存在しない場合は、torch.utils.model_zoo が自動的にダウンロードします。モデルは、model_dir 引数で指定したディレクトリに保存されます。
モデルのロード: ダウンロードと保存が完了したら、torch.utils.model_zooを使用してモデルをロードできます。ロードされたモデルは、torch.nn.Module のサブクラスであり、通常のPyTorchモデルと同様に使用できます。

例

import torch
import torch.nn as nn
import torch.utils.model_zoo as model_zoo

# ResNet50モデルをロード
model = model_zoo.load_state_dict(model_zoo.resnet50(pretrained=True))

# モデルを評価モードに設定
model.eval()

# 入力データを作成
input_data = torch.randn(1, 3, 224, 224)

# モデルを実行
output = model(input_data)

スタイル転写
画像キャプション生成
画像セグメンテーション
オブジェクト検出
画像分類

モデルのアーキテクチャとパラメータの詳細については、PyTorchドキュメントを参照してください。
torch.utils.model_zoo は、ImageNetで事前トレーニングされたモデルのみを提供します。異なるデータセットでトレーニングされたモデルをロードするには、カスタムコードを使用する必要があります。

最新の情報については、PyTorchドキュメントとTorch Hubリポジトリを参照してください。
torch.utils.model_zoo は、Torch Hubの一部になりました。Torch Hubは、PyTorchモデルとデータセットの包括的なリポジトリです。

import torch
import torch.nn as nn
import torch.utils.model_zoo as model_zoo
from torchvision import transforms

# モデルをロード
model = model_zoo.load_state_dict(model_zoo.resnet50(pretrained=True))

# モデルを評価モードに設定
model.eval()

# データ変換を定義
data_transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]),
])

# 画像を読み込み、変換
image = Image.open('image.jpg')
image = data_transform(image)

# 画像をバッチサイズ1のテンソルに変換
image = torch.unsqueeze(image, 0)

# モデルを実行
output = model(image)

# 出力を処理
_, predicted = torch.max(output.data, 1)
print('推定クラス:', predicted.item())

torch.utils.model_zoo.load_state_dictを使用して、ResNet50モデルをロードします。
model.eval()を使用して、モデルを評価モードに設定します。
transforms.Composeを使用して、データ変換を定義します。この変換は、画像をPyTorchテンソルに変換し、標準化します。
Image.openを使用して、画像を読み込みます。
data_transformを使用して、画像を変換します。
torch.unsqueezeを使用して、画像をバッチサイズ1のテンソルに変換します。
model(image)を使用して、モデルを実行します。
torch.maxを使用して、出力の最大値とインデックスを取得します。
predicted.item()を使用して、推定クラスを印刷します。

詳細については、PyTorchドキュメントとTorch Hubリポジトリを参照してください。
異なる画像分類タスクには、異なるデータ変換とモデルアーキテクチャが必要になる場合があります。
このコードは、ImageNetで事前トレーニングされたResNet50モデルを使用しています。

torch.hub を利用する

torch.hub は、PyTorchモデルとデータセットの包括的なリポジトリです。torch.utils.model_zoo で利用可能だったモデルの大多数は、torch.hub からロードできます。

import torch
import torch.hub as hub

# ResNet50モデルをロード
model = hub.load('pytorch/vision', 'resnet50', pretrained=True)

カスタムスクリプトを使用する

一部のモデルは、torch.hub で利用できない場合があります。このような場合は、カスタムスクリプトを使用してモデルをロードする必要があります。モデルのロード方法の詳細については、モデルのドキュメントを参照してください。

PyTorch Model Zoo (非公式) を利用する

PyTorch Model Zoo () は、非公式のコミュニティプロジェクトであり、torch.utils.model_zoo と互換性のあるモデルを提供しています。

ONNX モデルを利用する

ONNX形式のモデルは、PyTorch以外にも様々なフレームワークで利用できます。ONNXモデルをロードするには、torch.onnx.load() 関数を使用します。

比較

方法	利点	欠点
torch.hub	使いやすく、多くのモデルに対応	最新のモデルがすべて含まれているとは限らない
カスタムスクリプト	柔軟性が高い	モデルのロード方法を自分で理解する必要がある
PyTorch Model Zoo (非公式)	非公式コミュニティがサポート	モデルの数が少ない可能性がある
ONNXモデル	移植性が高い	モデルの変換が必要

研究や実験目的の場合は、PyTorch Model Zoo (非公式) や ONNXモデルを検討することもできます。
特定のモデルが必要な場合は、カスタムスクリプトを使用する必要があります。
最新のモデルを利用したい場合は、torch.hub を利用するのがおすすめです。