PyTorch による DLRM の理解

Mrinal Kshirsagar
4月13日
読了時間: 4分

更新日：4月21日

DLRMはディープラーニング・レコメンデーション・モデルの略称です。Facebook AI (Meta) が大規模なパーソナライズされたレコメンデーションシステム向けに開発したニューラルネットワークアーキテクチャです。DLRMは、パーソナライズされたレコメンデーションやランキング予測が必要な実世界のアプリケーションで広く利用されています。DLRMは、クリックスルー率 (CTR) の予測とランキングタスク向けに設計されています。

例: オンライン広告、電子商取引の推奨、ソーシャルメディアフィードのランキング、ストリーミングサービス、オンラインマーケットプレイス、クラシファイド広告など。

DLRM の機能:

DLRM インストールオプション:

git と python を使用してオリジナルの Facebook DLRM (PyTorch) をインストールします。
TorchRec を使用して DLRM をインストールする
NVIDIA DLRMをインストールする
Docker に DLRM をインストールする (CPU のみまたは GPU)

DLRM と PyTorch の関係は何ですか?

DLRMはPyTorchを使用して構築されています。PyTorchは、DLRM内のすべてのコンポーネントを動かす基盤となるディープラーニングフレームワークとして機能します。

PyTorchはフレームワーク、DLRMはモデル

DLRM はフレームワークではなく、大規模な推奨システム向けに Meta (Facebook) が設計した特定のニューラルネットワークアーキテクチャです。

PyTorch は以下を提供します:

DLRM はこれらのツールを使用して、高密度 MLP、埋め込みテーブル、および機能相互作用レイヤーを構築します。

Pytorch インストールオプション:

PyTorch は、環境、ハードウェア、ワークフローに応じてさまざまな方法でインストールできます。

pip 経由でインストールする (最も一般的かつ最も簡単)
Conda 経由でインストール (GPU 環境に最適)
Docker 経由でインストール (分離 & 本番環境対応)
ソースからインストール (開発者およびカスタムビルド向け)
クラウドベースの PyTorch インストール
パッケージマネージャー経由でインストールする (OS サポートが限定的)

Docker 経由の Pytorch インストール:

Docker経由でPyTorchをインストールすることは、ディープラーニング環境を構築する最も信頼性が高く、手間のかからない方法の一つです。Pythonのバージョン、CUDAツールキット、cuDNNライブラリ、システムの依存関係を手動で管理する代わりに、Dockerは事前設定済みのコンテナを提供し、すべてがすぐに使える状態になっています。公式のPyTorchイメージ（CPUのみ、またはCUDAサポート付き）をプルすることで、どのマシンでも同じように動作する、分離され再現可能な環境が得られます。

クイックステップ

1. イメージを取得する

CPUのみ:
- docker pull pytorch/pytorch:latest
GPU (CUDA 11.8 の例):
- docker pull pytorch/pytorch:latest-cuda11.8-cudnn8-runtime

2. コンテナを実行する

CPU：
- docker run -it pytorch/pytorch:latest bash
GPU (NVIDIA コンテナツールキットを使用):
- docker run -it --gpus all pytorch/pytorch:latest-cuda11.8-cudnn8-runtime bash

3. コンテナ内の確認

python3 -c "torchをインポートします。print(torch.__version__);print('cuda:', torch.cuda.is _available())"

PyTorch Docker コンテナ内で DLRM を実行するにはどうすればよいでしょうか?

PyTorch Dockerイメージを取得する
コンテナを起動する
依存関係のインストール（コンテナ内）
DLRMリポジトリのクローン
DLRMを実行する

DLRM コマンド:

DLRMを効果的に実行するには、データの読み込み、モデルアーキテクチャ、トレーニング設定、パフォーマンスチューニングを制御する主要なコマンドラインオプションを理解する必要があります。DLRMは、バッチサイズから埋め込み次元まで、あらゆる設定を可能にする豊富なフラグセットに対応しています。これらのオプションは、主に4つのカテゴリに分類されます。

データオプション
トレーニングオプション
モデルアーキテクチャオプション
システム/パフォーマンスオプション

よく使用される DLRM コマンド:

python dlrm_s_pytorch.py \

    --data-generation=synthetic \

    --mini-batch-size=2048 \

    --learning-rate=0.01 \

    --arch-sparse-feature-size=16 \

    --arch-mlp-bot="13-512-256-64-16" \

    --arch-mlp-top="512-256-1" \

    --print-freq=10

結論

PyTorch Dockerコンテナを使用してDLRM（ディープラーニング推奨モデル）を実行することで、異なるハードウェアプラットフォーム間で、合理化され、一貫性があり、再現性の高い環境を実現できます。Dockerは依存関係の競合を排除し、セットアップを簡素化し、PyTorchのバージョン、ライブラリ、最適化など、必要なソフトウェアスタックをシームレスにデプロイすることを保証します。

要するに、PyTorch Docker + DLRM を利用すれば、レコメンデーションモデルのトレーニング、評価、デプロイを、最小限の手間で、信頼性が高く、柔軟かつ効率的に行うことができます。

PyTorch による DLRM の理解

最新記事

コメント