DVCディーブイシー (Data Version Control)

▼ ざっくり言うと

Gitのデータ版、機械学習のデータセットやモデルをバージョン管理するツールです。

▼ もうちょっと詳しく

Gitはコードを管理しますが、何ギガバイトもあるデータセットやモデルファイルは、そのままだとGit に乗せられません。これらをGit的に管理できるようにするのがDVC。

v1.2.3のときに学習したデータ」「この実験のときのモデル」みたいな「再現性のある実験」を可能にしてくれます。MLOpsの地味な必需品。

「あのときのデータ、どこ?」というのが研究の永遠の悩みで、それを救うのがDVCです。

あなたの読了: 0 / 390