DVC (Data Version Control)
▼ ざっくり言うと
Gitのデータ版、機械学習のデータセットやモデルをバージョン管理するツールです。
▼ もうちょっと詳しく
Gitはコードを管理しますが、何ギガバイトもあるデータセットやモデルファイルは、そのままだとGit に乗せられません。これらをGit的に管理できるようにするのがDVC。
「v1.2.3のときに学習したデータ」「この実験のときのモデル」みたいな「再現性のある実験」を可能にしてくれます。MLOpsの地味な必需品。
「あのときのデータ、どこ?」というのが研究の永遠の悩みで、それを救うのがDVCです。
あなたの読了: 0 / 390 語

