投稿日更新日

【OIDv6】PythonライブラリでGoogle Open Images Dataset V6のデータセットを簡単にダウンロードする

はじめに

今回は、Google Open Images Dataset V6のデータセットをoidv6というPythonのライブラリを使用して、簡単にダウンロードする方法をご紹介します。

Google Open Images Dataset V6

Google Open Images Dataset V6は、Googleが作成している物体検出向けの学習用データセットです。Yolo等のためのバウンディングボックスの他に、セマンティックセグメンテーション向けのマスクデータ等も用意されています。

oidv6のインストール

oidv6は、Google Open Images Dataset V6のデータセットを簡単にダウンロードできるPython ライブラリです。 早速pipでインストールしましょう。

pip3 install oidv6

oidv6の使い方

コマンドの使い方は以下の通りです。

oidv6 downloader en --dataset $(DATASET_DIR) --type_data $(TYPE) --classes $(CLASS_LIST) --limit $(LIMIT) --yes
  • $(DATASET_DIR): ダウンロード先のディレクトリパスを指定します。
  • $(TYPE): 'train', 'validation', 'test'の中から必要なデータのタイプを指定します。
  • $(CLASS_LIST): ダウンロードするデータのクラスを指定します。(指定可能なクラスのリストhttps://github.com/DmitryRyumin/OIDv6/blob/master/oidv6/classes.txt)
  • $(LIMIT): 各クラスの画像の枚数を指定します。

oidv6でデータセットをダウンロードする

今回は、personballクラスのデータをダウンロードしてみます。 画像の枚数を増やすと、めちゃ時間がかかります。

oidv6 downloader en --dataset './download_repo' --type_data 'train' --classes person ball --limit '5' --yes

おわりに

今回は、PythonライブラリOIDv6を利用して、Google Open Images Datasetからデータセットをダウンロードする方法について説明しました。 皆さまのお役に立てれば幸いです。

関連記事

に投稿

M1 MacにlabelImgをインストールする方法

© 2022 はるとんのブログ