Автор: Илья Бакалец

Введение

В предыдущей статье я описывал ускоренный процесс разметки с использованием CVAT и Fiftyone. Мы развернули сервис разметки и получили предварительно размеченные данные.

Сейчас мы рассмотрим некоторые возможности новой SDK PyTorch от команды CVAT. Основная идея — использовать CVAT для получения ваших данных в формате PyTorch Dataset object. Это помогает решать следующие проблемы:

Все перечисленные выше проблемы отнимают много времени и сил. Поэтому давайте разберемся с тем, как мы можем их автоматизировать.

Датасеты

В этой статье мы рассмотрим два важных класса:

  1. ProjectVisionDataset — ****он ****позволяет загрузить все Tasks в конкретном проекте в единый датасет;
  2. TaskVisionDataset — он позволяет загрузить определенный Task.

Оба класса наследуются от torch.utils.data.Dataset и возвращают датасет, состоящий из:

Если вам нужны данные в других форматах, то для этого можно использовать трансформации (transforms).

Transforms

Для получения датасета в необходимом формате можно обратиться к transforms с целью изменения возвращаемых объектов.