Автор: Илья Бакалец
В предыдущей статье я описывал ускоренный процесс разметки с использованием CVAT и Fiftyone. Мы развернули сервис разметки и получили предварительно размеченные данные.
Сейчас мы рассмотрим некоторые возможности новой SDK PyTorch от команды CVAT. Основная идея — использовать CVAT для получения ваших данных в формате PyTorch Dataset object. Это помогает решать следующие проблемы:
Все перечисленные выше проблемы отнимают много времени и сил. Поэтому давайте разберемся с тем, как мы можем их автоматизировать.
В этой статье мы рассмотрим два важных класса:
Оба класса наследуются от torch.utils.data.Dataset
и возвращают датасет, состоящий из:
PIL.Image.Image
;cvat_sdk.pytorch.Target
.Если вам нужны данные в других форматах, то для этого можно использовать трансформации (transforms).
Для получения датасета в необходимом формате можно обратиться к transforms с целью изменения возвращаемых объектов.