Автор: Антон Броиловский
Редактура: Дмитрий Раков
Выход новой версии YOLO снова создал инфоповод в научном сообществе. И причиной этому послужили не только технические нововведения, но и неожиданный порядок выхода моделей. Как и две предыдущие части, 6-ая и 7-ая версии появились практически одновременно. При этом YOLOv7 вышла на 2 месяца раньше YOLOv6! YOLOv7 — 6-го июля 2022 года, а YOLOv6 — 7-го сентября 2022 года.
Почему так произошло? Всё просто: YOLOv6 создавалась исследователями из AI-лаборатории в Meituan (Китайский ритейлер), а разработкой YOLOv7 занималась другая команда. Возможно, авторы заранее договорились о нейминге, но в последний момент что-то пошло не так. Забавный факт: в статье про YOLOv6 есть сравнение с YOLOv7.

Рисунок 1. Мем, подходящий для описания этой ситуации 🙂
У вас может возникнуть вопрос: с чем связано двухлетнее затишье? Ведь даже пока мы публикуем эту серию статей в Deep School, вышло ещё две новых архитектуры! 🤯
Давайте вспомним, чем весь мир занимался в 2020-2021 годах? Сидел дома и ничего не делал пережидал ковид. Скорее всего, исследователи решили пропустить конференции 2021 года, спокойно дописать статьи и подать их на конференции 2022 года.
Тем не менее в это время научное сообщество активно выпускало новые версии семейства, называя их с помощью заглавных букв. Например, группа исследователей, написавших YOLOv4, создала версию YOLOR. В ней авторы работали над многозадачным обучением (multi-task learning): создавали модель, способную решать несколько задач одновременно.
Ещё одна интересная работа — YOLOX. Она вышла в свет в 2021 году благодаря команде Megvii (Face++). От неё авторы YOLOv6 позаимствовали anchor-free decoupled head, которую мы подробно разберём чуть позже.
Также после выхода YOLOv4 развивается параллельная версия YOLO-моделей — PP-YOLO. Это семейство разработано в Baidu с использованием их платформы для обучения PaddlePaddle. Поэтому они и имеют префикс PP. Всего было создано три архитектуры: PP-YOLO, PP-YOLOv2 и PP-YOLOE. Авторы YOLOv6 пробовали использовать некоторые наработки из PP-YOLOE, однако в финальную архитектуру они не вошли.
YOLOv6 не так популярна, как YOLOv5. Однако её активно используют в Китае, поэтому авторы до сих пор развивают свою модель, но об этом поговорим чуть позже. А сейчас давайте рассмотрим исходную версию архитектуры, которую предложили авторы.
Основные изменения YOLOv6: