
В предыдущей статье мы разобрались, почему видеоаналитика приносит огромную пользу не только в сфере охраны, но и бизнеса, а также начали рассматривать платформы, на которых она может работать.
Как я сказал ранее, встроенная видеоаналитика крутится на самом устройстве. Что, как бы, логично. :)
Использование специализированной аналитики на борту камеры является наиболее правильным решением при построении системы видеонаблюдения (СВН). У данного метода есть множество плюсов:
Казалось бы, отлично, дайте побольше камер, сейчас сделаем супер-аналитику!
И все было бы круто, если бы не одно но…
Темная сторона такого решения заключается в том, что:
Как можно заметить, данный сценарий - палка о двух концах. С одной стороны - возможность сделать свою систему видеонаблюдения “умной”, а с другой - в случае, если СВН уже развернута, придется менять уже установленные на объекте камеры, что встанет в определенную сумму (при этом, снятые камеры нужно будет куда-то деть, либо держать в качестве запасных).
Есть-ли в камере ИИ? Нет конечно, его как такового не будет года эдак до 2061.
Есть-ли в камере нейросети и “глубокое обучение”(deep learning) - определенно, да! И именно нейросеть и машинное зрение помогает “отсекать” ненужные события.
Когда-то давно в камерах использовали OpenCV, теперь же на смену ему пришли такие модули как SSD (Single Shot Detector - не путать с Solid State Driver!) и YOLO (You Only Look Once, недавно обновившийся до версии v8). Разумеется, нейросети различаются по своему быстродействию и точности срабатывания: когда одни модели быстро реагируют, но чаще “мажут” мимо цели, другие действуют медленнее, зато и процент ошибок значительно ниже. Предлагаю рассмотреть определенные, достаточно распространенные аналитики, которые можно реализовать на данных нейросетевых моделях.
Первая аналитика, которую я хотел бы разобрать - “Обнаружение человека/автомобиля” (или же IVS/AcuSence и так далее). Если говорить кратко, то в ней работает такая технология, как “Метод фонового вычитания”.
Об этом есть интересные статьи на хабре (и не только). Специально в рамках данной статьи я подобрал для вас целых три, уверен, что это будет интересно прочитать:
Ну, а для тех, кому “Многобукаф, не хочется читать…”, я сделаю максимально краткий и поверхностный пересказ данных статей, так как нейросети работают по похожему принципу и отличаются скоростью, точностью (ну и некоторыми фичами, конечно же).
Сам по себе процесс обучения - это нахождение экстремумов функций сходимости, но сам процесс, разумеется, значительно сложнее.
Опустим момент с развертыванием нейросети, так как это, разумеется, база. Сразу после развертывания начинается самый важный и ответственный этап любой взрослой нейросети - обучение.
Для нейросети подготавливают определенный объем размеченных данных, в контексте видеонаблюдения, это зачастую картинки (видео тоже можно загружать, и это, как ни странно, повысит точность определения, но и объем датасетов вырастет в разы), главное условие - единая размерность, например, 500х500 пикселей. Если картинка больше - ее сожмут, если меньше - то дополнят черным по краям, чтобы увеличить. Затем, системе “скармливают” расшифровку - маски этих картинок.
Далее, происходит “дробление картинки на сегменты” / grid cells (если речь идет о YOLO-модели), привязываются Bounding boxes (либо anchor boxes) - те самые “прямоугольнички”, которые обводят в кадре интересующий нас объект.
Стоит отметить, в рамках первой итерации данный процесс делается вручную, после чего нейросеть начинает работать с заранее подгруженным датасетом.
После того, как нейросеть обучится, мы получим детектор, который способен отображать интересующие нас объекты и отсекать ложные срабатывания. И все бы здорово, но с этим массивом данных тоже нужно работать. Поэтому в ход идёт ReID посредством DeepSort (на самом деле, вариантов масса), и о чудо - нейросеть способна сортировать и передавать метаданные.
Как я говорил выше, использование нейросетей повышает требования к аппаратной части камеры, и даже несмотря на более “жирную” начинку, большинство камер может работать с аналитиками только по паттерну “или, или”. Или обнаружение человека, или детекция лиц, к примеру. И лишь единичные модели у high-tier вендоров способны в работу “и, и”, при этом они тоже имеют свои нюансы.
На ноябрь 2024 года розничная стоимость камер Omny со встроенными аналитиками начинается от 9000 рублей
Алгоритм работы встроенной аналитики в регистратор точно такой же, как и в камерах (иногда, они обучаются на том же датасете, да и в целом, зачастую идентичны), поэтому нет смысла расписывать логику обучения заново. Плюсов в использовании аналитики исключительно на регистраторах, при построении СВН, меньше, а минусов - больше.
Перечислим плюсы:
А вот минусов, в данном случае, значительно больше, но оно и не мудрено, мы комбинируем в записывающем устройстве еще и AI-функционал:
Несмотря на присутствующие системе минусы, я все-же рекомендую использовать “умные” регистраторы вместе с камерами (конечно же, поддерживающими аналитику), особенно, когда речь идет о монобренде. Причина невероятно проста. Используя регистратор Omny с поддержкой метаданных, нам открывается возможность использовать наш интеллектуальный поиск “AcuSearch” в архиве (привет, AcuPick от Dahua) и прочие аналоги от сторонних производителей.
В конечном счете, это решает следующие задачи:
На время написания этой статьи (а это ноябрь 2024 года) регистраторы Omny со встроенными аналитиками стоят от 17000 рублей
Внешние устройства аналитики являются промежуточными между камерой и регистратором / сервером.
Точно так же имеет заранее заготовленные аналитики, обученные по датасетам производителя. Платформа получает поток от камер, анализирует его, а далее отправляет обработанный поток метаданных, которые понимает (это важно!) регистратор. Пройдемся по плюсам и минусам.
Плюсы:
Как ни странно, у данного способа также имеются недостатки.
Минусы:
Средняя стоимость подобных аналитических платформ от сторонних вендоров начинается от 360000 рублей.
Если рассматривать систему видеонаблюдения, построенную на основе полноценных серверных платформ, то можно провести прямые параллели с системами на регистраторах. И это вполне логично, ведь сервер действительно можно рассматривать как большой, мощный регистратор с расширенным функционалом.
Безусловно, можно приобрести бюджетное решение (но, зачастую, к серверным исполнениям приходят тогда, когда объем камер большой) и использовать его как регистратор с расширенными возможностями, к примеру - использовать шасси на 24 жестких диска.
Как я писал ранее, большинство производителей серверов для видеонаблюдения продают “голые” шасси - комплект железок, из которых состоит сам сервер, устанавливают ОС (чаще всего debian, реже - windows), поверх которой накатывают оболочку (GUI), либо оставляют сервер без локального отображения. Для того, чтобы программа могла взять RTSP-поток с камер, либо подключиться к ним по ONVIF, требуются лицензии специализированного ПО (модули аналитики зачастую продают как отдельную позицию), у каждого из производителей они имеют свое название. Например - OmnyVideo.
Достоинства данной системы неоспоримы - система достаточно гибкая, а самое главное - масштабируемая, что в случае расширения парка используемых камер, будет лишь плюсом. “Взрослые” серверные решения можно резервировать по модели N+M, вводить в эксплуатацию (или выводить из нее с сохранением всего записанного объема информации) стримеры, менять шасси серверов для увеличения количества используемых дисков, и не только.
В рамках аналитик, серверные решения являются наиболее гибкими и настраиваемыми, даже в сравнении с аналитиками на борту камер. Возможность переобучить ReID-алгоритмы, а также выполнить переобучение системы в целом.
Большинство (почти все, на самом деле) производителей видеоаналитики используют в качестве источника вычислительной мощности именно графические процессоры, за счет соотношения цена/производительность. Благодаря этому и достигается увеличение количества доступных аналитик. Никто не мешает доукомплектовать шасси десятком Nvidia Quadro и получить мощную платформу аналитики, которая еще и умеет строить рейды (а иногда, даже иметь дублирующий контроллер, который обеспечит сохранность информации), либо пойти другим путем - увеличить количество серверов и получить такую же вычислительную мощность.
И даже пропускная способность не станет серьезным ограничением. Если необходимо - можно установить дополнительные сетевые карты, хоть 10-гигабитные.
Также, нельзя забывать о возможности написания специализированных модулей аналитики под конкретные задачи (к слову, OmnyVideo может предложить и это).
Лишний раз повторюсь, что суть работы нейросетевого детектора максимально похожа на те, что “крутятся” на камерах, регистраторах и так далее. Сервер получает живой поток от камеры и прогоняет через развернутую нейросеть, добавляя метаданные.
Правда, стоит понимать, что при использовании продвинутых GPU (особенно, если их несколько в одном сервере) придется позаботиться об охлаждении, и и речь сейчас даже не об условных “отвалах” видеочипа.
Думаю, никто не станет спорить, что GPU имеют колоссальное тепловыделение (привет, high-end решения). А что еще имеет приличное тепловыделение при постоянной эксплуатации? Как это правильно говорится: “Прямо бинго!” - жесткие диски.
Что может быть лучше, чем хороший сервер? Несколько хороших серверов!
Если говорить кратко - при необходимости производить сложный анализ, а также хранить архив большого объема, следует разделить данный функционал на два разных сервера. При этом, стоит позаботиться о реализации охлаждения стойки в целом, при помощи кондиционера.
В финале подраздела предлагаю подбить в кратком виде плюсы и минусы подобной системы:
Плюсы:
Минусы:
Также, у серверной платформы есть одновременно и плюс, и минус в одном лице: приобретая полноценное железо мы остаемся свободными в выборе используемого ПО, и вольны пересесть с одного на другое, если так захочется. Минусом же является тот факт, что ПО может работать некорректно, либо вовсе не заведется, так как требования к аппаратной составляющей у каждого производителя свои.
На ноябрь 2024 года стоимость серверных платформ Omny начинается от 270 тысяч рублей.
Облачная аналитика является относительно свежим направлением в видеонаблюдении, как и облачные сервисы, в целом. Чисто технически, разница заключается в том, что мощный сервер находится не у вас в серверной, а в ЦОДе производителя, он же и отвечает за техническое обслуживание и сохранность записываемых данных.
Решение интересное, которое имеет свои плюсы и недостатки.
Плюсы:
Минусы:
Думаю, после прочтения у вас появилось понимание, каким образом работает “магия” внутри оборудования видеонаблюдения, а также, какими преимуществами и недостатками обладают способы реализации аналитики.
Что же будет дальше? Ровно то, что я анонсировал во вступлении - в следующей статье проведу разбор ошибок монтажников и рекомендации по установке камер видеонаблюдения.
Авторизуйтесь, чтобы иметь возможность оставлять комментарии