Азбука AVoIP. Часть 2

В прошлом месяце мы начали обсуждение основ AV-over-IP. Мы объяснили концепцию отправки данных по ИТ-сетям в виде пакетов, которые имеют заголовки, известные как протоколы, объясняющие, какой тип данных находится в каждом пакете. Для видео и аудио эти пакеты создаются с помощью кодека. Но какой кодек подойдет для вашего Pro AV приложения?

Высокая эффективность, высокая задержка

Первый тип кодеков (высокоэффективный с высокой задержкой) основан на стандартах, разработанных Группой экспертов по движущимся изображениям (MPEG). Кодеки на основе MPEG существуют уже более 30 лет и продолжают развиваться. Хотя мы уже не используем первый кодек MPEG (MPEG-1), мы все еще полагаемся на его стандарт сжатия звука (MP3) для распространения файлов.

Кодеки MPEG получают потоки видео, анализируют их и разбивают на группы изображений (GOP). В каждом GOP есть полный кадр со всеми деталями изображения в начале и в конце (внутрикадровое кодирование или I-кадры), плюс кадры, копирующие и повторяющие информацию, которая не меняется от кадра к кадру (избыточность), а также кадры, которые смотрят вперед, чтобы предсказать изменения (P-кадры), и кадры назад и вперед (B-кадры) или межкадровое кодирование. Очевидно, что ничего из этого не может происходить в реальном времени, поэтому вводится задержка.

Простая 8-кадровая структура GOP для кодеков MPEG включает I-кадры (внутрикодовые), P-кадры (предиктивные) и B-кадры (двунаправленные).

Любая эффективность достигается за счет копирования и повторения информации в каждом кадре, а не за счет передачи каждого полного видеокадра. Получающий кодек собирает все вместе, надеюсь, без потерь, для передачи. Длина каждой группы изображений также влияет на эффективность: Чем длиннее GOP, тем больше сжатие (и задержка). Обычно для потокового видео используется GOP длиной 90 кадров, что соответствует примерно 1,5 секунды задержки. На YouTube GOP еще длиннее - до 20 секунд задержки для прямых трансляций.

Новые версии кодека MPEG, включая High Efficiency Video Codec (HEVC или H.265) и Versatile Video Codec (VVC), могут выполнять еще более масштабные и быстрые анализы и вычисления, разбивая каждый кадр на блоки дерева кодирования и еще более мелкие сегменты, называемые блоками преобразования, - этот процесс известен как внутрикадровое кодирование. Это необходимо для сжатия и транспортировки видео 4K и видео с высоким динамическим диапазоном, которые требуют значительной пропускной способности по сравнению с видео 1080p.

Низкая эффективность, низкая задержка

Второй тип видеокодеков (с низкой эффективностью и низкой задержкой) основан на стандартах, разработанных Объединенной группой экспертов по фотографии (JPEG), начиная с 1992 года. Кодек JPEG был разработан для легкого сжатия неподвижных изображений для хранения, копирования и передачи по сети, но он одинаково хорошо работает и при сжатии видеопотоков.

Кодер или декодер не всегда должен быть черным ящиком - кодер NAV 10E 401 D AV-over-IP от компании Extron представляет собой настенную панель в декоративном стиле, способную передавать сигналы через интерфейс Ethernet 10 Гбит/с.

В отличие от кодеков на основе MPEG, кодеки JPEG анализируют и сжимают только каждый кадр в видеопотоке. Они не рассматривают предыдущие или последующие кадры и не выполняют предсказание движения. (В результате файлы и потоки получаются значительно больше, чем потоки MPEG. И соответствующие битрейты для сжатых видеопотоков на основе JPEG тоже гораздо выше.

Вот сравнение. Видеопоток 4K с высоким динамическим диапазоном может быть передан в дом с помощью сжатия HEVC со скоростью 25-30 Мбит/с. Для сравнения, видеопоток 4K с частотой обновления 30 кадров в секунду (fps) при использовании сжатия JPEG может потребовать 8,9 Гбит/с, то есть почти всю пропускную способность сети 10 Гбит/с.

Существуют новые, более эффективные версии кодеков JPEG, оптимизированные для видео. Одна из популярных версий - JPEG-XS, так называемый "мезонинный" кодек, который может сжимать видеопотоки до 10:1 без заметного ухудшения изображения. (Для сравнения, сжатие на основе MPEG обычно достигает 50:1).

Одна из проблем сжатия на основе JPEG заключается в том, что отдельные видеопакеты не могут поместиться в стандартный (IEEE) кадр размером 1500 байт для прохождения через обычные сетевые коммутаторы. Поэтому необходимо создавать более крупные "джамбо"-пакеты размером до 9000 байт и передавать их через совместимые сетевые коммутаторы. Некоторые гигабитные сетевые коммутаторы уже доступны на рынке Pro AV и оснащены входами HDMI и кодировщиками JPEG для упрощения установки.

Усовершенствования кодеков

Выбор кодека - дело несложное. Если вы передаете видеоконтент по нескольким сетям или воспроизведение происходит не в режиме реального времени, то для наибольшей эффективности лучше использовать кодек на основе MPEG. Если же вам нужна потоковая передача в реальном времени, то лучше использовать кодек на основе JPEG.

Конечно, можно использовать оба кодека, если вы ведете прямую трансляцию в помещении, где проходит мероприятие, и одновременно отправляете поток удаленным зрителям. Но имейте в виду, что в настоящее время вы не можете передавать видео на основе JPEG по нескольким сетям из-за джамбо-кадров и других ограничений пропускной способности.

Усовершенствованные кодеки MPEG предоставляют некоторые очень полезные возможности. Современные кодеки не применяют одинаковую степень сжатия к каждому кадру - этот процесс известен как кодирование с постоянной скоростью передачи данных (CBR). Скорее, они используют кодирование с переменным битрейтом (VBR), в зависимости от того, что меняется от кадра к кадру и от сцены к сцене. Пара говорящих голов, сидящих за столом, получит высокий уровень сжатия, а сцены с большим количеством движения будут сжаты гораздо меньше.

Эти кодеки также могут одновременно создавать разные потоки с разным битрейтом для разных зрителей. Битрейт для видео, которое вы смотрите на смартфоне, будет гораздо ниже, чем для того, кто смотрит его на 65-дюймовом 4K-телевизоре или на 15-дюймовом ноутбуке. Специализированные кодеки также могут регулировать битрейт и разрешение видео в зависимости от доступной пропускной способности сети (Adaptive Bitrate Encoding и Dynamic Stream Shaping). Эффект редко заметен зрителю и может быстро меняться в зависимости от доступной пропускной способности.

Кодеки JPEG, с другой стороны, все еще "простая ваниль". Они сжимают данные с постоянной скоростью и используются для передачи внутри сети, а не между коммутаторами, как кодеки MPEG. Хорошим примером видеосети на основе JPEG может быть сеть внутри офиса или здания кампуса, где все узлы подключены к одному коммутатору и серверу.

Обрезать шнур?

В течение многих лет считалось неразумным полагаться на беспроводные сети (802.1) для потоковой передачи видеоконтента. У многих из нас остались не самые приятные воспоминания о том, как мы смотрели фильм через потоковую службу, а потом его прерывали из-за проблем с сетью (Buffering! Buffering!) или вообще прекращали просмотр из-за потери Wi-Fi соединения.

Эти дни давно в прошлом. Хотя передача видео и звука по проводным Ethernet-соединениям по-прежнему считается передовой практикой, новейший протокол Wi-Fi (802.11ax) отлично справляется с задачей, используя диапазоны Wi-Fi 2,4 и 5 ГГц для передачи контента на мобильные устройства. Системы адаптивного битрейта также могут работать с беспроводными соединениями, измеряя устойчивую и среднюю пропускную способность и кодируя видео соответствующим образом. Однако следует отметить, что это справедливо только для видеопотоков в формате MPEG, но не JPEG.

Устройства управления сигналами на базе HDMI по-прежнему популярны, но наблюдается медленное движение в сторону систем на базе программного обеспечения.

Появление доступных и быстрых сетевых коммутаторов стало переломным моментом. Хотя оборудование для управления сигналами на базе HDMI все еще продается (наряду с гибридными удлинителями категории провод/HDMI), индустрия Pro AV постепенно переходит от сложных аппаратных систем коммутации к системам на базе программного обеспечения.

Многопортовый коммутатор 10 Гбит/с может поместиться в пространстве 1 RU или 2 RU, в то время как для аналогичного HDMI-коммутатора потребуется гораздо больше места. Ethernet-кабели Cat 6 обычно намного дешевле HDMI-кабелей и не имеют ограничений по длине. Что касается удлинителей сигнала HDMI, то передача видео и аудио по ИТ-сетям по-прежнему дает преимущество в количестве портов, которые можно коммутировать одновременно. И если удлинители сигнала используют собственный формат кодирования, то системы AVoIP основаны на широко поддерживаемых форматах кодеков и интернет-протоколах, которыми пользуются все.

Под контролем

Прием видео и аудио, их сжатие и преобразование в пакеты - это лишь одна часть системы AVoIP. Попутно могут передаваться сигналы управления, позволяющие удаленно управлять AV-оборудованием, подключенным к той же сети.

Современные системы управления переходят на "прикладной" подход, загружая по мере необходимости драйверы из облачной базы данных для настройки и управления широким спектром продуктов. Поскольку эти системы управления также используют сети для обмена данными между собой, объединить управляющие пакеты с видео- и аудиопотоками не составляет труда, так как управляющие пакеты по своей природе короткие и нестабильные.

Одна из популярных запатентованных архитектур AVoIP использует кодек на основе сжатия потоков отображения (DSC). Хотя эта платформа "все в одном пакете" привлекательна, у нее есть ограничение. DSC, первоначально разработанный в 2014 году для сжатия сигналов с дисплеев, в настоящее время может достигать только коэффициента сжатия 2:1.

Этот кодек с низкой задержкой может сжимать сигнал Ultra HD (3 840x2 160 пикселей) с частотой обновления 60 кадров в секунду и 8-битным цветом RGB настолько, что его достаточно для прохождения через коммутатор 10 Гбит/с. Однако некоторые приложения для отображения требуют частоты обновления 120 кадров в секунду или 10- и 12-битного цвета. К тому же, хотя спрос на него пока невелик, видео в формате 8K доступно уже сейчас, как и соответствующие дисплеи. Упомянутый ранее кодек стандарта JPEG-XS продемонстрировал передачу 8K-видео через коммутатор 10 Гбит/с со сжатием 6:1 без видимых артефактов изображения.

Хотя это был краткий обзор, мы надеемся, что он заложил основу для понимания перехода на AVoIP для распределения аудио- и видеосигналов. Теперь вы можете меньше задумываться об аббревиатурах и вместо этого задавать производителям и продавцам вопросы о возможностях вашего оборудования и программного обеспечения.

Комментарии к статье