+7 495 748-46-58

Оценка качества произвольного контента потокового видео в сетях мобильной связи

В условиях широкого распространения сервисов мобильного интернета, использующих передачу и воспроизведение видео в реальном времени, оценка качества произвольного контента, принимаемого абонентом, становится особенно актуальной. Краткое описание существующих способов количественной оценки качества воспроизведения видео и алгоритмов для расчета соответствующего показателя приводится в статье, размещенной на сайте компании DMTEL. В статье подробно рассматривается применение интрузивного алгоритма PEVQ-S (Rec. ITU-T J.343.5). Алгоритм PEVQ-S реализован на основе тестовой видеозаписи, используемой в качестве опорного образца (FR — Full Reference) для сравнения с видеоконтентом, поступающим из сети и расчета объективной оценки. Такой подход позволяет получать оценки, наиболее близкие к результатам субъективных тестов с участием экспертов. Необходимость использования опорного образца медиаконтента заметно ограничивает области применения данного алгоритма.

При воспроизведении произвольного контента, поступающего в реальном времени из интернета, нет возможности использовать методику оценки на основе опорного образца. В Рекомендации ITU-T P.1203 приводится описание неинтрузивной методики расчета интегрального показателя (метрики) качества аудиовизуального контента. Алгоритм Rec. ITU-T P.1203 позволяет в реальном времени рассчитывать общую интегральную оценку качества потокового видео одновременно со звуковым сопровождением без сравнения с образцом (NR – No Reference).

Алгоритм Rec. ITU-T P.1203 обеспечивает высокий коэффициент корреляции метрик с субъективными оценками (0.85 – 0.90) и существенно расширяет области применения тестов для оценки качества аудиовизуального контента. В частности, данный алгоритм может эффективно использоваться при воспроизведении произвольного медиаконтента с помощью различных сервисов и приложений мобильного интернета.

Методы и алгоритмы оценки

Алгоритм прогнозирует качество медиаконтента и реализует расчет оценки на основе метаданных входного битового потока с учетом характеристик качества видео и звука, а также качества доставки данных. Итоговая оценка характеризует качество аудиовизуального контента в соответствии с пятибалльной шкалой MOS (см ITU-T P.910). Пятибалльная шкала оценок отражает степень удовлетворенности абонента качеством воспринимаемого контента.

Сокращенная схема алгоритма представлена на Рисунке 1. Входной поток разделяется на два канала (модули Pa и Pv) для анализа аудио- и видеоданных по отдельности. Результат расчета единой интегральной оценки регистрируется каждую секунду на выходе модуля Pq. Кроме того, реализована возможность контроля вспомогательных результатов расчета, включая оценки качества аудиоконтента и видеоконтента по отдельности. Описание функций, реализованных в модулях Pv, Pa и Pq, приводится в рекомендациях ITU-T P.1203.1, ITU-T P.1203.2 и ITU-T P.1203.3, соответственно.

Рисунок 1. Сокращенная схема алгоритма Rec. ITU-T P.1203
Рисунок 1. Сокращенная схема алгоритма Rec. ITU-T P.1203

При расчете используется актуальная информация о контенте, поступающем на устройство воспроизведения. Кроме того, при расчете учитывается исходная информация о характеристиках канала передачи данных и устройства, на котором воспроизводится видео со звуковым сопровождением. Алгоритм реализует четыре уровня предварительного контроля входного потока данных. В зависимости от состава исходной информации, полученной на этапе предварительного контроля, при расчете автоматически выбирается один из четырех режимов работы алгоритма. Все четыре режима перечислены на Рисунке 2. По мере увеличения номера режима улучшается точность прогнозирования итоговой оценки.

Рисунок 2. Рабочие режимы алгоритма Rec. ITU-T P.1203
Режим Кодирование Входные данные
Mode 0 Кодированный медиаконтент Метаданные, включают информацию о кодеке, битрейте, задержке начальной загрузки, замирании изображения
Mode 1 Кодированный медиаконтент Все данные Режима 0, плюс дополнительные данные из заголовков пакетов о видео- и аудиокадрах.
Mode 2 Декодированный медиаконтент Вся информация из режима 1, а также до 2% (в байтах) от общего объема информации о входных данных, полученных на основе глубокого анализа пакетов и частичного преобразования битового потока.
Mode 3 Декодированный медиаконтент Вся информация из режима 1, а также полная информация о входных данных, извлеченная из битового потока.

На Рисунке 3 показана функциональная схема, отражающая основную идею алгоритма Rec. ITU-T P.1203. На внутренние входные интерфейсы алгоритма независимо от актуального режима поступают следующие данные (см. Рекомендации ITU-T P.1203):

I.GEN. Разрешение дисплея и типы устройств. Возможны следующие типы устройств:
— персональный компьютер / телевизор, размер экрана 24 дюйма или больше, но не более 100 дюймов;
— мобильное устройство, размер экрана 10 дюймов или меньше.

I.11. Информация о кодировании аудио.

I.13. Информация о кодировании видео.

I.14. Информация о начальной задержке загрузки и замираниях изображения (stalling).

Каждая выборка аудиосигнала (аудиосэмпл) и каждый кадр видео контента (видеокадр) составляют последовательность данных, поступающих на вход алгоритма. В дальнейшем тексте под термином «кадр» будут подразумеваться оба базовых фрагмента входных данных — как для аудио-, так и для видеоконтента.

Рисунок 1. Сокращенная схема алгоритма Rec. ITU-T P.1203
Рисунок 3. Функциональная схема алгоритма ITU-T P.1203

В состав выходных данных алгоритма входят значения итоговой интегральной оценки качества аудиовизуального контента (O.46) и диагностические данные (O.21, O.22, O.34, O.35 и O.23), см. Рисунок 3. Для всех выходных данных используется пятибалльная шкала оценок (ITU-T P.910). Перечень выходных данных модели ITU-T P.1203:

O.21. Значение оценки качества кодирования аудио по шкале MOS, обновляется каждую секунду в течение мультимедиа сессии.

O.22. Значение оценки качества кодирования видео по шкале MOS, обновляется каждую секунду в течение сессии.

O.23. Значение оценки воспринимаемого качества при замираниях (stalling). Единая (однократная) оценка для каждой сессии по шкале MOS.

O.34. Значение оценки качества кодирования аудиовизуального сегмента по шкале MOS, обновляется каждую секунду. Рассчитывается несколько оценок по сегментам для каждой сессии.

O.35. Значение итоговой оценки качества кодирования аудиовизуального контента. Единая (однократная) оценка для каждой сессии по шкале MOS с учетом временной интеграции.

O.46. Значение итоговой оценки качества медиасессии по шкале MOS, обновляется каждую секунду. Единая (однократная) оценка для каждой сессии по шкале MOS с учетом задержки начальной загрузки и “замираний” (stalling).

Диагностические данные позволяют использовать алгоритм для решения технических задач контроля влияния различных факторов на оценку качества аудиовизуального контента. В частности, рассчитывать и анализировать оценки качества видеоконтента и звукового сопровождения по отдельности.

Применение алгоритма Rec. ITU-T P.1203

Алгоритм Rec. ITU-T P.1203 можно интегрировать в состав специализированного тестового программного обеспечения (ПО), которое устанавливается на современные мобильные телефоны, планшеты или компьютеры и используется для исследования качества услуг мобильной связи. Такое ПО обеспечивает возможность автоматически в реальном времени регистрировать и сохранять в лог-файл показатели, характеризующие качество сетей и сервисов мобильной связи. Алгоритм Rec. ITU-T P.1203. позволяет включить оценки качества аудиовизуального контента в состав регистрируемых характеристик. Пример схемы использования элементов специализированного программно-аппаратного комплекса для контроля качества воспроизведения потокового видео приводится на Рисунке 4.

Основные области применения алгоритма:

  • воспроизведение видео с помощью сервисов OTT («over the top»), а также видеосервисов на основе TCP;
  • воспроизведение аудиовизуального контента на экране устройства пользователя как в сетях мобильной связи, так и в стационарных сетях на основе проводного подключения;
  • видеосервисы на основе протоколов HTTP/TCP/IP, RTMP/TCP/IP, HLS/HTTP/TCP/IP и DASH/HTTP/TCP/IP. Модель не зависит от конкретного метода доставки в сети (HTTP, DASH или другого) при условии надежной доставки контента (TCP/IP);
  • видеосервисы, использующие контейнерные форматы, такие как Flash (FLV), MP4, WebM, 3GP и MPEG2-TS. Модель не зависит от типа контейнерного формата.
Рисунок 1. Сокращенная схема алгоритма Rec. ITU-T P.1203
Рисунок 4. Схема тестирования качества аудиовизуального контента с помощью измерительного комплекса

Для корректного результата расчета оценок необходимо учитывать ограничения условий применения алгоритма. В частности, алгоритм не отражает влияние искажений, возникших на этапе создания контента или обусловленных потерей пакетов. Кроме того, низкое качество звукового сопровождения может негативно влиять на единую итоговую оценку при высоком качестве воспроизведения видео.

Важным преимуществом алгоритма Rec. ITU-T P.1203 является возможность в реальном времени оценивать качество аудиовизуального контента, отображаемого на экране абонентского устройства с помощью популярных сервисов и приложений.