Популярность просмотра видео на экране мобильного устройства (телефона, планшета или ноутбука) стремительно растет в настоящее время. Значительное расширение технических возможностей сетей мобильной связи и абонентских устройств позволяет воспроизводить видео в формате UHD (4K, разрешение 3840x2160 пикселей) и выше. При этом реальное восприятие абонентом качества на экране устройства зависит от множества факторов. Для своевременного выявления фактов снижения качества воспроизведения видео необходимо постоянно контролировать соответствующие характеристики предоставляемой услуги.
Качество изображения на экране характеризует сохранность (целостность) оригинальных свойств передаваемого контента и является субъективной характеристикой, поскольку зависит от восприятия абонента. Целостность услуги связи отражает возможность доставить контент потребителю без искажений или с приемлемым уровнем искажений с учетом характеристик абонентского устройства и дисплея. Для количественной оценки целостности такой услуги используется показатель качества воспроизведения видео в баллах.
Существует два подхода к оценке качества воспроизведения видео – субъективный и объективный. Субъективный подход предполагает просмотр и визуальную оценку экспертами контента, воспроизводимого на экране дисплея (Rec. ITU-T P.910). Участие человека заметно усложняет процесс оценки и ограничивает области применения субъективных методов. В частности, такие методы невозможно использовать для масштабного тестирования в реальном времени. Объективные методы основаны на специальных алгоритмах автоматизированной оценки качества видео.
Существует три способа реализации алгоритмов объективной оценки:
Метод на основе опорного образца (Full Reference) обеспечивает наилучший результат в части точности оценки. Использование при расчете показателя исходного видеоконтента для сравнения с принятым с помощью математического алгоритма позволяет получать оценки, наиболее близкие к результатам субъективных тестов с участием экспертов. Для автоматизированной объективной оценки качества видео в реальном времени в современных сетях мобильной связи наиболее широко используется алгоритм PEVQ-S (Rec. ITU-T J.343.5).
Алгоритм PEVQ-S построен на основе анализа большого массива экспертных оценок по результатам просмотров тестового видеоконтента, качество которого изменяется в широком диапазоне. Алгоритм PEVQ-S обеспечивает высокую корреляцию результатов расчета и субъективных экспертных оценок восприятия качества соответствующих образцов видеоконтента.
Показатель качества видео рассчитывается в соответствии с рекомендациями по применению алгоритма PEVQ-S Rec. ITU-T J.247 и Rec. ITU-T J.343.5. Результат расчета отображается согласно пятибалльной шкале MOS оценок качества в соответствии с рекомендациями ITU-T P.800. Пятибалльная шкала субъективных оценок алгоритма PEVQ-S, по существу, отражает степень удовлетворенности абонента качеством видеоконтента, воспринимаемого визуально.
В таблице 1 приводится шкала дискретных значений оценок по пятибалльной шкале MOS.
Квалификация уровня качества | Шкала дискретных значений оценок MOS | Искажения |
---|---|---|
Отлично | 5 | Не заметны |
Хорошо | 4 | Заметны, но не мешают просмотру |
Удовлетворительно | 3 | Заметны, немного мешают просмотру |
Приемлемо | 2 | Мешают просмотру, но допустимо |
Плохо | 1 | Очень мешают просмотру, неприемлемо |
Алгоритм PEVQ-S позволяет прогнозировать влияние искажений, возникающих в канале передачи данных, на субъективное восприятие качества видео абонентом. Основные области применения алгоритма – мультимедиа и мобильные приложения, используемые для просмотра контента, поступающего из интернета. Специальные возможности алгоритма PEVQ-S:
Для контроля качества видео используется 5 индикаторов. Эти индикаторы определены на основе анализа функций системы визуального восприятия человека (Human visual system, HVS). Особенности маскировки восприятия системой HVS человека моделируются на нескольких этапах алгоритма. Итоговые значения индикаторов объединяются на основе особого алгоритма пространственной и временной агрегации.
На первом этапе накапливается информация необходимая для выравнивания в части монохромных и «замерших» или пропущенных кадров. На втором этапе кадры синхронизируются в пространственной, временной и цветовой областях, затем следует сравнение визуальных различий по яркости и цветности, с учетом эффектов маскирования и движения. Дополнительно к сравнению изображений анализируется поток передаваемых данных на наличие ошибок на уровне транспортной сети (потери пакетов, задержки и др.). Все перечисленные этапы (шаги) приводят в результате к набору индикаторов, каждый из которых отражает соответствующий аспект качества.
На завершающем этапе выполняется агрегация индикаторов с помощью нелинейной функции для расчета итоговой оценки по шкале MOS
Благодаря небольшому количеству индикаторов и, соответственно, малой степени свободы модель лишена избыточности и очень устойчива. Это позволяет эффективно внедрять алгоритм PEVQ-S и обеспечивать высокую точность оценки.
На рисунке 2 показана функциональная схема, отражающая основную идею алгоритма PEVQ-S (см. Rec. ITU-T J.343.5.). Расчет оценки PEVQ-S выполняется на основе гибридного алгоритма с использованием опорного образца видео (Hybrid-FR – Hybrid Full Reference). Для расчета используются три источника данных: опорный (исходный) поток неискаженных данных (SRC, S – Source reference channel), обработанная последовательность видеокадров (PVS, P – Processed Video Sequence) и накапливаемый на приемной стороне файл битового потока B (PCAP).
Схема включает два основных модуля: модуль анализа битового потока и модуль анализа на основе пикселей изображения. Модуль анализа битового потока определяет наличие потерь пакетов битового потока B (PCAP), поступающего на вход блока предварительной обработки (Preprocessing) и формирует на выходе блока агрегации (Agregation) индикатор (Bitstream indicator), характеризующий временные и пространственные искажения.
В модуле анализа на основе пикселей выполняется детальный анализ искажений на основе распакованных опорной SRC и преобразованной PVS видео последовательностей. Последовательности SRC и PVS поступают на вход блока предварительной обработки (Preprocessing). Выравнивание в пространстве, по времени и цвету выполняется в блоке полного выравнивания последовательности (Detailed sequence alignment). На выходе модуля в блоке анализа пространственных искажений (Spatial distortion analysis) регистрируются индикаторы, отражающие интенсивность искажений, в части длительности (Temporal), охвата поля изображения (Field), яркости (Luminance) и цветности (Chrominance).
На завершающем этапе 5 рассчитанных индикаторов взвешиваются и агрегируются в блоке преобразования (Mapping to DMOS) для расчета показателя DMOS (Difference Mean Opinion Score – дифференциальная оценка качества) и, соответственно, финального значения оценки PEVQ-S в баллах (см. ITU-T P.910). Итоговая оценка PEVQ-S обеспечивает высокую корреляцию с оценками субъективных тестов по шкале MOS.
Специальное программное обеспечение позволяет реализовать алгоритм PEVQ-S на современных типовых абонентских устройствах (смартфонах, планшетах и ноутбуках) и проводить автоматизированный контроль качества потокового видео, предоставляемого абонентам при пользовании мультимедийными приложениями и устройствами в сетях связи.
Воспроизведение видео на мобильных устройствах относится к категории сервисов, доставляющих видеоконтент через Интернет. Поскольку доставка контента потребителю реализуется с помощью платформы, которая является внешней по отношению к оператору связи, такой сервис называют сервисом OTT («over the top»).
Технические возможности современной версии алгоритма PEVQ-S позволяют отражать повышение качества видео, обусловленное внедрением новейших технологий и режимов в сетях связи. Кроме того, текущая версия алгоритма демонстрирует возможность эффективно оценивать влияние факторов, характеризующих разные участки OTT-процесса доставки контента на абонентское устройство. Основные субъекты процесса доставки и преобразования контента: владелец контента, провайдер OTT-сервиса, оператор сети связи и производитель абонентского устройства. Каждый субъект обеспечивает качество на соответствующем участке. Основные участки и технические элементы процесса:
Для наглядности на рисунке 2 приводится последовательность этапов преобразования видеоконтента на каждом участке процесса OTT.
Технология тестирования качества потокового видео основана на имитации поведения реального абонента. Для оценки качества видео автоматически выполняются повторяющиеся циклы загрузки и воспроизведения контента, размещенного, например, на платформе YouTube. В качестве тестового контента используется эталонный образец видео (видеоклип) высокого качества, который обычно включается в состав комплекта поставки измерительного оборудования или приобретается дополнительно и обеспечивает корректные оценки в соответствии с алгоритмом PEVQ-S. Качество принимаемого образца видео оценивается по пятибалльной шкале MOS, характеризующей восприятие просматриваемого видеоклипа абонентом.
В качестве примера рассмотрим изменение оценок качества воспроизведения видеоклипа, зарегистрированных с помощью тестового мобильного телефона. Оценки по шкале MOS получены на основе результатов последовательности тестов, выполненных в действующей сети мобильной связи с помощью программно-аппаратного комплекса Nemo Invex и Nemo Analyze производства компании Keysight Technologies. Каждый тест реализует воспроизведение эталонного видеоклипа длительностью 60 секунд.
В таблице 2 для справки приводятся форматы качества изображения, зарегистрированные в сети.
Качество изображения | Формат разрешения |
---|---|
Стандартное (SD) | 256х144 |
Стандартное (SD) | 426х240 |
Стандартное (SD) | 640х360 |
Стандартное (SD) | 854х480 |
Высокое (HD) | 1280х720 |
Высокое (Full HD) | 1920х1080 |
Снижение оценок обусловлено влиянием негативных факторов, которые приводят к искажениям изображения на экране абонентского устройства. Важно учитывать, что характер искажений определяется ошибками преобразования и доставки контента, которые могут возникать на любом участке процесса OTT. Такие ошибки приводят к нарушению целостности изображения как во времени, так и в пространстве.
Возможные проявления временных искажений:
Примеры проявления пространственных искажений:
Алгоритм PEVQ-S обладает высокой чувствительностью к подобным артефактам, что проявляется в снижении оценок по шкале MOS.
Надежность и скорость передачи данных по каналу сети связи влияют, в частности, на стабильность и скорость доставки информации для воспроизведения видеопотока в реальном времени. Заметное уменьшении скорости потока данных (bitrate) может приводить к ухудшению разрешения и «замираниям» (stalling, freezing) и/или пропускам фрагментов изображения.
Далее на рисунке 2 наглядно показано влияние скорости доставки контента на непрерывность воспроизведения клипа и на формат разрешения изображения на экране абонентского устройства. Рассматриваются две последовательные сессии воспроизведения видео V0 и V1.
В верхней части рисунка 3 слева приводятся графики изменения оценок качества видео PEVQ-S по шкале MOS (Video quality MOS — оранжевый цвет) и длительности повторной буферизации (YouTube video rebuffering time [ms] – зеленый цвет). В нижней части рисунка 2 слева на графике I показаны изменения мгновенных значений скорости передачи данных Application throughput downlink (регистрируются примерно каждую секунду), на графике II – средние значений скорости для каждой сессии воспроизведения Application throughput downlink per file transfer. В правой части рисунка 3 в таблицах отражено изменение форматов разрешения для сессий V0 (в рамке зеленого цвета) и V1 (в рамке синего цвета). Графики и таблицы визуализируют динамику изменения скорости передачи данных, форматов разрешения, а также соответствующих оценок качества изображения. Графики и таблицы отражают последовательность и длительность процедур первичной буферизации, повторной буферизации и смены форматов разрешения.
Маркеры S0 и S1 отмечают начало (старт) сессий воспроизведения V0 и V1, соответственно, а также моменты инициализации первичной буферизации потоковых данных. Маркер M установлен в точке, соответствующей инициализации повторной буферизации (buffering) данных сессии V1.
Сессия V0 выполнена успешно в штатном режиме. Скорости передачи данных не ниже 1,2 Mbit/s, при этом средняя скорость для сессии составляет около 2,6 Mbit/s, формат разрешения на начальном этапе устанавливается 426х240, затем повышается до HD (1280х720) и удерживается в течение примерно 25 секунд, далее качество изображения улучшается до Full HD и сохраняется в течение примерно 25 секунд до конца сессии воспроизведения. Оценка качества при воспроизведении в форматах HD и Full HD не опускалась ниже значения 4,2 баллов по шкале MOS («хорошо»).
На примере сессии V1 можно наблюдать влияние существенного и продолжительного снижения скорости (до 1000 bit/s) на качество изображения. При этом средняя скорость для сессии составляет около 1,0 Mbit/s. На графиках и в таблице символом F красного цвета отмечен интервал времени (около 18,5 секунд), в течение которого происходило повторное заполнение буфера, что привело к «замиранию» (freezing) изображения на экране, поскольку воспроизведение сессии V1 было остановлено. Непосредственно перед остановкой оценка качества составляла около 4,4 MOS («хорошо»). Во время остановки оценка качества составляла 1,1 MOS или «плохо», т.е. неприемлемое для просмотра изображение.
Важно отметить, что после перерыва воспроизведение продолжалось с сохранением качества Full HD и без потери кадров клипа с момента остановки. Затем формат изображения быстро ухудшился с уровня Full HD до SD 256х144 и сохранялся в течение примерно 19 секунд до окончания воспроизведения. Оценка качества PEVQ-S по шкале MOS также быстро понизилась со значения около 4,4 MOS («хорошо») до значений 3,3 MOS («удовлетворительно»), 2,1 MOS («приемлемо») и ниже, вплоть до невозможности продолжать просмотр.
Технические возможности современной версии алгоритма PEVQ-S (Rec. ITU-T J.343.5 (11/2014)) позволяют эффективно оценивать качество услуг потокового видео, которое операторы сетей связи предоставляют абонентам. Анализ распределения оценок качества воспроизведения эталонного видеоклипа на разных маршрутах и точках объекта исследования позволяет определить наличие и масштаб проблем в части качества потокового видео. Предметный анализ распределения оценок на маршруте драйв-теста, с учетом характеристик качества радиопокрытия, используемых технических ресурсов и сетевой статистики позволяет локализовать участки, определить возможные причины снижения качества видео и планировать действия по улучшению качества совместно с участниками процесса OTT.