+7 495 748-46-58

Оценка качества речи в сетях мобильной связи

Качество услуги телефонной связи в целом определяется возможностью быстро и успешно дозвониться до собеседника, слышать разборчивую речь без искажений и завершить телефонный разговор без обрыва. Для количественной оценки качества используются числовые показатели, которые позволяют контролировать характеристики, определяющие технические и потребительские свойства услуги (см. ITU-T Е.804, ETSI TS 102 250-2). Расчет показателей доступности и непрерывности выполняется на основе количества отказов и обрывов, зарегистрированных на исследуемой территории с помощью тестовых телефонов, имитирующих поведение абонентов.

Качество принимаемой речи, характеризует сохранность (целостность) оригинальных свойств передаваемой информации и является субъективной характеристикой, поскольку зависит от восприятия абонента. Целостность услуги связи отражает возможность доставить сообщение потребителю без искажений или с приемлемым уровнем искажений. Для количественной оценки целостности услуги связи в процессе разговора двух абонентов используется показатель качества принимаемой речи.

Методы и алгоритмы оценки

Существующие методы оценки качества передачи речи по каналам связи можно разделить на субъективные и объективные. Субъективные методы предполагают прослушивание и оценку экспертами воспринимаемого качества речи. Участие человека заметно усложняет процесс оценки и ограничивает области применения субъективных методов. В частности, такие методы невозможно использовать для масштабного тестирования качества передачи речи по каналам связи в реальном времени. Объективные методы основаны на специальных алгоритмах автоматизированной оценки качества принимаемой речи.

Существует два способа реализации алгоритмов объективной оценки: интрузивный и неинтрузивный. Неинтрузивные решения построены на оценках качества живой речи в реальном времени только на принимающей стороне (Single-ended method). Для реализации неинтрузивных решений используются алгоритм P.563 (см. ITU – T P.563) и Е-модель (см. ITU – T G.107). Интрузивные решения основаны на передаче по каналу связи специального образца речи, сравнении принятого и исходного образцов речи с помощью математического алгоритма и расчете показателя. Интрузивные методы заметно опережают неинтрузивные в части точности оценки и обеспечивают результаты, наиболее близкие к результатам субъективных оценок. Для автоматизированной оценки качества принимаемой речи в современных сетях мобильной связи наиболее широко используется интрузивный алгоритм POLQA.

Алгоритм POLQA

Алгоритм POLQA построен на основе анализа экспертных оценок, полученных при прослушивании большого массива образцов речи, качество которых изменяется в широком диапазоне. Важно отметить, что все субъективные тесты выполняются без прямого сравнения с исходным (опорным) образцом речи и, следовательно, представление каждого эксперта об идеальном качестве, которое определяет наилучшую оценку, неизвестно в процессе тестирования. Алгоритм POLQA обеспечивает высокую корреляцию результатов расчета и субъективных экспертных оценок восприятия качества соответствующих образцов речи.

Показатель качества принимаемого образца речи рассчитывается в соответствии с рекомендациями по применению алгоритма POLQA ITU-T P.863 и P.863.1. Результат расчета отображается согласно пятибалльной шкале [MOS] оценок качества речи в соответствии с рекомендациями ITU-T P.800. Пятибалльная шкала субъективных оценок, по существу, отражает степень удовлетворенности абонента качеством воспринимаемой речи. В таблице 1.1 приводится шкала дискретных значений оценок по пятибалльной шкале MOS.

Таблица 1.1. Соответствие оценок уровню качества речи.
Квалификация уровня качества Шкала дискретных значений оценок [MOS]
Отлично 5
Хорошо 4
Удовлетворительно 3
Приемлемо 2
Плохо 1

Алгоритм POLQA позволяет оценивать качество речи в каналах связи на основе современных кодеков, охватывающих все диапазоны частот звукового сигнала (NB, WB, SWB и FB). В верхней части рисунка 1.1 представлена функциональная схема алгоритма POLQA. Оценка выполняется на основе сравнения эталонного образца речи, поступающего на вход исследуемого канала связи (Device under test), и искаженного, получаемого на выходе (Degraded output), с помощью модели (Model), имитирующей субъективное (Subject) слуховое восприятие (Perception) с учетом оценок изменяющейся задержки (Delay estimates di). Результат сравнения MOS-LQO отражает прогноз субъективной оценки MOS.

В нижней части рисунка 1.1 показана структурная схема основных фаз преобразования исходного и искаженного образцов речи: предварительная обработка на основе модели психоакустического восприятия (Perceptual model) и выравнивание во времени (Time alignment) для последующего сравнения внутренних представлений (Internal representation) исследуемых образцов. Итоговая мера оценки (показатель) качества MOS-LQO рассчитывается с помощью модели распознавания характерных субъективных признаков искажения речи (Cognitive model).

Функциональная схема алгоритма оценивания качества принимаемой речи Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.1 Функциональная схема алгоритма оценивания качества принимаемой речи

Специальное программное обеспечение позволяет реализовать алгоритм POLQA на современных типовых абонентских устройствах (смартфонах, планшетах и ноутбуках) и проводить автоматизированный контроль качества речи, передаваемой от абонента к абоненту в сетях мобильной связи.

Технологии выполнения тестов на основе алгоритма POLQA

Контроль качества услуг телефонной связи осуществляется с помощью повторяющихся вызовов, имитирующих поведение реального абонента.

Для оценки качества принимаемой речи выполняются повторяющиеся циклы тестов для соединений типа «мобильный – мобильный» или «мобильный – фиксированный». Наиболее часто реализуются соединения типа «мобильный – мобильный», поскольку в сетях мобильной связи преобладают вызовы между мобильными абонентами. Кроме того, телефонные вызовы между мобильными устройствами позволяют реализовать преимущества широкополосных речевых кодеков AMR WB в части повышения качества передачи речи в сетях на основе технологий LTE, WCDMA и GSM. Ограничением применимости двусторонних вызовов внутри мобильной сети является невозможность отдельно оценивать влияние искажений, возникающих при доставке образца речи от телефона в направлении сети. Данное ограничение не влияет на применимость подхода при End-to-End контроле качества услуг телефонной связи.

Преимуществом соединений «мобильный – фиксированный» и «фиксированный – мобильный» (в направлении от тестового устройства к голосовому серверу и наоборот) является возможность регистрировать качество образца речи, передаваемого в направлении сети (от тестового устройства), в точке подключения голосового сервера. Однако такой подход существенно усложняет технологию сравнительных тестов и заметно увеличивают стоимость работ и трафика. В частности, необходимо устанавливать и подключать голосовой сервер к коммутатору оператора фиксированной связи с присвоением выделенных номеров, а также обеспечивать идентичные маршруты установления телефонных соединений в исследуемой сети каждого оператора. Контроль качества телефонной связи на стороне коммутатора фиксированной сети обычно проводится при необходимости найти причины снижения качества принимаемой речи и определить плечо соединения (MOC или MTC), на котором возникают искажения на проблемном участке сети. В качестве альтернативного решения можно рассмотреть размещение тестового телефона, принимающего голосовой вызов (MTC), в точке, исключающей негативное влияние качества принимаемого радиосигнала на качество передаваемого образца речи. Такое решение не позволяет оценивать влияние негативных факторов на качество образца речи, принимаемого отдельно на каждом плече (MOC и MTC) соединения. Однако снижение оценки End-to-End при таком подходе может характеризовать наличие негативных факторов в канале, передающем образец речи.

В течение каждого успешного соединения специальный образец речи передается поочередно со стороны исходящего (MOC) в направлении входящего (MTC) вызова и обратно. Расчет показателя качества на основе алгоритма POLQA производится также для каждого принятого образца речи (поочередно, на стороне MOC и на стороне MTC). Количество измерений (оценок) в течение каждого успешного голосового соединения определяется длительностью звучания образца речи и технологической паузы (как правило, не менее 10 измерений качества речи в течение успешного соединения длительностью 120 с, при использовании образца речи длительностью 8 с).

Алгоритм POLQA предполагает два режима оценки качества передачи речи – NB (Narrowband – узкополосный) и FB (Fullband – полнополосный). При выборе режима необходимо учитывать диапазон звуковых частот, который поддерживает исследуемый канал связи. В частности, режим NB рекомендуется применять только в случае использования узкополосных кодеков, а режим FB – в случае совместного использования любых комбинаций кодеков NB, WB, SWB и FB. Допускается использование режима FB для выполнения тестов в сетях, реализующих голосовые соединения на основе кодеков NB. Это позволяет сравнивать результаты тестов, выполненных в разных сетях, на основе единого диапазона оценок. Важно учитывать, что максимальное значение качества передачи речи в режиме FB составляет 4.85 [MOS], а в режиме NB – 4.5 [MOS].

Акустический файл образца речи обычно включается в состав комплекта поставки измерительного оборудования или приобретается дополнительно (например, образец речи на русском языке, длительность – 8 с, мужской/женский голос, кодирование для режима NB или FB). Следует учитывать, что выбор состава, длительности звучания и языка образца речи (русский, английский или другой) может влиять на результаты оценок качества передачи речи по каналу связи. Рекомендуется использовать одинаковый образец речи, если планируется сравнивать результаты тестов, выполненных в разное время на разных объектах. Используемый образец речи должен обеспечивать корректную оценку качества передачи речи при совместном использовании комбинаций разных речевых кодеков для соединений типа «мобильный — мобильный». Важно учитывать, что в сети NB результаты оценки в режиме NB отличаются от результатов аналогичных тестов, выполненных в сети NB в режиме FB.

Для реализации возможностей алгоритма POLQA в части эффективной оценки End-to-End качества речи, передаваемой по каналам мобильной связи, необходимо выполнять тесты с помощью телефонов, поддерживающих все режимы и кодеки, активированные в сети. Кроме того, важно рационально выбрать маршрут и/или стационарные точки на территории исследуемого объекта.

Комплексный анализ результатов тестов, включая сообщения сигнального обмена, используемые режимы и характеристики радиопокрытия позволяет не только обнаружить и локализовать проблемные участки, но и определить возможные причины снижения качества речи. Дополнительный анализ данных сетевой статистики и реальной абонентской нагрузки заметно повышает результативность тестов на радиоинтерфейсе.

Влияние характеристик канала связи на качество речи

На качество принимаемой речи в сетях мобильной связи оказывает влияние совокупность факторов:

  • тип и скорость речевого кодека;
  • полоса пропускания канала связи;
  • пропускная способность транспортных каналов;
  • кодирование/транскодирование речевого сигнала;
  • потери пакетов голосовых данных;
  • ошибки при передаче битов или пакетов голосовых данных;
  • увеличение сквозной задержки в канале связи;
  • технология мобильной связи (2G, 3G, 4G (VoLTE) и др.);
  • качество радиосигнала.

Технические возможности современной версии алгоритма POLQA (P.863 Edition 3) позволяют отражать повышение качества речи, обусловленное внедрением новейших технологий и режимов в сетях мобильной связи. Кроме того, текущая версия алгоритма демонстрирует возможность эффективно оценивать влияние различных факторов, которые приводят к искажению принимаемых образцов речи, в каналах телефонной связи, включая каналы с расширенной полосой пропускания (до 24 кгц).

Далее приводятся примеры, иллюстрирующие возможности алгоритма POLQA в части анализа влияния кодеков, резкого увеличения задержки и снижения качества радиосигнала на оценки качества принимаемых образцов речи для соединений типа «мобильный – мобильный». Оценки получены на основе результатов тестов, выполненных в действующих сетях мобильной связи с помощью программно-аппаратного комплекса Nemo Invex и Nemo Analyze производства компании Keysight Technologies. Каждый тест реализует голосовое соединение длительностью 120 с, в течение которого образец речи (сэмпл) на русском языке длительностью 6 с передается и принимается суммарно не менее 14 раз (7 раз в направлении MTC и 7 раз в направлении MOC).

Влияние кодека

Для иллюстрации влияния характеристик кодеков далее приводятся результаты оценки качества принимаемой речи, полученные на основе современной версии алгоритма POLQA (P.863 Edition 3). В качестве примеров рассматриваются кодеки EVS SWB 24.4 и AMR WB 23.85, реализованные в сетях LTE с поддержкой VoLTE, а также кодек AMR WB 12.65, реализованный в сети WCDMA. Доля оценок, зарегистрированных в каждой технологии и для каждого рассматриваемого кодека, составляет не менее 98%.

На рисунке 1.2 приводятся графики функции плотности вероятности (PDF) значений показателя Telephony Speech Quality on Sample Basis [MOS] для трех типов кодеков: синий цвет – EVS SWB 24.4, зеленый цвет – AMR WB 23.85 и красный цвет – AMR WB 12.65. Относительные позиции графиков позволяют визуально оценить динамику изменения показателя для каждого кодека.

График распределения значений показателя качества принимаемой речи для кодека EVS SWB 24.4 (VoLTE) заметно смещен вправо, в область высоких значений и наглядно отражает преимущества кодека по сравнению с кодеками AMR WB 23.85 (VoLTE) и AMR WB 12.65 (WCDMA). В частности, решение на основе кодека EVS SWB 24.4 демонстрирует абсолютное преобладание оценок выше 4.35 MOS и незначительную частоту регистрации значений оценок ниже 4.0 MOS. Кроме того, незначительное количество оценок ниже 3.5 MOS характеризует высокую устойчивость кодека к помехам в радиоканале, потерям пакетов и другим факторам, негативно влияющим на качество речи.

График распределения значений показателя для кодека AMR WB 23.85 (VoLTE) смещен вправо, в область высоких значений, примерно на 0,3 MOS относительно аналогичного графика для кодека AMR WB 12.65 (WCDMA). На графике распределения значений показателя для кодека AMR WB 23.85 (VoLTE) отсутствуют значения выше 4.4 MOS. Кроме того, относительно высокая частота оценок ниже 3.85 MOS характеризует комплексное влияние совокупности негативных факторов, действующих в реальной сети, с учетом используемой технологии связи и характеристик качества радиопокрытия (включая количество переводов обслуживания (хэндоверов) между частотными каналами). Относительное снижение оценок, обусловленное негативными факторами, наглядно отражено с помощью алгоритма POLQA (P.863 Edition 3).

Заметное отставание решения на основе кодека AMR WB 12.65 (WCDMA) по качеству передачи речи наглядно демонстрирует относительное смещение соответствующего графика влево, в область низких значений. В частности, на графике распределения значений показателя для кодека AMR WB 12.65 (WCDMA) отсутствуют значения выше 4.15 MOS. Кроме того, на графике отражено увеличение частоты оценок ниже 3.6 MOS, что характеризует алгоритм POLQA (P.863 Edition 3) как эффективный инструмент автоматизированного контроля наличия и степени влияния негативных факторов канала связи на качество передачи речи.

Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.2 Графики функции плотности вероятности (PDF) значений показателя Telephony Speech Quality on Sample Basis [MOS]

В таблице 1.2 приводится распределение диапазонов значений показателя в соответствии с градациями экспертных оценок качества речи. Такой способ классификации оценок позволяет сопоставлять клиентский опыт и результаты автоматизированной объективной оценки качества принимаемой речи в сетях мобильной связи на основе современных технологий. Расчет показателей выполнен на основе рекомендаций Международного союза электросвязи ITU-T P.800.1, ITU-T G.107 и ITU-T G.109 с учетом результатов анализа специалистами компании DMTEL соответствия оценок по шкале MOS реальному качеству воспринимаемой абонентом речи.

Таблица 1.2. Соответствие оценок по шкале MOS и клиентского опыта
Интервалы значений [MOS] Уровень качества принимаемой речи SWB EVS 24.4 WB 23.85 WB 12.65
1.00 – 1.50, % Неприемлемо 0,07 0,19 0,61
1.50 – 3.10, % Плохо 1,53 4,48 6,51
3.10 – 3.60, % Удовлетворительно 1,35 7,36 9,41
3.60 – 4.34, % Хорошо 8,10 87,87 83,46
4.34 – 4.85, % Отлично 88,94 0,10 0,00

Градации экспертных оценок уровня воспринимаемого качества речи характеризуют степени удовлетворенности абонентов на маршруте драйв-теста:

  • «неприемлемо» – низкая разборчивость речи и наличие искажений, при которых невозможно продолжать разговор;
  • «плохо» – возможность обмена речевой информацией, но со значительными ограничениями, в частности, искажения звуков и снижение разборчивости речи могут приводить к необходимости многократно повторять отдельные слова;
  • «удовлетворительно» – возможность обмена речевой информацией, но с ограничениями, в частности, искажения звуков и снижение разборчивости речи могут приводить к необходимости повторять отдельные слова;
  • «хорошо» – качество и разборчивость речи, достаточные для успешной коммуникации;
  • «отлично» – наилучшее качество, при котором практически сохраняются натуральность и тембр голоса собеседника, а слушающий практически не ощущает разницу между разговором по телефону и живой речью. Такое качество позволяют реализовать, например, современные кодеки EVS в сетях на основе технологии VoLTE.

Распределение оценок, представленное в таблице 1, позволяет квалифицировать степени удовлетворенности абонентов качеством речи на основе оценок по шкале MOS в действующих сетях, реализованных на базе различных технических решений.

В рассматриваемом примере абсолютное преобладание высшей оценки “Отлично” отмечено только в случае применения кодека SWB EVS 24.4 в сети LTE с поддержкой VoLTE и составляет почти 89%. Кроме того, в сети на основе данного решения доли оценок “Удовлетворительно”, “Плохо” и “Неприемлемо” многократно меньше (в 3 – 7 раз), чем в сетях на основе кодеков AMR WB 23.85 (VoLTE) и AMR WB 12.65 (WCDMA).

Важно отметить, что кодек SWB EVS 24.4 относится к новому поколению аудиокодеков высокой четкости HD+ (EVS) и применяется в сетях 4G с поддержкой VoLTE. Функционал EVS позволяет сохранять натуральность и тембр голоса собеседника, при этом слушающий практически не ощущает разницу между разговором по телефону и живой речью. Кроме того, кодек EVS охватывает весь слышимый человеческим ухом спектр частот, что дает возможность также транслировать «живую» музыку по телефону.

В сети на основе кодека AMR WB 23.85 (VoLTE) преобладают оценки “Хорошо”, а оценки “Отлично” практически отсутствуют. Данное решение заметно опережает решение на основе кодека AMR WB 12.65 (WCDMA) по совокупности оценок, характеризующих степень удовлетворенности абонентов качеством речи.

В сети на основе кодека AMR WB 12.65 (WCDMA преобладают оценки “Хорошо”, а оценки “Отлично” не зарегистрированы. При этом такое решение заметно уступает решению на базе кодека AMR WB 23.85 (VoLTE) по доле оценок “Хорошо”. Кроме того, доли оценок “Плохо” и “Неприемлемо” в 1.5 – 3 раза больше, чем в сети на основе кодека AMR WB 23.85 (VoLTE).

Далее рассматривается пример влияния значительного однократного увеличения (скачка) задержки пакетов данных, обусловленного хэндовером между частотными каналами, на оценку качества принимаемой речи соединения VoLTE.

Влияние скачка задержки пакетов данных соединения VoLTE

В качестве примера рассматривается влияние значительного однократного увеличения (скачка) задержки при доставке пакетов голосовых данных на оценку качества принятого образца речи. Голосовое соединение реализовано в сети LTE с поддержкой VoLTE и кодека AMR WB 12.65. В литературе для обозначения эффекта регулярной флуктуации задержки в канале связи часто используется термин джиттер (jitter). Для иллюстрации приводится факт снижения качества принимаемого образца речи до значения 1.85 [MOS]. Снижение качества обусловлено кратковременным, но существенным увеличением задержки (примерно до 400 ms), которое приводит к нарушению непрерывности принимаемого образца речи. Такую задержку может компенсировать стандартный буфер, настроенный с учетом диапазона изменения сквозной задержки канала связи на стороне приемника (см. рекомендации ITU-T G.114). В описываемом примере механизм буферизации действительно сохраняет практически весь звуковой сэмпл, однако возникающая при воспроизведении длинная пауза, которая воспринимается на слух как своеобразное "заикание" (скачок задержки пакетов данных), приводит к искажению принятого образца речи и снижению оценки до уровня «плохо» (см. рисунок 1.3).

В примере для теста использовался образец речи на русском языке, общая длительность которого составляет 8 секунд. Текст приведен ниже:

«Благодаря книгам я учусь мечтать. Мне хочется чувствовать себя хорошо».

Далее на рисунке 1.3 наглядно показано влияние скачка задержки пакетов данных на форму и характер принимаемого образца речи.

Влияние негативных факторов канала связи
Рисунок 1.3 Влияние флуктуации задержки на форму и характер принимаемого речевого сигнала

Для визуальной оценки характера искажений в верхней части рисунка синим цветом изображен график изменения уровня сигнала исходного образца речи. В средней части рисунка приводятся график изменения уровня сигнала образца речи, искаженного в процессе передачи и приема (зеленый цвет). Графики звуковой активности отражают значения индикатора наличия (Audio on) или отсутствия (Audio off) звукового сигнала, включая тональный сигнал, используемый для синхронизации образца речи. В нижней части рисунка 1.4 показан график изменения регулярной задержки (джиттера) пакетов в канале связи. Вертикальные маркеры отражают моменты времени успешного завершения хэндоверов HO 1 – HO 3. Единая шкала времени приводится для визуализации соответствия искажений событиям и процессам на принимающей стороне соединения (MTC) с учетом общей задержки сквозного канала связи VoLTE.

Графики отражают наличие искажений в виде несвоевременного поступления финального фрагмента речи на приемную сторону, обусловленного нарушением непрерывности образца речи при передаче пакетов голосовых данных.

Для определения причин резкого увеличения задержки рассмотрим динамику изменения основных характеристик радиопокрытия и сетевые процедуры (события), зарегистрированные непосредственно до и после нештатной ситуации. На рис. 1.4 приводятся графики изменения характеристик качества речи и радиопокрытия, а также сообщения сигнального обмена на принимающей стороне (MTC) соединения типа «мобильный – мобильный» на проблемном участке драйв-теста.

Многократное увеличение задержки отмечено после быстрого снижения уровня и качества опорного радиосигнала и активации процедуры выполнения хэндовера HO2 и, по существу, является индикатором наличия нарушений в работе канала связи.

Маркер M установлен в точке, отражающей значения соответствующих характеристик непосредственно перед событием HO2 на стороне MTC. Оценка качества образца речи S1, принятого на стороне входящего вызова (MTC) составляет 1.85 [MOS]. При этом на стороне MTC отмечены низкие уровень и качество принимаемого опорного сигнала, что приводит к серии успешных хэндоверов HO1 – HO3 в период времени, соответствующий принятому образцу речи S1. Хэндоверы HO1 и HO3 выполняются штатно до и после поступления пакетов данных принимаемого образца речи S1, не влияют на оценку качества и не рассматриваются в данном примере.

Для оценки успешности и длительности процедуры выполнения хэндовера HO2 на стороне MTC рассмотрим последовательность сигнальных сообщений, зарегистрированных тестовым устройством (см. таблицу, левая нижняя часть рисунка 1.4). Инициализация перехода HO2 при действующем RRC соединении зарегистрирована в момент времени 16:25:03.551 (сообщение RRCConnectionReconfiguration). В таблице справа приводятся значения количества попыток передачи преамбулы случайного доступа, указаны причина инициализации процедуры (в примере – хэндовер) и результат. В соответствии с таблицей, факт успешного завершения хэндовера HO2 отмечен в момент времени 16:25:04.250 (сообщение Succeeded). В итоге общее время выполнения процедуры перевода обслуживания голосового соединения из сектора PCI 353 в сектор PCI 192 составляет около 699 мс. Значительная часть длительности процедуры хэндовера обусловлена многократным повтором попыток передачи преамбулы случайного доступа в сеть по каналу RACH (35 попыток, см. рис. 1.4). Регистрация активности нового RRC соединения (16:25:04.350, сообщение RRCConnectionReconfiguration) после перевода обслуживания в новый сектор подтверждает успешное завершение перехода HO2.

Далее, для наглядности, выполним расчет общей длительности повторных попыток передачи преамбулы случайного доступа. В соответствии с документом 3GPP TS 36.211 version 10.0.0 Release 10, при значении параметра prach-ConfigIndex = 3 (отображается в сообщении RRCConnectionReconfiguration) для передачи преамбулы случайного доступа в сеть используется один подкадр (subframe) в кадре, следовательно, длительность одной попытки равна длительности одного кадра, а именно – 10 мс. Итоговая длительность попытки установления соединения RRC при реализации хэндовера HO2 составляет около 350 мс, поскольку в примере количество попыток передачи преамбул случайного доступа в сеть составляет 35.

Измеренная задержка звукового фрагмента речи на приемной стороне с учетом времени реакции элементов сетевого оборудования и буфера компенсации стандартных флуктуаций задержки пакетов данных составляет около 558 мс,. При этом длительность прерывания процесса передачи пакетов данных звукового сигнала составляет около 0.699 с.

Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.4 Динамика изменения характеристик качества принимаемой речи и радиопокрытия в окрестности точки M

В результате такой длительной задержки отмечается относительное снижение оценки качества принятого образца речи на основе алгоритма POLQA до уровня “Плохо” (1.85 [MOS]). При этом оценки предыдущего S0 и следующего S1 образцов речи соответствуют уровню “Хорошо” (3.63 и 3.75 [MOS] соответственно).

Влияние качества принимаемого радиосигнала

В качестве примера приводится сравнение оценок качества речи, зарегистрированных в двух сетях LTE с поддержкой VoLTE, которые значительно отличаются по качеству принимаемого опорного радиосигнала. При этом исследуемые сети обеспечивают практически одинаковое распределение уровня принимаемого опорного сигнала на маршруте драйв-теста. Кроме того, в одной сети преобладает кодек AMR WB 12.65, в другой – AMR WB 23.85. Доля оценок, зарегистрированных в каждой технологии и для каждого рассматриваемого кодека, составляет не менее 99%. Оценки качества принимаемых образцов речи в течение каждого голосового соединения выполнены на основе современной версии алгоритма POLQA (P.863 Edition 3).

На рис. 1.5 и 1.6 приводятся графики функций распределения вероятности (CDF) значений уровня RSRP и отношения сигнал/помеха RS SNR опорного сигнала обслуживающего канала, зарегистрированных в сети на основе кодека AMR WB 12.65 (красный цвет) и в сети на основе кодека AMR WB 23.85 (синий цвет). Визуальная оценка показывает (см. рис. 1.5.), что по уровню опорного сигнала обе сети демонстрируют практически идентичные результаты. При этом график CDF значений отношения сигнал/помеха RS SNR в сети на основе кодека AMR WB 12.65 существенно смещен влево (примерно на 7 dB) и наглядно отражает высокую долю отрицательных значений RS SNR < 0 – около 38 % (см. рис. 1.6.). Для сравнения, доля значений RS SNR < 0, зарегистрированных в сети на основе кодека AMR WB 23.85, составляет около 10 %.

Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.5. Функция распределения вероятности (CDF) значений уровня RSRP принимаемого опорного радиосигнала в сетях на основе кодеков WB 12,65 и WB 23,85
Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.6. Функция распределения вероятности (CDF) значений отношения сигнал/помеха RS SNR принимаемого опорного радиосигнала в сетях на основе кодеков WB 12,65 и WB 23,85

На рис. 1.7. приводятся графики функции плотности вероятности (PDF) значений показателя Telephony Speech Quality on Sample Basis [MOS] для двух рассматриваемых сетей.

Функциональная схема алгоритма оценивания качества принимаемой речи
Рисунок 1.7. Графики функции плотности вероятности (PDF) значений показателя Telephony Speech Quality on Sample Basis [MOS] в сетях на основе кодеков WB 12,65 и WB 23,85

Смещение влево максимума функции PDF примерно на 0.3 MOS в сети на основе кодека AMR WB 12.65 обусловлено выбором кодека. Значительное увеличение частоты оценок ниже 3.1 MOS отражает влияние совокупности негативных факторов канала связи. При этом существенный вклад в снижение качества речи вносит интерференция, поскольку в сети на основе кодека AMR WB 12.65 отмечено многократное превышение доли значений RS SNR < 0 (почти в 4 раза больше, чем в сети на основе кодека AMR WB 23.85, см. Рис 1.6).

Применение результатов оценки качества речи

Анализ распределения оценок качества речи в таблицах и графиков функций распределения PDF и CDF значений показателя Telephony Speech Quality on Sample Basis [MOS] позволяет определить наличие и масштаб проблем в части качества речи. Предметный анализ распределения оценок на маршруте драйв-теста, с учетом характеристик качества радиопокрытия и сетевой статистики позволяет локализовать участки, определить причины снижения качества речи и планировать действия по улучшению качества голосовой связи.