Кодек Opus 1.2 появился на вашем телефоне: высококачественный звук со скоростью 32 кбит/с

Ксиф. Org Foundation выпустила аудиокодек Opus 1.2, который вносит существенные улучшения в звук в реальном времени. Узнайте все о том, как все изменилось!

Ксиф. Org Foundation только что объявила о своем последнем усовершенствовании аудиокодека Opus, выпустив свой кодер libopus 1.2. Благодаря этому последнему усовершенствованию Xiph. Организации удалось сделать Opus пригодным для полнополосного стереозвука со скоростью всего 32 кбит/с, что хорошо сочетается с предстоящим бесплатным Формат видео AV1 в контейнере WebM, чтобы обеспечить более высокое качество звука и видео при более медленных соединениях.

Для тех из вас, кто не знаком с этим форматом, Opus — это стандартный аудиокодек IETF, не требующий лицензионных отчислений, который появился в результате слияния Xiph. Кодек CELT Org Foundation и кодек SILK Skype в попытке создать один бесплатный формат для всего аудио с потерями. Он был разработан для хорошего масштабирования при изменении битрейта, для требования чрезвычайно низкой пропускной способности и для возможности кодирования и декодирования с очень высокой скоростью. используется небольшая вычислительная мощность, и все это имеет решающее значение для использования в видеоконференциях, мобильной потоковой передаче и любом другом аудио в реальном времени. Приложения. За 5 лет, прошедших с момента стандартизации Opus, он уже нашел широкое распространение в сети, включая потоковые сервисы, IP-телефоны, медиаплееры и другие.

Опус 1.2 приносит с собой некоторые существенные улучшения как к качеству музыки, так и к качеству речи. Как упоминалось выше, Opus достиг той точки, когда его можно использовать для полнополосный стереозвук со скоростью всего 32 кбит/с, то, что еще несколько лет назад считалось недостижимым. Усовершенствования, внесенные в libopus 1.2, позволяют использовать кодирование VBR со скоростью 32 кбит/с, чего ранее избегали из-за Создается ошибочное впечатление, что это повредит качеству звука в областях с чрезвычайно низким битрейтом, чего Opus удается избежать.

[playlist ids="179434,179437,179435,179436,179438,179514"]

Opus 1.2 также доводит качество речи до уровня, при котором его можно использовать для полнополосной речи со скоростью всего 14 кбит/с по сравнению с 21 кбит/с в Opus 1.1 и 29 кбит/с в Opus. 1.0. Частично это обусловлено усовершенствованиями гибридного режима Opus, в котором используется SILK для частот ниже 8 кГц и CELT для частот от 8 до 20 кГц. кГц. Настройка, выполненная в libopus 1.2, позволяет использовать CELT и SILK вместе со скоростью передачи данных всего 16 кбит/с, что вдвое меньше предыдущего предела в 32. кб/с.

[playlist ids="179445,179447,179446,179448,179444,179443,179442,179518"]

Интересно отметить, что не произошло ни одного серьезного изменения, которым можно было бы объяснить это улучшение. В то время как улучшения Opus 1.1 возникли в основном за счет небольшого набора изменений, Opus 1.2 является результатом итеративной разработки и множества мелких настроек, которые в совокупности привели к значительному улучшению.

Несмотря на эти существенные улучшения качества, работа над кодером фактически привела к тому, что Opus потребовал еще меньше вычислительной мощности, чем раньше. Opus уже был лидером рынка с точки зрения того, как мало вычислительной мощности он использовал, но обновление 1.2 для libopus довело кодирование до такой степени, что вы можете декодировать полнополосную стерео музыку со скоростью 128 Кбит/с в реальном времени, используя всего ~11 МГц вычислительной мощности на процессоре Intel Haswell в режиме с плавающей запятой (или всего ~33 МГц на ARM). Cortex-A53 в режиме с фиксированной запятой) и широкополосную монофоническую речь со скоростью 12 Кбит/с всего за ~2 МГц на процессоре Intel Haswell в режиме с плавающей запятой (или всего ~6 МГц на ARM Cortex-A53 в режим фиксированной точки). Аналогично, время кодирования также уменьшилось для большинства ситуаций, причем в некоторых из наиболее экстремальных ситуаций оно сократилось вдвое (например, сложность кодирования 5 для Полнополосная стереомузыка со скоростью 128 Кбит/с на процессоре Intel Haswell в режиме с плавающей запятой, которая упала с ~ 40 МГц с libopus 1.0 до всего ~ 21 МГц с libopus. 1.2).

Продолжающееся развитие Opus с помощью libopus 1.2 интересно наблюдать, и мы надеемся, что со временем Opus продолжит получать распространение. Кодеки, не требующие лицензионных отчислений, имеют решающее значение для развития открытого и совместимого Интернета. Это единственные кодеки, которые могут быть реализованы на всех устройствах, поскольку кодеки, обремененные патентами, часто сталкиваются с различными проблемами, начиная от от дистрибьюторов контента и потоковых сервисов, не желающих платить непомерные лицензионные сборы, которые требуют некоторые, до программного обеспечения с открытым исходным кодом, часто не могут гарантировать правильное лицензирование от имени своих пользователей или даже программное обеспечение полностью не может интегрировать его, не нарушая собственное лицензирование. условия. Эти проблемы с кодеками, обремененными патентами, вызывают фрагментацию вместо сотрудничества, поскольку разные группы создают и внедрять свои собственные кодеки, чтобы избежать лицензионных сборов и других проблем, связанных с обременением патентами кодеков. приносить. Это приводит к тому, что группы создают свои собственные кодеки, для которых требуются определенные браузеры, операционные системы и/или аппаратное обеспечение, которое может полностью лишить большие группы пользователей возможности использовать определенные содержание. Единственный способ появления по-настоящему универсального кодека — это его бесплатное использование и широкое распространение. использование нескольких кодеков жизненно важно для здорового Интернета, где все пользователи имеют возможность доступа к любому содержание. Открытые стандарты — единственный способ гарантировать единообразный пользовательский опыт на всем рынке, и это здорово, когда вариант без лицензионных отчислений также является лучшим.