Opus 1.2 Codec ankommer på din telefon: Højkvalitetslyd ved 32 kbps

click fraud protection

Xiph. Org Foundation har lanceret Opus 1.2 audio codec, som bringer væsentlige forbedringer til realtime audio. Lær alt om, hvordan det ændrede sig!

Xiph. Org Foundation har netop annonceret deres seneste forbedring af Opus audio codec med udgivelsen af ​​deres libopus 1.2 encoder. Med denne seneste forbedring, Xiph. Org har formået at gøre Opus anvendelig til fuldbånds stereolyd med kun 32 kb/s, hvilket vil parre godt med den kommende royaltyfrie AV1 videoformat i WebM-beholderen for at bringe lyd og video i højere kvalitet på langsommere forbindelser.

For de af jer, der ikke er bekendt med formatet, er Opus en IETF-standard royaltyfri lyd-codec, der blev til ved at fusionere Xiph. Org Foundations CELT-codec og Skypes SILK-codec, i et forsøg på at skabe ét royaltyfrit format til al tabslyd. Den blev designet til at skalere godt med skiftende bithastigheder, til at kræve ekstremt lav gennemstrømning og til at kunne kodes og afkodes med meget lille processorkraft brugt, som alle er kritiske til brug i videokonferencer, mobilstreaming og enhver anden realtidslyd applikationer. I de 5 år, der er gået, siden Opus blev standardiseret, har det allerede fundet udbredt adoption overalt på nettet, idet det har set adoption fra streamingtjenester, IP-telefoner, medieafspillere og andre.

Opus 1.2 bringer nogle med sig væsentlige forbedringer til både musikkvalitet og talekvalitet. Som nævnt ovenfor er Opus nu nået til det punkt, hvor den er anvendelig til fuldbånds stereolyd med kun 32 kb/s, noget man mente var uopnåeligt for blot et par år siden. Forbedringerne med libopus 1.2 muliggør brugen af ​​VBR-kodning ved 32 kb/s, hvilket tidligere blev undgået pga. unøjagtigt indtryk af, at det ville skade lydkvaliteten i de ekstremt lave bithastighedsområder, hvilket Opus er i stand til at undgå.

[playlist ids="179434,179437,179435,179436,179438,179514"]

Opus 1.2 bringer også talekvalitet til det punkt, hvor den er anvendelig til fuldbåndstale med kun 14 kb/s, ned fra 21 kb/s i Opus 1.1 og 29 kb/s i Opus 1.0. Dette drives til dels takket være forbedringer af Opus' hybridtilstand, som bruger SILK til frekvenser under 8 kHz og CELT til frekvenser fra 8 kHz til 20 kHz. Tuning udført i libopus 1.2 gør det muligt at bruge både CELT og SILK i forbindelse med bithastigheder så lave som 16 kb/s, hvilket er halvdelen af ​​den tidligere grænse på 32 kb/s.

[playlist ids="179445,179447,179446,179448,179444,179443,179442,179518"]

En ting, der er interessant at bemærke, er, at der ikke var én større ændring, som denne forbedring kan tilskrives. Mens Opus 1.1’s forbedringer primært kom fra et lille udvalg af ændringer, er Opus 1.2 resultatet af iterativ udvikling og et væld af mindre justeringer, der resulterede i en massiv forbedring.

På trods af disse betydelige kvalitetsforbedringer har arbejdet med indkoderen faktisk resulteret i, at Opus har krævet endnu mindre processorkraft, end det tidligere gjorde. Opus var allerede førende på markedet med hensyn til, hvor lidt processorkraft den brugte, men 1.2-opdateringen til libopus har bragt koderne til det punkt, hvor du kan afkode 128 kb/s fuldbånds stereomusik i realtid med kun ~11 MHz processorkraft på en Intel Haswell CPU i floating-point-tilstand (eller kun ~33 MHz på en ARM Cortex-A53 i fixed-point-tilstand) og 12 kb/s bredbånds monotale på kun ~2 MHz på en Intel Haswell CPU i floating-point-tilstand (eller kun ~6 MHz på en ARM Cortex-A53 i fastpunktstilstand). På samme måde er kodningstiden også faldet i de fleste situationer, hvor nogle af dem mere ekstreme er blevet skåret i halve (såsom kodning af kompleksitet 5 for 128 kb/s fuldbånds stereomusik på en Intel Haswell CPU i floating-point mode, som faldt fra ~40 MHz med libopus 1.0 til kun ~21 MHz med libopus 1.2).

Den fortsatte udvikling af Opus med libopus 1.2 er spændende at se, og forhåbentlig vil vi se, at Opus bliver ved med at blive adopteret, som tiden går. Royalty-fri codecs er afgørende for udviklingen af ​​et åbent og interoperabelt internet. De er de eneste codecs, der kan implementeres på alle enheder, da patentbehæftede codecs ofte vil støde ind i forskellige showstoppende problemer, der spænder fra indholdsdistributører og streamingtjenester, der ikke ønsker at betale de ublu licensafgifter, som nogle kræver, til open source-software, der ofte bliver ude af stand til at garantere korrekt licensering på vegne af deres brugere, eller endda software, der er fuldstændig ude af stand til at integrere det uden at krænke deres egen licens betingelser. Disse problemer med patentbehæftede codecs forårsager fragmentering i stedet for samarbejde, da forskellige grupper skaber og implementere deres egne codecs for at undgå de licensafgifter og forskellige andre problemer, som patenter behæftede codecs på tage med. Det resulterer i, at grupper opretter deres egne codecs, der kræver specifikke browsere, operativsystemer og/eller hardware at bruge, og som fuldstændig kan låse store dele af brugere ude af at kunne bruge visse indhold. Den eneste måde, hvorpå et virkeligt universelt codec kan opstå, er, hvis det er royaltyfrit og udbredt vedtagelse af de få codecs i brug er afgørende for et sundt internet, hvor alle brugere har mulighed for at få adgang til enhver indhold. Åbne standarder er den eneste måde at garantere en ensartet brugeroplevelse på tværs af markedet, og det er fantastisk, når den royaltyfrie mulighed også er den bedste.