Opus 1.2 Codec kommer på telefonen din: Høykvalitetslyd ved 32 kbps

Xiph. Org Foundation har lansert Opus 1.2 lydkodeken, som gir betydelige forbedringer for sanntidslyd. Lær alt om hvordan det endret seg!

Xiph. Org Foundation kunngjorde nettopp deres siste forbedring av Opus-lydkodeken med utgivelsen av deres libopus 1.2-koder. Med denne siste forbedringen, Xiph. Org har klart å gjøre Opus brukbar for fullbånds stereolyd med bare 32 kb/s, noe som vil passe godt sammen med den kommende royaltyfrie AV1 videoformat i WebM-beholderen for å få høyere kvalitet på lyd og video på tregere tilkoblinger.

For de av dere som ikke er kjent med formatet, er Opus en IETF-standard royaltyfri lydkodek som ble til ved å slå sammen Xiph. Org Foundations CELT-kodek og Skypes SILK-kodek, i et forsøk på å lage ett royaltyfritt format for all tapslyd. Den ble designet for å skalere godt med skiftende bithastigheter, for å kreve ekstremt lav gjennomstrømning, og for å kunne kodes og dekodes med svært lite prosessorkraft brukt, som alle er kritiske for bruk i videokonferanser, mobilstrømming og annen sanntidslyd applikasjoner. I løpet av de 5 årene siden Opus ble standardisert, har det allerede funnet utbredt bruk over hele nettet, og har sett adopsjon fra strømmetjenester, IP-telefoner, mediespillere og andre.

Opus 1.2 bringer med seg noe betydelige forbedringer til både musikkkvalitet og talekvalitet. Som nevnt ovenfor har Opus nå nådd det punktet hvor det er brukbart for fullbånds stereolyd på bare 32 kb/s, noe som ble antatt å være uoppnåelig for bare noen år siden. Forbedringene med libopus 1.2 muliggjør bruk av VBR-koding ved 32 kb/s, som tidligere ble unngått på grunn av unøyaktig inntrykk av at det ville skade lydkvaliteten i områder med ekstremt lav bithastighet, noe Opus er i stand til å unngå.

[spilleliste ids="179434,179437,179435,179436,179438,179514"]

Opus 1.2 bringer også talekvaliteten til et punkt hvor den er brukbar for fullbåndstale med bare 14 kb/s, ned fra 21 kb/s i Opus 1.1 og 29 kb/s i Opus 1.0. Dette drives delvis takket være forbedringer av Opus’ hybridmodus, som bruker SILK for frekvenser under 8 kHz, og CELT for frekvenser fra 8 kHz til 20 kHz. Innstillingen gjort i libopus 1.2 gjør at den kan bruke både CELT og SILK i kombinasjon med bithastigheter så lave som 16 kb/s, som er halvparten av den forrige grensen på 32 kb/s.

[spilleliste ids="179445,179447,179446,179448,179444,179443,179442,179518"]

En ting som er interessant å merke seg er at det ikke var en eneste stor endring som denne forbedringen kan tilskrives. Mens Opus 1.1s forbedringer først og fremst kom fra et lite utvalg endringer, er Opus 1.2 et resultat av iterativ utvikling og en mengde mindre justeringer som ga en massiv forbedring.

Til tross for de betydelige kvalitetsforbedringene, har arbeidet med koderen faktisk resultert i at Opus krever enda mindre prosessorkraft enn tidligere. Opus var allerede markedsleder når det gjelder hvor lite prosessorkraft den brukte, men 1.2-oppdateringen til libopus har brakt kodene til et punkt hvor du kan dekode 128 kb/s fullbånds stereomusikk i sanntid med bare ~11 MHz prosessorkraft på en Intel Haswell CPU i flytende kommamodus (eller bare ~33 MHz på en ARM Cortex-A53 i fastpunktmodus) og 12 kb/s bredbånds mono tale på bare ~2 MHz på en Intel Haswell CPU i flytepunktmodus (eller bare ~6 MHz på en ARM Cortex-A53 i fastpunktmodus). På samme måte har kodingstiden også gått ned for de fleste situasjoner, med noen av dem mer ekstreme som er halvert (som koding av kompleksitet 5 for 128 kb/s fullbånds stereomusikk på en Intel Haswell CPU i flytende kommamodus, som falt fra ~40 MHz med libopus 1.0 til bare ~21 MHz med libopus 1.2).

Den fortsatte utviklingen av Opus med libopus 1.2 er spennende å se, og forhåpentligvis vil vi se Opus fortsette å bli tatt i bruk ettersom tiden går. Avgiftsfrie kodeker er avgjørende for utviklingen av et åpent og interoperabelt internett. De er de eneste kodekene som kan implementeres på alle enheter, ettersom patentbeheftede kodeker ofte vil støte på forskjellige showstopping-problemer, alt fra innholdsdistributører og strømmetjenester som ikke ønsker å betale de ublu lisensavgiftene som noen krever, til åpen kildekode-programvare som ofte blir ute av stand til å garantere riktig lisensiering på vegne av sine brukere, eller til og med programvare som er fullstendig ute av stand til å integrere den uten å bryte deres egen lisensiering vilkår. Disse problemene med patentbeheftede kodeker forårsaker fragmentering i stedet for samarbeid, ettersom forskjellige grupper skaper og implementere sine egne kodeker for å unngå lisensavgiftene og diverse andre problemer som patenterer beheftet kodeker bringe. Det resulterer i at grupper lager sine egne kodeker som krever spesifikke nettlesere, operativsystemer og/eller maskinvare å bruke, og som fullstendig kan låse store mengder brukere ute fra å kunne bruke visse innhold. Den eneste måten for en virkelig universell kodek å dukke opp er hvis den er royaltyfri og utbredt bruk av de få kodekene som er i bruk er avgjørende for et sunt internett der alle brukere har muligheten til å få tilgang til alle innhold. Åpne standarder er den eneste måten å garantere en konsistent brukeropplevelse på tvers av markedet, og det er fantastisk når det royaltyfrie alternativet også er det beste.