Opus 1.2 コーデックが携帯電話に登場: 32 kbps の高品質オーディオ

サイフ。 Org Foundation は、リアルタイム オーディオに大幅な改善をもたらす Opus 1.2 オーディオ コーデックをリリースしました。 どのように変化したかをすべて学びましょう!

サイフ。 Org Foundation は、Opus オーディオ コーデックの最新の改良版のリリースを発表しました。 libopus 1.2 エンコーダ. この最新の改良により、Xiph. Org は、Opus をわずか 32 kb/s でフルバンド ステレオ オーディオに使用できるようにすることに成功しました。これは、今後のロイヤリティフリーの製品とうまく組み合わされます。 AV1ビデオフォーマット WebM コンテナ内で、低速接続でも高品質のオーディオとビデオを実現します。

この形式に詳しくない方のために説明すると、Opus は、Xiph を統合して誕生した IETF 標準のロイヤルティ フリー オーディオ コーデックです。 Org Foundation の CELT コーデックと Skype の SILK コーデックは、すべての非可逆オーディオに対応する 1 つのロイヤリティフリーの形式を作成することを目的としています。 ビットレートの変化に適切に対応し、非常に低いスループットを必要とし、非常に高速でエンコードおよびデコードできるように設計されています。 使用される処理能力はほとんどありません。これらはすべて、ビデオ会議、モバイル ストリーミング、その他のリアルタイム オーディオでの使用に不可欠です。 アプリケーション。 Opus が標準化されてから 5 年間で、Opus はすでに Web 全体で広く採用されており、ストリーミング サービス、IP 電話、メディア プレーヤーなどでの採用が見られます。

Opus 1.2 はいくつかのことをもたらします 大幅な改善 音楽品質と音声品質の両方に影響を与えます。 上で述べたように、Opus は現在、次の用途に使用できる段階に達しています。 わずか 32 kb/s のフルバンド ステレオ オーディオ、ほんの数年前には達成不可能だと考えられていたこと。 libopus 1.2 の機能強化により、以前は次の理由で避けられていた 32 kb/s での VBR エンコーディングの使用が可能になりました。 極度に低いビットレート領域でオーディオ品質が損なわれるという不正確な印象がありますが、Opus はそれを回避することができます。

[プレイリストids="179434,179437,179435,179436,179438,179514"]

また、Opus 1.2 では、音声品質が、Opus 1.1 の 21 kb/s、Opus の 29 kb/s からわずか 14 kb/s でフルバンド音声に使用できるレベルまで向上しました。 1.0。 これは、8 kHz 未満の周波数には SILK を使用し、8 kHz から 20 kHz までの周波数には CELT を使用する Opus のハイブリッド モードの改善のおかげでもあります。 kHz。 libopus 1.2 で行われたチューニングにより、以前の制限である 32 kb/s の半分である 16 kb/s という低いビットレートで CELT と SILK の両方を組み合わせて使用​​できるようになりました。 kb/秒。

[プレイリストids="179445,179447,179446,179448,179444,179443,179442,179518"]

注目すべき興味深い点の 1 つは、この改善が原因と考えられる大きな変更が 1 つもなかったことです。 Opus 1.1 の改善は主に小さな変更の選択によってもたらされましたが、Opus 1.2 は反復的な開発と大量の細かい調整の結果、大規模な改善が加えられました。

こうした大幅な品質向上にも関わらず、エンコーダーの改良により、Opus で必要な処理能力は以前よりもさらに少なくなりました。 Opus は、使用する処理能力の少なさの点ですでに市場リーダーでしたが、libopus の 1.2 アップデートにより、エンコードが可能なレベルになりました。 浮動小数点モードの Intel Haswell CPU でわずか ~11 MHz (または ARM ではわずか ~33 MHz) の処理能力で、128 kb/秒のフルバンド ステレオ音楽をリアルタイムでデコードします 固定小数点モードの Cortex-A53)、浮動小数点モードの Intel Haswell CPU でわずか ~2 MHz (または、ARM Cortex-A53 の場合はわずか ~6 MHz) で 12 kb/s 広帯域モノラル音声を実現します。 固定小数点モード)。 同様に、ほとんどの状況でエンコード時間も短縮され、一部のより極端な状況ではエンコード時間が半分に短縮されました (エンコードの複雑さ 5 など)。 浮動小数点モードの Intel Haswell CPU 上の 128 kb/s フルバンド ステレオ音楽。これは、libopus 1.0 の ~40 MHz から、libopus ではわずか ~21 MHz に低下しました。 1.2).

libopus 1.2 による Opus の継続的な開発は非常に興味深いものであり、時間の経過とともに Opus の採用が増えていくことを期待しています。 ロイヤリティフリーのコーデックは、オープンで相互運用可能なインターネットの開発に不可欠です。 特許で制約されたコーデックは、さまざまな重大な問題に頻繁に遭遇するため、すべてのデバイスに実装できる唯一のコーデックです。 一部で要求されている法外なライセンス料を払いたくないコンテンツディストリビューターやストリーミングサービスから、頻繁に利用されるオープンソースソフトウェアまで、 ユーザーに代わって適切なライセンスを保証できない、あるいはソフトウェアさえも、独自のライセンスに違反することなく統合することが完全に不可能である 条項。 特許で妨げられたコーデックに関するこれらの問題は、異なるグループが作成したり、作成したりするため、コラボレーションではなく断片化を引き起こします。 コーデックの特許によって妨げられるライセンス料やその他のさまざまな問題を回避するために、独自のコーデックを実装する 持ってくる。 その結果、グループが特定のブラウザ、オペレーティング システム、またはその両方を必要とする独自のコーデックを作成することになります。 使用するハードウェアが制限され、多数のユーザーが特定のハードウェアを使用できないように完全にロックされる可能性があります。 コンテンツ。 真にユニバーサルなコーデックが出現する唯一の方法は、ロイヤリティフリーで、広く普及することです。 使用されているいくつかのコーデックは、すべてのユーザーがあらゆるものにアクセスできる健全なインターネットにとって不可欠です。 コンテンツ。 オープンスタンダードは、市場全体で一貫したユーザーエクスペリエンスを保証する唯一の方法であり、ロイヤルティフリーのオプションが最良のオプションである場合、それは素晴らしいことです。