インタビュー: Snapdragon 855 の Kryo 485 と Hexagon 690 についてのクアルコム

Qualcomm の Travis Lanier 氏は、Snapdragon 855 モバイル プラットフォームの Kryo 485 CPU と Hexagon 690 DSP のマーケティングについて XDA とのインタビューに応じました。

先月、クアルコムは Snapdragon 855 モバイル プラットフォーム. Snapdragon 855 は、2019 年にほとんどの Android フラッグシップ スマートフォンに搭載されるモバイル プラットフォームです。 クアルコムは、次世代モバイル プラットフォームで毎年大幅な改善を行ってきました。 Snapdragon 855 モバイル プラットフォームは 7nm 製造プロセスに基づいて構築されており、Snapdragon 845 と比較して CPU パフォーマンスが 45% 向上するという驚異的な性能を発揮します。 全体的な計算能力の向上により、クアルコムは新しい Snapdragon 855 で優れた AI パフォーマンスを誇ることができます。 ここには明らかにすべき情報がたくさんありますが、私たちは全力を尽くしてご紹介しました。 クアルコムはどのようにパフォーマンスと AI を向上させたのか Snapdragon 855で。 しかし、製品の発表後もまだ疑問が残っていたため、シニアの Travis Lanier 氏に話を聞きました。 クアルコムの製品管理ディレクターがクアルコムの新しいモバイルの Kryo 485 CPU と AI について語る プラットホーム。


マリオ・セラフェロ: 「45%(ジャンプ)、これは史上最大のようだ。 それを解き明かしてみましょう。 A76 ベースの 7nm があり、これらが大きく貢献しています。 皆さんがカスタムコアから離れて以来、一部の出版物や読者がいるようです。 Built on ARM ライセンスで何が許可されるのかについては、あまり手がかりがありませんでした。 あなたがやるべきこと。 あなたはそれが何を意味するかについてかなり秘密にしてきました。 今、あなたは、少なくとも質疑応答を超えて、初めてのステージに立っています...しかし、初めて、いくつかの改善点を示しました。それは素晴らしいことです。 そこで私たちは、クアルコムが Kryo 485 をどのように調整して、より多くの情報を絞り出すかについて詳しく説明していただけないかと考えていました。 ARMの拠点それは、あなたがそこで公開したものを拡張するものであっても、あなたが提示していないものであっても。」

トラビス・ラニアー: 「ですから、スライドに記載されている内容以外にはあまり多くを語ることはできません。 おそらく将来的には、実際に作業を行った専門家を招いて座ることができるでしょう。 私は高度な話の要点を知っています。 しかしご存知のとおり、A76 はすでに高度な設計になっており、かなり優れています。 そして、それが ARM のロードマップを見た理由の 1 つです。 それで、私は、分かった、彼らともっと緊密に協力するべきかもしれない、と思った、なぜなら彼らは非常に強そうだったから。 カスタマイズと ARM についてのコメントに戻りましょう。 それで、あなたができることはすべてあります。 そして、あなたが何かをしていて、差別化が必要な場合は、100%何かを行うか、彼らと提携することができます。 そして、昨年と同様に、私たちは統合についてもう少し取り組んでいます。 つまり、バス、システムへの接続方法、CPU に組み込まれたバスのセキュリティ機能、キャッシュ構成です。 エンゲージメントが長期化したので、今回はさらに深いカスタマイズを行うことができました。 このようにして、より大きな [順不同] 実行ウィンドウなどのいくつかをそこに配置することができたので、より多くの処理を行うことができます。 実行中の命令、データのプリフェッチは、実際にはマイクロプロセッサ業界で最も革新が起こっている分野の 1 つです。 今すぐ。 これらの多くのテクニックの多くは非常に似ており、最近では誰もが TAGE 分岐予測子を使用しています。 どれだけ大きなキャッシュをプロビジョニングするかに関係なく、人々はアウトオブオーダーや転送など、より大きなキャッシュを実現する方法を知っています。 しかし、プリフェッチにはまだたくさんのものがあり、それはダークアートタイプのものの 1 つです。 したがって、その分野ではまだ多くの革新が起こっています。 ですから、それは私たちがお手伝いできると感じたことです。

そして、私たちが一般的により良い仕事ができると感じているからといって... 通常、私たちは他の人がプロセス ノードを統合するよりも早く設計を実装できます。 したがって、これらのことをそこに組み込むと、たとえば、順序がさらに狂う場合には、デザインにさらにストレスがかかります。 これらすべての実行機能をそこに追加するのは無料ではありません。 それで、それができるようになり、あなたの打撃を受けないようにするためには、 fmax. そうですね、それは私たちがARMと行っている取り組みの一部です、どうやって彼らを成功させるのですか?」

マリオ・セラフェロ: 「ちょっと興味があるのですが、プレゼンテーションで、今後の効率改善について話していましたね」 プリフェッチから、電力効率、パフォーマンスの向上、その他のことについて話していましたか? 両方?"

トラビス・ラニアー: "上記のすべて。 したがって、本質的に、プリフェッチを行っているのです。つまり、キャッシュ内の内容を取得したことになります。 したがって、キャッシュがそれほど多くのメモリ アクセスを行わない場合、プリフェッチには裏返しがあります。つまり、プリフェッチをやりすぎると、より多くのメモリが使用されることになります。 推測的なプリフェッチをしすぎていますが、データが入っていて正しいものを取り込んでいる限り、それを取り込むためにメモリにアクセスすることはありません。 そこには。 したがって、より効率的なプリフェッチャーがあれば、電力が節約され、パフォーマンスが向上します。」

マリオ・セラフェロ: 「分かった、クール、そうだね。 そうですね、それ以上の展開ができるとは思っていませんでしたが、そう言われてみると面白いですね。 現在、皆さんはさらにカスタマイズを進めており、将来的にはさらに多くのことを共有できるようになるかもしれないので、私はそれに注目していきたいと思います。 つまり、少なくとも私の周りにいる人々の間では、別の種類の注目を集める人が主要なコアです。 そのため、私たちは数年前から DynamIQ の導入により、より柔軟なクラスター配置を期待しており、他の企業が 4+4 配置から離れていくことを期待していました。 そこで 2 つの質問があります。プライム コアの背後にある動機は何ですか? プライム コアはユーザー エクスペリエンスにどのようなメリットをもたらしますか。読者は、なぜそこに単独のコアがあるのか​​、また、なぜ完全に単独のコアではないのかを知りたいと考えているからです。 電源プレーンをパフォーマンス クラスターと共有すると、DynamIQ を単独で使用している場合に得られるユーティリティの一部が軽減されるのではありませんか?」

トラビス・ラニアー: 「それでは、まずさまざまなクロックとさまざまな電圧プレーンについて話しましょう。 したがって、クロックを追加するたび、電圧を追加するたびにコストがかかります。 そのため、パッケージに配置するピンの数には制限があり、さまざまなクロックに対してより多くの PLL が必要となり、複雑さが増すだけです。 したがって、物事を行うことにはトレードオフがあります。 私たちはある時点で極端な方向に進みました。 私たちは 4 つの異なるクロックに 4 つの異なるドメインを持っていたので、その経験はありましたが、費用がかかりました。 大きくなり始めたときのようなもの。 リトル、小さなクラスター上に小さなコアがありますが、それらは、いわば、小さなコア間の別個のクロックと同じ粒度をまったく必要としません。 はい、それらをどうするかは未定です。 それで、あなたが大きなものを持っているとき。 小さなシステムであれば、逆に、これらの大きなコアがあります。 そうですね、それぞれを大きな時計の上に置きますか? まあ、実際に占有されていないクロックがいずれにしても小さなコアで実行される十分に低い状況にある場合は、常にそれらで実行しているわけではありません。 だから実際のところ、彼らのうちの2人はそれで十分です。

そして、この主要なコアがあった場所に到達します。ここには、より高い周波数まで動作できる別個のクロック コアがあります。 しかし、これらの他のコアや他のパフォーマンス クラスターは、同じ高い周波数まで上げることができません。 したがって、そのコアの完全な権利を取得したい場合は、そのコアの 3 番目のクロックが必要です。 では、このコアは何をするのでしょうか? それについては少し触れました。 重要なのは、アプリ ランチャーとウェブ ブラウジングです。 では、なぜコアが 1 つだけなのでしょうか? さて、現在はさらにマルチスレッド化が進んでいます。 たとえば、ゲーム エンジン (これについては後ほど説明します) は、より多くのスレッドに向けて非常に積極的に動いています。 ただし、ほとんどのアプリに複数のスレッドがある場合でも、ほとんどのアプリと同様に、負荷の 80% が 1 つのスレッドにあるというパレートの法則を使用します。 したがって、アプリを起動すると、8 つのコアすべてが起動して点灯する可能性があります。 しかし、おそらく、その 80% は 1 つの支配的なスレッド、つまりその 1 つのコアにあります。 Web ブラウジングは依然として主に JavaScript で行われていると言えます。Web ブラウジングは、複数の画像を使用してそれらをデコードできるマルチスレッドによって少し改善されました。 しかし、たとえば JavaScript では、単一のスレッドが 1 つのコア上で実行されます。 したがって、この 1 つのコアを非常に高速化することで恩恵を受けるユースケースが多数あります。

現在、3 つのコアが少し低い周波数で実行されていますが、電力効率も向上しています。 たとえば、コアの実装についてどれだけ知っているかはわかりませんが、周波数の最高点に達し始めるたびに、 これらのコアの実装には電力のトレードオフがあり、最後の数メガヘルツまたはギガヘルツで物事が指数関数的になり始めます。 持っている。 はい、それで私は 1 秒前に話しましたが、すべてのゲームがマルチスレッド化され始めています。 突然、振り返ってみると、少し前までいくつかのゲームがありましたが、それらは 1 つだけを使用していました 糸。 しかし、業界がこれほど急速に変化するのは奇妙です。 過去 1 年、1 年半と同様に、彼らは文字通りこれらすべてのゲームを投入し始めました…私はこれらの忠実度の高いゲームに興奮しています。 そのため、半年から 1 年前までは多くのことが起こっていましたが、実際には中国全土がひっくり返りました。 中国では「ビッグコアなんてどうでもいい、何でも8つあげて、8つあげて」と聞きます。 最小のコアなので 8 個のコアを搭載できます。」 彼らが変更したのは、これらのゲームが必要なためです。これらのゲームには必要なものがあります。 大きなコア。 そして今、私たちはパートナーから「いや、実際には大きなコアが 4 つ必要だ」というフィードバックを受けています。これは、すべての高度なゲームが発売されるためです。 そして、彼らはこれらすべてのコアを使用するつもりです。

つまり、ゲームをするときは 30 秒や 5 分ではなく、もっと長い時間ゲームをすることになります。 したがって、これは当然のことですが、マルチスレッドのビッグ コアのユースケースのほとんどで、これらの他の 3 つのコアが使用されており、電力効率をもう少し高めたいと考えています。 ある種のバランスが取れており、いくつかの用途で必要なときに、このより高性能なコアを使用できます。 これらの持続的なケースでは、大きなコアも搭載しており、より電力効率の高いソリューションと組み合わせることができます。 それ。 それは一種の考え方であり、少し珍しい対称性です。 しかし、これで、なぜプライムコアがあるのか​​、なぜ別々のクロックを持たないのか、なぜ別々の電圧を持たないのか、という答えが得られるといいのですが。 それで、それらすべてに触れたと思います。」

Kryo 485 CPU コア構成。 出典: クアルコム。

マリオ・セラフェロ: 「さあ、異種コンピューティングです。 これは、クアルコムが古いブランドからモバイル プラットフォームに移行して以来強調してきたことです。 およびその種の [a] 記述子、および次のような特定のパフォーマンス メトリクスを記述するブロックも集約します。 あい。 よりヘテロジニアスなコンピューティング アプローチに切り替えることで、その進化はどのようになりましたか? デザインから実行、マーケティングまで、または触れられるものなら何でも。」

トラビス・ラニアー:「少し前後します。 しかし、モバイルにおける重要な点は電力効率であるため、最終的にはこれらのエンジンが必要になります。 今では、それが時々一般化に戻るのが時々見られます。 元に戻れば、スマートフォンでも、フィーチャーフォンにはマルチメディアとカメラがありました ある程度の機能があり、これらの小さな専用の機能がすべて備わっています。 やれ。 ARM 9 または ARM 7 上に構築された携帯電話に戻ると、すべての携帯電話にはすべてのハードウェア アクセラレーション ウィジェットが搭載されていました。

しかし、例を挙げると、何かが一般化した後、再びハードウェアが求められるようになった場合、それは JPEG になります。 以前はJPEGアクセラレータがありました。 最終的に CPU は十分な性能を発揮し、電力効率も十分になり、JPEG はそのままの状態でした。 同じサイズの場合は、CPU 上で実行するほうが簡単なので、そのまま進めてみましょう。 それ。 さて、写真がますます大きくなるにつれて、突然、人々は、実際に、これらの非常に巨大な写真ファイルのサイズを高速化したいと考えています。 CPU の速度が十分でないか、消費電力が多すぎるかのどちらかです。 JPEG アクセラレータの可能性が再び注目されるようになったのは突然です。 したがって、物事がどのように進むかは必ずしも直線ではありません。その場合は、ムーアの法則で現在何が起こっているかを確認する必要があります。 みんなが「死んではいないかもしれないけど、少しずつ速度が落ちてきているんじゃないか」と話し続けています。 では、次の各ノードから電力の向上やパフォーマンスの向上が得られない場合、そのオーバーヘッドがない場合、どのようにして電話機にさらに多くの機能を搭載し続けるのでしょうか? したがって、それをCPUに置くだけで済みます。 しかし、CPU にこれ以上の余裕がない場合、どうやってこれらの処理を高速化できるでしょうか? 答えは、これらすべての特殊なコアなどをより効率的に配置することです。 それで自然な緊張感が生まれます。

おそらく誰もが最先端にいるわけではないため、一般的な業務のためにこれらのことを強いられている人々を目にするでしょう。 しかし、私たちは可能な限りそこに留まるように努めるつもりですが、必ずしもそこにない場合には、ファブを強制的に次のノードに移動させることはできません。 そのため、パフォーマンスと電力効率を向上し続けるためには、継続的なイノベーションとこれらのアーキテクチャに焦点を当てる必要があります。 それが私たちの強みであり、背景なのです。」

マリオ・セラフェロ: 「クアルコム側でヘテロジニアス コンピューティングへの移行があったにもかかわらず、多くの聴衆と確かに多くの出版物が、確かに 驚いたことに、多くの愛好家は、あなたがよく知っていると思いますが、依然としてブロックを別々のものとして考え、検討し、評価しています エンティティ。 彼らは依然として「CPU の数値が気になるので見たい」ということに重点を置いています。 彼らはゲームが好きなので GPU の数値を見たいなどと考えています。 彼らはそれらを 1 つの統合された製品の通信部分とは考えていません。 競合他社が実際にマーケティングにおける特定のブロックごとの改善に注力し続ける中、クアルコムはどのようにしてそのパラダイムを打ち破り、そして今、そして打ち砕くことができると思いますか? 具体的には、後ほどニューラル ネットワークやニューラル エンジンの話に移ります。」

トラビス・ラニアー: 「今日はそのことについて少し触れられたと思います。 たとえば、私たちは継続的なゲームに重点を置いているため、すべてのゲーム ベンチマークで良いスコアを獲得できるかもしれません。 人々はそれに夢中になります。 しかし、実際に重要なのは、ゲームをプレイしている場合、1 秒あたりのフレーム数が、これらの点で最高の値になるように一貫して維持されているかどうかです。 人々はこれらのブロックの 1 つの数字を重視しすぎていると思います。 それはとても難しいことですが、何が最善であるかを示す 1 つの数字を教えてほしいという気持ちはわかります。 それは本当に便利です、特に今のAIでは、それはただの狂気です。 CPU ベンチマークがあっても、CPU ベンチマークは何を測定するのでしょうか? それらはすべて異なるものを測定します。 GeekBench には多数のサブコンポーネントがあるなど、ベンチマークを試してみましょう。 これらのサブコンポーネントのどれが私が実際にやっていることに最も関連しているかを分解して調べた人はいますか?」

マリオ・セラフェロ: 「時々、そうします。」

トラビス・ラニアー:「もしかしたら、あなたたちもそうなのかもしれない。 君たちは異常者のようなものだ。 しかし、おそらくある CPU はこの点で優れており、ある CPU は別の CPU で優れている可能性があります。 SPEC についても同じで、人々は 1 つの SPEC を強調しますが、その中にはさまざまなワークロードが含まれています。 これらは非常に厳しいものですが、CPU の開発に実際に使用される SPEC でさえ、実際のワークロードを見てみると、実際に関連しているのでしょうか? ワークステーションのワークロードを比較するのには最適ですが、本当に携帯電話で分子モデリングを行っているのでしょうか? いいえ。しかし、繰り返しになりますが、ここで言いたいのは、これらのベンチマークのほとんどは何らかの形で役に立ちますが、その目的とそこに到達する方法のコンテキストを理解する必要があるということです。 したがって、物事を 1 つの数字に絞り込むのは非常に困難です。

そして、私は特にこれを目にします—私はここで少し方向転換しています—しかし、私は今これをAIで見ています、それはばかげています。 AI にとって 1 つの数値を取得できないものはいくつかあるようです。 CPU について話したのと同じくらい、さまざまなワークロードがあり、1 つの数値を取得しようとしています。 なんと、AIさん。 非常に多くの異なるニューラル ネットワークがあり、非常に多くの異なるワークロードがあります。 浮動小数点で実行していますか? int で実行していますか? 8 ビット精度または 16 ビット精度で実行していますか? それで何が起こったのかというと、人々がこれらのものを作成しようとしているのを見て、私たちはこのワークロードを選択し、それを実行しました 浮動小数点を使用し、この 1 つのネットワークと他の 2 つのテストにテストの 50% を重み付けします。 これ。 そうですね、そのネット上でその特定のワークロードを実際に使用している人はいますか? 実際のアプリケーションはありますか? AI が魅力的なのは、その動きが非常に速いからです。 私があなたに言うことは、おそらく 1 ~ 2 か月後には間違っているでしょう。 それがとても素晴らしいことでもあります。なぜなら、それは大きく変化しているからです。

しかし、AI で最も重要なのはハードウェアではなく、ソフトウェアです。 誰もがそれを使用しているので、たとえば、私はこのニューラルネットを使用しています。 基本的に、これらすべての乗数がそこにあります。 その特定のニューラル ネットワークを最適化しましたか? それで、ベンチマーク用に最適化したのでしょうか、それとも、一部の人が言うように最適化したのでしょうか? 超解像度を測定するベンチマークを作成しました。これは超解像度のベンチマークです あい。 そうですね、彼らはこのネットワークを使用しており、それを浮動小数点で実行している可能性があります。 しかし、私たちが関わっているすべてのパートナーは、16 ビットまたは 8 ビット、あるいはその両方で、別のネットワークを使用してそれを実行しています。 ということは、本作は超解像に対応していないので苦手ということでしょうか? つまり、私が言いたいのは、AI のベンチマークは非常に複雑だということだけです。 CPUとGPUは複雑だと思っていませんか? AIはただ狂っているだけだ。」

マリオ・セラフェロ: 「そうですね、ネットワークの種類が多すぎて、パラメータ化が多すぎます。パラメータ化が異なれば、影響やその計算方法も異なります。」

トラビス・ラニアー: 「査読者は忙しくなります。」

マリオ・セラフェロ: 「しかし、広範囲のものを測定したい場合と同様に、それははるかに困難です。 でも、そうだね、誰もやってないよ。」

ミシャール・ラーマン: 「それが、皆さんがユースケースにもっと重点を置いている理由です。」

トラビス・ラニアー: 「最終的には、ユースケースを示せば、それが現時点での AI の優れた点だと思います。 ソフトウェアに関しては、数年以内にもう少し成熟すると思います。 しかし、現時点では、やらなければならないソフトウェア作業が非常に多く、その後、「わかった、まあ、このネットワークは熱いし、その後は」というように変更されます。 来年、「ああ、違う、これらすべての点でより効率的な新しいネットワークを見つけた」というように、その場合はやり直す必要があります。 ソフトウェア。 かなりクレイジーだよ。」

マリオ・セラフェロ: 「NNと言えば、あなたは私の代わりにトランジションをしてくれたようなもので、私にとってそれほど厄介なトランジションの考え方ではありませんでした。 ヘキサゴンに移ります。 これは、消費者、ほとんどの愛好家、そして間違いなく私の同僚にも最も理解されていないコンポーネントの 1 つです。 特に、それが AI ブロックとして導入されたものではなく、デジタル信号処理のアイデア全体のようなものであることを考えると、何かを導入するときに その元のアイデアはある意味固執しているので、何かをしようとしている場合、それは神経、神経、神経の脳知性を備えた神経的なものです、それは一種の固執です 人々。 彼らは、他のソリューション用の AI 機械学習ニューラル、ニューラル、ニューラル ラベルを持っています。 そこで、Hexagon DSP の進化と、なぜそこから離れないのかを説明する機会を与えたいと思います。 Hexagon DSP、ベクトル拡張機能など、マーケティングとは思えないエンジニアリングっぽい名前 フレンドリー。 でもそうですね、DSP の最前線にいるあなたがイメージング ワークロードの始まりから最新のテンソル アクセラレータに至るまでをどのように見てきたかを簡単に要約するようなものかもしれません。」

トラビス・ラニアー: 「これは実に興味深い点です。なぜなら、競合他社の中にはニューラル エンジンまたはニューラル アクセラレータと呼ばれるものを実際に搭載しているからです。実際には DSP であり、同じものです。 名前は重要だと思いますが、重要な点に触れました。正直に言うと、これを世に出したとき、それはイメージング用であり、たまたま 8 ビットをサポートしただけです。 そして、私たちが Hot Chips でプレゼンテーションをしていたとき、Google の Pete Warden が私たちを追跡して、「おい、あなた…それで、あなたたちは 8 ビットをサポートしているんですね?」と言われたのを覚えています。 はい、そうです。 それで、そこから私たちはすぐに出かけて、「おい、これですべてのプロジェクトが進行中だ」と感じました。 私たちが TensorFlow を Hexagon に移植したのはそのときです。なぜなら、それを行うために、このような 8 ビット サポート ベクトル プロセッサが世の中にあり、それが Hexagon DSP に搭載されていたからです。 もう一度やり直さなければならないとしたら、おそらく Hexagon Neural Signal Processor と呼ぶでしょう。 そして、まだ他の DSP があり、スカラー DSP があり、それが本当の意味での DSP です。 そして、この種のベクトル DSP を私たちは呼びます。 おそらく名前を変更すべきか、ニューラルシグナルプロセッサと呼ぶべきかもしれません。なぜなら、私たちはおそらく自分自身をそれほど信用していないからです。 なぜなら、私が言ったように、一部の人々はベクトル DSP を持っているだけで、それを何と呼んでいて、何も明らかにしていないからです。 それはそうです。 私はあなたの質問に答えましたか?」

ヘキサゴン690の概要。 出典: クアルコム。

マリオ・セラフェロ: 「それで、ええ、おそらくほとんどのことは正しいです。」

トラビス・ラニアー: 「2番目の質問は何でしたか?」

マリオ・セラフェロ: 「社内でそのような展開がどのように見られたか。 それはどのようなものでしたか: 経験、困難、挑戦など、私たちに話したいことは何ですか? 画像処理の始まりからテンソル アクセラレータまでの進化をどのように見てきましたか?」

トラビス・ラニアー:「少しイライラしているのは、報道陣の何人かが手を挙げて、「クアルコム、何をそんなに遅れているんだ! なぜそうしなかったのですか? いつになったら専用の神経信号プロセッサーのようになれるのですか?」 そして私はただ頭をぶつけたいだけです。 私たちが初めてベクトルプロセッサを搭載したような気分でした。 ただし、そうは言っても、私たちはこれを編集しており、AI についてさらに学ぶにつれて、おそらく今後もさらに多くのことが起こるでしょう。 そこで、これを追加しました。そう、これは AI のみを実行し、ヘキサゴン コンプレックスの一部として画像処理を実行しないので、提供します… 私たちは今でもヘキサゴン DSP と呼んでいますが、六角形全体の名前を取得しようとして、複合体全体をヘキサゴン プロセッサと呼んでいます。 今。 実際にはもっと直接的に計算するものを追加しましたが、直接計算すると言うべきではありません。 乗算する場所の高次マップをどのように実行するかを自動的に管理します 行列。」

マリオ・セラフェロ: 「実際、テンソルについて理解するのは私にとってかなり難しいです。 とにかく、彼らも自分自身に巻き付いているようなものです。」

トラビス・ラニアー: 「そうだ、大学で線形代数の授業を受講したときはそう思った。 私は「二度とあんなことをしなくて済むといいのですが!」と同じようにそうしました。 そして彼らは復讐を持って戻ってきた。 おそらく私は、『おお、微分方程式と線形代数が復讐して戻ってきた!』と思ったと思います。」

マリオ・セラフェロ: "多くの同僚がこのことを理解していないと感じます。 彼らは、NPU が単に行列の乗算、ドット積、非線形関数、畳み込みなどの集まりである場合、NPU には不可解な側面があると今でも考えています。 個人的には、そのようなニューラル処理エンジンの名前が役立つとは思いませんが、それが問題ですよね? そのどれくらいが、命名規則によって拡張されていないか、難読化されており、基礎となる数学が掘り出されたようなものであり、おそらく何ができるのでしょうか? あなたがこれについて考えたかどうかはわかりません。 これがどのように機能するかを人々に知らせるために[何が]できるでしょうか? たとえば、他の新しいニューラル処理エンジンが実行できることを DSP が実行できるのはなぜでしょうか? つまり、これは単なる数学ですが、ユーザー、読者、一部のジャーナリストはそれを理解していないようです。 クアルコムの責任だとは言いませんが、何か別の方法でできることは何だと思いますか? それはおそらく私の責任です。」

トラビス・ラニアー:「正直に言うと、私は降参し始めています。 おそらく、物事に「ニューラル」という名前を付ける必要があるのか​​もしれません。 線形代数や微分方程式を見始めたときに、頭がくらくらするような話をしたばかりです。 それで、回帰分析を始めるときのように、それを人々に説明しようとすると、方程式などを見て、人々の頭の中を観察することになります。 爆発する。 ほとんどの人に基本的なプログラミングを教えることはできますが、逆伝播の方程式がどのように機能するかを教え始めると、彼らはそれを見て頭が爆発するでしょう。 そうですね、楽しいことです。 彼らは偏微分を見たくないのです...」

マリオ・セラフェロ: 「スカラー間ではなくベクトル間で、非線形関数を含む偏導関数の連鎖。」

トラビス・ラニアー:「それでは頑張ってください! そうですね、それは難しいですし、ほとんどの人がそれについて知りたいかどうかはわかりません。 でも、私はこうしようとします。「ここでやっていることはベクトル計算だけです。 私たちはベクトルプロセッサを持っています。」 それを見て人々はこう思うと思います。 アクセル。" 「テンソル」は依然として数学的ですが、人々はそれをもう少し AI と関連付けることができると思います 処理。"

マリオ・セラフェロ: 「ギャップ、意味上のギャップを埋めるようなものかもしれません。」

トラビス・ラニアー: 「最終的には、おそらく別の名前を考え出すしかないということになると思います。」


この記事のすべてのグラフィックは、Snapdragon Tech Summit での Travis Lanier のプレゼンテーションから引用しています。 プレゼンテーションのスライドをご覧いただけます ここ.