Интервью: Qualcomm о Kryo 485 и Hexagon 690 на Snapdragon 855

Трэвис Ланье из Qualcomm дал интервью XDA о процессоре Kryo 485 в мобильной платформе Snapdragon 855 и маркетинге Hexagon 690 DSP.

В прошлом месяце Qualcomm представила Мобильная платформа Snapdragon 855. Snapdragon 855 — это мобильная платформа, которая будет использоваться в большинстве флагманских смартфонов Android в 2019 году. Qualcomm из года в год добилась существенных улучшений в своей мобильной платформе следующего поколения. Мобильная платформа Snapdragon 855 построена по 7-нм производственному процессу и обеспечивает впечатляющий прирост производительности процессора на 45% по сравнению со Snapdragon 845. Улучшения в вычислениях по всем направлениям позволяют Qualcomm похвастаться превосходной производительностью искусственного интеллекта на новом Snapdragon 855. Здесь много информации, которую нужно раскрыть, и мы сделали все возможное, чтобы ее показать. как Qualcomm улучшила производительность и искусственный интеллект на Snapdragon 855. Однако после презентации продукта у нас все еще оставались вопросы, поэтому мы поговорили с Трэвисом Ланье, старшим Директор по управлению продуктами Qualcomm расскажет о процессоре Kryo 485 и искусственном интеллекте в новом мобильном телефоне Qualcomm. Платформа.

Марио Серраферо: «45% [прыжок] — это самый большой результат за всю историю. Давайте развернем это. У нас есть база A76, 7 нм — это большой вклад. Похоже, что с тех пор, как вы, ребята, отошли от кастомных ядер, некоторые публикации и аудитории понятия не имею, что влечет за собой лицензия «Построено на ARM» с точки зрения того, что она может разрешить. Вам делать. Вы [тоже] довольно скрывали, что это влечет за собой. Сейчас вы впервые на сцене, по крайней мере, за пределами вопросов и ответов... но впервые вы показали, какие улучшения были, и это круто. Поэтому нам было интересно, не хотите ли вы подробно рассказать о том, как Qualcomm настроила Kryo 485, чтобы выжать больше из База ARM, будь то расширение того, что вы там раскрыли, или что-то, чего вы не представили».

Трэвис Ланье: «Поэтому я не могу сказать больше, чем то, что было на моих слайдах. Возможно, в будущем мы сможем это сделать, чтобы сесть и найти экспертов, которые действительно выполнили работу; Я знаю тезисы для разговоров на высоком уровне. Но, как известно, А76 — это уже дизайн высокого уровня, он довольно хорош. И это одна из причин, по которой мы увидели дорожную карту ARM. Я такой: ладно, может, нам стоит поработать с этими ребятами более тесно, потому что они выглядели очень сильными. И просто возвращаюсь к вашему комментарию о настройке по сравнению с ARM. Так что ладно, есть все, что вы можете сделать. А если вы что-то делаете, то это должно быть дифференцировано, чтобы вы могли сделать что-то на сто процентов или сотрудничать с ними. И [как и в] предыдущие годы, мы больше занимаемся интеграцией. Итак, шины и то, как мы подключались к системе, их функции безопасности, которые мы встраиваем в процессоры, конфигурации кэша. Теперь, когда взаимодействие продлилось дольше, мы смогли провести более глубокую настройку. И именно так мы смогли поместить туда некоторые из этих вещей, например, большие окна выполнения [не по порядку], так, чтобы у вас было больше инструкции в полете, предварительная выборка данных на самом деле является одной из областей, в которых происходит больше всего инноваций в микропроцессорной промышленности. прямо сейчас. Многие методы для многих из этих вещей очень похожи, в настоящее время все используют предсказатель ветвления TAGE, насколько велики вы его выделяете, люди знают, как это делать вне очереди, пересылку и все такое для больших кешей. Но предварительная загрузка, ее еще много, это одна из тех вещей в стиле темного искусства. Так что в этой области все еще происходит много инноваций. Мы чувствовали, что можем помочь с этим.

И потом только потому, что мы чувствуем, что обычно лучше справляемся с... обычно мы можем реализовать проект быстрее, чем другие могут интегрировать узел процесса. И поэтому, когда мы добавляем туда некоторые из этих вещей, например, когда вы выходите из строя, это создает дополнительную нагрузку на ваш дизайн, верно? Добавлять туда все эти элементы исполнения не бесплатно. Итак, чтобы иметь возможность сделать это и не нанести удар по вашему fмакс. Да, это часть нашего взаимодействия с ARM, например, как вы их реализуете?»

Марио Серраферо: «Просто из любопытства в презентации вы говорили о грядущем повышении эффективности. Судя по предварительной выборке, вы говорили об энергоэффективности, повышении производительности и немного о чем-то оба?"

Трэвис Ланье: "Все выше. Итак, по своей природе мы выполняем предварительную выборку — вы извлекаете данные из кеша. Итак, когда у вас кеш не выполняет столько обращений к памяти, у предварительной выборки есть обратная сторона: если вы выполняете слишком много предварительной выборки, вы [используете] больше памяти, потому что вы знаете, [вы] делаете слишком много спекулятивной предварительной выборки, но если у вас есть что-то и вы извлекаете правильные данные, то вы не будете обращаться к памяти, чтобы вставить их. там. Поэтому, если у вас есть более эффективный модуль предварительной выборки, вы экономите электроэнергию и повышаете производительность».

Марио Серраферо: «Ладно, круто, да. Да, я не ожидал, что ты сможешь выйти за рамки этого, но интересно, если ты так скажешь теперь вы, ребята, настраиваете больше, и, возможно, вы сможете поделиться больше в будущем, тогда я буду следить за этим. Итак, другой тип головорезов, по крайней мере среди людей, которые меня окружают, — это главное ядро. Таким образом, мы ожидали более гибких кластерных схем в течение нескольких лет с включением DynamIQ и что мы ожидали, что другие компании отойдут от схемы 4 + 4. Итак, два вопроса: каков был мотив создания основного ядра? Как основное ядро улучшает взаимодействие с пользователем, ведь наши читатели хотели бы знать, почему здесь только одно ядро, а также почему это не совсем одиночное ядро? Не приведет ли совместное использование уровня электропитания с кластером производительности к уменьшению некоторых преимуществ, которые вы могли бы получить, если бы использовали DynamIQ и сидели бы [он] сам по себе?»

Трэвис Ланье: «Итак, давайте сначала поговорим о разных тактовых частотах и разных плоскостях напряжения. Таким образом, каждый раз, когда вы добавляете часы и каждый раз, когда вы добавляете напряжение, это стоит денег. Таким образом, существует ограничение на количество контактов, которые вы помещаете в корпус, вам нужно иметь больше PLL для разных тактовых импульсов, и это просто увеличивает сложность. Так что есть компромисс в том, чтобы что-то делать. В какой-то момент мы пошли на крайние меры; у нас было четыре разных домена на четырех разных часах, поэтому у нас был опыт в этом, и это было дорого. Типа того, когда начинаешь добиваться больших успехов. МАЛЕНЬКИЙ, у вас есть небольшие ядра в небольшом кластере, и им не совсем нужна такая же степень детализации, так сказать, отдельных тактовых импульсов между небольшими ядрами. Да, это как бы витает в воздухе, что с ними делать. Итак, когда у вас есть большой. МАЛЕНЬКАЯ система, то, наоборот, у вас есть большие ядра. Ну, ладно, ты поместишь каждую из них на большие часы? Что ж, вы не будете работать на них все время, если вы на самом деле находитесь в достаточно низкой ситуации, когда незанятые часы все равно будут работать на небольшом ядре. Так что на самом деле, их двоих вполне достаточно.

И затем вы попадаете туда, где у нас было это основное ядро, где, ладно, ну, у нас есть отдельное тактовое ядро, которое может работать на более высокой частоте. Но эти другие ядра, другие кластеры производительности не могут работать на такой же высокой частоте. Итак, если вы хотите получить полное право на это ядро, вам нужно иметь для него третью тактовую частоту. Так что же делает это ядро? Мы немного этого коснулись. Важными моментами станут запуск приложений и просмотр веб-страниц. И так почему только одно ядро? Хорошо, теперь все становится более многопоточным. Например, игровые движки — я вернусь к этому через секунду — очень агрессивно стремятся к большему количеству потоков. Но если вы посмотрите на большинство приложений, даже если они имеют несколько потоков, я буду использовать правило Парето, как и большинство из них, 80% нагрузки приходится на один поток. Таким образом, вы можете запустить приложение, и оно может запуститься и загореться на всех 8 ядрах. Но более чем вероятно, что 80% из них находится в одном доминирующем потоке — в этом одном ядре. Просмотр веб-страниц по-прежнему в первую очередь, ну, я бы сказал, JavaScript: просмотр веб-страниц стал немного лучше благодаря многопоточности, где вы можете иметь несколько изображений и декодировать их. Но, например, JavaScript — один поток будет выполняться на одном ядре. Таким образом, существует большое количество вариантов использования, которые выиграют от наличия этого одного ядра, которое будет действительно высокопроизводительным.

Теперь у нас есть три ядра, которые работают немного на более низкой частоте, но они также более энергоэффективны. И так, всякий раз, когда вы — я не знаю, насколько много вы знаете о реализации ядер — но всякий раз, когда вы начинаете достигать максимальной частоты, и реализации этих ядер, есть компромисс в мощности, все становится экспоненциально в тех последних нескольких мегагерцах или гигагерцах, которые вы иметь. Да, и я говорил об этом секунду назад, когда, эй, все игры начинают становиться многопоточными, как и все вдруг, если оглянуться назад, не так давно было пару игр, и они используют только одну нить. Но странно, как быстро может измениться индустрия. Как и в последние год-полтора, они буквально начали вставлять все эти игры в… Я был в восторге от этих игр с высоким качеством воспроизведения. И поэтому, хотя многие вещи, как и шесть месяцев или год назад, фактически перевернулись по всему Китаю. В Китае я слышу: «Меня не волнуют большие ядра, дайте мне восьмерку чего угодно, дайте мне восемь ядер». наименьшие ядра, чтобы у меня было восемь ядер». Они изменились, потому что им нужны эти игры, эти игры требуют большие ядра. И теперь мы получаем отзывы от партнеров: «Нет, на самом деле нам нужно четыре больших ядра» из-за всех новых продвинутых игр, которые выходят. И они собираются использовать все эти ядра.

Итак, когда вы играете, вы играете не 30 секунд или 5 минут, а дольше. Итак, это имеет смысл, у нас есть эти три других ядра в большинстве случаев использования многопоточных больших ядер, они хотят иметь немного большую энергоэффективность. Это как бы уравновешивает то, что у вас есть ядро с более высокой производительностью, когда оно вам нужно для некоторых из этих задач в некоторых случаях. из этих устойчивых случаев, когда у них также есть большие ядра, и у вас есть более энергоэффективное решение в сочетании с что. Это своего рода мышление — это своего рода необычная симметрия. Но, надеюсь, это ответит на вопрос, почему [есть] основное ядро, почему у вас нет отдельных тактовых импульсов и почему у вас нет отдельных напряжений? И поэтому я думаю, что затронул все это».

Конфигурация ядра процессора Kryo 485. Источник: Qualcomm.

Марио Серраферо: «Теперь гетерогенные вычисления. Именно на этом настаивает Qualcomm с момента перехода от старого брендинга к мобильной платформе. и такого рода дескриптор [a], а также агрегирующие блоки для описания определенных показателей производительности, таких как ИИ. Какова была эта эволюция при переходе на более гетерогенный вычислительный подход? Где угодно, от дизайна до реализации и маркетинга, или всего, чего вы можете коснуться».

Трэвис Ланье: «Это идет немного вперед и назад. Но, в конце концов, вам нужны эти движки, потому что главное в мобильных устройствах — энергоэффективность. Теперь вы иногда видите, как время от времени он возвращается к обобщению. Если вернуться к исходной версии, то даже для смартфонов у обычных телефонов были мультимедиа и камера. возможности в некоторой степени, и поэтому у них есть все эти маленькие специальные вещи, потому что вы не могли сделай это. Если вы вернетесь к телефонам, построенным на ARM 9 или ARM 7, у них всех был виджет аппаратного ускорения для всего.

Но приведу вам пример, когда что-то пошло не так, а теперь они снова просят оборудование, это будет JPEG. Раньше был ускоритель JPEG. Процессор в конечном итоге стал достаточно хорошим и достаточно энергоэффективным, а файлы JPEG как бы остались такого же размера, эй, знаете что, мы просто продолжим и сделаем это на процессоре, [поскольку] это проще сделать это. Теперь, когда изображения становятся все больше и больше, внезапно люди начинают, знаете ли, на самом деле, я хочу, чтобы эти действительно гигантские размеры файлов фотографий были ускорены. Процессоры либо недостаточно быстры, либо потребляют слишком много энергии. Просто внезапно появился интерес к потенциальному использованию ускорителей JPEG снова. Так что не всегда все идет по прямой линии, тогда вам нужно посмотреть, что происходит сейчас с законом Мура. Все продолжают говорить: эй, может, ты и не умер, но процесс немного замедляется, верно? Итак, если вы не получаете такого прироста мощности или прироста производительности от каждого следующего узла, как вы продолжите добавлять в телефон больше функциональности, если у вас нет таких накладных расходов? Таким образом, вы можете просто поместить его в процессор. Но если у вас недостаточно места для вашего процессора, как вы можете ускорить эти процессы? Что ж, ответ в том, что вы используете все эти специализированные ядра и тому подобное более эффективно. И это естественное напряжение.

Вы увидите, как людей заставляют делать эти вещи для выполнения общих функций, поскольку, возможно, не все будут в курсе последних событий. Но мы, конечно, постараемся оставаться там как можно дольше, но мы не можем заставить фабрики перейти на следующий узел, если его там нет обязательно. Вот почему вам необходимо сосредоточиться на постоянных инновациях и этих архитектурах, чтобы продолжать повышать производительность и энергоэффективность. В этом наша сила и наше прошлое».

Марио Серраферо: «Несмотря на то, что Qualcomm сделал переход к гетерогенным вычислениям, многие аудитории и, конечно, многие публикации, безусловно, Удивительно, но многие энтузиасты, которые, по вашему мнению, знают лучше, все еще думают, рассматривают и оценивают блоки как отдельные сущности. Они по-прежнему сосредоточены на следующем: «Я хочу видеть количество процессоров, потому что меня это волнует». Они хотят видеть цифры графического процессора, потому что им нравятся игры и так далее и тому подобное. Они не рассматривают их как сообщающиеся части одного целостного продукта. Как, по вашему мнению, Qualcomm имеет, есть и может разрушить эту парадигму, поскольку конкуренты фактически продолжают концентрироваться на конкретных, поэтапных улучшениях в маркетинге? В частности, [мы] перейдем к нейронным сетям и нейронным движкам позже».

Трэвис Ланье: «Надеюсь, я сегодня коснулся этой темы. Мы фокусируемся, например, на продолжительных играх, так что, возможно, вы получите хорошие результаты по всем игровым тестам. Люди становятся одержимыми этим. Но на самом деле важно то, что если вы играете в свою игру, остается ли количество кадров в секунду стабильно таким, каким вы хотите, чтобы оно было на самом высоком уровне для этих вещей? Я думаю, что люди придают слишком большое значение числу одного из этих блоков. Это так сложно, и я понимаю это желание дать мне один номер, который подскажет мне, что лучше. Это так удобно, особенно в сфере искусственного интеллекта сейчас, это просто безумие. Что измеряет тест процессора даже при использовании тестов процессора? Все они измеряют разные вещи. Возьмите любой из тестов, например, в GeekBench есть куча подкомпонентов. Видели ли вы, чтобы кто-нибудь когда-нибудь разрывался на части и выяснял, какой из этих подкомпонентов наиболее важен для того, что я на самом деле делаю?»

Марио Серраферо: «Иногда да».

Трэвис Ланье: «Может быть, ребята, да. Ребята, вы как изгои. Но, может быть, один процессор лучше в этом, а может быть, другой лучше в другом. То же самое и со SPEC, люди будут выделять один SPEC, ну ладно, внутри него много разных рабочих нагрузок. И это довольно жесткие вещи, но даже SPEC, который мы на самом деле используем для разработки процессоров, если вы посмотрите на реальные рабочие нагрузки, действительно ли они актуальны? Это отлично подходит для сравнения рабочих нагрузок на рабочих станциях, но действительно ли я занимаюсь молекулярным моделированием на своем телефоне? Нет. Но опять же, я хочу сказать, что большинство этих тестов в некотором роде полезны, но вы должны понимать контекст того, для чего [это] и как вы этого достигаете. И поэтому действительно сложно свести вещи к одной цифре.

И я особенно это вижу — я здесь немного поворачиваюсь — но я вижу это с ИИ прямо сейчас, это безумие. Я вижу, что есть несколько разных вещей, которые не получили бы одного номера для ИИ. Итак, сколько бы я ни говорил о процессоре, у вас есть все эти разные рабочие нагрузки, и вы пытаетесь получить одно число. Господи, АИ. Существует так много разных нейронных сетей и так много разных рабочих нагрузок. Вы запускаете его с плавающей запятой, запускаете ли вы его с точностью до 8 или 16 бит? И вот что произошло: я вижу, как люди пытаются создавать эти вещи, и мы выбрали эту рабочую нагрузку и сделали ее в с плавающей запятой, и мы собираемся взвешивать 50% наших тестов в этой сети и два других теста, и мы будем взвешивать их по этот. Хорошо, а кто-нибудь вообще использует эту конкретную рабочую нагрузку в этой сети? Есть реальные приложения? Искусственный интеллект интересен тем, что он развивается очень быстро. Все, что я вам скажу, вероятно, через месяц или два окажется неверным. Вот что в этом крутого, потому что оно так сильно меняется.

Но самое главное в ИИ не аппаратное обеспечение, а программное обеспечение. Потому что все этим пользуются, например, я использую эту нейронную сеть. По сути, там есть все эти множители. Вы оптимизировали эту конкретную нейронную сеть? Итак, вы оптимизировали тот, который используется для эталонного теста, или вы оптимизируете тот, который некоторые люди говорят, вы знаете, я создал тест, измеряющий суперразрешение, это тест на суперразрешение ИИ. Ну, они используют эту сеть и, возможно, сделали это с плавающей запятой. Но у каждого партнера, с которым мы сотрудничаем, нам удавалось сделать это либо на 16-битной, либо на 8-битной версии, используя другую сеть. Означает ли это, что мы не очень хороши в суперразрешении, потому что эта работа не соответствует этому? Итак, единственное, что я хочу сказать, это то, что бенчмаркинг ИИ действительно сложен. Вы думаете, что процессор и графический процессор — это сложно? ИИ просто сумасшедший».

Марио Серраферо: «Да, существует слишком много типов сетей, слишком много параметризаций — разная параметризация приводит к разным последствиям в том, как она вычисляется».

Трэвис Ланье: «Это займет рецензентов».

Марио Серраферо: «Но, например, если вы хотите измерить весь спектр вещей, это намного сложнее. Но да, никто этого не делает».

Мишаал Рахман: «Вот почему вы, ребята, больше сосредотачиваетесь на вариантах использования».

Трэвис Ланье: «Я думаю, что, в конце концов, как только вы покажете варианты использования, вы поймете, насколько хорош ваш ИИ прямо сейчас. Все сводится к программному обеспечению, я думаю, через несколько лет оно станет более зрелым. Но прямо сейчас нужно проделать так много работы над программным обеспечением, а затем изменения типа: «Хорошо, ну, эта сеть горячая, а потом например, в следующем году: «О, нет, мы нашли новую сеть, которая более эффективна во всех этих вещах», и тогда вам придется переделывать программное обеспечение. Это довольно безумно».

Марио Серраферо: «Говоря о NN, вы как бы сделали за меня переход, менее неловкое мышление о переходе за меня. Переходим к шестиугольнику. Это своего рода один из компонентов, который наименее понятен, я бы сказал, потребителям, даже большинству энтузиастов, и уж точно моим коллегам. Знаете, особенно учитывая, что он был представлен не как блок искусственного интеллекта, а как всякая идея цифровой обработки сигналов, знаете, когда вы что-то вводите эта оригинальная идея как бы прилипает, так что если вы что-то делаете, окей, это нейронная вещь с нейронным, нейронным, нейронным интеллектом мозга, она как бы прилипает к люди. У них есть ярлыки «нейронное, нейронное, нейронное машинное обучение ИИ» для других решений. Поэтому мы хотим, возможно, дать вам возможность объяснить эволюцию Hexagon DSP, почему вы не отошли от этого. своего рода инженерно-звучащие названия, такие как Hexagon DSP, векторные расширения и т. д., которые не похожи на маркетинг. дружелюбно. Но да, это, может быть, краткое изложение того, как вам, на переднем крае цифровой обработки изображений, пришлось увидеть, как она прошла путь от начала обработки изображений до совершенно нового тензорного ускорителя».

Трэвис Ланье: «На самом деле это интересный момент, потому что у некоторых наших конкурентов действительно есть что-то, что они называют нейронным двигателем или нейронным ускорителем — на самом деле это DSP, это одно и то же. Так что я думаю, название важно, но вы затронули важный момент, и, честно говоря, когда мы это публиковали, оно было предназначено для обработки изображений, мы просто поддерживали 8-битную версию. И я помню, как мы выступали на Hot Chips, и Пит Уорден из Google как бы выследил нас и сказал: «Эй, вы… так вы, ребята, поддерживаете 8-битную систему, да?» Да, мы делаем. И вот оттуда мы сразу же вышли и подумали: эй, у нас есть все [эти] проекты. Именно тогда мы пошли и портировали TensorFlow на Hexagon, потому что у нас есть такой 8-битный векторный процессор с поддержкой для этого, и он был на нашем Hexagon DSP. Если бы мне пришлось проходить все заново, я бы, наверное, назвал это процессором нейронных сигналов Hexagon. И у нас все еще есть другой DSP, у нас есть скалярные DSP, и это DSP в прямом смысле этого слова. И тогда мы называем этот вид векторного DSP. Может быть, нам следует переименовать его, может быть, нам следует назвать его процессором нейронных сигналов, потому что мы, вероятно, не придаем себе такого большого значения, как мы должен для этого, потому что, как я уже сказал, у некоторых людей просто есть векторные DSP, и они называют это как угодно, и они ничего не раскрыли это. Я ответил на ваш вопрос?»

Обзор шестигранника 690. Источник: Qualcomm.

Марио Серраферо: «Так что да, это правда, вероятно, по большей части».

Трэвис Ланье: «Какой был второй вопрос?»

Марио Серраферо: «Именно то, как вы видели такое развитие внутри компании. На что это было похоже: опыт, трудности, вызовы, о чем вы хотите нам рассказать? Как вы увидели эволюцию от обработки изображений до тензорного ускорителя?»

Трэвис Ланье: «Это меня немного расстраивает, потому что меня съеживает то, как будто некоторые представители прессы поднимают руки и говорят: «Qualcomm, чего ты так отстаешь! Почему ты этого не сделал? Когда ты собираешься стать специализированным процессором нейронных сигналов? и я просто хочу, чтобы мне стучали по голове. Я подумал, что мы были первыми, у кого появился векторный процессор! Но, тем не менее, мы отредактируем это, и, вероятно, по мере того, как мы узнаем больше об ИИ, будет еще больше вещей. Итак, мы добавили еще одну штуку, и да, вот эта — она занимается только искусственным интеллектом, но не обрабатывает изображения как часть шестиугольного комплекса, поэтому вы предлагаете… поскольку мы до сих пор называем его Hexagon DSP, мы называем весь комплекс процессором Hexagon, [чтобы] попытаться получить захваченное имя для всего шестиугольника. сейчас. Мы добавили что-то, что на самом деле [является] более прямым вычислением, я не должен говорить прямым вычислением, например имеет автоматическое управление тем, как вы делаете эту карту более высокого порядка, где вы умножаете матрицы».

Марио Серраферо: «Мне на самом деле довольно сложно усвоить тензоры. В любом случае, они как будто тоже обволакивают себя».

Трэвис Ланье: «Да, я подумал, я посещал уроки линейной алгебры в колледже. Я сделал это как мужчина: «Надеюсь, мне никогда больше не придется этого делать!» И они вернулись с удвоенной силой. Наверное, я подумал: «О боже, дифференциальные уравнения и линейная алгебра вернулись с удвоенной силой!»»

Марио Серраферо: "Я чувствую, что многие мои коллеги этого не поняли. Они до сих пор думают, что у NPU есть этот загадочный аспект, когда это всего лишь набор матричных умножений, скалярных произведений, функций нелинейности, сверток и так далее. И лично я не думаю, что такое название механизма нейронной обработки помогает, но в этом-то и дело, верно? Насколько это не расширяется, не запутывается, не перелопачивается лежащая в основе математика соглашениями об именах, и что, возможно, можно сделать? Я не знаю, думали ли вы об этом. [Что] можно сделать, чтобы информировать людей о том, как это работает? Чем это не похоже на то, почему, например, DSP может делать то же, что и другие новые механизмы нейронной обработки? Я имею в виду, это всего лишь математика, но, похоже, пользователи, читатели, некоторые журналисты этого не понимают. Что можно — я не говорю, что это обязанность Qualcomm — но что, по вашему мнению, можно было бы сделать по-другому? Наверное, это моя ответственность».

Трэвис Ланье: «Честно говоря, я начинаю сдаваться. Возможно, нам просто нужно назвать вещи «нейронными». Мы только что говорили о том, как линейная алгебра и дифференциальные уравнения закружили нам голову, когда мы начали рассматривать эти вещи, и поэтому, когда вы начинаете пытаться объяснить это людям, например, когда вы начинаете проводить регрессионный анализ, вы смотрите на уравнения и прочее, головы людей взорваться. Вы можете научить большинство людей основам программирования, но когда вы начнете учить их тому, как работают уравнения обратного распространения ошибки, они посмотрят на это и у них взорвется голова. Так что да, забавная штука. Они не хотят видеть частные производные…»

Марио Серраферо: «Цепочки частных производных не по скалярам, а по векторам, включая нелинейные функции».

Трэвис Ланье: "Удачи с этим! Да, это сложно, и я не уверен, что большинство людей хотят об этом знать. Но я стараюсь: я добавляю что-нибудь вроде: «Эй, все, что мы здесь делаем, — это векторная математика. У нас есть векторный процессор». И я думаю, что люди смотрят на это и говорят: «Хорошо, чувак, мне действительно нужна нейронная сеть». ускоритель». «Тензор» по-прежнему является математическим, но я думаю, что люди могут больше ассоциировать его с ИИ. обработка."

Марио Серраферо: «Может быть, это похоже на преодоление разрыва, смыслового разрыва».

Трэвис Ланье: «В конце концов, я думаю, всё свелось к тому, что нам, наверное, просто придётся придумать другое название».

Все графики в этой статье взяты из презентации Трэвиса Ланье на Snapdragon Tech Summit. Вы можете просмотреть слайды презентации здесь.