Как Qualcomm улучшила производительность, игры и искусственный интеллект на Snapdragon 855

Новая мобильная платформа Qualcomm Snapdragon 855 обеспечивает значительные улучшения с точки зрения производительности, игр и искусственного интеллекта, и мы расскажем, как они это сделали.

На саммите Qualcomm Snapdragon 2018 компания объявила о своем новейшем флагманском чипсете премиум-класса: платформе Snapdragon 855.. Этот новый продукт станет основой большинства флагманов 2019 года, обещая невероятную скорость передачи данных через модем Snapdragon X50. Помимо этого, Snapdragon 855 привносит множество улучшений в каждый блок системы на кристалле. некоторые вычислительные блоки демонстрируют наибольший прирост производительности и энергоэффективности в годовом исчислении за последнее время история.

Мы уже подробно описали Spectra 380 ISP-CV., например, что еще больше улучшает качество фотографий со смартфона, а также дает пользователям значительную экономию заряда батареи. Хотя мы все больше внимания уделяем периферийным компонентам, таким как Hexagon DSP, больше всего энтузиасты уделяют внимание основным блокам. внимание, а именно процессоры и графические процессоры, также увидели более чем скромный прирост благодаря архитектурным улучшениям и переходу на новый процесс. узел. В этой статье мы кратко расскажем, что нового и что известно о процессоре, графическом процессоре и DSP Snapdragon 855, а также о том, как улучшения и новые функции могут повлиять на

твой Пользовательский опыт в 2019 году.


Процессор Kryo 485 на базе A76 и переход на 7-нм техпроцесс

Snapdragon 855 переходит на новейший 7-нм производственный процесс FinFET от TSMC. Обычно мы видим пересмотр узла каждый год или два с сокращением размеров или оптимизацией в середине цикла (например, переход от «раннего режима низкого энергопотребления»). (LPE) на «Low-Power Plus» (LPP) в узлах Samsung-LSI), поэтому вы наверняка слышали об этих метриках в тех или иных новостях. статья. Но что это значит? В этом контексте он описывает размер транзисторов процессора, что, в свою очередь, подсказывает нам, какого рода улучшения плотности транзисторов мы можем ожидать с каждым новым поколением. Увеличение количества транзисторов на единицу площади позволяет увеличить производительность процессора. Эта функция также важна, поскольку меньшие технологические узлы позволяют реализовывать конструкции процессоров в меньшем масштабе, что интуитивно понятно. уменьшает пространство между элементами процессора, что, в свою очередь, сокращает расстояние, которое электроны должны пройти, чтобы достичь цели. расчет. Это приводит к повышению производительности, а более мелкие процессы также имеют меньшую емкость, а это означает, что транзисторы могут включаться и выключаться с меньшей задержкой и с меньшим энергопотреблением. Для справки: TSMC утверждает, что переход на 7-нм техпроцесс позволяет достичь производительность и энергоэффективность порядка 20% и 40% соответственно, хотя это по сравнению с собственным 10-нм техпроцессом FinFET TSMC..

В отношении последних нескольких флагманских чипсетов Snapdragon мы видели, как Qualcomm сотрудничает с Samsung и реализует их 14-нм и 10-нм техпроцесс LPP/LPE. Однако переход на 7-нм техпроцесс TSMC для Snapdragon 855 не является неожиданным, учитывая, что 7-нм техпроцесс Samsung только что поступил в серийное производство в октябре, хотя тогда сообщалось, что на нем будет построен чипсет 5G Qualcomm. Кроме того, конструкция 7LPP от Samsung изготовлена ​​с использованием усовершенствованной технологии литографии, известной как литография в крайнем ультрафиолете (EUVL). уменьшение площади на 40 % при равной сложности конструкции, увеличение скорости на 20 % или снижение энергопотребления на 50 % по сравнению с 10-нм FinFET предшественники. Каждый новый переход к более мелким узлам процесса празднуется именно потому, что их так сложно достичь. Например, по мере того, как транзисторы становятся меньше, они могут демонстрировать большую «утечку» или ток, протекающий через транзисторы, которые «выключены», увеличивая статическое энергопотребление в состояниях ожидания. И хотя чипы меньшего размера с более плотным числом транзисторов могут позволить максимально эффективно использовать данную кремниевую пластину, производительность, как правило, ниже. из-за вышеупомянутой утечки, а также трудности с получением процессоров с «более высоким уровнем бина», которые работают на своей (высокой) опорной частоте. частоты. Это просто некоторый из многих препятствий, которые, конечно, будут устранены к тому времени, когда новый технологический узел попадет в массовое производство, но в Короче говоря, существует множество проблем, связанных с исследованиями и разработками, а также производственными проблемами, которые увеличивают стоимость внедрения нового размера процесса в рынок.

Новейшая архитектура ARM A76, лицензированная для Kryo 485, является еще одним важным фактором существенных улучшений, которые мы наблюдаем в Qualcomm Snapdragon 855 из года в год. Ядро A76 — это совершенно новый, чистый дизайн, разработанный в офисах ARM в Остине, с новой микроархитектурой, созданной с нуля и обеспечивающей то, что ARM называет «производительностью класса ноутбука с эффективность мобильных устройств». Это по-прежнему полуиндивидуальный дизайн, и Qualcomm внесла такие улучшения, как оптимизированная предварительная выборка данных для повышения эффективности и более масштабное выполнение вне очереди. окно. Этот новый дизайн предлагает огромные улучшения производительности по сравнению с A75, на котором основаны золотые ядра Snapdragon 845: он обещает Улучшение производительности на 35 % и повышение энергоэффективности на 40 %. При сравнении A75, изготовленного по 10-нм техпроцессу, с A76, изготовленного по 7-нм техпроцессу, при том же диапазоне мощности 750 мВт/ядро, преимущество в производительности вырастет до 40 % в пользу нового ядра, а также может вырасти экономия энергии. до 50%. Более того, другие улучшения в конвейерах асимметричных одноинструкционных множественных данных (ASIMD) и инструкции по скалярному произведению в совокупности дает примерно 3,9-кратное улучшение производительности задач машинного обучения, таких как вывод в сверточных нейронных сетях. Все это обеспечивает лучшую в отрасли производительность на единицу площади и является отличным дополнением к новому 7-нм техпроцессу: процессор Qualcomm Prime core с тактовой частотой 2,84 ГГц приближается к эталонной тактовой частоте 3 ГГц ARM. использовал при детализации нового ядра. В целом, Qualcomm обещает невероятное повышение производительности процессора на 45% больше 845, что является самым большим приростом в годовом исчислении.

Говоря о «Prime core» Snapdragon 855, также неудивительно, что Qualcomm переходит на эту новую настройку кластера, учитывая значительные улучшения. LITTLE с поддержкой ARM ДинамИКВ технологические платформы. По сути, DynamIQ обеспечивает большую гибкость и масштабируемость при проектировании многоядерных процессоров, позволяя использовать несколько ядер в данном кластере, а также точно контролировать напряжение каждого ядра. (РЕДАКТИРОВАНИЕ: В ответах на вопросы Qualcomm подтвердила, что ядро ​​Prime разделяет свой домен мощности с кластером производительности, что ограничивает описанную здесь утилиту). A76 особенно хорошо подходит для такого одинокого ядра премиум-класса с собственной тактовой частотой, поскольку он расширяет границы возможностей, когда дело доходит до однопоточных вычислений. производительность: на 25 % больше целочисленных инструкций за такт, чем у A75, а также на 35 % выше производительность ASIMD и операций с плавающей запятой, обеспечивая при этом на 90 % выше пропускная способность памяти. Короче говоря, A76 демонстрирует больший подъем поколений, чем предыдущие поколения, что, несомненно, способствовало росту популярности Qualcomm. более высокий, чем обычно, прирост производительности Snapdragon 855 в годовом исчислении (для справки, Qualcomm указала прирост производительности Snapdragon 845 на 25–30 % по сравнению с предыдущим годом). 835). Этого может быть достаточно, чтобы производительность Qualcomm Snapdragon 855 опередила ядро ​​Samsung LSI Mongoose 3 (M3), установленное в Exynos 9810. хотя эта конкретная конструкция пострадала от энергоэффективности в отличие от чипов Qualcomm, и что Snapdragon 855, скорее всего, не будет или.

Что это значит для конечного пользователя? Конечно, нам следует ожидать увеличения количества ядер в тестах — ARM прогнозирует на 28% более высокие оценки Geekbench для мобильных устройств и на 35% повышение производительности Javascript. Помимо тестов, которые могут иметь мало отношения к опыту конечного пользователя, A76 продолжает фокус A75 на устойчивая производительностьЭто означает, что пользователям следует ожидать меньшего регулирования во время длительных игровых сессий. Переход на 7-нм техпроцесс в сочетании с новой конструкцией ядра определенно приведет к заметному увеличению заряда батареи. улучшения жизни конечных пользователей, и это, пожалуй, самая привлекательная особенность этого набора обновления. Новое ядро ​​Prime также интересно, учитывая, что одно ядро, ориентированное на максимальную однопоточную производительность, может оказаться полезным во всех приложениях и процессах, которые не настроены на надлежащее использование преимуществ многопоточность. Конечно, 7-нм производственный процесс также влияет и на другие блоки Snapdragon 855, обеспечивая такую ​​же экономию энергии. к другим вычислительным блокам, которые также участвуют в повседневной работе пользователя, например, при обработке изображений для фотографий на смартфон.


«Snapdragon Elite Gaming Experience» и графический процессор Adreno 640

На этот раз Qualcomm Snapdragon 855 в значительной степени ориентирован на игры, что неудивительно, учитывая популярность игр. такие как Fortnite и PlayerUnknown’s Battlegrounds, а также растущая популярность мобильного киберспорта (да, это действительно так) в Азии. Согласно данным, представленным Qualcomm Отчет Newzoo о мировом рынке игр за 2017 г.Мобильные игры имеют тенденцию к росту: ожидаемый общий доход в 2018 году составит $70,3 млрд, что составит 51% всех доходов от игр благодаря росту на 25,5% в годовом исчислении.

Графический процессор Adreno 640 обеспечивает здоровое Повышение графической производительности на 20 %, что еще больше усиливает преимущество Qualcomm над конкурентами в этой конкретной области. Для справки, Snapdragon 845 принес прирост на 30% по сравнению со Snapdragon 835, который сам по себе также предлагал улучшение на 30% по сравнению со Snapdragon 821. Тем не менее, это должно держать Qualcomm впереди по производительности графики и, что наиболее важно, по производительности на ватт, если им удастся улучшить и этот фронт. Помимо этой цифры, Qualcomm, как всегда, хранит скрытность, когда дело касается Adreno: мы слышали об интегрированном микроконтроллер для управления питанием и то, что у 640 самые низкие затраты на драйверы, хотя компания упомянула включение На 50% больше арифметико-логических блоков (ALU), что еще больше ускорит работу ИИ.

Одна вещь, о которой Qualcomm много времени говорила на брифингах, — это их желание внедрить «физический рендеринг» (PBR) в большее количество мобильных игр. PBR — это модель затенения, позволяющая реалистично рендерить графику, точно моделируя световой поток в соответствии с материалом, представленным в текстурах, или тесселяцией поверхности. Это позволяет внутриигровым объектам правильно имитировать визуальные свойства реальных материалов, включая правильную прорисовку микроповерхностей, таких как потертости и зеркальные блики. Однако наиболее заметные улучшения заключаются в том, что он позволяет более точно отображать отражательную способность и блеск всех поверхностей, даже из плоских и непрозрачных (имитированных) материалов.

Qualcomm и разработчики популярного Unity Engine работают над тем, чтобы сделать PBR более доступным. но компания также работает с другими разработчиками движков и игр над оптимизацией мобильных игр для Snapdragon. устройства. Например, игровые движки, такие как Unity, Unreal, Messiah и NeoX, уже оптимизированы для устройств Snapdragon, а Snapdragon 855 поддерживает новейшие графические API, такие как новый Вулкан 1.1. Такие студии, как NetMarble, стоящая за Lineage II: Revolutions, в прошлом также работали с Qualcomm, чтобы лучше продемонстрировать сильные стороны платформы Snapdragon. Более того, с Snapdragon 675мы видели разговоры о специальном алгоритме, который достиг На 90 % меньше рывков по сравнению с той же платформой без оптимизаций, и те же изменения коснулись Snapdragon 855. До сих пор неясно, что влекут за собой эти оптимизации, и мы не ожидаем, что они будут применимы в в каждой игре, но это определенно будет означать лучшую производительность, по крайней мере, в более крупных играх на Андроид.

Вдобавок ко всему, хотя Snapdragon 835 и 845 позволяли воспроизводить и захватывать (соответственно) 10-битное видео в формате True HDR, Qualcomm Snapdragon 855 станет первым мобильным чипсетом, который позволит настоящие HDR-игры. Для этого потребуются настоящие дисплеи с поддержкой HDR, которые, к счастью, становятся все более распространенными среди флагманских смартфонов. Из-за этого пользователи могут рассчитывать на более насыщенные цвета с большей глубиной тонов, более широкий динамический диапазон (как следует из названия) и улучшенную контрастность. Это не обязательно обязательная функция, но, безусловно, приятно иметь такую ​​​​современную HDR-игру. для установки требуются дорогие телевизоры и мониторы с поддержкой HDR, а также мощные компьютеры и специальные игровые возможности. консоли. С Qualcomm Snapdragon 855 HDR в играх, возможно, станет более доступным и удобным (конечно, без сенсорного управления).


Новый процессор Hexagon 690 DSP для задач искусственного интеллекта

Хотя компания прямо не называет его «нейронным процессором» в своих маркетинговых материалах, рабочие нагрузки искусственного интеллекта также выиграют от нового и улучшенного Hexagon 690 DSP. Qualcomm незаметно представила эти сопроцессоры много поколений назад (с появлением QDSP6 v6). наряду с 820), но только недавно они начали позиционировать их как одни из лучших блоков SoC для ИИ. Первоначально разработанная для ускорения обработки изображений, архитектура DSP, в частности с включением Hexagon Vector eXtensions (HVX), стала отлично подходить для задач машинного обучения. DSP более программируем, чем аппаратное обеспечение с фиксированными функциями, но при этом сохраняет некоторую производительность и Преимущества эффективности, которые характеризуют процессорные блоки для конкретных приложений, значительно ускоряют скалярную и векторную обработку. операции. Это отлично подходит для постоянно меняющихся алгоритмов обработки изображений, которые можно переложить на DSP, а также, естественно, подходит для рабочих нагрузок искусственного интеллекта. Hexagon DSP был благо для машинного обучения на периферийных устройствах благодаря превосходной многопоточности на аппаратном уровне и параллельным вычислениям, способным обрабатывать тысячи бит векторных единиц за цикл обработки по сравнению с сотнями бит среднего ядра ЦП за цикл и обслуживание многократной разгрузки сеансы.

Hexagon DSP особенно хорошо подходит для задач обработки изображений, поскольку он может передавать данные напрямую от датчика изображения в локальную память DSP (кэш L2), минуя контроллер памяти DDR устройства. Google, например, использовала обработку изображений Hexagon DSP для работы алгоритмов HDR+ в Pixel и Pixel 2, прежде чем представить свои собственные Пиксельное визуальное ядро. Это также устройства с поддержкой Hexagon, которые показывают наилучшие результаты при использовании популярных портов Google Camera, которые вы можете изучить. здесь. Он использовался в рабочих нагрузках виртуальной и дополненной реальности, что, как известно, послужило основой для ныне несуществующий Проект Танго на Леново Фаб 2 Про и ASUS ZenFone AR. Тем не менее, большинство OEM-производителей, реализующих флагманские устройства Snapdragon, так или иначе используют Hexagon DSP для обработки изображений, что вы можете проверить с помощью таких инструментов, как Профилировщик Snapdragon.

Так что же нового в новом DSP? В Hexagon 690 удвоено количество векторных ускорителей (HVX) с двух до четырех, чтобы они работали в тандеме с четырьмя скалярными потоками, что также позволило повысить производительность на 20%. Кроме того, Hexagon 690 представляет собой первый тензорный ускоритель для мобильных устройств с Шестиугольный тензорный ускоритель (HTA). Это существенное дополнение: оно служит аппаратным ускорением дорогостоящего умножения матриц и также интегрирует функции нелинейности (такие как сигмоид и ReLU) на аппаратном уровне, что еще больше ускоряет вывод. Эти изменения в DSP должны привести к лучшая производительность голосового помощника, от обнаружения горячих слов до анализа команд на устройстве, например, предлагая улучшенное эхоподавление и подавление шума. Qualcomm подчеркивает, что они предоставляют полную гетерогенную вычислительную платформу, которая позволяет использовать рабочую нагрузку искусственного интеллекта. либо ЦП, графический процессор или DSP, либо любая комбинация трех блоков — по словам Гэри Бротмана из Qualcomm, это его «более одного ядра, это больше, чем оборудование, это полноценная система». Их «Qualcomm AI Engine» четвертого поколения выходит за рамки аппаратного обеспечения, поскольку мы также находим поддержку Snapdragon Neural Processing SDK и Hexagon NN для доступа к ним. вышеупомянутые блоки, а также API Android NN и популярные платформы машинного обучения, такие как Caffe/Caffe 2, TensorFlow/Lite и ONNX (открытая нейронная сеть). Обмен). В совокупности Snapdragon 855 может предложить в три раза выше производительность искусственного интеллекта своего предшественника (и в два раза по сравнению с Huawei), превысив 7 триллионов операций в секунду (TOP). Однако имейте в виду, что Qualcomm продолжает концентрироваться на гетерогенных вычислительных решениях, а не на одном выделенном блоке.

Чтобы узнать больше о Hexagon DSP, посетите прошлогодняя штука подробное описание того, как это помогает при рабочих нагрузках ИИ.


Подводя итог, можно сказать, что вычислительный пакет Snapdragon 855 приносит некоторые из наиболее значительных улучшений, которые мы наблюдали за последние годы. Spectra 380 ISP-CV, о котором мы рассказали в отдельной статье, также значительно повышает производительность и энергоэффективность, обеспечивая новые превосходные функции, такие как запись HDR-видео 4K со скоростью 60 кадров в секунду. с портретный режим или смена фона (довольно гибко!).

Как объясняется в этой статье, эти улучшения и новые функции должны ощутимо проявиться в процессе взаимодействия с пользователем. Мы с нетерпением ждем Qualcomm Snapdragon 855 и скоро сможем его тщательно протестировать, поэтому следите за обновлениями на XDA-Developers, чтобы быть в курсе последних новостей и анализа Snapdragon 855!