Bagaimana Qualcomm meningkatkan Performa, Gaming, dan AI pada Snapdragon 855

click fraud protection

Platform seluler Qualcomm Snapdragon 855 yang baru menghadirkan peningkatan luar biasa dalam hal kinerja, permainan, dan AI, dan kami menguraikan cara mereka melakukannya.

Pada Qualcomm Snapdragon Summit 2018, perusahaan mengumumkan chipset andalan tingkat premium terbaru mereka: platform Snapdragon 855. Produk baru ini akan menjadi inti dari sebagian besar produk andalan di tahun 2019, dengan menjanjikan kecepatan data yang luar biasa melalui modem Snapdragon X50. Selain itu, Snapdragon 855 membawa banyak perbaikan pada setiap blok sistem-on-chip beberapa unit komputasi mengalami peningkatan kinerja dan efisiensi daya terbesar dari tahun ke tahun baru-baru ini sejarah.

Kami telah merinci Spectra 380 ISP-CV, misalnya, yang semakin meningkatkan fotografi ponsel cerdas sekaligus memberikan penghematan baterai yang sehat bagi pengguna. Meskipun kami semakin memperhatikan komponen periferal seperti Hexagon DSP, blok inti yang paling banyak dibayar oleh para antusias perhatian—yaitu, CPU dan GPU—juga telah memperoleh peningkatan yang cukup besar dengan perbaikan arsitektur dan peralihan ke proses baru simpul. Dalam artikel ini, kami akan merangkum secara singkat apa saja yang baru dan apa yang diketahui tentang CPU, GPU, dan DSP Snapdragon 855, serta dampak peningkatan dan fitur baru tersebut.

milikmu pengalaman pengguna pada tahun 2019.


CPU Kryo 485 berbasis A76 dan berpindah ke 7nm

Snapdragon 855 beralih ke proses manufaktur FinFET 7nm terbaru TSMC. Kami biasanya melihat revisi node setiap satu atau dua tahun sekali, dengan pengurangan ukuran atau optimalisasi di pertengahan siklus (seperti peralihan dari "Daya Rendah Dini" (LPE) hingga "Low-Power Plus” (LPP) di node Samsung-LSI), jadi Anda mungkin pernah mendengar metrik ini di beberapa berita artikel. Tapi apa maksudnya? Dalam konteks ini, ini menggambarkan ukuran fitur transistor prosesor, yang pada gilirannya memberi petunjuk kepada kita tentang peningkatan kepadatan transistor seperti apa yang dapat kita harapkan pada setiap generasi baru. Dengan lebih banyak transistor per unit area, kinerja prosesor yang dihasilkan dapat ditingkatkan. Fitur ini juga penting karena node proses yang lebih kecil memungkinkan desain prosesor diimplementasikan pada skala yang lebih kecil, secara intuitif memperkecil ruang antar elemen prosesor, yang pada gilirannya memperpendek jarak yang harus ditempuh elektron untuk mencapainya komputasi. Hal ini menghasilkan peningkatan kinerja, dan proses yang lebih kecil juga memiliki kapasitansi yang lebih rendah, yang berarti transistor dapat hidup dan mati dengan latensi lebih rendah dan energi lebih rendah. Sebagai referensi, TSMC mengklaim peralihan ke proses 7nm mereka telah tercapai kinerja dan efisiensi daya masing-masing sekitar 20% dan 40%., meskipun itu dibandingkan dengan proses FinFET 10nm milik TSMC.

Untuk beberapa chipset andalan Snapdragon sebelumnya, kita telah melihat Qualcomm bekerja sama dengan Samsung dan mengimplementasikan proses LPP/LPE 14nm dan 10nm. Perpindahan ke 7nm TSMC untuk Snapdragon 855 bukanlah hal yang tidak terduga, mengingat proses 7nm Samsung telah baru memasuki produksi massal pada bulan Oktober, meskipun pada saat itu dilaporkan bahwa chipset Qualcomm 5G akan dibangun di atasnya. Selain itu, desain 7LPP Samsung diproduksi dengan teknik litografi yang ditingkatkan yang dikenal sebagai litografi ultraviolet ekstrim (EUVL), menghasilkan pengurangan area sebesar 40% dengan kompleksitas desain yang sama, dengan kecepatan 20% lebih cepat atau konsumsi daya 50% lebih sedikit dibandingkan FinFET 10nm pendahulu. Setiap lompatan baru ke node proses yang lebih kecil dirayakan justru karena hal tersebut sangat sulit dicapai. Misalnya, ketika transistor menjadi lebih kecil, transistor mungkin menunjukkan 'kebocoran' atau arus yang mengalir melalui transistor yang 'mati' lebih besar, sehingga meningkatkan konsumsi daya statis dalam kondisi idle. Meskipun chip yang lebih kecil dengan jumlah transistor yang lebih padat memungkinkan penggunaan wafer silikon secara maksimal, hasilnya cenderung lebih rendah. karena kebocoran yang disebutkan di atas, ditambah kesulitan dalam mendapatkan prosesor 'binned lebih tinggi' yang berjalan pada referensi (tinggi). frekuensi. Ini adil beberapa dari sekian banyak rintangan pengembangan yang tentu saja teratasi pada saat node proses baru mencapai produksi massal, namun pada akhirnya singkatnya, ada banyak tantangan penelitian dan pengembangan serta manufaktur yang menambah biaya untuk mewujudkan ukuran proses baru pasar.

Arsitektur ARM A76 terbaru yang dilisensikan untuk Kryo 485 merupakan kontributor besar lainnya terhadap peningkatan substansial dari tahun ke tahun yang kita lihat pada Qualcomm Snapdragon 855. Inti A76 adalah desain baru dan kosong dari kantor ARM di Austin, menampilkan arsitektur mikro baru yang dibangun dari awal untuk menghadirkan apa yang disebut ARM sebagai "performa kelas laptop dengan efisiensi seluler." Ini masih merupakan desain semi-kustom, dan Qualcomm telah melakukan perbaikan seperti pengambilan data yang dioptimalkan untuk efisiensi yang lebih baik, dan eksekusi out-of-order yang lebih besar. jendela. Desain baru ini menawarkan beberapa peningkatan kinerja yang luar biasa dibandingkan A75, yang menjadi dasar inti Emas Snapdragon 845: desain ini menjanjikan a Peningkatan kinerja 35%, dan efisiensi daya 40% lebih baik. Saat membandingkan A75 pada proses 10nm versus A76 pada proses 7nm dengan daya yang sama sebesar 750mW/core, keunggulan kinerja tumbuh hingga 40% seiring dengan peningkatan core baru, dan penghematan energi juga dapat meningkat hingga 50%. Terlebih lagi, perbaikan lainnya pada pipeline Asymmetric Single instruction Multiple Data (ASIMD) dan instruksi perkalian titik meningkatkan ~3,9x peningkatan performa tugas pembelajaran mesin, seperti inferensi dalam jaringan neural konvolusional. Semua ini menghasilkan kinerja per area terdepan di industri dan pelengkap yang hebat untuk proses 7nm baru, dengan 'Prime core' Qualcomm 2,84GHz mendekati kecepatan jam referensi 3GHz ARM telah digunakan saat merinci inti baru. Semua seutuhnya, Qualcomm menjanjikan peningkatan kinerja CPU yang sangat besar sebesar 45%. dibandingkan 845, peningkatan terbesar dari tahun ke tahun.

Berbicara tentang 'Prime core' Snapdragon 855, tidak mengejutkan juga melihat Qualcomm bergabung dengan pengaturan cluster baru ini mengingat peningkatan yang sangat besar. LITTLE diaktifkan oleh ARM DynamIQ platform teknologi. Intinya, DynamIQ memungkinkan lebih banyak fleksibilitas dan skalabilitas dalam desain prosesor multi-inti, memungkinkan desain beberapa inti dalam satu cluster tertentu, serta kontrol voltase per inti yang lebih detail. (EDIT: Dalam sesi tanya jawab, Qualcomm mengonfirmasi bahwa inti Prime membagikan domain dayanya dengan kluster kinerja, sehingga membatasi utilitas yang dijelaskan di sini). A76 sangat cocok untuk inti premium tunggal dengan jamnya sendiri, mengingat ia sangat unggul dalam hal single-thread. kinerja dengan instruksi integer per jam 25% lebih banyak dibandingkan A75, dan kinerja ASIMD dan floating point 35% lebih tinggi, sekaligus menawarkan 90% lebih tinggi bandwidth memori. Singkatnya, A76 menghadirkan peningkatan generasi yang lebih besar dibandingkan generasi sebelumnya, yang tentunya juga berkontribusi pada Qualcomm peningkatan kinerja tahun-ke-tahun yang lebih besar dari biasanya untuk Snapdragon 855 (sebagai referensi, Qualcomm menyebutkan peningkatan 25 hingga 30% untuk 845 dibandingkan 835). Ini mungkin cukup untuk menempatkan kinerja yang dihasilkan Qualcomm Snapdragon 855 di depan inti Mongoose 3 (M3) Samsung LSI yang ditemukan di Exynos 9810, meskipun desain khusus tersebut mengalami efisiensi daya yang tidak dimiliki oleh chip Qualcomm, dan Snapdragon 855 kemungkinan besar tidak akan melakukannya. salah satu.

Apa artinya bagi pengguna akhir? Tentu saja, kita mengharapkan peningkatan inti benchmark—ARM memproyeksikan skor Geekbench 28% lebih tinggi untuk seluler, dan peningkatan kinerja Javascript sebesar 35%. Di luar tolok ukur, yang mungkin tidak banyak berpengaruh pada pengalaman pengguna akhir, A76 melanjutkan fokus A75 pada kinerja berkelanjutan, yang berarti pengguna akan merasakan lebih sedikit pembatasan selama sesi permainan yang berkepanjangan. Peralihan ke 7nm dikombinasikan dengan desain inti baru pasti akan menghasilkan baterai yang nyata peningkatan kehidupan bagi pengguna akhir, dan itu mungkin fitur paling menarik dari rangkaian ini peningkatan. Inti 'Prime' yang baru juga menarik, mengingat inti tunggal yang berfokus pada kinerja single-threaded terbaik dapat melakukannya terbukti bermanfaat di seluruh aplikasi dan proses yang tidak diatur untuk dimanfaatkan dengan tepat multi-utas. Tentu saja, proses manufaktur 7nm juga berdampak pada blok lain dari Snapdragon 855, sehingga menghasilkan penghematan daya yang sama. hingga unit komputasi lain yang juga terlibat dalam pengalaman pengguna sehari-hari, seperti pemrosesan gambar untuk fotografi ponsel cerdas.


'Pengalaman Gaming Snapdragon Elite' dan GPU Adreno 640

Kali ini Qualcomm Snapdragon 855 sangat berfokus pada game, sebuah peristiwa yang tidak mengejutkan mengingat popularitas judul-judulnya seperti Fortnite dan PlayerUnknown’s Battlegrounds serta meningkatnya popularitas eSports seluler (ya, memang demikian) di Asia. Menurut angka yang ditunjukkan oleh Qualcomm dari Laporan Pasar Game Global Newzoo 2017, game seluler sedang tren dengan perkiraan total pendapatan pada tahun 2018 sebesar $70,3 miliar, yang mencakup 51% dari seluruh pendapatan game berkat peningkatan 25,5% dari tahun ke tahun.

GPU Adreno 640 menghadirkan performa yang sehat Peningkatan 20% pada kinerja grafis, semakin menambah keunggulan Qualcomm dalam persaingan di bidang ini. Sebagai referensi, Snapdragon 845 menghadirkan peningkatan 30% dibandingkan Snapdragon 835, yang juga menawarkan peningkatan 30% dibandingkan Snapdragon 821. Namun, hal ini akan membuat Qualcomm unggul dalam performa grafis, dan yang paling penting, performa per watt jika mereka berhasil meningkatkannya juga. Di luar angka itu, Qualcomm tetap tertutup dalam hal Adreno: kami mendengar tentang yang terintegrasi mikrokontroler untuk manajemen daya, dan bagaimana 640 memiliki overhead pengemudi terendah, meskipun perusahaan menyebutkannya penyertaan 50% lebih banyak unit logika aritmatika (ALU) yang selanjutnya akan mempercepat kinerja AI.

Satu hal yang sering dibicarakan oleh Qualcomm dalam briefing adalah keinginan mereka untuk menghadirkan 'rendering berbasis fisik' (PBR) ke lebih banyak pengalaman bermain game seluler. PBR adalah model bayangan yang memungkinkan rendering grafik realistis, memodelkan aliran cahaya secara akurat sesuai dengan material yang direpresentasikan dalam tekstur atau tesselasi permukaan. Hal ini memungkinkan objek dalam game meniru dengan tepat sifat visual material dunia nyata, termasuk rendering permukaan mikro yang tepat seperti lecet dan sorotan specular. Namun, peningkatan yang paling nyata terjadi pada kemampuan penggambaran reflektifitas dan kilap semua permukaan yang lebih akurat, bahkan permukaan yang terbuat dari bahan datar dan buram (simulasi).

Qualcomm dan pengembang di balik Unity Engine yang populer telah berupaya membuat PBR lebih mudah diakses, namun perusahaan juga bekerja sama dengan pengembang mesin dan game lain dalam mengoptimalkan game seluler untuk Snapdragon perangkat. Mesin game seperti Unity, Unreal, Messiah, dan NeoX sudah dioptimalkan untuk perangkat Snapdragon, misalnya, dan Snapdragon 855 mendukung API grafis terbaru seperti yang baru. Vulkan 1.1. Studio seperti NetMarble, yang berada di balik Lineage II: Revolutions, juga pernah bekerja sama dengan Qualcomm di masa lalu untuk menampilkan kekuatan platform Snapdragon dengan sebaik-baiknya. Apalagi dengan Snapdragon 675, kami melihat pembicaraan tentang algoritma khusus yang mencapai hingga 90% lebih sedikit sampah dibandingkan dengan platform yang sama tanpa pengoptimalan, dan perubahan yang sama juga terjadi pada Snapdragon 855. Masih belum jelas apa yang dimaksud dengan pengoptimalan ini, dan kami memperkirakan hal tersebut tidak dapat diterapkan di setiap game, namun hal ini pasti berarti performa yang lebih baik, setidaknya di game yang lebih besar Android.

Selain itu semua, meskipun Snapdragon 835 dan 845 memungkinkan pemutaran dan pengambilan (masing-masing) Video HDR sejati 10-bit, Qualcomm Snapdragon 855 akan menjadi chipset seluler pertama yang memungkinkannya game HDR sejati. Hal ini memerlukan tampilan berkemampuan HDR, yang untungnya semakin umum di antara smartphone unggulan. Oleh karena itu, pengguna dapat mengharapkan warna yang lebih kaya dengan kedalaman nada yang lebih tinggi, rentang dinamis yang lebih tinggi (seperti namanya), dan kontras yang lebih baik. Ini belum tentu merupakan fitur yang harus dimiliki, tetapi tentu menyenangkan mengingat game HDR saat ini pengaturannya memerlukan TV dan monitor berkemampuan HDR yang mahal, serta komputer yang mumpuni dan game tertentu konsol. Dengan Qualcomm Snapdragon 855, HDR dalam bermain game bisa dibilang akan lebih mudah diakses dan nyaman (tentu saja tanpa kontrol layar sentuh).


DSP Hexagon 690 baru untuk beban kerja AI

Meskipun perusahaan tidak secara eksplisit menyebutnya sebagai “unit pemrosesan saraf” dalam materi pemasarannya, beban kerja AI juga akan mendapat manfaat dari DSP Hexagon 690 yang baru dan lebih baik. Qualcomm secara diam-diam memperkenalkan co-prosesor ini beberapa generasi yang lalu (dengan diperkenalkannya QDSP6 v6 di samping 820), namun baru-baru ini mereka mulai menganggapnya sebagai blok SoC yang lebih baik untuk AI. Awalnya dirancang untuk mempercepat beban kerja pencitraan, arsitektur DSP—khususnya dengan penyertaan Hexagon Vector eXtensions (HVX)—menjadi sangat cocok untuk tugas ML. DSP lebih dapat diprogram daripada perangkat keras dengan fungsi tetap, namun tetap mempertahankan sebagian kinerja dan manfaat efisiensi yang menjadi ciri blok prosesor khusus aplikasi, mempercepat skalar dan vektor operasi. Hal ini terbukti sangat baik untuk algoritme pemrosesan gambar yang selalu berubah dan dapat dipindahkan ke DSP, namun juga secara alami cocok untuk beban kerja AI. DSP Hexagon telah menjadi a keuntungan untuk pembelajaran mesin pada perangkat edge karena multi-threading dan komputasi paralel tingkat perangkat kerasnya yang sangat baik, yang mampu menangani ribuan bit unit vektor per siklus pemrosesan, dibandingkan dengan rata-rata ratusan bit inti CPU per siklus, dan melayani banyak offload sesi.

Hexagon DSP sangat cocok untuk tugas pencitraan karena dapat mengalirkan data langsung dari sensor pencitraan ke memori lokal DSP (L2 Cache), melewati pengontrol memori DDR perangkat. Google, misalnya, menggunakan pemrosesan gambar Hexagon DSP untuk mendukung algoritma HDR+ Pixel dan Pixel 2, sebelum memperkenalkan algoritma mereka sendiri. Inti Visual Piksel. Ini juga merupakan perangkat yang mendukung Hexagon yang melihat hasil terbaik dari port Google Kamera populer, yang dapat Anda jelajahi Di Sini. Ini telah digunakan dalam beban kerja virtual dan augmented reality, yang terkenal dalam mendukung sekarang sudah tidak berfungsi Proyek Tango di Lenovo Phab 2 Pro Dan ASUS ZenFone AR. Meskipun demikian, sebagian besar OEM yang menerapkan perangkat andalan Snapdragon menggunakan DSP Hexagon untuk pemrosesan gambar dengan satu atau lain cara, yang dapat Anda verifikasi menggunakan alat seperti Profiler Snapdragon.

Jadi apa yang baru dengan DSP baru? Hexagon 690 menggandakan jumlah akselerator vektor (HVX) dari dua menjadi empat untuk bekerja bersama-sama dengan empat thread skalar, yang juga mengalami peningkatan kinerja sebesar 20%. Selain itu, Hexagon 690 menghadirkan akselerator tensor pertama untuk seluler dengan Akselerator Tensor Segi Enam (HTA). Ini merupakan tambahan yang signifikan: ini berfungsi sebagai akselerasi perangkat keras untuk perkalian matriks yang mahal, dan juga mengintegrasikan fungsi non-linearitas (seperti sigmoid dan ReLU) di tingkat perangkat keras, yang semakin mempercepat kesimpulan. Perubahan pada DSP ini harus diterjemahkan ke dalam kinerja asisten suara yang lebih baik, mulai dari deteksi kata cepat hingga penguraian perintah pada perangkat, misalnya menawarkan pembatalan gema dan peredam bising yang lebih baik. Qualcomm menekankan bahwa mereka menyediakan platform komputasi heterogen lengkap yang memungkinkan pemanfaatan beban kerja AI baik CPU, GPU, atau DSP, atau kombinasi apa pun dari ketiga blok tersebut -- menurut kata-kata Gary Brotman dari Qualcomm, ini dia "lebih dari satu inti, ini lebih dari sekedar perangkat keras, ini adalah sistem yang lengkap". "Qualcomm AI Engine" generasi ke-4 mereka juga melampaui perangkat keras, karena kami juga menemukan dukungan untuk Snapdragon Neural Processing SDK dan Hexagon NN untuk mengakses blok yang disebutkan di atas, serta Android NN API, dan framework ML populer seperti Caffe/Caffe 2, TensorFlow/Lite, dan ONNX (Open Neural Network Menukarkan). Secara agregat, Snapdragon 855 dapat menawarkan tiga kali lipat kinerja AI mentah dari pendahulunya (dan dua kali dibandingkan dengan Huawei), melampauinya 7 triliun operasi per detik (TOP). Namun, perlu diingat bahwa Qualcomm terus fokus pada solusi komputasi heterogen dibandingkan berfokus pada satu blok khusus.

Untuk mempelajari lebih lanjut tentang Hexagon DSP, lihat karya tahun lalu merinci bagaimana hal ini membantu beban kerja AI.


Singkatnya, paket komputasi Snapdragon 855 menghadirkan beberapa peningkatan yang lebih berdampak dari tahun ke tahun yang telah kita lihat dalam beberapa tahun terakhir. Spectra 380 ISP-CV, yang kami bahas dalam artikel terpisah, juga menghadirkan peningkatan luar biasa pada kinerja dan efisiensi daya, memungkinkan fitur-fitur baru yang luar biasa seperti perekaman video HDR 4K 60FPS dengan mode potret atau pertukaran latar belakang (cukup fleksibel!).

Seperti yang dijelaskan dalam artikel ini, kemajuan dan fitur baru ini seharusnya dapat dirasakan secara nyata sepanjang pengalaman pengguna. Kami menantikan Qualcomm Snapdragon 855 dan segera mengujinya secara mendalam, jadi pantau terus XDA-Developers untuk berita dan analisis Snapdragon 855 terbaru!