Röportaj: Qualcomm, Snapdragon 855'in Kryo 485 ve Hexagon 690'ı hakkında

Qualcomm'dan Travis Lanier, Snapdragon 855 mobil platformundaki Kryo 485 CPU ve Hexagon 690 DSP'nin pazarlanması hakkında bir röportaj için XDA ile bir araya geldi.

Geçtiğimiz ay Qualcomm, Snapdragon 855 mobil platformu. Snapdragon 855, 2019'da çoğu Android amiral gemisi akıllı telefona güç verecek mobil platformdur. Qualcomm, yeni nesil mobil platformuyla her geçen yıl önemli iyileştirmeler kaydetti. Snapdragon 855 mobil platformu, 7 nm'lik bir üretim süreci üzerine inşa edilmiştir ve Snapdragon 845'e göre CPU performansında %45'lik etkileyici bir artış sunar. Bilgi işlemdeki gelişmeler, Qualcomm'un yeni Snapdragon 855'te mükemmel yapay zeka performansına sahip olmasını sağlıyor. Burada açıklanacak çok fazla bilgi var ve göstermek için elimizden gelenin en iyisini yaptık Qualcomm performansı ve yapay zekayı nasıl geliştirdi? Snapdragon 855'te. Ancak ürünün tanıtımından sonra hala kendi sorularımız vardı, bu yüzden Kıdemli Travis Lanier ile görüştük. Qualcomm Ürün Yönetimi Direktörü, Qualcomm'un yeni cep telefonundaki Kryo 485 CPU ve yapay zeka hakkında konuşacak platformu.

Mario Serrafero: "%45'lik sıçrama, şimdiye kadarki en büyük artış gibi. Hadi bunu açalım. 7nm A76 tabanımız var; bunlar büyük katkı sağlıyor. Görünüşe göre siz özel çekirdeklerden uzaklaştığınızdan beri bazı yayınlar ve izleyiciler Dahili ARM lisansının nelere izin verebileceği konusunda neleri gerektirdiğine dair pek bir fikrim yoktu Yapmanız gereken. Bunun neleri gerektirdiği konusunda oldukça gizli davrandın. Şimdi ilk kez sahnedesiniz, en azından Soru-Cevap dışında, ...ama ilk kez bazı iyileştirmelerin neler olduğunu gösterdiniz ve bu harika. Bu yüzden Qualcomm'un Kryo 485'i daha fazla [dışarı] çıkarmak için nasıl ayarladığını genişletmek isteyip istemediğinizi merak ediyorduk. ARM'ın tabanı, ister orada sergilediğiniz şeyleri, ister sunmadığınız şeyleri genişletmek olsun."

Travis Lanier: "Dolayısıyla slaytlarımdaki diğer bilgilerden daha fazlasını söyleyemem. Belki ileriki bir tarihte bunu yapabiliriz, böylece oturup bu işi gerçekten yapan bazı uzmanları bulabiliriz; Üst düzey konuşma konularını biliyorum. Ama bildiğiniz gibi A76 zaten üst düzey bir tasarım; oldukça iyi. ARM'in yol haritasını görmemizin nedenlerinden biri de bu. Ben de tamam, belki de bu adamlarla daha yakın çalışmalıyız çünkü çok güçlü görünüyordu. ARM'e karşı kişiselleştirme konusundaki yorumunuza geri dönelim. Tamam, yapabileceğiniz tüm bunlar var. Ve eğer bir şey yapıyorsanız ve bunun farklılaşması gerekiyorsa, yüzde yüz bir şeyler yapabilir veya onlarla ortak olabilirsiniz. Ve önceki yıllarda olduğu gibi, entegrasyon konusunda biraz daha fazla duruyoruz. Otobüsler ve sisteme nasıl bağlandığımız, CPU'lara koyduğumuz güvenlik özellikleri, önbellek yapılandırmaları. Artık etkileşimler uzadığı için bu konuda daha derin bir özelleştirme yapabildik. Ve bu şekilde, daha büyük [sıra dışı] yürütme pencereleri gibi bazı şeyleri oraya koyabildik, değil mi, böylece daha fazlasına sahip olursunuz uçuş talimatları, verinin önceden getirilmesi aslında mikroişlemci endüstrisinde en fazla yeniliğin olduğu alanlardan biridir. Şu anda. Bunların çoğuna yönelik tekniklerin çoğu oldukça benzer, bugünlerde herkes bir TAGE dal tahmincisi kullanıyor, ne kadar büyük tedarik ederseniz, insanlar daha büyük önbellekler için nasıl sıra dışı yapılacağını, iletileceğini ve tüm bu şeyleri biliyor. Ama ön hazırlık, hala çok fazla var, bu karanlık sanat türü şeylerden biri. Yani bu alanda hala pek çok yenilik var. Bu, yardımcı olabileceğimizi düşündüğümüz bir konu.

Ve sonra sırf genel olarak daha iyi bir iş çıkardığımızı hissettiğimiz için... genellikle bir tasarımı diğerlerinin bir süreç düğümünü entegre edebileceğinden daha hızlı uygulayabiliriz. Ve bu şeylerden bazılarını oraya koyduğumuzda, örneğin daha fazla düzenin dışına çıktığınızda, tasarımınız üzerinde daha fazla stres olur, değil mi? Tüm bu yürütme şeylerini oraya eklemek bedava değil. Yani, bunu yapabilmek ve size bir darbe almamak için fmaks. Evet, bu ARM ile olan ilişkimizin bir parçası, mesela bunları nasıl başaracaksınız?"

Mario Serrafero: "Sırf merakımdan dolayı, sunumda verimlilik iyileştirmelerinin geleceğinden bahsetmiştiniz. ön alımdan itibaren güç verimliliğinden, performans iyileştirmelerinden ve biraz ikisi birden?"

Travis Lanier: "Yukarıdakilerin hepsi. Dolayısıyla, doğası gereği, önceden getirme işlemi yapıyoruz; önbellekteki şeyleri çektiniz. Dolayısıyla, önbellek çok fazla bellek erişimi yapmıyorsa, artık ön getirmenin diğer bir tarafı var: Çok fazla ön getirme yaparsanız, daha fazla bellek [kullanıyorsunuzdur] çünkü, biliyorum, çok fazla spekülatif ön alım yapıyorsunuz, ancak eğer elinizde bir şeyler varsa ve doğru şeyleri çekiyorsanız, o zaman onu içeri çekmek için hafızanıza gitmezsiniz Orası. Yani daha verimli bir ön getiriciye sahipseniz, güçten tasarruf edersiniz ve performansı artırırsınız."

Mario Serrafero: "Tamam, güzel, evet. Evet, bunun ötesine daha fazla genişleyebileceğinizi beklemiyordum ama bunu söylerseniz ilginç artık daha fazla kişiselleştiriyorsunuz ve belki gelecekte daha fazlasını paylaşabilirsiniz, o zaman buna göz kulak olacağım. Yani en azından çevremdeki insanlar arasında baş döndürücü diğer tür, temel çekirdektir. Dolayısıyla, birkaç yıldır DynamIQ'nun dahil edilmesiyle daha esnek kümelenme düzenlemeleri bekliyorduk ve diğer şirketlerin 4+4 düzenlemesinden uzaklaşmasını bekliyorduk. Yani iki soru: Ana çekirdeğin arkasındaki sebep neydi? Ana çekirdek kullanıcı deneyimine nasıl fayda sağlıyor, çünkü okuyucularımız orada neden sadece bir çekirdek olduğunu ve ayrıca neden tam olarak yalnız bir çekirdek olmadığını bilmek istiyor? Güç düzlemini performans kümesiyle paylaşmak, DynamIQ kullanıp kendi başına bekletirseniz elde edebileceğiniz faydanın bir kısmını azaltmaz mı?"

Travis Lanier: "O halde önce farklı saatlerden ve farklı voltaj düzlemlerinden bahsedelim. Yani her saat eklediğinizde ve her voltaj eklediğinizde, bunun maliyeti artar. Yani pakete koyduğunuz pin sayısının bir sınırı var, farklı saatler için sahip olmanız gereken daha fazla PLL var ve sadece artan karmaşıklık var. Yani bir şeyler yapmanın bir takası var. Bir noktada biraz aşırıya gittik; dört farklı saatte dört farklı alanımız vardı, dolayısıyla bu konuda deneyimimiz vardı ve pahalıydı. Bir nevi büyük olmaya başladığın zaman. LITTLE, küçük kümede küçük çekirdekler var ve bunların, tabiri caizse, küçük çekirdekler arasında ayrı bir saatin aynı ayrıntı düzeyine ihtiyaçları yok. Evet, bunlarla ne yapacağın belli değil. Yani büyük olduğunda. KÜÇÜK sistem, o zaman tam tersi, bu büyük çekirdeklere sahipsiniz. Tamam, bunların her birini büyük bir saate mi koyuyorsunuz? Aslında, boş bir saatin zaten küçük bir çekirdek üzerinde çalışacağı yeterince düşük bir durumdaysanız, her zaman bunlarla çalışmıyorsunuz demektir. Yani aslında iki tanesi orada yeterince iyi.

Ve sonra bu asal çekirdeğin olduğu yere gelirsiniz, tamam, daha yüksek frekanslara çıkabilen ayrı bir saat çekirdeğimiz var. Ancak bu diğer çekirdekler, diğer performans kümeleri aynı yüksek frekansa çıkamıyor. Yani eğer o çekirdeğin tüm yetkilerini almak istiyorsanız, bunun için üçüncü saate sahip olmanız gerekir. Peki bu çekirdek ne işe yarıyor? Buna biraz değindik. Büyük şeyler, uygulama başlatıcı ve web'de gezinme olacaktır. Peki neden tek çekirdek? Tamam, işler artık daha çok iş parçacıklı hale geliyor. Örneğin oyun motorları (bu konuya birazdan döneceğim) daha fazla iş parçacığına doğru çok agresif bir şekilde ilerliyor. Ancak çoğu uygulamaya bakarsanız, birden fazla iş parçacığı olsa bile, çoğu gibi Pareto kuralını kullanacağım, yükün %80'i tek iş parçacığındadır. Yani [bir] uygulamayı başlatabilirsiniz ve uygulama 8 çekirdeğin tamamında ateşlenebilir ve yanabilir. Ancak büyük olasılıkla bunun %80'i tek bir baskın ipliktedir; o çekirdektedir. Web'de gezinme hala öncelikli olarak JavaScript'tir diyebilirim; web'de gezinme, birden fazla görüntüye sahip olabileceğiniz ve bunların kodunu çözebileceğiniz çoklu iş parçacığıyla biraz daha iyi hale geldi. Ancak, örneğin, JavaScript—[a] tek bir iş parçacığı tek bir çekirdek üzerinde çalışacak. Yani bu tek çekirdeğin gerçekten yüksek seviyeye ulaşmasından faydalanan çok sayıda kullanım durumu var.

Artık biraz daha düşük frekansta çalışan üç çekirdeğimiz var, ancak bunlar aynı zamanda güç açısından da daha verimli. Ve böylece, ne zaman çekirdeklerin uygulanması hakkında ne kadar bilginiz olduğunu bilmiyorum ama frekansın zirvesine ulaşmaya başladığınızda ve Bu çekirdeklerin uygulanmasıyla, güçte bir değiş-tokuş olur, son birkaç megahertz veya gigahertz'de işler katlanarak artmaya başlar. sahip olmak. Evet, bir saniye önce bundan bahsetmiştim, hey, tüm oyunlar, tıpkı diğer oyunlar gibi, çok iş parçacıklı olmaya başlıyor birdenbire geriye bakarsanız, çok uzun zaman önce birkaç oyun olduğunu ve sadece birini kullandıklarını görürsünüz. iplik. Ancak sektörün bu kadar hızlı değişebilmesi tuhaf. Geçtiğimiz yıl, bir buçuk yılda olduğu gibi, kelimenin tam anlamıyla tüm bu oyunları koymaya başladılar… Bu yüksek kaliteli oyunlar beni heyecanlandırdı. Ve böylece, altı ay ila bir yıl öncesine kadar pek çok şey olmasına rağmen, aslında tüm Çin tersine döndü. Çin'de şöyle bir şey duyuyorum: "Büyük çekirdekler pek umurumda değil, bana her şeyin sekizini verin, bana her şeyin sekizini verin." en küçük çekirdekler böylece sekiz çekirdeğe sahip olabilirim." Değiştiler çünkü bu oyunları istiyorlar, bu oyunlar gerektiriyor büyük çekirdekler. Ve şimdi, ortaya çıkan tüm gelişmiş oyunlar nedeniyle ortaklarımızdan "hayır, aslında dört büyük çekirdek istiyoruz" şeklinde geri bildirimler alıyoruz. Ve tüm bu çekirdekleri kullanacaklar.

Yani oyun oynadığınızda 30 saniye veya 5 dakika değil, daha uzun süre oynarsınız. Dolayısıyla, çok iş parçacıklı büyük çekirdek kullanım durumlarınızın çoğunda bu üç çekirdeğin daha olması mantıklıdır, biraz daha fazla güç verimliliğine sahip olmak isterler. Bu bir nevi dengeleniyor, bazı durumlarda bu şeylerden bazıları için ihtiyaç duyduğunuzda bu daha yüksek performanslı çekirdeğe sahip oluyorsunuz. aynı zamanda büyük çekirdeklere sahip olan ve güç açısından daha verimli olan bu çözüme sahip olduğunuz bu uzun süreli kasalardan O. Bu bir tür düşünce; biraz alışılmadık bir simetri. Ama umarım bu, neden bir ana çekirdeğin var olduğunu, neden ayrı saatleriniz olmadığını ve neden ayrı voltajlarınız olmadığını yanıtlar. Ve sanırım bunların hepsine değindim."

Kryo 485 CPU çekirdek yapılandırması. Kaynak: Qualcomm.

Mario Serrafero: "Şimdi heterojen hesaplama. Qualcomm'un eski markadan mobil platforma geçişinden bu yana vurguladığı şey de bu. ve bu tür bir [a] tanımlayıcı ve ayrıca aşağıdaki gibi belirli performans ölçümlerini tanımlamanın önündeki blokları bir araya getirmek AI. Bu evrim, daha heterojen bir bilgi işlem yaklaşımına geçişte nasıl oldu? Tasarımdan uygulamaya ve pazarlamaya kadar her yerde veya dokunabileceğiniz her şey."

Travis Lanier: "Biraz ileri geri gidiyor. Ama sonuçta bu motorlara sahip olmanız gerekiyor çünkü mobilde oyunun adı güç verimliliğidir. Şimdi bazen bunun arada bir genellemeye geri döndüğünü görüyorsunuz. Orijinalinize geri dönerseniz, akıllı telefonlar için bile, özellikli telefonlarda multimedya ve kamera vardı bir dereceye kadar yeteneklere sahipler ve bu yüzden tüm bu küçük adanmış şeylere sahipler çünkü siz bunu yapamazsınız. yap. ARM 9 veya ARM 7 üzerine kurulu telefonlara geri dönerseniz, hepsinde her şey için bir donanım hızlandırma aracı vardı.

Ancak size bir örnek vermek gerekirse, bir şeyin genelleştiği ve şimdi tekrar donanım istedikleri bir durumda JPEG olurdu. Eskiden JPEG hızlandırıcı vardı. CPU sonunda yeterince iyi hale geldi ve yeterince güç verimli hale geldi ve JPEG'ler bir nevi aynı kaldı aynı boyutta, hey, biliyor musun, devam edip bunu CPU üzerinde yapacağız [çünkü] bunu yapmak daha kolay BT. Şimdi, resimler büyüdükçe, birdenbire insanlar gidiyor, biliyorsunuz, aslında ben bu gerçekten devasa fotoğraf dosyası boyutlarının hızlandırılmasını istiyorum. CPU'lar ya yeterince hızlı değil ya da çok fazla güç tüketiyor. Birdenbire potansiyel olarak JPEG hızlandırıcılara yeniden ilgi duyulmaya başlandı. Yani işlerin gidişatı her zaman düz bir çizgi değildir, o zaman Moore Yasasında şu anda neler olup bittiğine bakmanız gerekir. Herkes şunu konuşuyor: Hey, ölmemiş olabilirsin ama biraz yavaşlıyor, değil mi? Peki, eğer bir sonraki düğümden bu güç artışını veya performans artışını alamıyorsanız, bu ek yüke sahip değilseniz, telefona daha fazla işlevsellik eklemeye nasıl devam edebilirsiniz? Yani bunu CPU'ya koyabilirsiniz. Ancak CPU'nuz için daha fazla alanınız yoksa, bunları nasıl hızlandırırsınız? Cevap şu ki, tüm bu özel çekirdekleri ve şeyleri daha verimli bir şekilde yerleştirirsiniz. Ve işte bu doğal gerilim.

İnsanların ortak işlevler için bunları yapmaya zorlandığını göreceksiniz, çünkü belki de herkes son teknolojiye sahip olmayabilir. Ancak kesinlikle mümkün olduğu kadar uzun süre orada kalmaya çalışacağız, ancak fabrikaları bir sonraki düğüme geçmeye zorlayamayız. İşte bu nedenle, daha iyi performans ve güç verimliliği elde etmeye devam etmek için sürekli yeniliğe ve bu mimarilere odaklanmalısınız. İşte bizim gücümüz ve geçmişimiz budur."

Mario Serrafero: "Qualcomm açısından heterojen bilişime doğru bir hareket olsa da, pek çok izleyici ve kesinlikle pek çok yayın, kesinlikle Şaşırtıcı bir şekilde, daha iyi bildiğini düşündüğünüz pek çok meraklı, hâlâ blokları ayrı ayrı düşünüyor, değerlendiriyor ve değerlendiriyor. varlıklar. Hâlâ "CPU numaralarını görmek istiyorum çünkü bunu önemsiyorum" diye odaklanıyorlar. Oyunları sevdikleri için GPU numaralarını görmek istiyorlar vb. Bunları tek bir bütünleşik ürünün iletilen parçaları olarak görmüyorlar. Rakipler aslında pazarlamadaki belirli blok blok iyileştirmelere odaklanmaya devam ederken Qualcomm'un bu paradigmayı nasıl parçaladığını, yıkabileceğini ve kırabileceğini düşünüyorsunuz? Özellikle, sinir ağlarına, sinir motoru konularına daha sonra geçeceğiz."

Travis Lanier: "Umarım bugün bunların bir kısmına değinmişimdir. Örneğin, sürekli oyun oynamaya odaklanıyoruz, dolayısıyla belki de tüm oyun kriterlerinde iyi puanlar alırsınız. İnsanlar bu konuda takıntılı hale geliyor. Ama gerçekte önemli olan şu, eğer oyununuzu oynuyorsanız saniyedeki kare sayınız bu şeyler için tutarlı bir şekilde en yüksek noktada olmasını istediğiniz yerde kalıyor mu? İnsanların bu bloklardan biri için sayıya çok fazla ağırlık verdiklerini düşünüyorum. Bu çok zor ve bana en iyinin ne olduğunu söyleyen bir rakam verme arzusunu anlıyorum. Bu o kadar kullanışlı ki, özellikle de şu anda yapay zeka konusunda, tam bir çılgınlık. CPU kıyaslamalarında bile CPU kıyaslaması neyi ölçer? Hepsi farklı şeyleri ölçüyor. GeekBench'in bir dizi alt bileşeni olduğu gibi kıyaslamalardan herhangi birini alın. Hiç kimsenin bu alt bileşenlerden hangisinin benim gerçekte yaptığım şeyle en alakalı olduğunu araştırdığını gördünüz mü?"

Mario Serrafero: "Bazen yapıyoruz."

Travis Lanier: "Belki siz bilirsiniz. Siz bir aykırılık gibisiniz. Ama belki bir CPU bu konuda daha iyidir ve belki biri diğerinde daha iyidir. SPEC için de aynı şey geçerli, insanlar tek bir SPEC'i vurgulayacaklar, tamam, bunun içinde pek çok farklı iş yükü var. Bunlar oldukça sıkı şeyler, ancak CPU geliştirmek için kullandığımız SPEC bile, gerçek iş yüklerine bakarsanız, bunlar gerçekten alakalı mı? İş istasyonu iş yüklerini karşılaştırmak harika, ancak telefonumda gerçekten moleküler modelleme yapıyor muyum? Hayır. Ama yine söylemek istediğim şu ki, bu kriterlerin çoğu bir şekilde faydalıdır, ancak ne işe yaradığının bağlamını ve oraya nasıl ulaşacağınızı anlamalısınız. Ve bu yüzden işleri tek bir sayıya indirgemek gerçekten zor.

Ve bunu özellikle görüyorum - burada biraz dönüyorum - ama bunu şu anda yapay zeka ile görüyorum, bu çok çılgınca. Yapay zeka için tek bir numara alamayacak birkaç farklı şeyin olduğunu görüyorum. CPU hakkında konuştuğum kadarıyla, tüm bu farklı iş yükleriniz var ve tek bir sayı elde etmeye çalışıyorsunuz. Kutsal moly, AI. Pek çok farklı sinir ağı ve pek çok farklı iş yükü var. Kayan noktada mı çalıştırıyorsunuz, int olarak mı çalıştırıyorsunuz, 8 veya 16 bit hassasiyetle mi çalıştırıyorsunuz? Ve olan şu ki, insanların bu şeyleri yaratmaya çalıştıklarını görüyorum ve biz bu iş yükünü seçtik ve bunu başardık. kayan nokta ve testlerimizin %50'sini bu ağda ve diğer iki testte ağırlıklandıracağız ve bunları ağırlıklandıracağız Bu. Tamam, o ağdaki belirli bir iş yükünü gerçekten kullanan var mı? Gerçek uygulamalar var mı? Yapay zeka büyüleyici çünkü çok hızlı hareket ediyor. Size söyleyeceğim her şey muhtemelen bir veya iki ay içinde yanlış olacaktır. İşte bu da güzel bir şey çünkü çok değişiyor.

Ancak yapay zekadaki en büyük şey donanım değil, yazılımdır. Çünkü herkes onu kullanıyor, ben de bu sinir ağını kullanıyorum. Ve temel olarak, orada tüm bu çarpanlar var. Söz konusu sinir ağını optimize ettiniz mi? Peki bunu kıyaslama için mi optimize ettiniz, yoksa bazı insanların şunu söylemesi için mi optimize ettiniz: süper çözünürlüğü ölçen bir kıyaslama oluşturduğumu biliyorum, bu süper çözünürlük için bir kıyaslamadır AI. Bu ağı kullanıyorlar ve bunu kayan noktada yapmış olabilirler. Ancak etkileşime girdiğimiz her ortak, bunu ya 16 bit ve/veya 8 bit olarak ve farklı bir ağ kullanarak yapmayı başardık. Peki bu, süper çözünürlükte iyi olmadığımız anlamına mı geliyor çünkü bu çalışma bununla eşleşmiyor? Yani söylemek istediğim tek nokta, yapay zeka kıyaslamasının gerçekten karmaşık olduğudur. CPU ve GPU'nun karmaşık olduğunu mu düşünüyorsunuz? Yapay zeka tam bir çılgın."

Mario Serrafero: "Evet, çok fazla ağ türü var, çok fazla parametrelendirme var; farklı parametrelendirme, nasıl hesaplandığı konusunda farklı etkilere yol açıyor."

Travis Lanier: "İnceleyenleri meşgul edecek."

Mario Serrafero: "Ama eğer her şeyi genel olarak ölçmek istiyorsanız, bu çok daha zor. Ama evet, kimse bunu yapmıyor."

Mişaal Rahman: "Bu yüzden siz daha çok kullanım senaryolarına odaklanıyorsunuz."

Travis Lanier: "Sonunda, kullanım örneklerini gösterdiğinizde yapay zekanızın şu anda ne kadar iyi olduğunu düşünüyorum. Yazılıma gelince, birkaç yıl içinde biraz daha olgunlaşacağını düşünüyorum. Ancak şu anda yapılması gereken çok fazla yazılım işi var ve sonra şöyle değişiklikler oluyor: Tamam, bu ağ sıcak ve sonra gelecek yıl, "Ah, hayır, tüm bu konularda daha verimli olan yeni bir ağ bulduk" gibi, o zaman gidip işlemi yeniden yapmalısınız yazılım. Oldukça çılgınca."

Mario Serrafero: "NN'den bahsetmişken, bir nevi benim için geçişi gerçekleştirdin, benim için geçişi daha az garip bir şekilde düşündün. Altıgen'e geçiyoruz. Bu, tüketiciler, hatta çoğu meraklı ve kesinlikle meslektaşlarım tarafından en az anlaşılan bileşenlerden biri. Bilirsiniz, özellikle de bunun bir AI bloğu olarak tanıtılmadığı ve bir nevi dijital sinyal işleme fikri gibi olduğu göz önüne alındığında, bir şeyi tanıttığınızda bu orijinal fikir bir şekilde yapışıyor, yani eğer bir şey yapacaksanız, tamam bu sinirsel, sinirsel, sinirsel beyin zekasıyla ilgili sinirsel bir şey, bir nevi yapışıyor insanlar. Diğer çözümler için yapay zeka makine öğreniminin sinirsel, sinirsel, sinirsel etiketlerine sahipler. Bu yüzden belki size Hexagon DSP'nin evrimini ve neden bundan uzaklaşmadığınızı açıklama şansı vermek istiyoruz. Hexagon DSP, vektör uzantıları ve benzeri gibi pazarlamaya benzemeyen mühendislik gibi görünen adlar arkadaşça. Ama evet, tıpkı DSP'nin görüntüleme iş yükünün başlangıcından yepyeni tensör hızlandırıcıya geçişini görmenin sizin için nasıl ön saflarda yer aldığının kısa bir özeti gibi."

Travis Lanier: "Aslında ilginç bir nokta çünkü bazı rakiplerimizin aslında sinir motoru veya sinir hızlandırıcı adını verdikleri bir şeyleri var; bu aslında bir DSP, aynı şey. Sanırım isim önemli, ama önemli bir noktaya değindiniz ve dürüst olmak gerekirse, bunu ortaya koyduğumuzda bu görüntüleme içindi, sadece 8 bit'i destekliyorduk. Hot Chips'te sunum yaptığımızı hatırlıyorum ve Google'dan Pete Warden bizi takip etti ve şöyle dedi: "Hey, siz... yani siz 8 bit'i destekliyorsunuz, öyle mi?" Evet, yapıyoruz. Ve oradan hemen dışarı çıktık ve şöyle dedik, hey, devam eden tüm projelerimiz var. İşte o zaman TensorFlow'u Hexagon'a taşıdık, çünkü sanki, hey, bunu yapmak için orada 8 bit destekli vektör işlemcimiz var ve Hexagon DSP'mizdeydi. Her şeye yeniden başlamam gerekse muhtemelen buna Hexagon Nöral Sinyal İşlemcisi derdim. Ve hala diğer DSP'miz var, skaler DSP'lerimiz var ve bu, en gerçek anlamda bir DSP'dir. Ve sonra bu tür bir vektöre DSP diyoruz. Belki onu yeniden adlandırmalıyız, belki de ona sinirsel sinyal işlemcisi adını vermeliyiz çünkü muhtemelen kendimize gerektiği kadar itibar etmiyoruz. Bunun için yapmalı çünkü dediğim gibi, bazı insanların sadece vektör DSP'leri var ve buna ne diyorlarsa onu diyorlar ve hiçbir şeyi açıklamadılar. bu. Soruna cevap verdim mi?"

Altıgen 690'a Genel Bakış. Kaynak: Qualcomm.

Mario Serrafero: "Yani evet, muhtemelen çoğu doğru."

Travis Lanier: "İkinci soru neydi?"

Mario Serrafero: "Bu gelişmeyi içeride nasıl gördünüz? Nasıldı: deneyimler, zorluklar, zorluklar, bize anlatmak istediğiniz ne varsa? Görüntü işleme başlangıcından tensör hızlandırıcıya kadar olan evrimi nasıl gördünüz?"

Travis Lanier: "Biraz sinir bozucu oldu çünkü beni utandıran şey sanki bazı basın mensuplarının ellerini kaldırıp şöyle demeleri: "Qualcomm, ne kadar geri kalmışsın! Neden ne zaman özel bir sinir sinyali işlemcisine benzeyeceksin?” ve sadece başımı vurmak istiyorum. Sanki vektör işlemciye sahip ilk kişi bizdik! Ancak bununla birlikte, bunu düzenliyoruz ve AI hakkında daha fazla şey öğrendikçe muhtemelen daha fazla şey olmaya devam edeceğiz. Yani, diğer şeyi ekledik ve evet bu sadece yapay zeka yapıyor, altıgen kompleksinin bir parçası olarak görüntü işleme yapmıyor, yani siz şunu sunuyorsunuz… hala Hexagon DSP olarak adlandırdığımız gibi, tüm altıgen olayı için yakalanmış bir isim almaya çalışmak için tüm kompleksi Hexagon işlemci olarak adlandırıyoruz Şimdi. Aslında daha doğrudan hesaplama olan şeyler ekledik, doğrudan hesaplama dememeliyim, bunun gibi çarpma işlemini nerede yaptığınıza dair bu yüksek dereceli haritayı nasıl yapacağınıza dair otomatik yönetime sahip matrisler."

Mario Serrafero: "Tensörlerin kafamı sarması aslında benim için oldukça zor. Zaten sanki onlar da bir şekilde kendilerini sarıyorlar."

Travis Lanier: "Evet, üniversitede doğrusal cebir dersleri aldığımı düşündüm. Bunu adam gibi yaptım, "Umarım bunu bir daha asla yapmak zorunda kalmam!" Ve intikamla geri döndüler. Sanırım şöyle dedim, 'Ah dostum, diferansiyel denklemler ve doğrusal cebir intikamla geri döndü!'"

Mario Serrafero: "Pek çok meslektaşımın bu konuyu ele almadığını düşünüyorum. NPU'nun sadece bir dizi matris çarpımı, nokta çarpımı, doğrusal olmayan işlevler, evrişimler [ve] vb. olduğunda hala gizemli bir yönü olduğunu düşünüyorlar. Kişisel olarak bu tür bir sinirsel işlem motoru adının yardımcı olacağını düşünmüyorum, ama olay bu, değil mi? Adlandırma kuralları tarafından ne kadarı genişletilmiyor, karartılmıyor, temeldeki matematik küreklenmiyor ve belki ne yapılabilir? Bunu düşündün mü bilmiyorum. İnsanları bunun nasıl çalıştığı konusunda bilgilendirmek için [ne] yapılabilir? Bu nasıl bir şey değil, örneğin neden DSP diğer yeni sinirsel işleme motorlarının yapabildiği şeyi yapabiliyor? Yani bu sadece matematik ama kullanıcılar, okuyucular, bazı gazeteciler bunu anlamış gibi görünmüyor. Bunun Qualcomm'un sorumluluğunda olduğunu söylemiyorum ama sizce ne farklı yapılabilir? Bu muhtemelen benim sorumluluğumda."

Travis Lanier: "Dürüst olmak gerekirse teslim olmaya başlıyorum. Belki de bazı şeylere "sinirsel" adını vermemiz gerekiyor. Bunlara bakmaya başladığımızda lineer cebir ve diferansiyel denklemlerin başımızı nasıl döndürdüğünden bahsetmiştik. regresyon analizi yapmaya başladığınızda olduğu gibi bunu insanlara açıklamaya çalıştığınızda, denklemlere falan bakarsınız, insanların kafaları patlayabilir. Çoğu insana temel programlamayı öğretebilirsiniz, ancak onlara geri yayılım denklemlerinin nasıl çalıştığını öğretmeye başladığınızda, buna bakacaklar ve kafaları patlayacak. Yani evet, eğlenceli şeyler. Kısmi türevleri görmek istemiyorlar…”

Mario Serrafero: "Kısmi türev zincirleri, skalerler arasında değil, vektörler arasında ve doğrusal olmayan fonksiyonlar dahil."

Travis Lanier: "Bununla iyi şanslar! Evet, bu çok zor ve çoğu insanın bunu bilmek isteyip istemediğini bilmiyorum. Ama deniyorum: Şöyle küçük bir şey koydum: “Hey, burada yaptığımız tek şey vektör matematiği. Bir vektör işlemcimiz var.” Ve sanırım insanlar buna bakıp şöyle diyorlar: "Tamam ama dostum ben gerçekten sinirsel bir şey istiyorum. gaz pedalı." “Tensör” hala matematiksel, ancak insanların bunu biraz daha yapay zeka ile ilişkilendirebileceğini düşünüyorum. işleme."

Mario Serrafero: "Boşluğu, anlamsal boşluğu kapatmak gibi olabilir."

Travis Lanier: "Sonunda sanırım farklı bir isim bulmamız gerekecek."

Bu makaledeki tüm grafikler Travis Lanier'in Snapdragon Teknoloji Zirvesi'ndeki sunumundan alınmıştır. Sunum slaytlarını görüntüleyebilirsiniz Burada.