Interjú: Qualcomm a Snapdragon 855 Kryo 485-én és Hexagon 690-én

Travis Lanier a Qualcommtól leült az XDA-val egy interjúra a Snapdragon 855 mobilplatform Kryo 485 CPU-járól és a Hexagon 690 DSP marketingjéről.

A múlt hónapban a Qualcomm bemutatta a Snapdragon 855 mobil platform. A Snapdragon 855 az a mobilplatform, amely 2019-ben a legtöbb Android zászlóshajó okostelefont fogja működtetni. A Qualcomm évről évre jelentős fejlesztéseket hajtott végre következő generációs mobilplatformjával. A Snapdragon 855 mobilplatform 7 nm-es gyártási folyamatra épül, és lenyűgöző, 45%-os ugrást tesz lehetővé a CPU teljesítményében a Snapdragon 845-höz képest. A számítástechnikában végzett fejlesztések révén a Qualcomm kiváló mesterséges intelligencia teljesítménnyel büszkélkedhet az új Snapdragon 855-ön. Rengeteg információt kell itt kibontani, és mindent megtettünk, hogy megmutassuk hogyan javította a Qualcomm a teljesítményt és az AI-t a Snapdragon 855-ön. A termékbemutató után azonban továbbra is voltak saját kérdéseink, ezért leültünk Travis Lanier-vel, az idősebb A Qualcomm termékmenedzsment igazgatója, aki a Kryo 485 CPU-ról és az AI-ról beszél a Qualcomm új mobilján felület.

Mario Serrafero: "45% [ugrás], ez olyan, mint a valaha volt legnagyobb. Ezt bontsuk ki. Megvan az A76-os bázisunk, 7nm-ezek nagyok. Úgy tűnik, mióta eltávolodtatok az egyedi magoktól, néhány kiadványtól és a közönségtől fogalmam sem volt arról, hogy mit takar a Built on ARM licenc abból a szempontból, hogy mit engedhet meg megtenned. Elég titkolóztál azzal kapcsolatban, hogy ez mit takar [is]. Most az elsők egyike a színpadon, legalábbis a kérdezz-feleleteken túl…de most először mutattad meg, milyen fejlesztések történtek, és ez nagyszerű. Ezért arra voltunk kíváncsiak, hogy szeretné-e kifejteni azt, hogyan hangolta a Qualcomm a Kryo 485-öt, hogy többet tudjon kihozni Az ARM bázisa, akár az ott feltett cuccokra való kiterjesztést, akár olyasmit, amit még nem mutatott be."

Travis Lanier: "Tehát nem tudok többet mondani, mint a többi, ami a diákjaimban volt. Talán egy későbbi időpontban megtehetjük, hogy leülhessünk néhány szakértőt, akik ténylegesen elvégezték a munkát; Ismerem a magas szintű beszédtémákat. De mint tudod, az A76 már egy magas szintű dizájn – elég jó. És ez az egyik oka annak, amikor láttuk az ARM ütemtervét. Szóval úgy gondolom, oké, talán szorosabban kellene együtt dolgoznunk ezekkel a srácokkal, mert nagyon erősnek tűnt. És csak visszatérve a testreszabásról az ARM-mel kapcsolatos megjegyzésére. Rendben, ezeket a dolgokat megteheti. És ha csinálsz valamit, és annak különbséget kell tennie, akkor száz százalékig csinálhatsz valamit, vagy együttműködhetsz velük. És [mint az előző években], most is egy kicsit többet foglalkozunk az integrációval. Tehát buszok, és hogyan csatlakoztunk a rendszerhez, biztonsági funkcióik, amelyeket a CPU-kba helyeztünk, gyorsítótár konfigurációk. Most, hogy az eljegyzések hosszabb ideig tartanak, mélyebb testreszabást tudtunk végezni ezen. És így tudtunk behelyezni néhány ilyen dolgot, például nagyobb [nem rendes] végrehajtási ablakokat, igaz, így több utasítások repülés közben, az adatok előzetes letöltése valójában az egyik olyan terület, ahol a legtöbb innováció folyik a mikroprocesszor-iparban épp most. Sok technika ezekhez a dolgokhoz nagyon hasonló, manapság mindenki TAGE elágazás előrejelzőt használ, hogy mekkora méretűt biztosít, az emberek tudják, hogyan kell rendellenesen csinálni, és a továbbítás és minden ilyesmi a nagyobb gyorsítótárakért. De az előzetes letöltés, még mindig sok van, ez a sötét művészeti típusú dolgok egyike. Tehát még mindig sok újítás folyik ezen a téren. Tehát úgy éreztük, hogy segíthetünk.

És akkor csak azért, mert úgy érezzük, hogy általában jobban dolgozunk... általában gyorsabban tudunk megvalósítani egy tervet, mint mások integrálni egy folyamatcsomópontot. És így, ha ezek közül néhányat behelyezünk, például amikor jobban elromlik, az nagyobb terhelést jelent a tervezésen, igaz? Nem szabad hozzáadni ezeket a végrehajtási dolgokat. Tehát, hogy képes legyen erre, és ne érjen rád fmax. Igen, ez is része az ARM-mel kötött elköteleződésünknek, például, hogyan húzod le őket?

Mario Serrafero: „Csak kíváncsiságból az előadásban arról beszélt, hogy várható hatékonyságjavulás az előzetes letöltésből, energiahatékonyságról, teljesítményjavításokról beszélt, egy kicsit mindkét?"

Travis Lanier: "A fentiek mind. Tehát természeténél fogva előletöltést végzünk – Ön a gyorsítótárba húzta a dolgokat. Tehát ha a gyorsítótár nem tesz annyi memória-hozzáférést, most az előletöltés másik oldala is van: Ha túl sok előletöltést végez, több memóriát [használ], mert Tudd, [te] túl sok spekulatív előletöltést végez, de ami azt illeti, ha vannak cuccai, és a megfelelő cuccokat húzza ki, akkor nem megy a memóriába, hogy behúzza. ott. Tehát ha hatékonyabb előletöltővel rendelkezik, akkor energiát takarít meg, és növeli a teljesítményt."

Mario Serrafero: "Rendben, jó, igen. Igen, nem számítottam rá, hogy ennél sokkal többet tudsz majd terjeszkedni, de érdekes, hogy ha ezt mondod most többet szabtok testre, és talán a jövőben többet is megoszthattok egymással, akkor majd nyitva fogom tartani a szemem. Tehát a másik fajta fejforgató, legalábbis azok között, akikkel körülvesznek, az elsődleges mag. Így néhány éve rugalmasabb, klaszteres megállapodásokra számítottunk a DynamIQ bevonásával, és arra számítottunk, hogy más vállalatok is eltávolodnak a 4+4 megállapodástól. Tehát két kérdés: Mi volt az indíték az elsődleges mag mögött? Milyen előnyökkel jár az elsődleges mag a felhasználói élményben, mivel olvasóink szeretnék tudni, miért van ott csak egy magányos mag, és azt is, hogy miért nem egészen magányos mag? A teljesítménysík megosztása a teljesítményfürttel nem csökkenti-e azt a hasznosságot, amelyet akkor kaphatna, ha a DynamIQ-t használná, és önmagában ülne?

Travis Lanier: "Tehát először beszéljünk a különböző órákról és a különböző feszültségsíkokról. Tehát minden alkalommal, amikor hozzáad egy órát, és minden alkalommal, amikor hozzáad egy feszültséget, pénzbe kerül. Tehát korlátozott a csomagban elhelyezett tűk száma, több PLL-re van szükséged a különböző órákhoz, és ez csak megnövekedett bonyolultság. Tehát van egy csere a dolgok megtételére. Valamikor szélsőségesek lettünk; négy különböző tartományunk volt négy különböző órán, tehát volt tapasztalatunk ezzel és drága volt. Olyan, amikor elkezdesz nagyra menni. LITTLE, a kis magok a kis klaszteren vannak, és nincs szükségük ugyanarra a részletességre, úgymond külön órajelre a kis magok között. Igen, a levegőben van, hogy mit csinálsz ezekkel. Tehát amikor nagy. KIS rendszer, akkor viszont megvannak ezek a nagy magok. Nos, oké, mindegyiket egy nagy órára teszed? Nos, nem azokon futsz állandóan, ha valójában elég alacsony helyzetben vagy, amikor egy üres óra úgyis egy kis magon fog működni. Szóval tényleg elég jó kettő közülük.

És akkor eljutunk oda, ahol ez az elsődleges mag volt, ahol oké, nos, van egy külön óramagunk, amely magasabb frekvenciára tud futni. De ezek a többi mag, a többi teljesítményfürt nem képes felmenni ugyanarra a magas frekvenciára. Tehát ha meg akarja szerezni a mag teljes jogosultságát, akkor ehhez a harmadik órára van szüksége. Tehát mit csinál ez a mag? Kicsit érintettük ezt. Nagy dolgok lesznek [az] alkalmazásindító és a webböngészés. És akkor miért csak egy mag? Oké, a dolgok egyre többszálúak. Például a játékmotorok – erre egy másodperc múlva visszatérek – nagyon agresszíven haladnak több szál felé. De ha megnézed a legtöbb alkalmazást, még ha több szál is van, akkor a Pareto szabályt fogom használni, mint a legtöbb, a terhelés 80%-a egy szálon van. Tehát elindíthat [egy] alkalmazást, és az mind a 8 magon bekapcsolhat és világíthat. De több mint valószínű, hogy 80%-a egy domináns szálban van – abban az egy magban. A webböngészés továbbra is elsősorban, nos, JavaScript, azt mondanám – a webböngészés egy kicsit jobb lett a többszálú megoldással, ahol több kép is lehet, és dekódolni tudja őket. De például a JavaScript – [egy] egyetlen szál fog futni egy magon. Tehát számos olyan felhasználási eset létezik, amelyeknek haszna származik abból, hogy ez az egy mag nagyon magasra sikerült.

Most már három magunk van, amely egy kicsit alacsonyabb frekvencián fut, de energiahatékonyabbak is. És így például, amikor Ön – nem tudom, mennyit tud a magok megvalósításáról –, de amikor elkezdi elérni a frekvencia csúcsát, és ezeknek a magoknak a megvalósítása során kompromisszum van a teljesítményben, a dolgok kezdenek exponenciálissá válni az utolsó néhány megahertzben vagy gigahertzben van. Igen, és egy másodperccel ezelőtt beszéltem arról, hogy minden játék kezd többszálas lenni, mint minden ha visszanézel, hirtelen volt pár játék nem is olyan régen, és csak egyet használnak. cérna. De furcsa, milyen gyorsan tud az iparág megváltozni. Az elmúlt egy-másfél évhez hasonlóan, szó szerint elkezdték ezeket a játékokat belehelyezni… Izgatott lettem ezektől a high-fidelity játékoktól. És így, miközben sok dolog, akár hat hónappal vagy egy évvel ezelőtt is, valójában egész Kínában megfordult. Kínában azt hallom: "Nem igazán érdekelnek a nagy magok, adj nyolcast bármiből, adj nyolcat a a legkisebb magokat, hogy nyolc magom legyen." Változtak, mert ezeket a játékokat akarják, ezekhez a játékokhoz szükség van nagy magok. Most pedig azt a visszajelzést kapjuk a partnereinktől, hogy „nem, valójában négy nagy magot akarunk”, az összes megjelenő fejlett játék miatt. És ezeket a magokat fogják használni.

Tehát amikor játszol, nem játszol 30 másodpercig, vagy 5 percig, hanem tovább. Tehát logikus, hogy ez a három másik mag van a legtöbb többszálas nagymagos használati esetedben, ezek egy kicsit nagyobb energiahatékonyságot akarnak elérni. Valahogy kiegyenlíti, akkor van ez a nagyobb teljesítményű mag, amikor szüksége van rá néhány ilyen dologhoz ezek közül a tartós esetek közül, ahol nagy magok is vannak, és Önnek van ez a hatékonyabb, energiahatékonyabb megoldás a párosításhoz hogy. Ez a fajta gondolkodás – ez egy kicsit szokatlan szimmetria. De remélhetőleg ez választ ad arra, hogy miért [van] elsődleges mag, miért nincs külön óra, és miért nincs külön feszültség? És ezért azt hiszem, hogy mindezeket érintettem."

Kryo 485 CPU magkonfiguráció. Forrás: Qualcomm.

Mario Serrafero: "Most, heterogén számítás. Ez az, amit a Qualcomm hangsúlyoz, amióta a régi márkajelzésről a mobilplatformra vált, és ez a fajta [egy] leíró, valamint blokkok összesítése bizonyos teljesítménymutatók leírásából, mint pl. AI. Hogyan történt ez az evolúció a heterogénebb számítási megközelítésre való átállásban? Bárhol, a tervezéstől a kivitelezésen át a marketingig, vagy bármihez, amihez hozzányúlhat."

Travis Lanier: "Egy kicsit oda-vissza megy. De végül is rendelkeznie kell ezekkel a motorokkal, mert a játék neve mobilban az energiahatékonyság. Most néha azt látod, hogy időnként visszatér az általánosításhoz. Ha visszatér az eredetihez, még az okostelefonok esetében is, a telefonok multimédiával és kamerával rendelkeztek bizonyos mértékig képességeik vannak, és így megvannak ezek a kis dedikált dolgok, mert te nem tudtad csináld. Ha visszatérünk az ARM 9-re vagy ARM 7-re épülő telefonokhoz, mindegyiknek volt hardveres gyorsító widgete mindenhez.

De hogy mondjak egy példát, ahol valami általános lett, és most megint hardvert kérnek, az a JPEG. Régebben volt JPEG gyorsító. A CPU végül elég jó lett, és elég hatékony volt, a JPEG-ek pedig megmaradtak Ugyanolyan méretű, hé, tudod mit, mi csak megyünk előre, és csináljuk a CPU-n [ahogy] egyszerűen könnyebb megtenni azt. Most, ahogy a képek egyre nagyobbak és nagyobbak lesznek, hirtelen az emberek elmennek. Tudod, valójában azt akarom, hogy felgyorsuljanak ezek az igazán gigantikus fényképfájlok. A CPU-k vagy nem elég gyorsak, vagy túl sok energiát égetnek el. Csak hirtelen megnőtt az érdeklődés a JPEG-gyorsítók iránt. Tehát nem mindig egyenes vonal a dolgok menete, akkor meg kell nézni, hogy most mi történik Moore törvényével. Mindenki folyton arról beszél, hé, lehet, hogy nem haltál meg, de egy kicsit lassul, igaz? Tehát ha nem kapja meg ezt a teljesítménynövekedést vagy a teljesítménynövekedést minden következő csomóponttól, hogyan helyezhet el további funkciókat a telefonra, ha nincs ilyen többletköltsége? Tehát egyszerűen ráteheti a CPU-ra. De ha nincs több hely a CPU számára, hogyan gyorsíthatja fel ezeket a dolgokat? Nos, a válasz az, hogy ezeket a speciális magokat és dolgokat hatékonyabban helyezi el. És hát ez a természetes feszültség.

Látni fogja, hogy az embereket arra kényszerítik, hogy megtegyék ezeket a dolgokat a közös funkciókért, mivel talán nem mindenki lesz a vérzés szélén. De minden bizonnyal megpróbálunk ott maradni, ameddig csak lehetséges, de nem kényszeríthetjük a fabeket, hogy a következő csomópontba költözzenek, ha az nincs szükségszerűen ott. Ezért kell a folyamatos innovációra és ezekre az architektúrákra összpontosítania, hogy továbbra is jobb teljesítményt és energiahatékonyságot érhessen el. Tehát ez az erősségünk és a hátterünk."

Mario Serrafero: "Annak ellenére, hogy a Qualcomm részről sok közönség és minden bizonnyal sok publikáció is elmozdult a heterogén számítások felé. Meglepő módon sok rajongó, akiről azt gondolja, hogy jobban ismeri, még mindig különállónak gondolja, mérlegeli és értékeli a blokkokat entitások. Továbbra is a következőre koncentrálnak: „Látni akarom a CPU-számokat, mert ez érdekel.” GPU-számokat akarnak látni, mert szeretik a játékokat, így tovább és így tovább. Nem tekintik őket egyetlen integrált termék kommunikált részének. Hogyan gondolja, hogy a Qualcomm összetörte ezt a paradigmát, és képes-e megtörni, mivel a versenytársak továbbra is a marketing adott blokkról blokkra történő fejlesztésére összpontosítanak? Pontosabban, később továbbtérünk a neurális hálózatokra, a neurális motorokra."

Travis Lanier: "Remélem, ma érintettem valamit. Mi például a tartós játékra összpontosítunk, így lehet, hogy jó pontszámot érsz el a játék összes benchmarkján. Az emberek megszállottá válnak emiatt. De valójában az számít, hogy ha játszod a játékodat, a másodpercenkénti képkockáid folyamatosan ott maradnak, ahol a legmagasabb ponton szeretnéd, hogy legyenek? Szerintem az emberek túlságosan nagy súlyt helyeznek egy számra egy ilyen blokk esetében. Nagyon nehéz, és megértem azt a vágyat, hogy adjak egy számot, amely megmondja, mi a legjobb. Annyira kényelmes, különösen manapság az AI-ban, egyszerűen őrültség. Még a CPU-benchmarkok mellett is mit mér a CPU-benchmark? Mindegyik mást mér. Vegyük bármelyik referenciaértéket, például a GeekBenchnek van egy csomó alkomponense. Látsz valakit, aki szétszakad, és megvizsgálja, hogy ezen alkomponensek közül melyik a legrelevánsabb ahhoz, amit valójában csinálok?

Mario Serrafero: – Néha igen.

Travis Lanier: "Talán ti igen. Olyanok vagytok, mint egy kiugró. De talán az egyik CPU jobb ebben, és talán egy jobb a másikban. Ugyanez a helyzet a SPEC-vel, az emberek az egyetlen SPEC-et fogják kiemelni, nos, oké, ezen belül sokféle munkaterhelés van. És ezek elég szűk dolgok, de még a SPEC is, amit tulajdonképpen a CPU-k fejlesztésére használunk, ha a tényleges terhelést nézzük, valóban relevánsak? Kiválóan alkalmas a munkaállomások terheléseinek összehasonlítására, de tényleg molekuláris modellezést végzek a telefonomon? Nem. De megint csak az a lényeg, hogy ezeknek a benchmarkoknak a többsége valamilyen szempontból hasznos, de meg kell értened a kontextust, hogy mire való, és hogyan jutsz el oda. Így nagyon nehéz egy számra lebontani a dolgokat.

És én ezt különösen látom – itt egy kicsit elfordulok –, de ezt most látom az MI-nél, ez hülyeség. Úgy látom, hogy van néhány különböző dolog, amely nem kap egy számot a mesterséges intelligencia számára. És bármennyire is a CPU-ról beszéltem, és ezek a különböző munkaterhelések, és megpróbálsz egy számot szerezni. Holy Moly, AI. Olyan sokféle neurális hálózat van, és annyi különböző munkaterhelés. Lebegőpontos, int-ben futtatod, 8 vagy 16 bites pontossággal? És ami történt, az az, hogy látom, hogy az emberek megpróbálják létrehozni ezeket a dolgokat, és hát mi választottuk ezt a munkaterhelést, és megcsináltuk lebegőpontos, és tesztjeink 50%-át ezen az egy hálózaton és két másik teszten súlyozzuk, és súlyozzuk őket ez. Oké, tényleg használja valaki azt a bizonyos munkaterhelést azon a neten? Valódi alkalmazások? Az AI azért lenyűgöző, mert olyan gyorsan mozog. Bármit mondok, valószínűleg egy-két hónapon belül helytelen lesz. Szóval ez is jó benne, mert rengeteget változik.

De a legnagyobb dolog nem a hardver az AI-ban, hanem a szoftver. Mert mindenki ezt használja, én például ezt a neurális hálót használom. És alapvetően ott vannak ezek a szorzók. Optimalizáltad az adott neurális hálózatot? És így optimalizáltad-e a referenciaértéket, vagy azt, hogy egyesek azt mondják: tudja, mit hoztam létre egy viszonyítási alap, amely a szuperfelbontást méri, ez a szuperfelbontás viszonyítási alapja AI. Nos, ők ezt a hálózatot használják, és lehet, hogy lebegőpontos formában tették. De minden partnerünk, akivel kapcsolatba lépünk, vagy 16 bites és/vagy 8 bites, más hálózatot használva sikerült. Ez azt jelenti, hogy nem vagyunk jók a szuperfelbontásban, mert ez a munka nem illik hozzá? Tehát az egyetlen megjegyzésem az, hogy az AI benchmark [ing] nagyon bonyolult. Szerinted bonyolult a CPU és a GPU? Az AI egyszerűen őrült."

Mario Serrafero: "Igen, túl sokféle hálózat létezik, túl sok a paraméterezés – a különböző paraméterezések különböző hatásokhoz vezetnek, és hogyan számítják ki."

Travis Lanier: "Ez lefoglalja a bírálókat."

Mario Serrafero: "De mint ha a dolgok egészét akarod mérni, az sokkal nehezebb. De igen, senki sem csinálja."

Mishaal Rahman: "Ezért, srácok, jobban összpontosítanak a használati esetekre."

Travis Lanier: "Szerintem, ha egyszer megmutatod a használati eseteket, akkor most ilyen jó a mesterséges intelligencia. Ez a szoftveren múlik, szerintem pár éven belül egy kicsit tovább fog érni. De jelenleg annyi szoftveres munka van, amit el kell végezni, aztán olyan változások következnek be, mint: Oké, nos, ez a hálózat forró, majd például jövőre: „Ó, nem, találtunk egy új hálózatot, amely mindezekben a dolgokban hatékonyabb”, így aztán újra kell csinálnod szoftver. Ez elég őrült."

Mario Serrafero: „Ha már az NN-ről beszélünk, te csináltad meg helyettem az átállást, számomra kevésbé kínos átmeneti gondolkodást. Tovább a hatszögre. Ez az egyik olyan összetevő, amelyet – mondhatnám – a fogyasztók, még a legtöbb rajongó, minden bizonnyal a kollégáim is a legkevésbé értenek. Tudod, főleg, hogy nem mesterséges intelligencia blokkként vezették be, és mint az egész digitális jelfeldolgozási ötlet, tudod, amikor bemutatsz valamit. ez az eredeti ötlet valahogy ragad, szóval ha csinálsz valamit, oké, az egy neurális dolog a neurális, neurális, neurális agyi intelligenciával, valahogy kitart emberek. Rendelkeznek AI gépi tanulási neurális, neurális, neurális címkékkel más megoldásokhoz. Szeretnénk tehát lehetőséget adni, hogy elmagyarázza a Hexagon DSP fejlődését, miért nem távolodott el ettől. olyan mérnöki hangzású nevek, mint a Hexagon DSP, vektor kiterjesztések és így tovább, amelyek nem olyanok, mint a marketing barátságos. De igen, csak úgy, mint egy gyors összefoglaló arról, hogy a DSP élvonalában milyen volt az Ön számára, hogy a képalkotási terhelés kezdetétől a vadonatúj tenzorgyorsítóig haladjon."

Travis Lanier: "Ez valójában egy érdekes pont, mert néhány versenytársunknak van valami, amit neurális motornak vagy neurális gyorsítónak neveznek – ez valójában egy DSP, ez ugyanaz. Szóval azt hiszem, a név fontos, de érintettél egy fontos pontot, és őszintén szólva, amikor ezt közzétettük, az a képalkotásról szólt, csak véletlenül támogattuk a 8 bitet. És emlékszem, hogy a Hot Chipsben prezentáltunk, és Pete Warden a Google-tól valahogy lenyomott minket, és azt mondta: „Hé, te… szóval 8 bitet támogattok, mi?” Igen, igen. És így onnantól azonnal kimentünk, és azt mondtuk, hé, mindannyian [ezek] projektek vannak. Ekkor mentünk át, és portoltuk a TensorFlow-t a Hexagonra, mert olyan, hé, ehhez van egy 8 bites támogatott vektorprocesszorunk, és ez a Hexagon DSP-n volt. Ha újra kellene kezdenem az egészet, valószínűleg Hexagon Neural Signal Processornak nevezném. És még mindig megvan a másik DSP, vannak skalár DSP-ink, és ez egy DSP a legigazibb értelemben. És akkor ezt a fajta vektort DSP-nek hívjuk. Talán át kellene nevezni, talán neurális jelfeldolgozónak kellene nevezni, mert valószínűleg nem adunk annyi hitelt magunknak, mint ezért kellene, mert ahogy mondtam, néhány embernek csak vektor DSP-je van, és bárminek is hívják, és nem árultak el semmit. ez. Válaszoltam a kérdésedre?"

Hexagon 690 áttekintése. Forrás: Qualcomm.

Mario Serrafero: – Szóval, igen, valószínűleg ez a legtöbb.

Travis Lanier: "Mi volt a második kérdés?"

Mario Serrafero: – Pontosan így láttad ezt a belső fejlődést. Milyen volt: tapasztalatok, nehézségek, kihívások, bármi, amiről szeretnél mesélni? Hogyan láttad a fejlődést a képfeldolgozás kezdeteitől a tenzorgyorsítóig?"

Travis Lanier: "Kicsit frusztráló volt, mert olyan, amitől megborzongok, mintha néhány sajtó felemelné a kezét, és azt mondaná: "Qualcomm, miről vagy annyira lemaradva! Miért nem… Mikor leszel olyan, mint egy dedikált neurális jelfeldolgozó? és csak szeretném, ha megütögetném a fejem. Olyan voltam, mintha mi lennénk az elsők, akiknek vektorprocesszoruk van! Ennek ellenére ezt szerkesztjük, és valószínűleg továbbra is több dolog lesz, ahogy többet megtudunk az AI-ról. Szóval, hozzáadtuk ezt a másik dolgot, és igen, ez az – csak mesterséges intelligenciát végez, képfeldolgozást nem végez a hatszög komplexum részeként, így Ön felajánlja… ahogy még mindig Hexagon DSP-nek hívjuk, az egész komplexumot Hexagon processzornak hívjuk [hogy] megpróbáljunk elkapott nevet szerezni az egész hatszög dolognak. Most. Hozzáadtunk olyan dolgokat, amelyek valójában [közvetlenebb] számítanak, nem szabad azt mondani, hogy közvetlenül számítanak, tetszik rendelkezik ezzel az automatikus kezeléssel, hogy hogyan csinálja ezt a magasabb rendű térképet, ahol szoroz mátrixok."

Mario Serrafero: „A tenzorokat valójában nagyon nehéz körbetekernem a fejem. Különben is olyan, mintha maguk köré csavarnák magukat."

Travis Lanier: "Igen, úgy gondoltam, hogy az egyetemen elvégeztem a lineáris algebra óráimat. Úgy tettem, mint az ember: „Remélem, soha többé nem kell ilyet csinálnom!” És bosszúval tértek vissza. Azt hiszem, úgy voltam vele, hogy "Ó, ember, a differenciálegyenletek és a lineáris algebra bosszúval tértek vissza!"

Mario Serrafero: "Úgy érzem, sok kollégám nem értette meg ezt. Még mindig azt hiszik, hogy az NPU-nak van egy rejtélyes aspektusa, amikor csak egy csomó mátrixszorzás, pontszorzatok, nemlinearitási függvények, konvolúciók stb. És nem hiszem, hogy személy szerint ez a fajta neurális feldolgozó motor neve segít, de ez a lényeg, nem? Mennyire nem tágítják, homályosítják el, nem lapátolják a mögöttes matematikát az elnevezési konvenciók, és mit lehet tenni? Nem tudom, gondoltál-e erre. [Mit] lehet tenni, hogy tájékoztassuk az embereket ennek működéséről? Hogy nem csak, miért, miért képes például a DSP arra, amit a többi új neurális feldolgozó motor? Úgy értem, ez csak matematika, de úgy tűnik, hogy a felhasználók, az olvasók, néhány újságíró nem érti ezt. Mit lehet – nem azt mondom, hogy ez a Qualcomm felelőssége –, de szerinted mit lehetne másként tenni? Valószínűleg az én felelősségem."

Travis Lanier: "Őszintén szólva, kezdem megadni magam. Talán csak „neurális”-nak kell neveznünk a dolgokat. Éppen arról beszéltünk, hogy a lineáris algebra és a differenciálegyenletek hogyan forgatták el a fejünket, amikor elkezdtük ezeket nézni. dolgokat, és így amikor elkezdi ezt elmagyarázni az embereknek, mint amikor elkezdi a regressziós elemzést, akkor az egyenleteket és másokat, az emberek fejét nézi. felrobban. A legtöbb embernek meg lehet tanítani az alapvető programozást, de amikor elkezdi tanítani nekik a visszaszaporítási egyenletek működését, akkor ránéznek, és felrobban a fejük. Szóval igen, szórakoztató dolgok. Nem akarnak részleges származékokat látni…”

Mario Serrafero: "Parciális derivált láncok, nem skalárokon, hanem vektorokon át, és nemlineáris függvényeket is beleértve."

Travis Lanier: "Sok sikert azzal! Igen, nehéz, és nem tudom, hogy a legtöbben tudni akarnak erről. De megpróbálom: beraktam egy apróságot, mint például: „Hé, mi itt csak vektoros matematikát csinálunk. Van vektorprocesszorunk.” És azt hiszem, az emberek ezt nézik, és azt mondják: „Rendben, de ember, én nagyon szeretnék egy idegrendszert gyorsító." A „Tensor” még mindig matematikai, de azt hiszem, az emberek ezt egy kicsit jobban az MI-hez köthetik feldolgozás."

Mario Serrafero: "Olyan lehet, mint a szakadék áthidalása, a szemantikai szakadék."

Travis Lanier: "Végül úgy gondolom, hogy csak más nevet kell kitalálnunk."

A cikkben szereplő összes grafika Travis Lanier Snapdragon Tech Summit-en tartott előadásából származik. Megtekintheti a bemutató diákat itt.