Rozhovor: Qualcomm o Kryo 485 a Hexagone 690 Snapdragon 855

Travis Lanier z Qualcommu sa posadil s XDA na rozhovor o CPU Kryo 485 v mobilnej platforme Snapdragon 855 a marketingu Hexagon 690 DSP.

Minulý mesiac spoločnosť Qualcomm predstavila Mobilná platforma Snapdragon 855. Snapdragon 855 je mobilná platforma, ktorá bude v roku 2019 poháňať väčšinu smartfónov so systémom Android. Spoločnosť Qualcomm medziročne výrazne zlepšila svoju mobilnú platformu novej generácie. Mobilná platforma Snapdragon 855 je postavená na 7nm výrobnom procese a oproti Snapdragonu 845 ponúka pôsobivý 45% skok vo výkone CPU. Vylepšenia vo výpočtoch umožňujú Qualcommu pochváliť sa vynikajúcim výkonom AI na novom Snapdragon 855. Je tu veľa informácií, ktoré treba rozbaliť, a my sme sa ich snažili ukázať ako Qualcomm zlepšil výkon a AI na Snapdragon 855. Po odhalení produktu sme však mali stále vlastné otázky, a tak sme si sadli s Travisom Lanierom, seniorom Riaditeľ produktového manažmentu v Qualcomm, aby hovoril o CPU Kryo 485 a AI na novom mobile Qualcomm plošina.


Mario Serrafero

: „45 % [skok], je to ako doteraz najväčší. Poďme to rozbaliť. Máme základňu A76, 7nm – to sú veľkí prispievatelia. Zdá sa, že odvtedy, čo ste sa odklonili od vlastných jadier, niektorých publikácií a publík nemal som ani poňatia o tom, čo znamená licencia Built on ARM z hľadiska toho, čo môže povoliť ty robiť. Bol si dosť tajný o tom, čo to obnáša [aj]. Teraz na pódiu po prvý raz máte, aspoň okrem otázok a odpovedí,... ale prvýkrát ste ukázali, aké boli niektoré vylepšenia, a to je skvelé. Zaujímalo nás teda, či by ste chceli rozšíriť informácie o tom, ako Qualcomm vyladil Kryo 485, aby vytlačil viac [z] základňa ARM, či už ide o rozšírenie vecí, ktoré ste tam odhalili, alebo niečo, čo ste neprezentovali.“

Travis Lanier: "Takže naozaj nemôžem povedať viac ako iné, čo bolo v mojich snímkach. Možno niekedy v budúcnosti budeme môcť, takže si môžeme sadnúť a zohnať odborníkov, ktorí tú prácu skutočne vykonali; Poznám témy na vysokej úrovni. Ale ako viete, A76 je už dizajn na vysokej úrovni – je celkom dobrý. A je to jeden z dôvodov, keď sme videli plán ARM. Takže si hovorím, dobre, možno by sme mali s týmito chlapcami užšie spolupracovať, pretože to vyzeralo veľmi silno. A len sa vrátim k vášmu komentáru k prispôsobeniu verzus ARM. Takže dobre, sú tu všetky tieto veci, ktoré môžete urobiť. A ak niečo robíte a musí to byť odlíšené, tak môžete niečo robiť na sto percent alebo sa s nimi spojiť. A [ako v] predchádzajúcich rokoch sme trochu viac o integrácii. Takže autobusy a ako sme sa pripojili k systému, ich bezpečnostné funkcie, ktoré sme vložili do CPU, konfigurácie vyrovnávacej pamäte. Teraz, keď už zásnuby trvajú dlhšie, mohli sme na tomto urobiť hlbšie prispôsobenie. A takto sme tam mohli vložiť niektoré z týchto vecí, napríklad väčšie [mimo poradie] spúšťacie okná, správne, takže máte viac Inštrukcie za letu, predbežné načítanie údajov je v skutočnosti jednou z oblastí, v ktorých prebieha najviac inovácií v mikroprocesorovom priemysle práve teraz. Veľa techník pre mnohé z týchto vecí je dosť podobných, každý dnes používa prediktor vetvy TAGE, ako veľké to poskytujete, ľudia vedia, ako to urobiť mimo prevádzky, a preposielanie a všetky tieto veci pre väčšie vyrovnávacie pamäte. Ale predbežné načítanie, stále je toho veľa, je to jedna z tých vecí typu temného umenia. Takže v tomto priestore je stále veľa inovácií. Takže to je niečo, s čím sme cítili, že by sme mohli pomôcť.

A potom len preto, že máme pocit, že vo všeobecnosti odvádzame lepšiu prácu s... zvyčajne dokážeme implementovať návrh rýchlejšie, ako iní dokážu integrovať procesný uzol. A tak, keď tam vložíme niektoré z týchto vecí, napríklad keď sa vám viac pokazí, je to väčší dôraz na váš dizajn, však? Nie je zadarmo pridať tam všetky tieto exekučné veci. Takže, aby ste to mohli urobiť a nemali by ste sa s tým stretnúť fmax. Áno, to je súčasť zásnub, ktoré máme s ARM, napríklad ako ich vytiahnete?"

Mario Serrafero: „Len zo zvedavosti ste v prezentácii hovorili o nadchádzajúcom zlepšení efektívnosti z predbežného načítania, hovorili ste o energetickej účinnosti, vylepšeniach výkonu, trochu obaja?"

Travis Lanier: "Všetky vyššie uvedené. Takže zo svojej podstaty robíme predbežné načítanie – vytiahli ste veci z vyrovnávacej pamäte. Takže keď vyrovnávacia pamäť nevykonáva toľko prístupov do pamäte, je tu odvrátená strana predbežného načítania: Ak vykonáte príliš veľa predbežného načítania, [používate] viac pamäte, pretože viete, [robíte] príliš veľa špekulatívneho predbežného načítania, ale pokiaľ máte veci a vyťahujete tie správne veci, potom sa nevrátite do pamäte, aby ste ich stiahli tam. Takže ak máte efektívnejší predvýber, šetríte energiu a zvyšujete výkon."

Mario Serrafero: "Dobre, v pohode, áno. Áno, nečakal som, že budete môcť rozšíriť oveľa viac, ale je zaujímavé, že ak poviete, že teraz si viac prispôsobujete a možno budete môcť v budúcnosti zdieľať viac, potom na to budem dávať pozor. Takže druhý druh obracania hlavy, aspoň medzi ľuďmi, ktorými som obklopený, je hlavným jadrom. Takže sme už niekoľko rokov po zahrnutí DynamIQ očakávali flexibilnejšie zoskupenia a očakávali sme, že ostatné spoločnosti odstúpia od usporiadania 4+4. Takže dve otázky: Aký bol motív hlavného jadra? Aký prínos má hlavné jadro pre používateľskú skúsenosť, pretože naši čitatelia by chceli vedieť, prečo je tam len osamelé jadro a tiež prečo to nie je celkom osamelé jadro? Neznížilo by zdieľanie energetického lietadla s výkonnostným klastrom niektoré funkcie, ktoré by ste mohli získať, ak by ste používali DynamIQ a sedeli ho samostatne?"

Travis Lanier: „Poďme teda najprv hovoriť o rôznych hodinách a rôznych napäťových rovinách. Takže zakaždým, keď pridáte hodiny a zakaždým, keď pridáte napätie, stojí to peniaze. Takže je tu limit na počet pinov, ktoré umiestnite na balík, je tu viac PLL, ktoré musíte mať pre rôzne hodiny a je tu len zvýšená zložitosť. Takže tam je výmena robiť veci. V jednom bode sme išli do extrému; mali sme štyri rôzne domény na štyroch rôznych hodinách, takže sme s tým mali skúsenosti a bolo to drahé. Druh, keď začnete byť veľký. MÁLO, máte malé jadrá na [malom] klastri a nepotrebujú takú istú granularitu, takpovediac, oddelené hodiny medzi malými jadrami. Áno, je to trochu vo vzduchu, čo s tým urobíte. Takže keď máte veľkú. LITTLE systém, potom máte naopak tieto veľké jadrá. Dobre, dáte každý z nich na veľké hodiny? No, nebežíte na nich po celú dobu, ak ste v skutočnosti v dostatočne nízkej situácii, keď neobsadené hodiny budú aj tak bežať na malom jadre. Takže naozaj, je to tak, že dvaja sú tam dosť dobrí.

A potom sa dostanete tam, kde sme mali toto hlavné jadro, kde dobre, no, máme samostatné hodinové jadro, ktoré môže bežať na vyššiu frekvenciu. Ale tieto ďalšie jadrá, ostatné výkonnostné klastre, nedokážu dosiahnuť rovnakú vysokú frekvenciu. Takže ak chcete získať plný nárok na toto jadro, musíte mať na to tretie hodiny. Čo teda robí toto jadro? Trochu sme sa toho dotkli. Veľké veci budú [spúšťač] aplikácií a prehliadanie webu. A prečo teda len jedno jadro? Dobre, veci sú teraz viac multivláknové. Napríklad herné motory – k tomu sa vrátim za sekundu – sa veľmi agresívne pohybujú smerom k viacerým vláknam. Ale ak sa pozriete na väčšinu aplikácií, aj keď majú viacero vlákien, použijem Paretovo pravidlo, ako väčšina z nich, 80 % záťaže je v jednom vlákne. Môžete teda spustiť [] aplikáciu a tá sa môže spustiť a rozsvietiť na všetkých 8 jadrách. Ale viac ako pravdepodobné, 80% z toho je v jednom dominantnom vlákne - je to v tomto jednom jadre. Prehliadanie webu je stále primárne, no, JavaScript, povedal by som – prehliadanie webu sa trochu zlepšilo vďaka multithreadingu, kde môžete mať viacero obrázkov a môžete ich dekódovať. Ale napríklad JavaScript – [jedno] vlákno bude bežať na jednom jadre. Existuje teda veľké množstvo prípadov použitia, ktoré ťažia z toho, že toto jedno jadro išlo naozaj vysoko.

Teraz máme tri jadrá, ktoré bežia o niečo na nižšej frekvencii, ale sú tiež energeticky efektívnejšie. A tak, kedykoľvek budete – neviem, koľko toho viete o implementácii jadier – ale kedykoľvek začnete dosahovať vrchol frekvencie a implementácie týchto jadier, dochádza k výmene moci, veci začínajú byť exponenciálne v tých posledných niekoľkých megahertzoch alebo gigahertzoch, ktoré mať. Áno, a tak som pred sekundou hovoril o tom, kde, hej, všetky hry začínajú byť multivláknové, ako všetky Zrazu, keď sa pozriete späť, prednedávnom tu bolo pár hier a práve jednu používajú niť. Ale je zvláštne, ako rýchlo sa toto odvetvie dokáže zmeniť. Rovnako ako v minulom roku, roku a pol, doslova začali vkladať všetky tieto hry do... Tieto hry s vysokou vernosťou ma nadchli. A tak zatiaľ čo veľa vecí, dokonca ako pred šiestimi mesiacmi až rokom, predtým, v skutočnosti sa to obrátilo po celej Číne. V Číne počujem: „V skutočnosti ma nezaujímajú veľké jadrá, dajte mi osem z čohokoľvek, dajte mi osem najmenšie jadrá, aby som mohol mať osem jadier." Zmenili sa, pretože chcú tieto hry, tieto hry vyžadujú veľké jadrá. A teraz dostávame spätnú väzbu od partnerov, že „nie, my vlastne chceme štyri veľké jadrá“ kvôli všetkým pokročilým hrám, ktoré vychádzajú. A použijú všetky tieto jadrá.

Takže keď hráte, nehráte 30 sekúnd alebo 5 minút, hráte dlhšie. Takže to dáva zmysel, máme tieto tri ďalšie jadrá vo väčšine prípadov použitia veľkých jadier s viacerými vláknami, chcú mať o niečo vyššiu energetickú účinnosť. Akosi sa to vyvažuje, toto jadro s vyšším výkonom máte, keď ho potrebujete na niektoré z týchto vecí v rámci niektorých z týchto trvalých prípadov, keď majú tiež veľké jadrá a máte k dispozícii toto energeticky efektívnejšie riešenie, s ktorým môžete spárovať že. To je druh myslenia – je to trochu nezvyčajná symetria. Ale dúfajme, že to odpovie, prečo [je tu] hlavné jadro, prečo nemáte samostatné hodiny a prečo nemáte samostatné napätie? A tak si myslím, že som sa dotkol všetkých."

Konfigurácia jadra CPU Kryo 485. Zdroj: Qualcomm.

Mario Serrafero: „Teraz, heterogénny výpočet. To je to, čo Qualcomm zdôrazňuje od prechodu od starej značky na mobilnú platformu, a tento druh deskriptora a tiež agregovanie blokov z opisu určitých výkonnostných metrík, ako napr AI. Aký bol tento vývoj pri prechode na heterogénnejší výpočtový prístup? Všade od návrhu cez realizáciu až po marketing alebo čokoľvek, čoho sa môžete dotknúť."

Travis Lanier: „Ide to trochu tam a späť. Ale nakoniec musíte mať tieto motory, pretože názov hry v mobile je energetická účinnosť. Teraz niekedy vidíte, že sa raz za čas vracia späť k zovšeobecneniu. Ak sa vrátite k originálu, dokonca aj v prípade smartfónov mali bežné telefóny multimédiá a fotoaparát schopnosti do určitej miery, a tak majú všetky tieto malé veci, pretože vy ste to nedokázali urob to. Ak sa vrátite k telefónom, ktoré sú postavené na ARM 9 alebo ARM 7, všetky mali widget na hardvérovú akceleráciu pre všetko.

Ale aby som vám dal príklad, kde sa niečo stalo všeobecným a potom teraz znova žiadajú hardvér, bol by JPEG. Kedysi existoval JPEG akcelerátor. Procesor bol nakoniec dosť dobrý a bol dostatočne výkonný a JPEG tak trochu zostal rovnakú veľkosť, hej, viete čo, jednoducho budeme pokračovať a urobíme to na CPU [keďže] je to jednoduchšie to. Teraz, keď sa obrázky zväčšujú a zväčšujú, ľudia zrazu idú, viete, vlastne chcem, aby sa tieto skutočne obrovské veľkosti súborov fotografií zrýchlili. CPU [sú] akosi buď nie dostatočne rýchle, alebo spaľujú príliš veľa energie. Zrazu je záujem o potenciálne opätovné použitie urýchľovačov JPEG. Takže to nie je vždy priama línia, ako veci idú, potom sa musíte pozrieť na to, čo sa práve deje s Moorovým zákonom. Všetci stále hovoria o tom, hej, možno nie si mŕtvy, ale trochu sa to spomaľuje, však? Ak teda nedostávate toto zvýšenie výkonu alebo zvýšenie výkonu z každého ďalšieho uzla, ako budete pokračovať v pridávaní ďalších funkcií do telefónu, ak nemáte túto réžiu? Takže si to mohol dať na CPU. Ale ak nemáte viac miesta pre váš procesor, ako urýchlite tieto veci? Odpoveď je, že všetky tieto špecializované jadrá a veci umiestnite efektívnejšie. A tak je to také prirodzené napätie.

Uvidíte ľudí, ktorí sú nútení robiť tieto veci pre bežné funkcie, pretože možno nie každý bude na pokraji krvácania. Ale určite sa tam pokúsime zostať tak dlho, ako to len bude možné, ale nemôžeme prinútiť fabiny, aby sa presunuli do ďalšieho uzla, ak tam nevyhnutne nie je. Preto sa musíte zamerať na neustále inovácie a tieto architektúry, aby ste aj naďalej dosahovali lepší výkon a energetickú účinnosť. Takže to je naša sila a naše zázemie.“

Mario Serrafero: „Aj keď došlo k tomuto prechodu na heterogénne výpočty, zo strany Qualcommu určite veľa divákov a určite veľa publikácií. Prekvapivo mnohí nadšenci, o ktorých si myslíte, že by vedeli lepšie, stále myslia, zvažujú a hodnotia bloky ako samostatné subjektov. Stále sa zameriavajú na: "Chcem vidieť čísla CPU, pretože mi na tom záleží." Chcú vidieť čísla GPU, pretože majú radi hry a tak ďalej. Nepovažujú ich za komunikované súčasti jedného uceleného produktu. Ako si myslíte, že Qualcomm má, je a môže rozbiť túto paradigmu, keďže konkurenti sa skutočne sústreďujú na konkrétne vylepšenia marketingu blok po bloku? Konkrétne [prejdeme] k neurónovým sieťam, k veciam s neurónovým motorom neskôr."

Travis Lanier: „Dúfam, že som sa dnes niečoho z toho dotkol. Zameriavame sa napríklad na trvalé hranie, takže možno dosiahnete dobré skóre vo všetkých herných benchmarkoch. Ľudia sú tým posadnutí. Ale v skutočnosti je dôležité, že ak hráte svoju hru, zostávajú vaše snímky za sekundu konzistentne tam, kde chcete, aby boli na najvyššom bode pre tieto veci? Myslím, že ľudia prikladajú príliš veľkú váhu číslu pre jeden z týchto blokov. Je to také ťažké a chápem tú túžbu dať mi jedno číslo, ktoré mi povie, čo je najlepšie. Je to tak pohodlné, najmä v AI práve teraz, je to šialené. Čo meria benchmark CPU aj pri porovnávaní CPU? Všetci merajú rôzne veci. Vezmite si niektorý z benchmarkov, napríklad GeekBench má veľa vedľajších komponentov. Vidíte niekedy niekoho, kto sa roztrhne a pozrie sa na to, ktorá z týchto čiastkových zložiek je najrelevantnejšia pre to, čo vlastne robím?"

Mario Serrafero: "Niekedy áno."

Travis Lanier: „Možno vy chlapci áno. Vy ste ako výstredník. Ale možno je jeden procesor lepší na tomto a možno jeden lepší na inom. To isté so SPEC, ľudia zdôraznia jeden SPEC, dobre, dobre, v rámci toho je veľa rôznych pracovných zaťažení. A sú to dosť tesné veci, ale dokonca aj SPEC, ktoré v skutočnosti používame na vývoj CPU, ak sa pozriete na skutočné pracovné zaťaženie, sú skutočne relevantné? Je to skvelé na porovnávanie pracovného zaťaženia pracovnej stanice, ale naozaj robím molekulárne modelovanie na svojom telefóne? Nie. Ale opäť, o to mi ide, že väčšina týchto benchmarkov je nejakým spôsobom užitočná, ale musíte pochopiť kontext toho, na čo [je] a ako sa tam dostanete. A tak je naozaj ťažké destilovať veci do jedného čísla.

A vidím to najmä - trochu sa tu otáčam - ale práve teraz to vidím s AI, je to šialené. Vidím, že existuje niekoľko rôznych vecí, ktoré by pre AI nedostali jedno číslo. A toľko, koľko som hovoril o CPU, máte všetky tieto rôzne pracovné zaťaženia a snažíte sa získať jedno číslo. Svätá moly, AI. Existuje toľko rôznych neurónových sietí a toľko rôznych pracovných zaťažení. Spúšťate to v pohyblivej rádovej čiarke, spúšťate to v int, spúšťate to s 8 alebo 16 bitovou presnosťou? A tak to, čo sa stalo, je, že vidím, ako sa ľudia snažia vytvoriť tieto veci, no, vybrali sme si túto pracovnú náplň a urobili sme to v s pohyblivou rádovou čiarkou a 50 % našich testov na tejto jednej sieti a dvoch ďalších testoch zvážime toto. Dobre, skutočne vôbec niekto používa toto konkrétne pracovné zaťaženie na tejto sieti? Nejaké reálne aplikácie? AI je fascinujúca, pretože sa pohybuje tak rýchlo. Všetko, čo vám poviem, bude pravdepodobne o mesiac alebo dva nesprávne. Takže to je na tom tiež super, pretože sa to veľmi mení.

Ale najväčšia vec nie je hardvér v AI, je to softvér. Pretože každý to používa, ako, ja používam túto neurónovú sieť. A tak v podstate sú tam všetky tieto multiplikátory. Optimalizovali ste túto konkrétnu neurónovú sieť? A tak ste optimalizovali ten pre benchmark, alebo optimalizujete ten, aby niektorí ľudia povedali, vy viem, čo som vytvoril benchmark, ktorý meria super rozlíšenie, je to benchmark pre super rozlíšenie AI. Používajú túto sieť a možno to urobili v pohyblivej rádovej čiarke. Ale s každým partnerom, s ktorým spolupracujeme, sa nám to podarilo buď 16-bitovým a/alebo 8-bitovým spôsobom a pomocou inej siete. Znamená to teda, že nie sme dobrí v super rozlíšení, pretože táto práca sa s tým nezhoduje? Takže moja jediná poznámka je, že benchmark [ing] AI je skutočne komplikovaný. Myslíte si, že CPU a GPU sú komplikované? AI je jednoducho šialená."

Mario Serrafero: "Áno, existuje príliš veľa typov sietí, príliš veľa parametrizácií - odlišná parametrizácia vedie k rôznym dopadom, ako sa to počíta."

Travis Lanier: "To zamestná recenzentov."

Mario Serrafero: „Ale ak chcete merať celú škálu vecí, je to oveľa ťažšie. Ale áno, nikto to nerobí."

Mishaal Rahman: "Preto sa viac zameriavate na prípady použitia."

Travis Lanier: „Nakoniec si myslím, že keď ukážete prípady použitia, vaša AI je práve teraz taká dobrá. Ide o softvér, myslím si, že o pár rokov dospeje o niečo viac. Ale práve teraz je toľko softvérovej práce, ktorú treba urobiť a potom sa zmení: Dobre, dobre, táto sieť je horúca a potom ako budúci rok: „Ach, nie, našli sme novú sieť, ktorá je vo všetkých týchto veciach efektívnejšia“, takže potom musíte ísť znova softvér. Je to dosť šialené."

Mario Serrafero: „Keď už hovoríme o NN, tak trochu ste pre mňa urobili prechod, pre mňa menej nepríjemné myslenie. Prechod na Hexagon. Toto je jedna zo zložiek, ktoré najmenej chápu, povedal by som, spotrebitelia, dokonca väčšina nadšencov, určite moji kolegovia. Viete, najmä vzhľadom na to, že to nebolo predstavené ako blok AI a ako celý nápad na digitálne spracovanie signálu, viete, keď niečo predstavíte tá pôvodná myšlienka sa drží, takže ak niečo robíte, je to neurálna vec s neurálnou, neurálnou, neurálnou mozgovou inteligenciou, ľudí. Majú AI strojové učenie neurálne, neurálne, neurálne označenia pre iné riešenia. Takže vám možno chceme dať príležitosť vysvetliť vývoj Hexagon DSP, prečo ste sa od toho nevzdialili druh inžiniersky znejúcich názvov ako Hexagon DSP, vektorové rozšírenia a podobne, ktoré nie sú ako marketing priateľský. Ale áno, možno ako rýchly prehľad toho, ako ste sa v popredí DSP videli, ako to prechádza od začiatku pracovnej záťaže zobrazovania až po úplne nový urýchľovač tenzorov."

Travis Lanier: „Je to skutočne zaujímavý bod, pretože niektorí naši konkurenti majú v skutočnosti niečo, čo budú nazývať neurónový motor alebo neurónový urýchľovač – v skutočnosti je to DSP, je to to isté. Takže myslím, že názov je dôležitý, ale dotkli ste sa dôležitého bodu a úprimne povedané, keď sme to tam dali, bolo to na zobrazovanie, náhodou sme podporili 8 bit. A pamätám si, že sme prezentovali na Hot Chips a Pete Warden z Google nás vystopoval a povedal: "Hej, vy...takže vy chlapci podporujete 8 bit, čo?" Áno, robíme. A tak sme odtiaľ okamžite vyšli von a páčilo sa mi, hej, všetky [tieto] projekty prebiehajú. Vtedy sme šli a preniesli TensorFlow na Hexagon, pretože je to ako, hej, máme takýto 8-bitový podporovaný vektorový procesor, ktorý to robí, a bolo to na našom Hexagon DSP. Ak by som to mal prejsť znova, pravdepodobne by som to nazval Hexagon Neural Signal Processor. A stále máme druhý DSP, máme skalárne DSP a to je DSP v pravom slova zmysle. A potom tento druh vektora nazývame DSP. Možno by sme ho mali premenovať, možno by sme ho mali nazvať procesorom nervových signálov, pretože si pravdepodobne nepripisujeme toľko uznania ako my malo by to byť preto, lebo, ako som povedal, niektorí ľudia majú len vektorové DSP a volajú to akokoľvek a nič neprezradili to je. Odpovedal som na tvoju otázku?"

Prehľad Hexagon 690. Zdroj: Qualcomm.

Mario Serrafero: "Takže áno, je to tak, pravdepodobne väčšina."

Travis Lanier: "Aká bola druhá otázka?"

Mario Serrafero: „Ako ste vnútorne videli taký vývoj. Aké to bolo: skúsenosti, ťažkosti, výzvy, čokoľvek, o čom nám chcete povedať? Ako ste videli vývoj od začiatkov spracovania obrazu po urýchľovač tenzorov?"

Travis Lanier: „Bolo to trochu frustrujúce, pretože to, čo ma prinúti skrčiť, je, že niektorí novinári zdvihnú ruku a povedia: „Qualcomm, čo si tak za sebou! Prečo si to neurobil — kedy budeš ako špecializovaný procesor nervových signálov?" a chcem si len búšiť hlavu. Bol som, akoby sme boli prví, ktorí mali vektorový procesor! To však znamená, že to upravíme a pravdepodobne bude stále viac vecí, keď sa dozvieme viac o AI. Takže sme pridali túto ďalšiu vec a áno, táto je – robí len AI, nevykonáva spracovanie obrazu ako súčasť šesťuholníkového komplexu, takže ponúkate… keďže to stále nazývame Hexagon DSP, nazývame celý komplex Hexagon procesorom, aby sme sa pokúsili získať zachytené meno pre celý šesťuholník teraz. Pridali sme veci, ktoré sú v skutočnosti priamo vypočítateľné, nemal by som povedať, že priamo počítajú, ako to má túto automatickú správu toho, ako robíte túto mapu vyššieho rádu, kde sa množíte matrice“.

Mario Serrafero: „Tenzory sú pre mňa v skutočnosti dosť ťažké omotať si hlavu. Je to tak, ako keby sa aj oni nejako omotali okolo seba."

Travis Lanier: "Áno, myslel som si, že som na vysokej škole absolvoval hodiny lineárnej algebry. Urobil som to ako muž: "Dúfam, že to už nikdy nebudem musieť urobiť!" A vrátili sa s pomstou. Myslím, že som si povedal: 'Och, páni, diferenciálne rovnice a lineárna algebra sú späť s pomstou!'“

Mario Serrafero: "Mám pocit, že veľa mojich kolegov to nezachytilo. Stále si myslia, že NPU má tento mystifikačný aspekt, keď je to len zhluk násobenia matíc, bodových súčinov, nelineárnych funkcií, konvolúcií atď. A osobne si nemyslím, že takýto názov neurálneho procesora pomáha, ale o to ide, však? Koľko z toho nie je rozšírené, zahmlené, druh základnej matematiky lopate, konvenciami pomenovania, a čo možno urobiť? Neviem, či ste nad týmto premýšľali. [Čo] možno urobiť na informovanie ľudí o tom, ako to funguje? Ako to nie je len ako, prečo napríklad, prečo DSP môže robiť to, čo iné nové neurónové procesory? Teda, je to len matematika, ale nezdá sa, že by tomu rozumeli používatelia, čitatelia, niektorí novinári. Čo môže – nehovorím, že je to zodpovednosťou spoločnosti Qualcomm – ale čo by sa podľa vás dalo urobiť inak? Pravdepodobne je to moja zodpovednosť."

Travis Lanier: „Úprimne, začínam sa vzdávať. Možno len musíme veci pomenovať „neurálne“. Práve sme hovorili o tom, ako sa nám z lineárnej algebry a diferenciálnych rovníc zatočila hlava, keď sme sa na ne začali pozerať veci, a tak keď sa to začnete snažiť vysvetliť ľuďom, ako keď začnete robiť regresnú analýzu, pozriete sa na rovnice a podobne, hlavy ľudí vybuchnúť. Väčšinu ľudí môžete naučiť základné programovanie, ale keď ich začnete učiť, ako fungujú rovnice spätného šírenia, pozrú sa na to a vybuchnú im hlavy. Takže áno, zábavné veci. Nechcú vidieť čiastočné deriváty...“

Mario Serrafero: "Reťazce parciálnych derivátov, nie naprieč skalármi, ale naprieč vektormi a vrátane nelineárnych funkcií."

Travis Lanier: "Veľa šťastia s tým! Áno, je to ťažké a neviem, že väčšina ľudí o tom chce vedieť. Ale snažím sa: vložím malú vec ako: „Hej, všetko, čo tu robíme, je vektorová matematika. Máme vektorový procesor." A myslím si, že ľudia sa na to pozerajú a hovoria si: „Dobre, ale chlape, naozaj chcem neurál urýchľovač." „Tensor“ je stále matematický, ale myslím si, že ľudia si to môžu spájať trochu viac s AI spracovanie."

Mario Serrafero: "Mohlo by to byť ako premostenie priepasti, sémantickej priepasti."

Travis Lanier: "Nakoniec si myslím, že to dopadlo, asi len musíme vymyslieť iné meno."


Všetky grafiky v tomto článku pochádzajú z prezentácie Travisa Laniera na Snapdragon Tech Summit. Môžete si prezerať snímky prezentácie tu.