Výsledky MLPerf Inference v3.0 ukazujú hlavné celoodvetvové trendy v zlepšovaní výkonu

Výsledky MLPerf 3.0 sú k dispozícii a existuje niekoľko zaujímavých trendov v odvetví.

Strojové učenie a umelá inteligencia sú rýchlo sa meniace odvetvie s neustálymi inováciami prebiehajúcimi každý deň. Preto je dôležitá možnosť porovnať možnosti zariadení a tiež je dôležité, aby existoval orgán alebo viaceré orgány, ktoré pomáhajú riadiť rast odvetvia. S MLPerf Inference v3.0 sa skupina MLCommons snaží zdvojnásobiť filozofiu poskytovania spravodlivých a prísny test schopností strojového učenia zariadení a zároveň poskytuje overiteľné a reprodukovateľné výsledky. Výsledky sú teraz k dispozícii a z ešte väčšieho zoznamu predajcov z predchádzajúcich rokov.

"Inferencia" v strojovom učení sa týka skutočného poskytovania výsledkov z trénovaného algoritmu, kde model potom dokáže identifikovať, čo bol trénovaný na rozpoznanie. Vidíme, že odvodenie sa používa vo všetkých oblastiach života vrátane samoriadiacich áut, návrhov vyhľadávania na Googli a dokonca aj chatbotov AI ako ChatGPT, Bing Chat alebo Google Bard. MLPerf v3.0 môže testovať nasledujúce úlohy:

Úloha	Aplikácie v reálnom svete
Odporúčanie	Odporúčania týkajúce sa obsahu alebo nákupu, ako sú vyhľadávanie, sociálne médiá alebo reklamy
Rozpoznávanie reči	Prevod reči na text na smartfónoch, asistencia vodiča handsfree
Spracovanie prirodzeného jazyka (NLP)	Vyhľadávanie, preklad, chatboti
Klasifikácia obrázkov	Označovanie obrázkov, všeobecné videnie
Detekcia objektov	Detekcia chodcov, detekcia výrobných chýb, redukcia červených očí
3D segmentácia	Analýza lekárskeho obrazu (napr. identifikácia nádoru)

V databáze výsledkov pre MLPerf v3.0 je viac ako 5 300 výsledkov výkonu a viac ako 2 400 výsledkov merania výkonu. Najmä trendy ktoré boli identifikované, zahŕňajú veľa nových hardvérových systémov, ktoré sa používajú so zvýšeným výkonom v komponentoch dátového centra v niektorých prípadoch približne o 30 %. referenčné hodnoty. Oveľa viac predkladateľov tiež poskytlo výsledky týkajúce sa energetickej účinnosti a došlo k trojnásobnému zvýšeniu záujmu o odvodenie siete.

Nvidia, ktorá je už niekoľko rokov hlavnou oporou prihlášok MLPerf, predložila prvé výsledky pre svoj DGX H100 a svoje prvé predloženie pre svoj L4 Tensor Core GPU. DGX H100 ponúkal až o 54 % vyšší výkon na akcelerátor v porovnaní s prvými modelmi H100 a L4 podával až trojnásobok výkonu poslednej generácie T4.

Medzi ďalšie spoločnosti, ktoré predložili výsledky, patrí Qualcomm, o ktorom spoločnosť hovorí, že „všetky referenčné hodnoty ukazujú zvýšenie výkonu a energetickej účinnosti pre NLP a počítače. Vision networks." Spoločnosť tiež podrobne uviedla, ako od svojho prvého predloženia MLPerf 1.0 sa Qualcomm Cloud AI 100 zlepšil až o 86 % vo výkone a o 52 % vo výkone. efektívnosť. Medzi ďalších významných predajcov, ktorí predložili výsledky, patria Intel, HPE, Gigabyte, Asus a Dell.