Rezultati MLPerf Inference v3.0 pokazuju glavne trendove u poboljšanju performansi u cijeloj industriji

Stigli su rezultati MLPerf 3.0 i postoje neki zanimljivi trendovi u industriji.

Strojno učenje i umjetna inteligencija industrija je koja se brzo mijenja sa stalnim inovacijama koje su u tijeku svaki dan. Zato je mogućnost usporedbe mogućnosti uređaja važna i zašto je također važno da postoji tijelo ili više tijela koja pomažu u usmjeravanju rasta sektora. S MLPerf Inference v3.0, grupa MLCommons ima za cilj udvostručiti filozofiju pružanja poštenog i rigorozan test sposobnosti strojnog učenja uređaja uz pružanje provjerljivosti i ponovljivosti rezultate. Stigli su rezultati, i to s još većeg popisa dobavljača iz prethodnih godina.

"Zaključak" u strojnom učenju odnosi se na stvarno dobivanje rezultata iz uvježbanog algoritma, gdje model zatim može identificirati ono što je uvježban prepoznati. Vidimo da se zaključivanje koristi u svim područjima života, uključujući samovozeće automobile, prijedloge pretraživanja na Googleu, pa čak i AI chatbotove poput ChatGPT, Bing Chat ili Google Bard. MLPerf v3.0 može testirati sljedeće zadatke:

Zadatak	Aplikacije iz stvarnog svijeta
Preporuka	Sadržaj ili preporuke za kupnju kao što su pretraživanje, društveni mediji ili oglasi
Prepoznavanje govora	Pretvaranje govora u tekst na pametnim telefonima, pomoć vozaču bez ruku
Obrada prirodnog jezika (NLP)	Pretraživanje, prijevod, chatbotovi
Klasifikacija slika	Označavanje slike, opća vizija
Otkrivanje objekata	Detekcija pješaka, detekcija grešaka u proizvodnji, smanjenje efekta crvenih očiju
3D segmentacija	Analiza medicinske slike (npr. identifikacija tumora)

Postoji više od 5300 rezultata performansi i više od 2400 rezultata mjerenja snage u bazi rezultata za MLPerf v3.0. Konkretno, trendovi koji su identificirani uključuju puno novih hardverskih sustava koji se koriste s povećanom izvedbom u komponentama podatkovnog centra od oko 30% u nekim mjerila. Također, mnogo više podnositelja dalo je rezultate koji se odnose na energetsku učinkovitost, a došlo je do tri puta većeg interesa za zaključivanje mreže.

Nvidia, koja je već niz godina glavni oslonac MLPerf podnesaka, poslala je prve rezultate za svoj DGX H100 i svoj prvi podnesak za svoj L4 Tensor Core GPU. DGX H100 ponudio je do 54% više performansi po akceleratoru u usporedbi s prvim H100 podnescima, a L4 je dao do tri puta veću izvedbu od posljednje generacije T4.

Druge tvrtke koje su dostavile rezultate uključuju Qualcomm, za koji tvrtka kaže da "sva mjerila pokazuju povećanje performansi i energetske učinkovitosti za NLP i Computer Vision networks." Tvrtka je također detaljno opisala kako je od svog prvog podnošenja MLPerf 1.0 Qualcomm Cloud AI 100 poboljšan do 86% u performansama i 52% u snazi učinkovitost. Ostali poznati dobavljači koji su poslali rezultate uključuju Intel, HPE, Gigabyte, Asus i Dell.