Stigli su rezultati MLPerf 3.0 i postoje neki zanimljivi trendovi u industriji.
Strojno učenje i umjetna inteligencija industrija je koja se brzo mijenja sa stalnim inovacijama koje su u tijeku svaki dan. Zato je mogućnost usporedbe mogućnosti uređaja važna i zašto je također važno da postoji tijelo ili više tijela koja pomažu u usmjeravanju rasta sektora. S MLPerf Inference v3.0, grupa MLCommons ima za cilj udvostručiti filozofiju pružanja poštenog i rigorozan test sposobnosti strojnog učenja uređaja uz pružanje provjerljivosti i ponovljivosti rezultate. Stigli su rezultati, i to s još većeg popisa dobavljača iz prethodnih godina.
"Zaključak" u strojnom učenju odnosi se na stvarno dobivanje rezultata iz uvježbanog algoritma, gdje model zatim može identificirati ono što je uvježban prepoznati. Vidimo da se zaključivanje koristi u svim područjima života, uključujući samovozeće automobile, prijedloge pretraživanja na Googleu, pa čak i AI chatbotove poput ChatGPT, Bing Chat ili Google Bard. MLPerf v3.0 može testirati sljedeće zadatke:
Zadatak |
Aplikacije iz stvarnog svijeta |
Preporuka |
Sadržaj ili preporuke za kupnju kao što su pretraživanje, društveni mediji ili oglasi |
Prepoznavanje govora |
Pretvaranje govora u tekst na pametnim telefonima, pomoć vozaču bez ruku |
Obrada prirodnog jezika (NLP) |
Pretraživanje, prijevod, chatbotovi |
Klasifikacija slika |
Označavanje slike, opća vizija |
Otkrivanje objekata |
Detekcija pješaka, detekcija grešaka u proizvodnji, smanjenje efekta crvenih očiju |
3D segmentacija |
Analiza medicinske slike (npr. identifikacija tumora) |
Postoji više od 5300 rezultata performansi i više od 2400 rezultata mjerenja snage u bazi rezultata za MLPerf v3.0. Konkretno, trendovi koji su identificirani uključuju puno novih hardverskih sustava koji se koriste s povećanom izvedbom u komponentama podatkovnog centra od oko 30% u nekim mjerila. Također, mnogo više podnositelja dalo je rezultate koji se odnose na energetsku učinkovitost, a došlo je do tri puta većeg interesa za zaključivanje mreže.
Nvidia, koja je već niz godina glavni oslonac MLPerf podnesaka, poslala je prve rezultate za svoj DGX H100 i svoj prvi podnesak za svoj L4 Tensor Core GPU. DGX H100 ponudio je do 54% više performansi po akceleratoru u usporedbi s prvim H100 podnescima, a L4 je dao do tri puta veću izvedbu od posljednje generacije T4.
Druge tvrtke koje su dostavile rezultate uključuju Qualcomm, za koji tvrtka kaže da "sva mjerila pokazuju povećanje performansi i energetske učinkovitosti za NLP i Computer Vision networks." Tvrtka je također detaljno opisala kako je od svog prvog podnošenja MLPerf 1.0 Qualcomm Cloud AI 100 poboljšan do 86% u performansama i 52% u snazi učinkovitost. Ostali poznati dobavljači koji su poslali rezultate uključuju Intel, HPE, Gigabyte, Asus i Dell.