Rezultati MLPerf Inference v3.0 kažejo glavne trende izboljšanja zmogljivosti v celotni industriji

Prihajajo rezultati MLPerf 3.0 in nekaj zanimivih industrijskih trendov.

Strojno učenje in umetna inteligenca sta hitro spreminjajoča se industrija z nenehnimi inovacijami, ki potekajo vsak dan. Zato je pomembno, da lahko primerjamo zmogljivosti naprav in zakaj je pomembno tudi, da obstaja telo ali več teles, ki pomagajo usmerjati rast sektorja. Z MLPerf Inference v3.0 želi skupina MLCommons podvojiti filozofijo zagotavljanja poštenega in strog preizkus zmogljivosti strojnega učenja naprav, hkrati pa zagotavlja preverljivo in ponovljivo rezultate. Rezultati so zdaj in na še večjem seznamu prodajalcev iz prejšnjih let.

"Sklepanje" v strojnem učenju se nanaša na dejansko pridobivanje rezultatov iz usposobljenega algoritma, kjer lahko model nato identificira, kaj je bil usposobljen prepoznati. Vidimo, da se sklepanje uporablja na vseh področjih življenja, vključno s samovozečimi avtomobili, iskalnimi predlogi v Googlu in celo klepetalnimi roboti z umetno inteligenco, kot je ChatGPT, Bing Chat ali Google Bard. MLPerf v3.0 lahko testira naslednje naloge:

Naloga	Aplikacije iz resničnega sveta
Priporočilo	Vsebina ali priporočila za nakupovanje, kot so iskanje, družbeni mediji ali oglasi
Prepoznavanje govora	Pretvorba govora v besedilo na pametnih telefonih, prostoročna pomoč vozniku
Obdelava naravnega jezika (NLP)	Iskanje, prevajanje, chatboti
Klasifikacija slik	Označevanje slik, splošni vid
Zaznavanje predmetov	Zaznavanje pešcev, zaznavanje proizvodnih napak, zmanjšanje učinka rdečih oči
3D segmentacija	Analiza medicinske slike (npr. identifikacija tumorja)

V bazi rezultatov za MLPerf v3.0 je več kot 5300 rezultatov zmogljivosti in več kot 2400 rezultatov meritev moči. Predvsem trendi ki so bile ugotovljene, vključujejo veliko novih sistemov strojne opreme, ki se uporabljajo z večjo zmogljivostjo v komponentah podatkovnega centra za približno 30 % v nekaterih merila uspešnosti. Prav tako je veliko več predlagateljev dalo rezultate v zvezi z energetsko učinkovitostjo, zanimanje za sklepanje omrežja pa se je povečalo za trikrat.

Nvidia, ki je že vrsto let glavni nosilec prispevkov MLPerf, je predložila prve rezultate za svoj DGX H100 in svojo prvo oddajo za svoj L4 Tensor Core GPE. DGX H100 je ponudil do 54 % večjo zmogljivost na pospeševalnik v primerjavi s prvimi predložitvami H100, L4 pa je dosegel do trikrat večjo zmogljivost kot zadnja generacija T4.

Druga podjetja, ki so predložila rezultate, vključujejo Qualcomm, za katerega družba pravi, da "vsa merila uspešnosti kažejo povečanje zmogljivosti in energetske učinkovitosti za NLP in Computer Vision networks." Podjetje je tudi podrobno opisalo, kako je bila Qualcomm Cloud AI 100 od svoje prve predložitve MLPerf 1.0 izboljšana za do 86% v zmogljivosti in 52% v moči učinkovitost. Drugi pomembni ponudniki, ki so predložili rezultate, so Intel, HPE, Gigabyte, Asus in Dell.