MLPerf Inference v3.0 tulemused näitavad peamisi kogu tööstusharu hõlmavaid suundumusi jõudluse parandamisel

MLPerf 3.0 tulemused on käes ja seal on mõned huvitavad valdkonna suundumused.

Masinõpe ja tehisintellekt on kiiresti muutuv tööstusharu, mille uuendused toimuvad iga päev. Seetõttu on seadmete võimekuse võrdlemise võimalus oluline ja oluline on ka see, et oleks olemas üks või mitu korpust, mis aitavad sektori kasvu suunata. MLPerf Inference v3.0 abil on MLCommonsi grupi eesmärk kahekordistada filosoofiat pakkuda õiglast ja seadmete masinõppe võimaluste range testimine, pakkudes samal ajal kontrollitavat ja reprodutseeritavat tulemused. Tulemused on nüüd käes ja varasemate aastate veelgi suuremast hankijate nimekirjast.

"Järeldus" viitab masinõppes tulemuste tegelikule saamisele treenitud algoritmi abil, kus mudel saab seejärel tuvastada, mida on koolitatud ära tundma. Näeme järeldusi, mida kasutatakse igasugustes eluvaldkondades, sealhulgas isejuhtivates autodes, Google'i otsingusoovitustes ja isegi tehisintellekti vestlusrobotites, nagu ChatGPT, Bing Chat või Google Bard. MLPerf v3.0 saab testida järgmisi ülesandeid:

Ülesanne	Reaalse maailma rakendused
Soovitus	Sisu- või ostusoovitused (nt otsing, sotsiaalmeedia või reklaamid).
Kõnetuvastus	Kõnest tekstiks muutmine nutitelefonides, käed-vabad juhiabi
Loomuliku keele töötlemine (NLP)	Otsing, tõlkimine, vestlusrobotid
Piltide klassifikatsioon	Pildi märgistamine, üldine nägemine
Objekti tuvastamine	Jalakäijate tuvastamine, tootmisdefektide tuvastamine, punasilmsuse vähendamine
3D segmenteerimine	Meditsiinilise pildi analüüs (nt kasvaja tuvastamine)

MLPerf v3.0 tulemuste andmebaasis on üle 5300 jõudlustulemuse ja üle 2400 võimsuse mõõtmise tulemuse. Eelkõige trendid tuvastatud, hõlmavad paljusid uusi riistvarasüsteeme, mille andmekeskuse komponentide jõudlus on mõnes riigis suurenenud umbes 30%. võrdlusalused. Samuti andis palju rohkem esitajaid energiatõhususega seotud tulemusi ning huvi võrku järeldada kasvas kolm korda.

Nvidia, mis on olnud MLPerfi esildiste alustala juba mitu aastat, esitas esimesed tulemused oma DGX H100 ja esimese esituse L4 Tensor Core GPU kohta. DGX H100 pakkus kuni 54% suuremat jõudlust ühe kiirendi kohta võrreldes selle esimeste H100 esitamistega ja L4 andis kuni kolm korda parema jõudluse kui viimase põlvkonna T4.

Teised tulemused esitanud ettevõtted on Qualcomm, mille kohta ettevõte ütleb, et "kõik võrdlusnäitajad näitavad NLP ja arvuti jõudluse ja energiatõhususe suurenemist Nägemisvõrgud." Ettevõte kirjeldas ka seda, kuidas alates esimesest MLPerf 1.0 esitamisest on Qualcomm Cloud AI 100 jõudlust paranenud kuni 86% ja võimsust 52%. tõhusust. Teised märkimisväärsed müüjad, kes tulemused esitasid, on Intel, HPE, Gigabyte, Asus ja Dell.