MLPerf Inference v3.0 -tulokset osoittavat merkittäviä alan laajuisia kehityssuuntauksia suorituskyvyn parantamisessa

MLPerf 3.0 -tulokset ovat saapuneet, ja siellä on mielenkiintoisia alan trendejä.

Koneoppiminen ja tekoäly on nopeasti muuttuva toimiala, jonka innovaatiot jatkuvat joka päivä. Siksi on tärkeää pystyä vertailemaan laitteiden ominaisuuksia ja siksi on myös tärkeää, että on olemassa yksi tai useampi runko, joka ohjaa alan kasvua. MLPerf Inference v3.0:lla MLCommons-ryhmä pyrkii kaksinkertaistamaan filosofian tarjota oikeudenmukainen ja laitteiden koneoppimiskyvyn tiukka testaus samalla kun tarjotaan todennettavissa ja toistettavissa tuloksia. Tulokset ovat nyt ja vielä suuremmalta aiempien vuosien toimittajalistalta.

Koneoppimisen "päätelmä" viittaa tulosten todelliseen tuottamiseen opetetusta algoritmista, jossa malli voi sitten tunnistaa sen, mitä se on koulutettu tunnistamaan. Näemme johtopäätöksiä, joita käytetään kaikilla elämänaloilla, mukaan lukien itse ajavat autot, hakuehdotukset Googlessa ja jopa tekoäly-chatbotit, kuten ChatGPT, Bing Chat tai Google Bard. MLPerf v3.0 voi testata seuraavia tehtäviä:

Tehtävä	Tosimaailman sovelluksia
Suositus	Sisältö- tai ostosuositukset, kuten haku, sosiaalinen media tai mainokset
Puheentunnistus	Puhe tekstiksi älypuhelimilla, handsfree-ajuri
Natural Language Processing (NLP)	Haku, käännös, chatbotit
Kuvan luokittelu	Kuvamerkinnät, yleinen näkö
Objektin tunnistus	Jalankulkijoiden tunnistus, valmistusvirheiden tunnistus, punasilmäisyyden vähentäminen
3D-segmentointi	Lääketieteellinen kuva-analyysi (esim. kasvaimen tunnistaminen)

MLPerf v3.0:n tulostietokannassa on yli 5 300 suoritustulosta ja yli 2 400 tehomittaustulosta. Varsinkin trendit tunnistettuihin järjestelmiin kuuluu paljon uusia laitteistojärjestelmiä, joissa datakeskuksen komponenttien suorituskyky on kasvanut noin 30 % joissakin maissa. vertailuarvot. Myös paljon enemmän lähettäjiä antoi tehotehokkuuteen liittyviä tuloksia, ja kiinnostus verkon päättelemiseen kasvoi kolminkertaiseksi.

Nvidia, joka on ollut MLPerf-lähetysten tukipilari useiden vuosien ajan, toimitti ensimmäiset tulokset DGX H100:sta ja ensimmäisen ehdotuksensa L4 Tensor Core -grafiikkasuorittimestaan. DGX H100 tarjosi jopa 54 % enemmän suorituskykyä kiihdytintä kohti verrattuna sen ensimmäisiin H100-lähetyksiin, ja L4 antoi jopa kolminkertaisen suorituskyvyn kuin viimeisen sukupolven T4.

Muita tuloksia toimittaneita yrityksiä ovat Qualcomm, jonka mukaan "kaikki vertailuarvot osoittavat NLP: n ja tietokoneen suorituskyvyn ja tehon tehokkuuden lisääntymistä. Vision verkot. tehokkuutta. Muita tuloksia toimittaneita merkittäviä toimittajia ovat Intel, HPE, Gigabyte, Asus ja Dell.