Výsledky MLPerf Inference v3.0 ukazují hlavní celoodvětvové trendy ve zlepšování výkonu

Výsledky MLPerf 3.0 jsou k dispozici a existuje několik zajímavých trendů v oboru.

Strojové učení a umělá inteligence je rychle se měnící odvětví s neustálými inovacemi, které probíhají každý den. To je důvod, proč je důležité porovnat schopnosti zařízení a proč je také důležité, aby existoval orgán nebo více orgánů, které pomáhají řídit růst odvětví. S MLPerf Inference v3.0 se skupina MLCommons snaží zdvojnásobit filozofii poskytování spravedlivých a přísný test schopností strojového učení zařízení při poskytování ověřitelnosti a reprodukovatelnosti Výsledek. Výsledky jsou nyní a z ještě většího seznamu prodejců z minulých let.

"Inference" ve strojovém učení se týká skutečného získávání výsledků z trénovaného algoritmu, kde model může identifikovat, co byl natrénován, aby rozpoznával. Vidíme, že odvození se používá ve všech druzích života, včetně samořídících aut, návrhů vyhledávání na Googlu a dokonce i chatbotů s umělou inteligencí, jako jsou ChatGPT, Bing Chat nebo Google Bard. MLPerf v3.0 může testovat následující úlohy:

Úkol

Aplikace v reálném světě

Doporučení

Obsah nebo nákupní doporučení, jako je vyhledávání, sociální média nebo reklamy

Rozpoznávání řeči

Převod řeči na text na chytrých telefonech, asistence řidiče handsfree

Zpracování přirozeného jazyka (NLP)

Vyhledávání, překlady, chatboti

Klasifikace obrázků

Označování obrazu, obecné vidění

Detekce objektů

Detekce chodců, detekce výrobních vad, redukce červených očí

3D segmentace

Lékařská analýza obrazu (např. identifikace nádoru)

V databázi výsledků pro MLPerf v3.0 je více než 5 300 výsledků měření výkonu a více než 2 400 výsledků měření výkonu. Zejména trendy které byly identifikovány, zahrnují mnoho nových hardwarových systémů používaných se zvýšeným výkonem v komponentách datových center, v některých případech o 30 %. benchmarky. Také mnohem více zadavatelů poskytlo výsledky týkající se energetické účinnosti a došlo k trojnásobnému nárůstu zájmu o odvození sítě.

Nvidia, která je již řadu let hlavní oporou přihlášek MLPerf, předložila první výsledky pro svůj DGX H100 a svůj první příspěvek pro svůj L4 Tensor Core GPU. DGX H100 nabídl až o 54 % vyšší výkon na akcelerátor ve srovnání se svými prvními verzemi H100 a L4 poskytl až trojnásobek výkonu poslední generace T4.

Mezi další společnosti, které předložily výsledky, patří Qualcomm, o kterém společnost říká, že „všechny benchmarky ukazují zvýšení výkonu a energetické účinnosti pro NLP a počítače. Vision networks." Společnost také podrobně popsala, jak od svého prvního předložení MLPerf 1.0 byla Qualcomm Cloud AI 100 vylepšena až o 86 % ve výkonu a 52 % ve výkonu. účinnost. Mezi další významné dodavatele, kteří zaslali výsledky, patří Intel, HPE, Gigabyte, Asus a Dell.