ผลลัพธ์ของ MPerf 3.0 มาแล้ว และมีแนวโน้มอุตสาหกรรมที่น่าสนใจบางประการ
การเรียนรู้ของเครื่องและปัญญาประดิษฐ์เป็นอุตสาหกรรมที่เปลี่ยนแปลงอย่างรวดเร็วโดยมีนวัตกรรมอย่างต่อเนื่องอย่างต่อเนื่องทุกวัน นั่นเป็นเหตุผลว่าทำไมความสามารถในการเปรียบเทียบความสามารถของอุปกรณ์จึงมีความสำคัญ และเหตุใดการมีส่วนของร่างกายหรือหลายส่วนที่ช่วยชี้แนะการเติบโตของภาคส่วนนี้จึงมีความสำคัญด้วย ด้วย MLPerf Inference v3.0 กลุ่ม MLCommons มีเป้าหมายที่จะเพิ่มปรัชญาในการมอบความยุติธรรมและ การทดสอบความสามารถด้านแมชชีนเลิร์นนิงของอุปกรณ์อย่างเข้มงวด พร้อมทั้งสามารถตรวจสอบและทำซ้ำได้ ผลลัพธ์. ผลลัพธ์มาแล้วและจากรายชื่อผู้จำหน่ายที่ใหญ่กว่าจากปีก่อนหน้า
"การอนุมาน" ในแมชชีนเลิร์นนิงหมายถึงผลลัพธ์ที่เกิดขึ้นจริงจากอัลกอริธึมที่ผ่านการฝึกอบรม ซึ่งโมเดลจะสามารถระบุสิ่งที่ได้รับการฝึกฝนให้จดจำได้ เราเห็นการอนุมานที่ใช้ในชีวิตทุกประเภท รวมถึงรถยนต์ที่ขับเคลื่อนด้วยตนเอง คำแนะนำในการค้นหาบน Google และแม้แต่แชทบอท AI เช่น ChatGPT, Bing Chat หรือ Google Bard. MPerf v3.0 สามารถทดสอบงานต่อไปนี้:
งาน |
แอปพลิเคชันในโลกแห่งความเป็นจริง |
คำแนะนำ |
คำแนะนำเนื้อหาหรือการซื้อ เช่น การค้นหา โซเชียลมีเดีย หรือโฆษณา |
การรู้จำเสียง |
การแปลงคำพูดเป็นข้อความบนสมาร์ทโฟน ระบบช่วยเหลือผู้ขับขี่แบบแฮนด์ฟรี |
การประมวลผลภาษาธรรมชาติ (NLP) |
ค้นหา การแปล แชทบอท |
การจำแนกประเภทภาพ |
การติดฉลากภาพการมองเห็นทั่วไป |
การตรวจจับวัตถุ |
การตรวจจับคนเดินถนน การตรวจจับข้อบกพร่องจากการผลิต การลดตาแดง |
การแบ่งส่วน 3 มิติ |
การวิเคราะห์ภาพทางการแพทย์ (เช่น การระบุเนื้องอก) |
มีผลการปฏิบัติงานมากกว่า 5,300 รายการและผลการวัดกำลังมากกว่า 2,400 รายการในฐานข้อมูลผลลัพธ์สำหรับ MLPerf v3.0 โดยเฉพาะเทรนด์ ที่ระบุ ได้แก่ ระบบฮาร์ดแวร์ใหม่จำนวนมากที่ใช้งานโดยเพิ่มประสิทธิภาพในส่วนประกอบศูนย์ข้อมูลประมาณ 30% ในบางส่วน เกณฑ์มาตรฐาน ผู้ส่งจำนวนมากให้ผลลัพธ์ที่เกี่ยวข้องกับประสิทธิภาพการใช้พลังงาน และมีความสนใจในการอนุมานเครือข่ายเพิ่มขึ้นสามเท่า
Nvidia ซึ่งเป็นแกนนำในการส่ง MLPerf มาเป็นเวลาหลายปี ได้ส่งผลงานครั้งแรกสำหรับ DGX H100 และการส่งครั้งแรกสำหรับ L4 Tensor Core GPU DGX H100 ให้ประสิทธิภาพต่อคันเร่งเพิ่มขึ้นสูงสุด 54% เมื่อเทียบกับ H100 รุ่นแรกที่ส่งเข้ามา และ L4 ให้ประสิทธิภาพมากกว่า T4 เจนเนอเรชั่นที่แล้วถึงสามเท่า
บริษัทอื่นๆ ที่ส่งผลงาน ได้แก่ Qualcomm ซึ่งบริษัทกล่าวว่า "การวัดประสิทธิภาพทั้งหมดแสดงให้เห็นถึงการเพิ่มประสิทธิภาพและประสิทธิภาพการใช้พลังงานสำหรับ NLP และคอมพิวเตอร์ เครือข่ายวิสัยทัศน์" บริษัทยังให้รายละเอียดว่านับตั้งแต่ส่ง MPerf 1.0 ครั้งแรก Qualcomm Cloud AI 100 ได้รับการปรับปรุงประสิทธิภาพสูงสุดถึง 86% และพลังงาน 52% อย่างไร ประสิทธิภาพ. ผู้จำหน่ายที่โดดเด่นอื่นๆ ที่ส่งผลงาน ได้แก่ Intel, HPE, Gigabyte, Asus และ Dell