ARM ประกาศซีพียู Cortex-A78, GPU Mali-G78, Ethos N78 NPU

click fraud protection

ARM ได้ประกาศสถาปัตยกรรม CPU Cortex-A78 และ GPU Mali-G78 ทั้งสองเป็นผู้สืบทอดของ CPU Cortex-A77 และ GPU Mali-G77

ในฐานะส่วนหนึ่งของ TechDay 2020 ARM ได้ประกาศสำคัญสามประการ การประกาศสำคัญพาดหัวข่าวคือโปรแกรม Cortex-X Custom (CXC) ซึ่งมีโปรแกรมใหม่ แกนซีพียู Cortex-X1. Cortex-X1 นำเสนอประสิทธิภาพสูงสุดที่สูงกว่าซีพียูซีรีส์ Cortex-A ใดๆ ในขณะเดียวกันก็ทำลายขอบเขตของ PPA ของซีรีส์ Cortex-A ประกาศอีกสองรายการที่ ARM ทำนั้นเป็นกิจวัตรมากกว่ามาก CPU Cortex-A78 และ CPU Mali-G78 เป็นทางการแล้ว และทำหน้าที่เป็นผู้สืบทอดของ คอร์เทกซ์-A77 ซีพียูและ มาลี-G77 ซีพียูตามลำดับ เรามาพูดถึงประกาศเหล่านี้ทีละรายการ:

ARM Cortex-A78

ด้วย Cortex-A78 จุดเน้นหลักของ ARM คือความต้องการด้านประสิทธิภาพ เช่น ความต้องการอายุการใช้งานแบตเตอรี่ที่ยาวนานขึ้น ฟอร์มแฟคเตอร์มือถือใหม่ และพื้นที่ SoC ที่หดตัว ประสิทธิภาพที่ยั่งยืนเป็นหัวใจสำคัญสำหรับ Cortex-A78 ในขณะที่ Cortex-X1 มุ่งสู่ดวงดาวโดยมีเป้าหมายในการบรรลุประสิทธิภาพสูงสุดในระยะสั้น

ARM กล่าวว่า Cortex-78 เป็นตัวแทนของไดรฟ์ที่ "ดีที่สุด" เพื่อประสิทธิภาพระดับสูงและประสิทธิภาพที่ดีที่สุดในระดับเดียวกัน สิ่งเหล่านี้ไม่ใช่เพียงคำที่ว่างเปล่าเช่นกัน ในช่วงสองสามปีที่ผ่านมา Cortex-A76 และ Cortex-A77 ได้แสดงให้เห็นถึงประสิทธิภาพการใช้พลังงานที่ดีที่สุดในระดับเดียวกันและ PPA ที่ดีที่สุดในระดับเดียวกัน (ประสิทธิภาพ พลังงาน และพื้นที่) พวกเขาไม่มีการออกแบบที่จำเป็นเพื่อแข่งขันกับชิป A-series ของ Apple แต่เป็นเพราะรุ่นที่ต่ำกว่า พลังงานที่สร้างขึ้น ประสิทธิภาพการใช้พลังงานแย่ที่สุดเช่นเดียวกับ Apple และอย่างดีที่สุดก็สูงกว่าด้วยซ้ำ แอปเปิล.

การปรับปรุงประสิทธิภาพของ A78 ครอบคลุมกรณีการใช้งานด้านประสิทธิภาพการทำงาน การสื่อสาร การรักษาความปลอดภัย และงานที่ใช้กล้อง การเล่นเกมขั้นสูง ประสบการณ์ที่ใช้ XR และ ML

ในประสิทธิภาพที่ยั่งยืน Cortex-A78 นำมาซึ่งการปรับปรุงเลขสองหลัก โดยให้ประสิทธิภาพที่ยั่งยืนเพิ่มขึ้น 20% เมื่อเทียบกับ Cortex-A77 รุ่นก่อน ในเคสพลังงานความร้อนเคลื่อนที่แบบเดียวกัน อานันท์เทค ผ่านตัวเลขแล้วอธิบายว่าตัวเลข 20% เป็นการรวมกันของ IPC ที่สูงกว่า A77 ถึง 7% ในขณะที่ ประสิทธิภาพที่เพิ่มขึ้น 13% ที่เหลือนั้นมาจากกระบวนการ 5 นาโนเมตร ซึ่ง SoC รุ่นต่อไปทั้งหมดจะเป็น ประดิษฐ์ ARM จดบันทึกถึงความสำคัญของประสิทธิภาพที่ยั่งยืนโดยกล่าวว่าอุปกรณ์เคลื่อนที่มีความจุที่จำกัด กระจายพลังงานและประสิทธิภาพที่ยั่งยืนช่วยหลีกเลี่ยงการควบคุมปริมาณพลังงานสำหรับแอปพลิเคชันที่ต้องการปริมาณมาก พลัง. ซึ่งในทางกลับกันจะปรับปรุง UX โดยการหลีกเลี่ยงความล่าช้าหรือเฟรมตก

การผลักดันประสิทธิภาพการใช้พลังงานแปลไปสู่ประสิทธิภาพการใช้พลังงานที่สูงขึ้น เนื่องจากทั้งสองมีความเกี่ยวข้องกัน แต่มีแนวคิดที่แตกต่างกัน จากข้อมูลของ ARM ที่จุดที่มีประสิทธิภาพสูง เช่น จุดสูงสุดสำหรับอุปกรณ์มือถือในปัจจุบัน Cortex-A78 ให้การประหยัดพลังงาน 50% เมื่อเทียบกับอุปกรณ์ปี 2019 ในการแสดงเดียวกัน เช่นเดียวกับ Cortex-A77 สิ่งนี้น่าประทับใจและทำให้ A78 เป็น Cortex-A CPU ARM ที่ประหยัดพลังงานมากที่สุดเท่าที่เคยออกแบบมา

การมุ่งเน้นไปที่ประสิทธิภาพที่ยั่งยืนของ ARM จะเป็นประโยชน์ต่อคลื่นลูกใหม่ของนวัตกรรมอุปกรณ์พกพา เช่น ฟอร์มแฟคเตอร์ใหม่ (โทรศัพท์แบบพับได้) รวมถึง "การดื่มด่ำแบบดิจิทัล" ที่ได้รับการปรับปรุงผ่าน 5G การตรวจสอบความเป็นจริงก็คือว่านี่ไม่ใช่กรณีสำหรับคนรุ่นปัจจุบัน และมันจะไม่สำคัญมากนักแม้แต่ในรุ่นต่อไป

กรณีการใช้งานหนึ่งที่ Cortex-A78 จะได้รับการปรับปรุงคือเกมมือถือ AAA เมื่อรวมกับ Mali-G78 GPU ใหม่ของ ARM การรวมกันของทั้งสองมีจุดมุ่งหมายเพื่อนำประสบการณ์การเล่นเกมที่มีความเที่ยงตรงสูงมาสู่มือถือ ประสิทธิภาพที่มากขึ้นเมื่อประกอบกับความเร็วที่รวดเร็วและแบนด์วิธสูงของ 5G จะทำให้สามารถเล่นเกมระดับพรีเมียมบนมือถือได้ ประสิทธิภาพของ A78 มีประโยชน์ตรงนี้ เนื่องจากจะทำให้อายุการใช้งานแบตเตอรี่ยาวนานขึ้นสำหรับการเล่นเกมที่ยาวนานขึ้น ARM กล่าวว่ากำลังทำงานร่วมกับระบบนิเวศเพื่อเพิ่มประสิทธิภาพและสร้างประสบการณ์การเล่นเกมที่สมบูรณ์ยิ่งขึ้น และยกตัวอย่างการทำงานร่วมกับ Unity เพื่อนำ Burst Compiler มาสู่ Android

ประสิทธิภาพการเรียนรู้ของเครื่อง (ML) ถือเป็นอีกหนึ่งความสำคัญสำหรับ ARM CPU เป็นโปรเซสเซอร์ตัวเลือกแรกสำหรับการประมวลผล ML บนมือถือ แม้ว่า SoC ระดับไฮเอนด์ในปัจจุบันจะมาพร้อมกับหน่วยประมวลผลประสาท (NPU) ที่แยกจากกันก็ตาม CPU ของ ARM รองรับแอปพลิเคชัน ML ในโลกแห่งความเป็นจริงที่ได้รับความนิยมสูงสุดและกรณีการใช้งานบนสมาร์ทโฟน เช่น ตัวกรองโซเชียลมีเดีย การเขียนตามคำบอก ความปลอดภัย และการรักษาความปลอดภัย Cortex-A78 ใช้พลังงานโดยเฉลี่ยน้อยลง 8% สำหรับงานที่ใช้ ML เมื่อเทียบกับ A77 ซึ่งนำไปสู่การปรับปรุงประสิทธิภาพอย่างเป็นทางการ 10%

ARM Cortex-A78 - สถาปัตยกรรม

ARM Cortex-A78 มีสถาปัตยกรรมแบบเดียวกับรุ่นก่อนหน้า (ยังคงเป็นคอร์ ARM v8.2) อย่างไรก็ตาม ARM ได้เพิ่มคุณสมบัติสถาปัตยกรรมจุลภาคที่มีจุดมุ่งหมายเพื่อเพิ่มประสิทธิภาพการทำงานให้สูงขึ้นในพื้นที่และในลักษณะประหยัดพลังงาน ARM ช่วยประหยัดพื้นที่และพลังงานในขณะที่ยังคงระดับประสิทธิภาพที่จำเป็นไว้ อีกครั้งที่ ARM ให้ความสำคัญกับซีรีส์ Cortex-A ยังคงอยู่ที่พื้นที่และประสิทธิภาพการใช้พลังงานมากกว่าประสิทธิภาพสูงสุด ซึ่งขณะนี้เป็นงานของโปรแกรม Cortex-X

การปรับปรุงประสิทธิภาพของ Cortex-A78 นั้นเปิดใช้งานผ่านฟีเจอร์สถาปัตยกรรมไมโครเพิ่มเติมที่ปรับความกว้างและความลึกให้เหมาะสม ความกว้างของการถอดรหัสคำสั่งยังคงอยู่ที่ 4 กว้างเช่นเดียวกับ A77 และ A76 (ในทางกลับกัน ความกว้างในการถอดรหัสของ Cortex-X1 คือ 5 กว้าง ในขณะที่ A13 มีความกว้างในการถอดรหัส 7 กว้าง) ARM ได้เพิ่มการคาดการณ์สาขาที่มากขึ้นสำหรับแบนด์วิดท์และความแม่นยำตลอดจนกรณีฟิวชั่นคำสั่ง การปรับปรุงสถาปัตยกรรมเหล่านี้ช่วยให้ประสิทธิภาพการทำงานแบบเธรดเดียวเพิ่มขึ้น 7% เมื่อเทียบกับ A77

ประสิทธิภาพได้รับการเพิ่มประสิทธิภาพสูงสุดด้วยการลดโครงสร้างที่มีประสิทธิภาพและพื้นที่ต่ำ เช่น บนแคช L1-I และ L1-D ARM ได้ปรับโครงสร้างที่มีอยู่ให้เหมาะสมเพื่อให้ใช้พลังงานน้อยลง เช่น โครงสร้างการคาดการณ์แบรนด์ ARM กล่าวว่าสิ่งนี้ทำให้ประสิทธิภาพพลังงานลดลง 4% ต่อ mW และพื้นที่น้อยลง 5% สำหรับประสิทธิภาพต่อ mm2 เมื่อเทียบกับ A77

A78 ให้ความสำคัญกับประสิทธิภาพที่ยั่งยืนด้วยประสิทธิภาพที่ดีที่สุดในระดับคลัสเตอร์ คลัสเตอร์ DynamIQ ของ CPU Cortex-A77 4x และ Cortex-A55 4x สามารถอัพเกรดเป็นคอร์ A78 4x และ A55 คอร์ 4x สิ่งนี้ให้การปรับปรุงประสิทธิภาพอย่างยั่งยืน 20% ในพื้นที่น้อยลง 15% แอปพลิเคชันที่ต้องใช้เธรดประสิทธิภาพสูงหลายตัวพร้อมกัน เช่น การเล่นเกมที่มีความเที่ยงตรงสูง จะได้รับประโยชน์จากการผลักดันประสิทธิภาพที่ยั่งยืน

ARM สังเกตประสิทธิภาพพื้นที่ที่ได้รับการปรับปรุงของคลัสเตอร์ A78 DynamIQ ทำให้เหมาะสำหรับโทรศัพท์แบบพับได้และจอแสดงผลหลายจอและขนาดใหญ่กว่า จุดมุ่งเน้นอีกประการหนึ่งคือการทำให้สมาร์ทโฟนพร้อมใช้งาน 5G ผ่านการปรับปรุงประสิทธิภาพและพลังงาน 5G คาดว่าจะให้ "ความเร็วที่เร็วกว่ามาก" "เวลาแฝงที่ต่ำกว่ามาก" และ "การเชื่อมต่อที่เร็วกว่าและแพร่หลายมากขึ้นสำหรับอุปกรณ์มือถือสำหรับแอปพลิเคชันที่มีแบนด์วิธสูง" อาจเป็นเช่นนั้นในอีกไม่กี่ปีข้างหน้า แต่ในปัจจุบัน ประโยชน์ส่วนใหญ่เหล่านี้ยังไม่เป็นที่สังเกตสำหรับผู้บริโภคปลายทาง

โดยรวมแล้ว Cortex-A78 เป็นผลิตภัณฑ์ที่แข็งแกร่ง SoC เรือธงรุ่นต่อไปจะรวมคอร์ A78 หลายคอร์เพื่อเสริมคอร์ Cortex-X1 คอร์เดี่ยวนั้น มีความต้องการด้านพลังงานและพื้นที่ที่สูงกว่า และ SoC ที่เน้นคุณค่าบางตัวอาจเลือกที่จะข้าม Cortex-X1 ออกไปด้วยซ้ำ โดยสิ้นเชิง สำหรับตลาด SoC ระดับกลาง A78 จะเป็นแกน CPU ที่ถูกเลือกสำหรับ SoC ปี 2021 และยินดีต้อนรับการมุ่งเน้นไปที่ประสิทธิภาพที่ยั่งยืน


อาร์ม มาลี-G78

GPU ซีรีส์ Mali ของ ARM ยังไม่ประสบความสำเร็จเกือบเท่าซีพียูซีรีส์ Cortex Mali GPU มีประสิทธิภาพเหนือกว่าอย่างต่อเนื่องทั้งในแง่ของประสิทธิภาพและประสิทธิภาพการใช้พลังงานโดย GPU แบบกำหนดเองของ Apple และ GPU Adreno แบบกำหนดเองของ Qualcomm ปีแล้วปีเล่า การเปิดตัวสถาปัตยกรรม Valhall ใหม่และ GPU Mali-G77 เมื่อปีที่แล้วไม่ได้ช่วยอะไรเปลี่ยนแปลงเลย น่าเศร้า SoCs ที่มี Mali-G77 รวมอยู่ด้วย เอ็กซิโนส 990 และ MediaTek ขนาด 1000L ตามลำดับ น่าเสียดายที่ทั้งคู่ดูเหมือนจะมีการใช้งานที่อ่อนแอซึ่งหมายความว่าประสิทธิภาพของ GPU สามารถทำได้ ไม่แข่งขันกับ Adreno 650 GPU ของ Qualcomm ไม่ต้องสนใจ GPU ระดับชั้นนำของ Apple ใน Apple A12 และ A13. Mali ล้าหลังมาหลายปีแล้ว และการปรับปรุงยังไม่เพียงพอที่จะเปลี่ยนสถานะที่เป็นอยู่ในพื้นที่ GPU บนมือถือ

อย่างไรก็ตาม ARM จะไม่มีความหมายอะไรเลยหากไม่มองโลกในแง่ดี โปรดทราบว่าพันธมิตรได้จัดส่ง Mali GPU มากกว่าหนึ่งพันล้านตัวต่อปี ทำให้ Mali เป็น GPU ที่มีการจัดส่งอันดับหนึ่งของโลก ตัวเลขนี้จะเพิ่มขึ้นตามที่คาดคะเน เนื่องจากอุปกรณ์หลายประเภทเปิดใช้งานกรณีการใช้งานที่เน้นกราฟิก เช่น เกมบนมือถือขั้นสูงและ XR (VR และ AR) จากข้อมูลของ ARM สิ่งนี้ทำให้ Mali เป็น GPU ที่ใช้กันอย่างแพร่หลายมากที่สุดสำหรับการพัฒนาอุปกรณ์พกพาทั่วทั้งระบบนิเวศ

ARM ตั้งข้อสังเกตว่าในปี 2019 ทางบริษัทได้ประกาศเปิดตัว GPU ตัวแรกที่ใช้สถาปัตยกรรม Valhall นั่นคือ Mali-G77 ในปี 2020 G77 กำลังจะเข้ามาแทนที่ Mali-G78 ซึ่งมีพื้นฐานมาจากสถาปัตยกรรม Valhall เช่นกัน แม้ว่า ARM จะบอกว่าเป็น GPU ที่มีประสิทธิภาพมากที่สุดสำหรับอุปกรณ์พกพาระดับพรีเมี่ยมในปัจจุบัน แต่ตัวเลขกลับไม่สามารถสำรองข้อมูลได้ แม้ว่า ARM จะพูดอย่างแดกดันว่าตัวเลขนั้นรองรับข้อเท็จจริงก็ตาม G78 นำการปรับปรุงประสิทธิภาพมาสู่ G77 ถึง 25% ซึ่งถือว่าน้อยมาก ช่องว่างในประสิทธิภาพ GPU สูงสุดระหว่าง G77 และ GPU ของ Apple A13 นั้นสำคัญ ซึ่งหมายความว่า G78 จะไม่สามารถตาม A13 ได้ ไม่ต้องสนใจ GPU ของ Apple A14 ที่กำลังจะมาถึง Qualcomm จะยังคงนำหน้าอยู่หนึ่งก้าวต่อไปเนื่องจากมีการปรับปรุงประสิทธิภาพที่เพิ่มขึ้นของตัวเอง

กราฟิกที่เปลี่ยนแปลงเกมและการเล่นเกมตลอดทั้งวันบนมือถือนั้นมีอยู่แล้วบน GPU อื่น ๆ ดังนั้นการตลาดของ ARM ที่นี่จึงดูกลวงไปเล็กน้อย

Mali-G78 สร้างขึ้นโดยคำนึงถึงนักพัฒนาและผู้ใช้ปลายทางตามข้อมูลของ ARM ช่วยให้ได้รับประสบการณ์การเล่นเกมบนมือถือคุณภาพสูงด้วยเกมคอนโซลที่พร้อมใช้งานบนมือถือแล้ว G78 ช่วยให้อายุการใช้งานแบตเตอรี่ยาวนานขึ้นมาสู่อุปกรณ์เคลื่อนที่ระดับพรีเมี่ยม นอกจากนี้ยังนำการเพิ่มประสิทธิภาพ ML เพิ่มเติมมาใช้สำหรับการเล่นเกม วิดีโอ กล้อง และคุณสมบัติ ML ความปลอดภัยที่ซับซ้อนมากขึ้นบนอุปกรณ์มือถือ

ARM มีความมั่นใจเกี่ยวกับโอกาสในการเล่นเกมบนมือถือ เกมบนมือถือคิดเป็นสัดส่วนมากกว่า 46% ของตลาดเกมทั่วโลกในปี 2562 โดยมีรายได้ 68.2 พันล้านดอลลาร์ นอกจากนี้ยังมีการเติบโตอย่างต่อเนื่องในอีกไม่กี่ปีข้างหน้า เนื่องจากจะแซงหน้าทั้งเกมพีซีและคอนโซล เกมระดับพรีเมียมจำนวนมากกำลังมาบนมือถือ และผู้ใช้คาดหวังประสบการณ์ที่คล้ายกันบนมือถือเมื่อเทียบกับคอนโซล

เพื่อให้ประสบการณ์เหล่านี้เป็นไปได้ Mali-G78 จึงมาพร้อมกับการเพิ่มประสิทธิภาพที่จำเป็น มีการปรับปรุงความหนาแน่นของประสิทธิภาพ 15% สำหรับเนื้อหาเกมเมื่อเทียบกับ G77 ด้วยพื้นที่เท่ากันกับรุ่นก่อนหน้า G78 จะให้ประสิทธิภาพที่มากกว่า การเพิ่มประสิทธิภาพนี้เกิดขึ้นได้ด้วยคุณสมบัติหลักสี่ประการ:

  • รองรับได้ถึง 24 คอร์
  • ระดับบนสุดแบบอะซิงโครนัส
  • การปรับปรุงช่างปูกระเบื้อง
  • ปรับปรุงการติดตามการพึ่งพาส่วนย่อย

แม้ว่าจำนวนคอร์สูงสุดของ G77 คือ 16 คอร์ แต่ ARM ได้เพิ่มจำนวนคอร์สูงสุดของ G78 เป็นสูงสุด 24 คอร์ แน่นอนว่าเพียงเพราะมีจำนวนสูงสุดไม่ได้หมายความว่าผู้จำหน่ายชิปมือถือจะรวม 24 คอร์จริงๆ รุ่นคอร์ที่กว้างที่สุดของ G77 ที่เราเคยเห็นคือ Mali-G77MP11 บน Exynos 990 ในขณะที่ Dimensity 1000 มี Mali-G77MC9

ARM เชื่อว่า Asynchronous Top Level จะเป็นคุณสมบัติที่เปลี่ยนแปลงเกมสำหรับประสิทธิภาพของ GPU กล่าวกันว่าเป็นการบีบประสิทธิภาพของเกมมือถือให้ได้มากที่สุดเท่าที่จะเป็นไปได้ เพื่อให้มั่นใจถึงประสิทธิภาพสูงสุด

ในทางกลับกัน การปรับปรุง Tiler จะเพิ่มคุณภาพอีกระดับให้กับเกมบนมือถือ เกมที่นำมาจากพีซีและคอนโซลมักจะมีเนื้อหาที่ซับซ้อนมากและฉากที่ซับซ้อน ซึ่งทำให้ประสิทธิภาพติดขัดและคอขวด การปรับปรุงตัวต่อจะช่วยลดภาระของจุดยอดบน GPU สำหรับฉากและเนื้อหาที่ซับซ้อนเหล่านี้ สิ่งนี้ช่วยปรับปรุงประสิทธิภาพสำหรับเนื้อหาเกมที่คล้ายกับคอนโซลที่ซับซ้อน

ARM ได้ปรับปรุงการติดตามการพึ่งพาแฟรกเมนต์บน G78 ด้วย สิ่งนี้ส่งผลต่อเกมมือถือโดยเฉพาะที่มีฉากเกมที่ซับซ้อนซึ่งเกี่ยวข้องกับควัน ต้นไม้ และหญ้า ผลลัพธ์ก็คือ ARM มีประสิทธิภาพดีขึ้นถึง 17% ในเกมมือถือชั้นนำ เมื่อเทียบกับ G77

Mali-G78 มีประสิทธิภาพการใช้พลังงานดีขึ้น 10% เมื่อเทียบกับรุ่นก่อน นั่นไม่เพียงพอที่จะตามให้ทันทั้ง Qualcomm หรือ Apple เป้าหมายของ ARM ที่นี่ดูอนุรักษ์นิยมเป็นพิเศษ คุณลักษณะระดับบนสุดแบบอะซิงโครนัสมีบทบาทสำคัญในประสิทธิภาพการใช้พลังงาน เนื่องจากช่วยลดการใช้พลังงาน จึงทำให้สามารถสร้างเนื้อหาได้อย่างยั่งยืน ดังนั้นเมื่ออุปกรณ์ส่งออกเนื้อหาตามอัตราเฟรมที่ต้องการ อุปกรณ์ก็สามารถลดสัญญาณนาฬิกาลงเพื่อประหยัดพลังงานได้ การเพิ่มระดับบนสุดสำหรับงานนี้ใช้พลังงานเพิ่มขึ้นเล็กน้อย แต่การประหยัดพลังงานจากการลดความถี่ของแกนเชเดอร์จะสูงกว่ามาก นั่นเป็นเพราะว่าคอร์เชเดอร์ใช้พลังงาน 90-95% ของงบประมาณพลังงานของ GPU

ประสิทธิภาพการใช้พลังงานที่ดีขึ้นใน G78 ยังเกิดขึ้นได้ด้วย Fused multiply-add (FMA) ได้รับการออกแบบใหม่ทั้งหมด ส่งผลให้ตัวเครื่องลดพลังงานลง 30% หน่วย FMA มีหน้าที่รับผิดชอบในการคำนวณส่วนใหญ่ที่เกิดขึ้นภายใน GPU และนั่นคือเหตุผลว่าทำไม ARM จึงเหมาะสมที่จะกำหนดเป้าหมายไปที่การลดพลังงาน

ความสามารถในการประมวลผลข้อมูลแบบขนานของ GPU ทำให้เหมาะสำหรับการรันปริมาณงาน ML แม้ว่า ARM จะรับทราบว่า CPU และ GPU ยังคงเป็นโปรเซสเซอร์หลักสำหรับ ML เนื่องจากกรณีการใช้งานมีความซับซ้อนมากขึ้น ปริมาณงานบางส่วนจะถูกถ่ายโอนไปยัง GPU กรณีการใช้งาน ML หลักสำหรับ GPU เชื่อมโยงกับคุณสมบัติด้านความปลอดภัยบนอุปกรณ์ กล้องที่แตกต่างกัน และโหมดวิดีโอ รวมถึงแอปพลิเคชันที่มีคุณสมบัติ AR

บทบาทของ ML บน GPU ช่วยให้ได้รับประสบการณ์ต่างๆ เช่น การติดตามใบหน้าภายในกรอบรูปภาพหรือวิดีโอ เกมที่ใช้คุณสมบัติ AR และอื่นๆ สำหรับงานที่ใช้ ML เหล่านี้ Mali-G78 มีการปรับปรุงประสิทธิภาพโดยเฉลี่ย 15% สำหรับเวิร์กโหลด ML ต่างๆ เมื่อเปรียบเทียบกับ G77 G77 นำประสิทธิภาพ ML ที่ดีขึ้น 60% เมื่อเทียบกับรุ่นก่อนๆ ดังนั้นการปรับปรุงเมื่อเทียบเป็นรายปีในปีนี้จึงน้อยกว่ามาก ระดับบนสุดแบบอะซิงโครนัสมีความสำคัญในการเพิ่มประสิทธิภาพ ML เนื่องจากการโอเวอร์คล็อกคอร์เชเดอร์ช่วยในกรณีการใช้งาน ML ต่างๆ บน GPU

ต่อไปก็มีประกาศของมาลี-จี68 นี่ไม่ได้เป็นอะไรนอกจาก Mali-G78 ที่แคบกว่า เช่นเดียวกับ Mali-G57 ที่เป็นรุ่นที่แคบกว่าของ Mali-G77 ARM กล่าวว่านี่เป็น GPU Mali ระดับย่อยตัวแรกสำหรับอุปกรณ์ปี 2021 มีฟีเจอร์ทั้งหมดของ G78 เช่น การปรับปรุงตัวต่อและยูนิต FMA ใหม่ในเอ็นจิ้นการดำเนินการ แต่รองรับได้ถึง 6 คอร์แทนที่จะเป็น 24 คอร์ ประสิทธิภาพระดับเกือบพรีเมียมด้วยต้นทุนที่ต่ำกว่าคือเป้าหมายของ GPU นี้

ARM พัฒนา GPU ระดับย่อยระดับพรีเมียมนี้หลังจากรับฟังความคิดเห็นจากพันธมิตรที่ต้องการคุณสมบัติระดับพรีเมียมในกลุ่มอุปกรณ์ของตน G68 มีพื้นที่ซิลิคอนต่ำกว่าตามที่คาดไว้ และนำเกมประสิทธิภาพสูงมาสู่กลุ่มนักพัฒนาและผู้บริโภคในวงกว้างขึ้น

สุดท้าย ARM กล่าวถึงความร่วมมือของนักพัฒนา ช่วยให้นักพัฒนาสามารถเพิ่มประสิทธิภาพเนื้อหาของตนเพื่อให้ทำงานได้ดีขึ้นบน Mali GPUs (ในทางทฤษฎี) ได้อย่างง่ายดาย ตัวอย่างหนึ่งคือที่ปรึกษาด้านประสิทธิภาพ ประการที่สองคือความร่วมมือของ ARM กับ Unity เพื่อนำ Burst Compiler รายละเอียดเกี่ยวกับเรื่องนี้สามารถอ่านได้ในบทความต้นฉบับ

มาลี-G78 - แนวโน้ม

แนวโน้มของ Mali-G78 นั้นดูสิ้นหวัง ดูเหมือนว่า ARM ไม่สนใจที่จะปรับปรุงประสิทธิภาพอย่างมากทุกปีในรูปแบบเดียวกับที่ Apple กำลังทำ ในรูปแบบเดียวกับที่ Qualcomm ทำในอดีต แม้ว่าอัตราการปรับปรุงของ Qualcomm จะชะลอตัวลงเช่นกัน แต่พื้นฐานก็ยังอยู่ในตำแหน่งที่สูงกว่า ARM มันดูไม่ดีสำหรับระบบนิเวศของ Android เมื่อผู้ตรวจสอบระบุด้วยหลักฐานเชิงตัวเลขว่าประสิทธิภาพที่ยั่งยืนของ GPU ของ A13 นั้นสูงกว่าประสิทธิภาพสูงสุดของ Snapdragon 865 เดลต้าประสิทธิภาพระหว่าง GPU ของ Apple และ Android กำลังเพิ่มขึ้น และจะขยายวงกว้างขึ้นเท่านั้น

ดังนั้น G78 จึงไม่ใช่โซลูชันมหัศจรรย์ในการแก้ปัญหา Mali GPU ของ ARM และนำพวกเขาไปอยู่อันดับต้นๆ ของแผนภูมิประสิทธิภาพ มันจะยังคงอยู่ในอันดับที่ต่ำกว่า GPU ของ Apple และ Qualcomm มันจะเป็นตัวเลือกเริ่มต้นสำหรับ SoC บางตัว เพียงเพราะเป็น GPU IP ของ ARM และโซลูชันแบบกำหนดเองมีอุปสรรคในการเข้าและมีค่าใช้จ่ายมากขึ้นเช่นกัน ดี.

ปีหน้าเป็นที่น่าสงสัยว่า Samsung Systems LSI จะลงเอยด้วยการใช้ Mali-G78 จริงหรือไม่ Samsung เป็นลูกค้ารายใหญ่ของ Mali GPU แต่เมื่อปีที่แล้ว ได้ลงนามความร่วมมือกับ AMD เพื่อนำสถาปัตยกรรม RDNA GPU ไปยัง SoC บนมือถือในปี 2021 หากแผนงานดังกล่าวยังคงเป็นไปตามแผน และ ณ จุดนี้เราไม่มีเหตุผลที่จะสงสัยว่าจะไม่เป็นไปตามแผน ผู้สืบทอดของ Exynos 990 จะมี GPU AMD RDNA แทน Mali GPU มันจะเป็นการสูญเสียการออกแบบครั้งใหญ่สำหรับ ARM อย่างแน่นอน แม้แต่ผู้จำหน่ายรายอื่นเช่น MediaTek ก็มีตัวเลือกมากขึ้นในปัจจุบัน จินตนาการเทคโนโลยีใหม่ สถาปัตยกรรม GPU ซีรีส์ A มีเป้าหมายการออกแบบเพื่อประสิทธิภาพที่สูงกว่า G78 และเป็นไปได้ว่า MediaTek จะเปลี่ยนจาก Mali ในอนาคต แน่นอนว่า Qualcomm ไม่มีเหตุผลที่จะละทิ้งความพยายามของ Adreno GPU ซึ่งยังคงอยู่ ดีที่สุดในแง่ของประสิทธิภาพและประสิทธิผลเมื่อพูดถึง Android โดยเฉพาะ ตลาดสมาร์ทโฟน

ดังนั้นจึงชัดเจนว่า ARM จะต้องเพิ่มอัตราการปรับปรุง Mali GPU ทุกปีเพื่อสร้างความแตกต่างอย่างแท้จริงในตลาด GPU มือถือ หากไม่สามารถทำได้ ก็อาจเสี่ยงที่จะถูกพิจารณาในภายหลังในพื้นที่ GPU มือถือระดับพรีเมี่ยม


ARM Ethos N78

ในที่สุด ARM ก็ได้ประกาศหน่วยประมวลผลประสาท (NPU) ของ Ethos N78 ด้วย เป็นผู้สืบทอดของ N77 NPU โดยมอบความสามารถ ML บนอุปกรณ์ที่ดียิ่งขึ้นและประสิทธิภาพการทำงานเพิ่มขึ้นสูงสุด 25% ความสามารถในการกำหนดค่ายังเป็นจุดแข็งอีกด้วย เนื่องจากการกำหนดค่าที่มีให้อยู่ในช่วงตั้งแต่ 1 TOP/s ถึง 10 TOP/s สำหรับรายละเอียดเพิ่มเติม โปรดดู โพสต์ในบล็อกของ ARM. NPU นี้น่าจะได้รับชัยชนะในการออกแบบอย่างจำกัด เนื่องจาก Qualcomm, Samsung, HiSilicon และ MediaTek ต่างก็มีหน่วยประมวลผลประสาท/เครื่องยนต์ AI ของตัวเอง


ที่มา: ARM (1, 2), อานันท์เทค (1, 2)