บทสัมภาษณ์: Qualcomm บน Kryo 485 และ Hexagon 690 ของ Snapdragon 855

click fraud protection

Travis Lanier จาก Qualcomm นั่งคุยกับ XDA เพื่อให้สัมภาษณ์เกี่ยวกับ Kryo 485 CPU ในแพลตฟอร์มมือถือ Snapdragon 855 และทำการตลาดให้กับ Hexagon 690 DSP

เมื่อเดือนที่แล้ว Qualcomm ได้เปิดตัว แพลตฟอร์มมือถือ Snapdragon 855. Snapdragon 855 เป็นแพลตฟอร์มมือถือที่จะขับเคลื่อนสมาร์ทโฟนเรือธง Android ส่วนใหญ่ในปี 2019 Qualcomm ได้ทำการปรับปรุงอย่างมากเมื่อเทียบเป็นรายปีด้วยแพลตฟอร์มมือถือรุ่นต่อไป แพลตฟอร์มมือถือ Snapdragon 855 สร้างขึ้นจากกระบวนการผลิตขนาด 7 นาโนเมตร และมอบประสิทธิภาพ CPU ที่เพิ่มขึ้นอย่างน่าประทับใจถึง 45% เมื่อเทียบกับ Snapdragon 845 การปรับปรุงการคำนวณทั่วทั้งบอร์ดทำให้ Qualcomm สามารถอวดประสิทธิภาพ AI ที่ยอดเยี่ยมบน Snapdragon 855 ใหม่ มีข้อมูลมากมายที่จะแกะออกที่นี่ และเราได้พยายามอย่างเต็มที่ที่จะแสดง Qualcomm ปรับปรุงประสิทธิภาพและ AI อย่างไร บน Snapdragon 855 อย่างไรก็ตาม เรายังคงมีคำถามของเราเองหลังจากเปิดตัวผลิตภัณฑ์ ดังนั้นเราจึงนั่งคุยกับ Travis Lanier ผู้อาวุโส ผู้อำนวยการฝ่ายบริหารผลิตภัณฑ์ที่ Qualcomm เพื่อพูดคุยเกี่ยวกับ Kryo 485 CPU และ AI บนมือถือใหม่ของ Qualcomm แพลตฟอร์ม.


มาริโอ เซอร์ราเฟโร: “45% [กระโดด] มันเหมือนกับใหญ่ที่สุดเท่าที่เคยมีมา มาแกะห่อกันดีกว่า เรามีฐาน A76 ขนาด 7 นาโนเมตร ซึ่งเป็นผู้มีส่วนร่วมรายใหญ่ ดูเหมือนว่านับตั้งแต่พวกคุณย้ายออกจากคอร์ที่กำหนดเอง สิ่งพิมพ์และผู้ชมบางส่วน ยังไม่มีเบาะแสมากนักว่าใบอนุญาต Built on ARM นั้นเกี่ยวข้องกับอะไรบ้างในแง่ของสิ่งที่อนุญาต คุณต้องทำ คุณค่อนข้างเก็บความลับเกี่ยวกับสิ่งที่เกี่ยวข้อง [ด้วย] ตอนนี้คุณอยู่บนเวทีเป็นครั้งแรก อย่างน้อยก็นอกเหนือจากการถามตอบ ...แต่เป็นครั้งแรกที่คุณได้แสดงให้เห็นว่ามีการปรับปรุงอะไรบ้าง และนั่นก็เยี่ยมมาก ดังนั้นเราจึงสงสัยว่าคุณต้องการขยายวิธีที่ Qualcomm ปรับ Kryo 485 เพื่อบีบ [ออก] มากขึ้นหรือไม่ ฐานของ ARMไม่ว่าจะเป็นการขยายเนื้อหาที่คุณได้เปิดเผยที่นั่นหรือสิ่งที่คุณไม่ได้นำเสนอ"

ทราวิส ลาเนียร์: "ฉันไม่สามารถพูดมากไปกว่าสิ่งอื่นที่อยู่ในสไลด์ของฉันได้ บางทีในอนาคตเราสามารถทำได้ เพื่อที่เราจะได้นั่งลงและหาผู้เชี่ยวชาญบางคนที่ทำงานจริง ฉันรู้ประเด็นการพูดคุยระดับสูง แต่อย่างที่คุณทราบ A76 มีการออกแบบระดับสูงอยู่แล้ว—ค่อนข้างดี และนี่เป็นหนึ่งในเหตุผลที่เราเห็นแผนงานของ ARM ฉันก็แบบว่า โอเค บางทีเราควรทำงานร่วมกับคนเหล่านี้ให้ใกล้ชิดกว่านี้ เพราะมันดูแข็งแกร่งมาก และเพียงแค่กลับไปที่ความคิดเห็นของคุณเกี่ยวกับการปรับแต่งเทียบกับ ARM โอเค มีทุกสิ่งที่คุณสามารถทำได้ และหากคุณกำลังทำอะไรบางอย่าง และจำเป็นต้องมีความแตกต่าง คุณจึงสามารถทำอะไรสักอย่างได้ร้อยเปอร์เซ็นต์หรือร่วมมือกับสิ่งเหล่านั้น และ [เช่นเดียวกับใน] ปีที่แล้ว เรามีการบูรณาการเพิ่มเติมอีกเล็กน้อย ดังนั้นบัส และวิธีที่เราเชื่อมต่อกับระบบ คุณลักษณะด้านความปลอดภัยที่เราใส่ไว้ใน CPU การกำหนดค่าแคช ตอนนี้การนัดหมายดำเนินไปนานขึ้นแล้ว เราจึงสามารถปรับแต่งอันนี้ให้ลึกซึ้งยิ่งขึ้นได้ และนั่นคือวิธีที่เราสามารถใส่สิ่งเหล่านี้ลงไปได้ เช่น หน้าต่างการดำเนินการ [ที่ไม่อยู่ในลำดับ] ที่ใหญ่ขึ้น ใช่ไหม คุณจึงมีมากขึ้น คำแนะนำในการบิน การดึงข้อมูลล่วงหน้าเป็นหนึ่งในพื้นที่ที่มีนวัตกรรมมากที่สุดที่เกิดขึ้นในอุตสาหกรรมไมโครโปรเซสเซอร์ ตอนนี้. เทคนิคมากมายสำหรับสิ่งเหล่านี้ค่อนข้างคล้ายกัน ทุกวันนี้ใครๆ ก็ใช้ตัวทำนายสาขา TAGE เพียงแค่คุณจัดเตรียมมันให้ใหญ่แค่ไหน ผู้คนก็รู้วิธีดำเนินการที่ไม่อยู่ในลำดับ และการส่งต่อและทุกสิ่งสำหรับแคชที่ใหญ่กว่า แต่การดึงข้อมูลล่วงหน้า ยังมีอีกมาก มันเป็นหนึ่งในประเภทศิลปะมืดเหล่านั้น ยังคงมีนวัตกรรมมากมายเกิดขึ้นในพื้นที่นั้น นั่นคือสิ่งที่เรารู้สึกว่าสามารถช่วยได้

และเพียงเพราะเรารู้สึกว่าโดยทั่วไปแล้วเราทำงานได้ดีกว่ากับ... โดยปกติแล้วเราสามารถใช้การออกแบบได้เร็วกว่าที่ผู้อื่นสามารถรวมโหนดกระบวนการได้ ดังนั้นเมื่อเราใส่สิ่งเหล่านี้ลงไป เช่น เมื่อคุณใช้สิ่งที่ไม่อยู่ในลำดับมากขึ้น มันก็จะเน้นไปที่การออกแบบของคุณมากขึ้นใช่ไหม มันไม่ฟรีที่จะเพิ่มการดำเนินการเหล่านี้ทั้งหมดลงในนั้น ดังนั้นเพื่อให้สามารถทำเช่นนั้นได้และไม่กระทบต่อคุณ เอฟแม็กซ์. ใช่ นั่นเป็นส่วนหนึ่งของการมีส่วนร่วมที่เรามีกับ ARM แบบว่าคุณจะดึงมันออกมาได้อย่างไร?”

มาริโอ เซอร์ราเฟโร: "ด้วยความอยากรู้อยากเห็น ในการนำเสนอ คุณได้พูดคุยเกี่ยวกับการปรับปรุงประสิทธิภาพที่กำลังจะมีขึ้น จากการดึงข้อมูลล่วงหน้า คุณกำลังพูดถึงประสิทธิภาพการใช้พลังงาน การปรับปรุงประสิทธิภาพ บ้างไหม ทั้งคู่?"

ทราวิส ลาเนียร์: "ทั้งหมดข้างต้น. โดยธรรมชาติแล้ว เรากำลังทำการดึงข้อมูลล่วงหน้า คุณได้ดึงสิ่งต่าง ๆ ไว้ในแคช ดังนั้นเมื่อคุณมีแคชที่ไม่สามารถเข้าถึงหน่วยความจำได้มากนัก ตอนนี้กลับมีการดึงข้อมูลล่วงหน้ากลับด้าน: หากคุณดึงข้อมูลล่วงหน้ามากเกินไป คุณจะ [ใช้] หน่วยความจำมากขึ้นเพราะคุณ รู้ไหม [คุณกำลัง] ทำการดึงข้อมูลล่วงหน้าแบบเก็งกำไรมากเกินไป แต่ตราบใดที่ ถ้าคุณมีของอยู่และดึงของที่ถูกต้องออกมา คุณก็จะไม่ต้องใช้ความจำในการดึงมันเข้าไป ที่นั่น. ดังนั้น หากคุณมีพรีฟีดเชอร์ที่มีประสิทธิภาพมากกว่า คุณจะประหยัดพลังงานและเพิ่มประสิทธิภาพการทำงาน"

มาริโอ เซอร์ราเฟโร: "เอาล่ะเจ๋งใช่ ใช่ ฉันไม่ได้คาดหวังว่าคุณจะสามารถขยายขอบเขตไปไกลกว่านั้นได้มากนัก แต่ก็น่าสนใจที่ถ้าคุณพูดแบบนั้น ตอนนี้พวกคุณกำลังปรับแต่งกันมากขึ้น และบางทีคุณอาจจะสามารถแบ่งปันได้มากขึ้นในอนาคต จากนั้นผมจะจับตาดูให้ดี ดังนั้น การหันศีรษะแบบอื่น อย่างน้อยในหมู่ผู้คนที่ฉันรายล้อมไปด้วย ก็คือแก่นสำคัญ ดังนั้นเราจึงคาดหวังว่าการจัดการคลัสเตอร์จะมีความยืดหยุ่นมากขึ้นในอีกสองสามปีข้างหน้านี้ โดยที่ [the] รวม DynamIQ ไว้ด้วย และเราคาดหวังว่าบริษัทอื่นๆ จะเลิกใช้ [the] 4+4 คำถามสองข้อ: อะไรคือแรงจูงใจเบื้องหลังแกนหลัก? Prime Core มีประโยชน์ต่อประสบการณ์ผู้ใช้อย่างไร เนื่องจากผู้อ่านของเราอยากรู้ว่าเหตุใดจึงมีแกนเดี่ยวอยู่ตรงนั้น และเหตุใดจึงไม่ใช่แกนเดี่ยวทีเดียว จะไม่แชร์ Power Plane กับคลัสเตอร์ประสิทธิภาพเพื่อบรรเทายูทิลิตี้บางอย่างที่คุณจะได้รับหากคุณใช้ DynamIQ และนั่ง [มัน] เพียงอย่างเดียวใช่ไหม?”

ทราวิส ลาเนียร์: "เรามาพูดถึงนาฬิกาและระนาบแรงดันไฟฟ้าที่แตกต่างกันก่อน ดังนั้นทุกครั้งที่คุณเพิ่มนาฬิกาและทุกครั้งที่เพิ่มแรงดันไฟฟ้า จะต้องเสียค่าใช้จ่าย ดังนั้นจึงมีการจำกัดจำนวนพินที่คุณใส่บนแพ็คเกจ มี PLL มากขึ้นที่คุณต้องมีสำหรับนาฬิกาที่แตกต่างกัน และมีความซับซ้อนเพิ่มขึ้นเท่านั้น ดังนั้นจึงมีข้อแลกเปลี่ยนกับการทำสิ่งต่างๆ มีอยู่ช่วงหนึ่งที่พวกเราไปกันแบบสุดโต่ง เรามีโดเมนที่แตกต่างกันสี่โดเมนบนนาฬิกาที่แตกต่างกันสี่นาฬิกา ดังนั้นเราจึงมีประสบการณ์กับสิ่งนั้นและมันก็มีราคาแพง เมื่อคุณเริ่มไปใหญ่ เล็ก ๆ น้อย ๆ คุณมีคอร์เล็ก ๆ บน [the] คลัสเตอร์เล็ก ๆ และพวกมันไม่ต้องการรายละเอียดที่เหมือนกันขนาดนั้น พูดได้เลยว่าต้องมีนาฬิกาแยกระหว่างคอร์เล็ก ๆ ใช่ มันเหมือนกับว่าคุณกำลังทำอะไรกับสิ่งเหล่านั้นอยู่ ดังนั้นเมื่อคุณมีเรื่องใหญ่ ระบบ LITTLE ในทางกลับกัน คุณมีคอร์ขนาดใหญ่เหล่านี้ โอเค คุณใส่แต่ละอันบนนาฬิกาเรือนใหญ่ไหม? คุณไม่ได้ทำงานบนสิ่งเหล่านั้นตลอดเวลา หากคุณอยู่ในสถานการณ์ที่ต่ำพอที่นาฬิกาที่ว่างจะยังคงทำงานบนแกนประมวลผลขนาดเล็กอยู่ดี จริงๆ มันเป็นแบบที่พวกเขาสองคนดีพอแล้ว

แล้วคุณก็จะไปถึงจุดที่เรามีคอร์ไพรม์คอร์ ซึ่งเอาล่ะ เรามีคอร์นาฬิกาแยกต่างหาก ซึ่งสามารถรันได้ถึงความถี่ที่สูงกว่า แต่คอร์อื่นๆ เหล่านี้ หรือคลัสเตอร์ประสิทธิภาพอื่นๆ ไม่สามารถไปถึงความถี่สูงแบบเดียวกันได้ ดังนั้นหากคุณต้องการได้รับสิทธิ์แบบเต็มของคอร์นั้น คุณต้องมีนาฬิกาที่สามสำหรับคอร์นั้น แล้วแกนนี้ทำอะไร? เราได้สัมผัสเรื่องนี้เล็กน้อย สิ่งที่ยิ่งใหญ่จะเป็น [ตัว] เครื่องเรียกใช้งานแอปและการท่องเว็บ แล้วทำไมมีคอร์เดียวล่ะ? โอเค สิ่งต่าง ๆ เริ่มมีมัลติเธรดมากขึ้นแล้ว ตัวอย่างเช่น เอ็นจิ้นเกม—ฉันจะกลับมาอีกครั้งในไม่กี่วินาที—กำลังเคลื่อนตัวไปสู่เธรดที่มากขึ้นอย่างจริงจัง แต่ถ้าคุณดูแอปส่วนใหญ่ แม้ว่าจะมีหลายเธรด ฉันจะใช้กฎ Pareto เช่นเดียวกับแอปส่วนใหญ่ 80% ของการโหลดอยู่ในเธรดเดียว ดังนั้นคุณอาจเปิดตัวแอป [an] และอาจสว่างขึ้นและสว่างขึ้นบนทั้ง 8 คอร์ แต่เป็นไปได้มากกว่านั้น 80% อยู่ในเธรดที่โดดเด่นเพียงเธรดเดียว—อยู่ในคอร์นั้น การท่องเว็บยังคงเป็น JavaScript เป็นหลัก การท่องเว็บดีขึ้นเล็กน้อยด้วยมัลติเธรดซึ่งคุณสามารถมีภาพหลายภาพและคุณสามารถถอดรหัสได้ แต่ตัวอย่างเช่น JavaScript—[a] เธรดเดียวจะทำงานบนคอร์เดียว ดังนั้นจึงมีกรณีการใช้งานจำนวนมากที่ได้รับประโยชน์จากการมีแกนประมวลผลตัวเดียวที่มีประสิทธิภาพสูงมาก

ตอนนี้เรามีคอร์สามคอร์ที่ทำงานน้อยลงเล็กน้อยที่ความถี่ต่ำกว่า แต่ยังประหยัดพลังงานมากกว่าอีกด้วย และอย่างเช่น เมื่อใดก็ตามที่คุณ—ฉันไม่รู้ว่าคุณรู้มากแค่ไหนเกี่ยวกับการใช้งานคอร์—แต่เมื่อใดก็ตามที่คุณเริ่มเข้าถึงความถี่สูงสุด และ การใช้งานคอร์เหล่านี้ มีการแลกเปลี่ยนพลังงาน สิ่งต่างๆ เริ่มได้รับแบบทวีคูณในช่วงสองสามเมกะเฮิรตซ์หรือกิกะเฮิรตซ์สุดท้ายที่คุณ มี. ใช่แล้ว และฉันก็พูดถึงเมื่อวินาทีที่แล้ว โดยที่ เฮ้ เกมทั้งหมดเริ่มมีมัลติเธรด เหมือนทุกเกม ทันใดนั้น หากคุณมองย้อนกลับไป มีเกมสองสามเกมเมื่อไม่นานมานี้ และพวกเขากำลังใช้เพียงเกมเดียว เกลียว. แต่มันแปลกที่อุตสาหกรรมสามารถเปลี่ยนแปลงได้เร็วแค่ไหน เช่นเดียวกับปีที่ผ่านมา ปีครึ่ง พวกเขาเริ่มใส่เกมเหล่านี้ลงไป... ฉันตื่นเต้นกับเกมที่มีความเที่ยงตรงสูงเหล่านี้ แม้ว่าหลายๆ อย่างจะเหมือนกับหกเดือนถึงหนึ่งปีที่แล้ว แต่ก่อนหน้านี้ จริงๆ แล้วกลับพลิกไปทั่วประเทศจีน ในประเทศจีน ฉันได้ยินมาว่า "ฉันไม่ค่อยสนใจแกนใหญ่ๆ ให้อะไรสักแปดอย่างให้ฉัน ให้แปดแกนให้ฉันหน่อย" คอร์ที่เล็กที่สุดดังนั้นฉันจึงมีแปดคอร์ได้" พวกมันเปลี่ยนไปเพราะพวกเขาต้องการเกมเหล่านี้ เกมเหล่านี้ต้องการ แกนใหญ่ และตอนนี้เราได้รับคำติชมจากพันธมิตรว่า “ไม่ เราต้องการคอร์ขนาดใหญ่สี่คอร์จริงๆ” เนื่องจากเกมขั้นสูงทั้งหมดที่กำลังจะออกมา และพวกเขาจะใช้แกนทั้งหมดเหล่านี้

ดังนั้นเมื่อคุณเล่นเกม คุณจะไม่เล่นเกมเป็นเวลา 30 วินาทีหรือ 5 นาที คุณจะเล่นเกมได้นานขึ้น ดังนั้นจึงสมเหตุสมผลที่เรามีคอร์อื่นๆ อีกสามคอร์นี้ในกรณีการใช้งานคอร์ขนาดใหญ่แบบมัลติเธรดส่วนใหญ่ของคุณ พวกเขาต้องการเพิ่มประสิทธิภาพในการใช้พลังงานเพิ่มขึ้นอีกเล็กน้อย มันค่อนข้างจะสมดุล คุณมีคอร์ที่มีประสิทธิภาพสูงกว่า เมื่อคุณต้องการมันสำหรับบางสิ่งเหล่านี้ภายในบางอย่าง ในกรณีต่อเนื่องเหล่านี้ซึ่งมีคอร์ขนาดใหญ่และคุณมีโซลูชันที่ประหยัดพลังงานมากกว่าที่จะจับคู่ด้วย ที่. เป็นความคิดแบบนั้น มันมีความสมมาตรที่ไม่ธรรมดานิดหน่อย แต่หวังว่าจะเป็นคำตอบว่าทำไม [มี] ไพรม์คอร์ ทำไมคุณไม่มีนาฬิกาแยกกัน และทำไมคุณไม่มีแรงดันไฟฟ้าแยกกัน? ดังนั้นฉันคิดว่าฉันได้สัมผัสสิ่งเหล่านั้นทั้งหมดแล้ว”

การกำหนดค่าหลักของ CPU Kryo 485 ที่มา: ควอลคอมม์

มาริโอ เซอร์ราเฟโร: “ตอนนี้ การคำนวณแบบต่างกัน นั่นคือสิ่งที่ Qualcomm เน้นย้ำตั้งแต่ย้ายจากแบรนด์เก่าไปสู่แพลตฟอร์มมือถือ และตัวอธิบาย [a] ประเภทนั้น และยังรวมบล็อกจากการอธิบายเมตริกประสิทธิภาพบางอย่าง เช่น AI. วิวัฒนาการดังกล่าวได้เปลี่ยนไปใช้แนวทางการคำนวณที่ต่างกันมากขึ้นอย่างไร ทุกที่ตั้งแต่การออกแบบ การดำเนินการ ไปจนถึงการตลาด หรืออะไรก็ตามที่คุณสามารถสัมผัสได้"

ทราวิส ลาเนียร์: "มันย้อนไปนิดหน่อย.. แต่สุดท้ายแล้วคุณต้องมีเอ็นจิ้นเหล่านี้เพราะชื่อเกมบนมือถือคือประสิทธิภาพการใช้พลังงาน ตอนนี้บางครั้งคุณจะเห็นว่ามันกลับไปสู่ลักษณะทั่วไปเป็นครั้งคราว หากคุณกลับไปใช้ต้นฉบับ แม้แต่สมาร์ทโฟน ฟีเจอร์โฟนก็มีมัลติมีเดียและกล้องถ่ายรูป ความสามารถในระดับหนึ่ง ดังนั้นพวกเขาจึงมีสิ่งที่ทุ่มเทเล็กๆ น้อยๆ ทั้งหมดนี้เพราะคุณทำไม่ได้ ทำมัน. หากคุณย้อนกลับไปที่โทรศัพท์ที่สร้างบน ARM 9 หรือ ARM 7 พวกเขาทั้งหมดมีวิดเจ็ตการเร่งความเร็วด้วยฮาร์ดแวร์สำหรับทุกสิ่ง

แต่เพื่อยกตัวอย่างให้คุณเห็นว่า มีบางอย่างเป็นเรื่องทั่วไปแล้วตอนนี้พวกเขากำลังขอฮาร์ดแวร์อีกครั้ง ก็คือ JPEG เคยมีตัวเร่งความเร็ว JPEG ในที่สุด CPU ก็ดีพอและประหยัดพลังงานเพียงพอและ JPEG ก็ยังคงอยู่ ขนาดเดียวกับที่ เฮ้ คุณรู้ไหม เราจะทำต่อไปบน CPU [เพราะ] มันง่ายกว่าที่จะทำ มัน. ตอนนี้ เมื่อรูปภาพใหญ่ขึ้นเรื่อยๆ ทันใดนั้น ผู้คนก็ไปกัน จริงๆ แล้ว ฉันอยากให้ไฟล์รูปภาพขนาดมหึมาเหล่านี้ถูกเร่งให้เร็วขึ้น CPU [เป็น] ชนิดไม่เร็วพอหรือสิ้นเปลืองพลังงานมากเกินไป ทันใดนั้นก็มีความสนใจที่จะมีตัวเร่งความเร็ว JPEG อีกครั้ง ดังนั้น สิ่งต่างๆ ไม่ได้เป็นเส้นตรงเสมอไป คุณต้องดูว่าเกิดอะไรขึ้นกับกฎของมัวร์ ใครๆ ก็พูดถึง เฮ้ อาจจะไม่ตาย แต่มันช้าลงนิดหน่อยใช่ไหมล่ะ? ดังนั้นหากคุณไม่ได้รับการเพิ่มพลังหรือการเพิ่มประสิทธิภาพจากโหนดถัดไปแต่ละโหนด คุณจะเพิ่มฟังก์ชันการทำงานบนโทรศัพท์ต่อไปได้อย่างไรหากคุณไม่มีค่าใช้จ่ายดังกล่าว ดังนั้นคุณสามารถวางมันลงบน CPU ได้ แต่ถ้าคุณไม่มีพื้นที่ว่างเหลือสำหรับ CPU คุณจะเร่งสิ่งเหล่านี้ได้อย่างไร คำตอบก็คือ คุณใส่คอร์พิเศษและสิ่งต่าง ๆ เหล่านี้ได้อย่างมีประสิทธิภาพมากขึ้น และมันก็เป็นความตึงเครียดตามธรรมชาติ

คุณจะเห็นผู้คนถูกบังคับให้ทำสิ่งเหล่านี้เพื่อหน้าที่ทั่วไป เพราะอาจไม่ใช่ทุกคนที่จะตกเลือด แต่แน่นอนว่าเราจะพยายามอยู่ที่นั่นให้นานที่สุดเท่าที่จะเป็นไปได้ แต่เราไม่สามารถบังคับให้ fabs ย้ายไปยังโหนดถัดไปได้หากไม่จำเป็น นั่นเป็นเหตุผลที่คุณต้องมุ่งเน้นไปที่นวัตกรรมอย่างต่อเนื่องและสถาปัตยกรรมเหล่านี้เพื่อให้ได้ประสิทธิภาพและประสิทธิภาพการใช้พลังงานที่ดีขึ้นต่อไป นั่นคือจุดแข็งและภูมิหลังของเรา"

มาริโอ เซอร์ราเฟโร: "แม้ว่าจะมีการเปลี่ยนแปลงไปสู่การประมวลผลที่ต่างกัน แต่ในส่วนของ Qualcomm ผู้ชมจำนวนมากและสิ่งพิมพ์จำนวนมากอย่างแน่นอน ผู้ที่ชื่นชอบหลายๆ คน น่าแปลกใจที่คุณคิดว่าจะรู้ดีกว่า พวกเขายังคงคิด พิจารณา และประเมินผล บล็อกที่แยกจากกัน เอนทิตี พวกเขายังคงมุ่งเน้นไปที่ “ฉันต้องการดูหมายเลข CPU เพราะฉันสนใจเรื่องนั้น” พวกเขาต้องการเห็นหมายเลข GPU เพราะพวกเขาชอบเกม และอื่นๆ พวกเขาไม่ถือว่าสิ่งเหล่านี้เป็นส่วนที่มีการสื่อสารของผลิตภัณฑ์ครบวงจรตัวเดียว คุณคิดว่า Qualcomm มีและเป็นและสามารถทำลายกระบวนทัศน์ดังกล่าวได้เนื่องจากคู่แข่งมุ่งเน้นไปที่การปรับปรุงการตลาดแบบบล็อกต่อบล็อกโดยเฉพาะ โดยเฉพาะอย่างยิ่ง [เราจะ] ก้าวไปสู่โครงข่ายประสาทเทียม ซึ่งเป็นโครงข่ายประสาทเทียมในภายหลัง”

ทราวิส ลาเนียร์: "ฉันหวังว่าฉันจะได้สัมผัสบางส่วนในวันนี้ ตัวอย่างเช่น เรามุ่งเน้นไปที่การเล่นเกมอย่างยั่งยืน ดังนั้นบางทีคุณอาจทำคะแนนได้ดีจากเกณฑ์มาตรฐานการเล่นเกมทั้งหมด ผู้คนหมกมุ่นอยู่กับเรื่องนั้น แต่จริงๆ แล้ว สิ่งที่สำคัญคือ หากคุณกำลังเล่นเกม เฟรมต่อวินาทีของคุณจะคงอยู่ในจุดที่คุณต้องการให้อยู่ที่จุดสูงสุดสำหรับสิ่งเหล่านี้อย่างสม่ำเสมอหรือไม่ ฉันคิดว่าผู้คนใส่น้ำหนักมากเกินไปให้กับตัวเลขสำหรับบล็อกใดบล็อกหนึ่งเหล่านี้ มันยากมาก และฉันเข้าใจความปรารถนาที่จะให้หมายเลขหนึ่งกับฉันเพื่อบอกว่าอะไรดีที่สุด มันสะดวกมาก โดยเฉพาะใน AI ในตอนนี้ มันโคตรจะบ้าเลย แม้จะมีการวัดประสิทธิภาพ CPU แล้ว CPU วัดประสิทธิภาพอะไรได้บ้าง พวกเขาทั้งหมดวัดสิ่งต่าง ๆ ใช้การวัดประสิทธิภาพใดๆ ก็ตาม เช่น GeekBench มีองค์ประกอบย่อยมากมาย คุณเห็นใครฉีกเป็นชิ้นๆ และดูว่าองค์ประกอบย่อยใดที่เกี่ยวข้องกับสิ่งที่ฉันกำลังทำอยู่มากที่สุด"

มาริโอ เซอร์ราเฟโร: "บางครั้งเราก็ทำ"

ทราวิส ลาเนียร์: "บางทีพวกคุณอาจจะทำ. พวกคุณเหมือนคนนอกรีต แต่บางที CPU ตัวหนึ่งอาจจะดีกว่าในเรื่องนี้ และบางทีตัวหนึ่งอาจจะดีกว่าในอีกตัวหนึ่งด้วย เช่นเดียวกับ SPEC ผู้คนจะเน้น SPEC อันเดียว เอาล่ะ มีภาระงานที่แตกต่างกันมากมายภายในนั้น และสิ่งเหล่านี้ค่อนข้างรัดกุม แต่แม้แต่ SPEC ที่เราใช้จริงในการพัฒนา CPU หากคุณดูที่ปริมาณงานจริง มันเกี่ยวข้องกันจริง ๆ หรือไม่? เป็นการดีสำหรับการเปรียบเทียบปริมาณงานในเวิร์กสเตชัน แต่ฉันกำลังสร้างแบบจำลองโมเลกุลบนโทรศัพท์ของฉันจริงๆ หรือไม่ ไม่ แต่ขอย้ำอีกครั้ง นั่นคือประเด็นของฉันคือ เกณฑ์มาตรฐานเหล่านี้ส่วนใหญ่มีประโยชน์ในทางใดทางหนึ่ง แต่คุณต้องเข้าใจบริบทว่ามีไว้เพื่ออะไร และคุณไปถึงจุดนั้นได้อย่างไร ดังนั้นจึงเป็นเรื่องยากมากที่จะกลั่นกรองสิ่งต่างๆ ให้เป็นตัวเลขเดียว

และฉันเห็นสิ่งนี้โดยเฉพาะ—ฉันกำลังหมุนตรงนี้นิดหน่อย—แต่ฉันเห็นสิ่งนี้กับ AI ในตอนนี้ มันช่างบ้าจริงๆ ฉันเห็นว่ามีสองสิ่งที่แตกต่างออกไปที่จะไม่ได้รับหมายเลขเดียวสำหรับ AI เท่าที่ฉันพูดถึง CPU และคุณมีเวิร์กโหลดที่แตกต่างกันทั้งหมดนี้ และคุณกำลังพยายามได้ตัวเลขตัวเดียว โฮลีโมลี, เอไอ มีโครงข่ายประสาทเทียมที่แตกต่างกันมากมาย และมีปริมาณงานที่แตกต่างกันมากมาย คุณรันมันในทศนิยม คุณรันมันใน int รันด้วยความแม่นยำ 8 หรือ 16 บิตหรือไม่? สิ่งที่เกิดขึ้นคือ ฉันเห็นผู้คนพยายามสร้างสิ่งเหล่านี้ และเราเลือกภาระงานนี้ และเราทำมันใน จุดลอยตัว และเราจะชั่งน้ำหนัก 50% ของการทดสอบของเราในเครือข่ายนี้และการทดสอบอื่นอีก 2 รายการ และเราจะชั่งน้ำหนักการทดสอบเหล่านั้น นี้. โอเค มีใครใช้เวิร์คโหลดนั้นบนเน็ตนั้นจริงๆ บ้างไหม? มีการใช้งานจริงบ้างไหม? AI น่าทึ่งเพราะมันเคลื่อนที่เร็วมาก ทุกสิ่งที่ฉันบอกคุณอาจจะไม่ถูกต้องในหนึ่งหรือสองเดือน นั่นคือสิ่งที่เจ๋งเช่นกัน เพราะมันเปลี่ยนแปลงไปมาก

แต่สิ่งที่ใหญ่ที่สุดไม่ใช่ฮาร์ดแวร์ใน AI แต่เป็นซอฟต์แวร์ เพราะใครๆ ก็ใช้มัน แบบว่า ฉันใช้โครงข่ายประสาทเทียมนี้ โดยพื้นฐานแล้ว มันมีตัวคูณพวกนี้อยู่ตรงนี้ คุณได้ปรับโครงข่ายประสาทเทียมนั้นให้เหมาะสมแล้วหรือยัง? และคุณได้เพิ่มประสิทธิภาพอันหนึ่งสำหรับเกณฑ์มาตรฐาน หรือคุณปรับอันหนึ่งเพื่อให้บางคนพูดว่าคุณ รู้ว่าฉันได้สร้างเกณฑ์มาตรฐานที่ใช้วัดความละเอียดสูงมาก ซึ่งเป็นเกณฑ์มาตรฐานสำหรับความละเอียดสูงพิเศษ AI. พวกเขาใช้เครือข่ายนี้ และอาจทำแบบจุดลอยตัวก็ได้ แต่พันธมิตรทุกรายที่เรามีส่วนร่วมด้วย เราสามารถทำมันได้ 16 บิตและ/หรือ 8 บิต และใช้เครือข่ายอื่น นั่นหมายความว่าเราไม่เก่งในเรื่องความละเอียดสูงสุด เพราะงานนี้มันไม่เข้ากันใช่ไหม? ประเด็นเดียวของฉันคือการวัดประสิทธิภาพ AI นั้นซับซ้อนมาก คุณคิดว่า CPU และ GPU มีความซับซ้อนหรือไม่? AI มันบ้าไปแล้ว”

มาริโอ เซอร์ราเฟโร: "ใช่แล้ว มีเครือข่ายหลายประเภทเกินไป มีการกำหนดพารามิเตอร์มากเกินไป การกำหนดพารามิเตอร์ที่แตกต่างกันทำให้เกิดผลกระทบที่แตกต่างกัน วิธีการคำนวณ"

ทราวิส ลาเนียร์: "มันจะทำให้ผู้ตรวจสอบยุ่ง"

มาริโอ เซอร์ราเฟโร: “แต่เช่นถ้าคุณต้องการวัดผลโดยรวม มันก็จะยากกว่ามาก แต่ใช่ ไม่มีใครทำแบบนั้น"

มิชาล ราห์มาน: "นั่นเป็นเหตุผลว่าทำไมพวกคุณถึงให้ความสำคัญกับกรณีการใช้งานมากขึ้น"

ทราวิส ลาเนียร์: "ฉันคิดว่าท้ายที่สุดแล้ว เมื่อคุณแสดงกรณีการใช้งานแล้ว AI ของคุณก็จะดีแค่ไหนในตอนนี้ มันขึ้นอยู่กับซอฟต์แวร์ ฉันคิดว่ามันจะเติบโตเพิ่มขึ้นอีกเล็กน้อยในอีกไม่กี่ปีข้างหน้า แต่ตอนนี้มีงานซอฟต์แวร์อีกมากที่ต้องทำ แล้วเกิดการเปลี่ยนแปลงแบบว่า โอเค เครือข่ายนี้มาแรงแล้ว เช่น ปีหน้า "โอ้ ไม่ เราพบเครือข่ายใหม่ที่มีประสิทธิภาพมากขึ้นในสิ่งเหล่านี้" ดังนั้นคุณจึงต้องทำซ้ำ ซอฟต์แวร์. มันค่อนข้างจะบ้าไปแล้ว”

มาริโอ เซอร์ราเฟโร: “เมื่อพูดถึง NN คุณช่วยเปลี่ยนความคิดให้ฉัน และลดความอึดอัดน้อยลงในการคิดแทนฉัน” ก้าวไปสู่รูปหกเหลี่ยม นี่เป็นหนึ่งในองค์ประกอบที่ผู้บริโภค แม้กระทั่งผู้ที่ชื่นชอบส่วนใหญ่เข้าใจน้อยที่สุด ก็คือเพื่อนร่วมงานของฉันนั่นเอง คุณรู้ไหม โดยเฉพาะอย่างยิ่งเมื่อพิจารณาว่ามันไม่ได้ถูกนำมาใช้เป็นบล็อก AI และเหมือนกับแนวคิดการประมวลผลสัญญาณดิจิทัลทั้งหมด เมื่อคุณแนะนำบางสิ่งบางอย่าง แนวคิดดั้งเดิมนั้นติดอยู่ ดังนั้นหากคุณกำลังทำอะไรบางอย่าง โอเค มันเป็นสิ่งที่เกี่ยวกับระบบประสาท ที่มีความฉลาดทางระบบประสาท ประสาท และสมองประสาท มันติดอยู่กับ ประชากร. พวกเขามีป้ายประสาทการเรียนรู้ของเครื่อง AI, ประสาท, ประสาทสำหรับโซลูชันอื่นๆ ดังนั้นเราจึงอยากให้โอกาสคุณอธิบายวิวัฒนาการของ Hexagon DSP ว่าทำไมคุณถึงไม่เปลี่ยนใจจากเรื่องนั้น ชื่อที่ฟังดูดีทางวิศวกรรม เช่น Hexagon DSP, ส่วนขยายเวกเตอร์ และอื่นๆ ที่ไม่เหมือนกับการตลาด เป็นกันเอง. แต่ใช่ เช่นเดียวกับการสรุปคร่าวๆ ว่าคุณเป็นอย่างไรในแถวหน้าของ DSP เพื่อดูว่ามันเปลี่ยนจากจุดเริ่มต้นภาระงานด้านภาพไปสู่ตัวเร่งความเร็วเทนเซอร์ตัวใหม่ล่าสุด"

ทราวิส ลาเนียร์: "จริง ๆ แล้วมันเป็นจุดที่น่าสนใจเพราะคู่แข่งของเราบางคนมีบางอย่างที่เรียกว่า neural engine หรือ neural accelerator จริงๆ แล้วมันคือ DSP ซึ่งเป็นสิ่งเดียวกัน ฉันเดาว่าชื่อนั้นสำคัญ แต่คุณได้สัมผัสถึงจุดสำคัญแล้ว และพูดตามตรงเมื่อเราใส่สิ่งนี้ลงไป มันเป็นสำหรับการสร้างภาพ เราเพิ่งจะรองรับ 8 บิต และฉันจำได้ว่าเรากำลังนำเสนอที่ Hot Chips และ Pete Warden จาก Google ก็ติดตามเราและแบบว่า "เฮ้ คุณ..พวกคุณสนับสนุน 8 บิตใช่ไหม?" ใช่เราทำ จากนั้นเราก็ออกไปทันทีและแบบว่า เฮ้ เรามีโปรเจ็กต์ [เหล่านี้] ทั้งหมดที่กำลังดำเนินอยู่ นั่นคือตอนที่เราไปและย้าย TensorFlow ไปที่Hexagon เพราะว่ามันเหมือนกับว่า เรามีตัวประมวลผลเวกเตอร์ที่รองรับ 8 บิตเพื่อทำแบบนั้น และมันก็อยู่ใน Hexagon DSP ของเรา ถ้าฉันต้องทำซ้ำอีกครั้ง ฉันคงเรียกมันว่าโปรเซสเซอร์สัญญาณประสาทหกเหลี่ยม และเรายังมี DSP อีกตัว เรามี DSP แบบสเกลาร์และนั่นคือ DSP ในความหมายที่แท้จริงที่สุด แล้วเราเรียกเวกเตอร์ DSP ชนิดนี้ บางทีเราควรเปลี่ยนชื่อมัน บางทีเราควรเรียกมันว่าตัวประมวลผลสัญญาณประสาท เพราะว่าเราอาจไม่ได้ให้เครดิตตัวเองมากเท่ากับเรา ควรทำสิ่งนี้ เพราะอย่างที่ฉันบอกไป บางคนมี vector DSP และเรียกมันว่าอะไรก็ตาม และพวกเขาไม่ได้เปิดเผยอะไรเลย มันคือ. ฉันตอบคำถามของคุณแล้วเหรอ?”

ภาพรวมหกเหลี่ยม 690 ที่มา: ควอลคอมม์

มาริโอ เซอร์ราเฟโร: “ใช่แล้ว น่าจะเป็นส่วนใหญ่”

ทราวิส ลาเนียร์: "คำถามที่สองคืออะไร?"

มาริโอ เซอร์ราเฟโร: “วิธีที่คุณเห็นการพัฒนาแบบนั้นภายใน เป็นยังไงบ้าง ประสบการณ์ ความยากลำบาก ความท้าทาย อะไรก็ตามที่คุณอยากบอกเรา [คุณ] เห็นวิวัฒนาการตั้งแต่เริ่มต้นการประมวลผลภาพไปจนถึงตัวเร่งเทนเซอร์ได้อย่างไร"

ทราวิส ลาเนียร์: "มันน่าหงุดหงิดนิดหน่อยเพราะมันเหมือนกับสิ่งที่ทำให้ฉันสะดุ้งเหมือนกับว่าสื่อมวลชนบางคนยกมือขึ้นแล้วพูดว่า "Qualcomm สิ่งที่คุณอยู่เบื้องหลัง! ทำไมคุณถึงไม่ทำ เมื่อไรคุณจะกลายเป็นเหมือนตัวประมวลผลสัญญาณประสาทโดยเฉพาะ” และฉันแค่อยากจะทุบหัวตัวเอง ฉันรู้สึกเหมือนเราเป็นคนแรกที่มีตัวประมวลผลเวกเตอร์! แต่ถึงอย่างนั้น เราได้แก้ไขสิ่งนี้แล้ว และอาจมีสิ่งต่างๆ มากขึ้นต่อไปเมื่อเราเรียนรู้เพิ่มเติมเกี่ยวกับ AI ดังนั้นเราจึงเพิ่มสิ่งอื่นนี้และใช่อันนี้—มันทำเฉพาะ AI เท่านั้น มันไม่ได้ทำการประมวลผลภาพซึ่งเป็นส่วนหนึ่งของคอมเพล็กซ์รูปหกเหลี่ยม ดังนั้นคุณจึงเสนอ... ในขณะที่เรายังคงเรียกมันว่า Hexagon DSP เรากำลังเรียกคอมเพล็กซ์ทั้งหมดว่าโปรเซสเซอร์หกเหลี่ยม [เพื่อ] พยายามรับชื่อที่บันทึกไว้สำหรับสิ่งหกเหลี่ยมทั้งหมด ตอนนี้. เราได้เพิ่มสิ่งที่จริงๆ แล้ว [คือ] คำนวณโดยตรงมากกว่า ฉันไม่ควรพูดว่าคำนวณโดยตรงแบบนั้น มีการจัดการอัตโนมัติเกี่ยวกับวิธีที่คุณทำแผนที่ลำดับที่สูงกว่าของตำแหน่งที่คุณกำลังคูณ เมทริกซ์"

มาริโอ เซอร์ราเฟโร: “จริงๆ แล้วเทนเซอร์ค่อนข้างยากสำหรับฉันที่จะพันหัว มันก็เหมือนกับว่าพวกเขาพันรอบตัวเองเหมือนกัน”

ทราวิส ลาเนียร์: "ใช่ ฉันคิดว่าฉันเรียนวิชาพีชคณิตเชิงเส้นในวิทยาลัย ฉันทำแบบนั้นเหมือนเพื่อน “ฉันหวังว่าจะไม่ต้องทำแบบนั้นอีก!” และพวกเขาก็กลับมาแก้แค้น ฉันเดาว่าฉันแบบ 'โอ้เพื่อน สมการเชิงอนุพันธ์และพีชคณิตเชิงเส้นกลับมาพร้อมการแก้แค้นแล้ว!'"

มาริโอ เซอร์ราเฟโร: "ฉันรู้สึกว่าเพื่อนร่วมงานหลายคนไม่เข้าใจเรื่องนี้ พวกเขายังคงคิดว่า NPU มีแง่มุมที่น่าสงสัย เมื่อมันเป็นเพียงการคูณเมทริกซ์ ผลคูณดอท ฟังก์ชันไม่เชิงเส้น การโน้มน้าวใจ [และ] อื่นๆ และฉันไม่คิดว่าโดยส่วนตัวแล้ว ชื่อเครื่องมือประมวลผลประสาทแบบนั้นจะช่วยได้ แต่นั่นคือสิ่งที่ใช่ไหม มีมากน้อยเพียงใดที่ไม่ได้รับการขยาย ทำให้สับสน คณิตศาสตร์พื้นฐานที่ถูกขุดโดยแบบแผนการตั้งชื่อ และสิ่งที่สามารถทำได้? ฉันไม่รู้ว่าคุณคิดเรื่องนี้หรือเปล่า [อะไร] สามารถทำได้เพื่อแจ้งให้ผู้คนทราบเกี่ยวกับวิธีการทำงานนี้ มันไม่เหมือนกับทำไม ตัวอย่างเช่น ทำไม DSP ถึงสามารถทำสิ่งที่กลไกประมวลผลประสาทใหม่อื่นๆ สามารถทำได้ ฉันหมายถึง มันเป็นแค่คณิตศาสตร์ แต่ดูเหมือนว่าผู้ใช้ ผู้อ่าน และนักข่าวบางคนจะไม่เข้าใจ ฉันไม่ได้บอกว่ามันเป็นความรับผิดชอบของ Qualcomm แต่คุณคิดว่าจะทำอะไรที่แตกต่างออกไปได้บ้าง มันอาจเป็นความรับผิดชอบของฉัน”

ทราวิส ลาเนียร์: "บอกตรงๆ ว่าฉันเริ่มยอมแพ้แล้ว บางทีเราแค่ต้องตั้งชื่อสิ่งต่าง ๆ ว่า "ประสาท" เราเพิ่งคุยกันว่าพีชคณิตเชิงเส้นและสมการเชิงอนุพันธ์ทำให้หัวเราหมุนได้อย่างไรเมื่อเราเริ่มดูสิ่งเหล่านี้ สิ่งต่างๆ และเมื่อคุณเริ่มพยายามอธิบายให้คนอื่นฟัง เช่น เมื่อคุณเริ่มวิเคราะห์การถดถอย คุณจะดูที่สมการและสิ่งต่างๆ หัวของคน ระเบิด. คุณสามารถสอนการเขียนโปรแกรมพื้นฐานให้กับคนส่วนใหญ่ได้ แต่เมื่อคุณเริ่มสอนพวกเขาว่าสมการการถ่ายทอดกลับทำงานอย่างไร พวกเขาจะมองสิ่งนั้นแล้วหัวจะระเบิด ใช่แล้ว สิ่งที่สนุก พวกเขาไม่ต้องการเห็นอนุพันธ์บางส่วน…”

มาริโอ เซอร์ราเฟโร: "สายโซ่ของอนุพันธ์ย่อย ไม่ใช่ข้ามสเกลาร์ แต่ข้ามเวกเตอร์ และรวมถึงฟังก์ชันไม่เชิงเส้น"

ทราวิส ลาเนียร์: "ขอให้โชคดีนะ! ใช่ มันยากและฉันไม่รู้ว่าคนส่วนใหญ่อยากรู้เรื่องนี้ แต่ฉันลอง: ฉันใส่สิ่งเล็กๆ น้อยๆ เช่น "เฮ้ สิ่งที่เราทำที่นี่คือคณิตศาสตร์เวกเตอร์ เรามีตัวประมวลผลเวกเตอร์” และฉันคิดว่าผู้คนมองดูสิ่งนั้นแล้วประมาณว่า "เอาล่ะ แต่เพื่อน ฉันอยากได้ระบบประสาทจริงๆ คันเร่ง” “Tensor” ยังคงเป็นคณิตศาสตร์ แต่ฉันคิดว่าผู้คนอาจเชื่อมโยงกับ AI มากกว่าเล็กน้อย กำลังประมวลผล."

มาริโอ เซอร์ราเฟโร: "อาจเหมือนกับการเชื่อมช่องว่าง ช่องว่างความหมาย"

ทราวิส ลาเนียร์: "สุดท้ายผมคิดว่ามันลงมาแล้ว เราอาจจะต้องคิดชื่ออื่นขึ้นมา"


กราฟิกทั้งหมดในบทความนี้มาจากการนำเสนอของ Travis Lanier ที่ Snapdragon Tech Summit คุณสามารถดูสไลด์การนำเสนอได้ ที่นี่.