Arm-ის ახალი Cortex X4, A720 და A520 არის მხოლოდ 64-ბიტიანი ბირთვები, რომლებიც დიდი ყურადღებას ამახვილებენ ეფექტურობაზე.

click fraud protection

Arm-ის ახალი ბირთვები, როგორც 2023 წლის Total Compute Solution-ის ნაწილი, გამოცხადდა და ისინი საკმაოდ საინტერესოა.

სწრაფი ბმულები

  • მხოლოდ 64 ბიტიანი: "მისია შესრულებულია"
  • Arm Cortex-X4: კიდევ უფრო მეტი შესრულება და უკეთესი ეფექტურობა
  • Arm Cortex-A720: მუშაობის და ენერგიის მოხმარების დაბალანსება
  • Arm Cortex A520: ეფექტურობის გაორმაგება
  • DSU-120: გამოთვლითი სიკეთის 14 ბირთვამდე
  • ეფექტურობა ახალი მიზანია

Arm არის კომპანია, რომელიც შეიმუშავებს თითქმის ყველა CPU ბირთვს, რომელიც საბოლოოდ გამოიყენება თქვენს Android სმარტფონში და ყოველწლიურად აცხადებს ახალ გამეორებებს, რომლებიც მოგვიანებით იპოვიან გზას ჩიპსეტებში, როგორიცაა იმ წლის ფლაგმანი Snapdragon ან შემდეგი ფლაგმანი MediaTek განზომილება. წელს ის გამოუშვებს ფლაგმანურ Cortex-X4 ბირთვს, Cortex-A720 შესრულების ბირთვს და Cortex-A520 ეფექტურობის ბირთვს. ეს ბირთვები ქმნიან კომპანიის ახალი Arm v9.2 თავსებადი დიზაინის და კომპანიის Total Compute Solution-ს 2023 წლისთვის, ან TCS23-ის საფუძველს. გარდა ამისა, ჩვენ ასევე ვხედავთ ახალ DynamIQ საზიარო ერთეულს და განახლებულ Immortalis-G720 GPU-ს. კიდევ უფრო დიდია სრული გადასვლა 64-ბიტიან გამოთვლებზე, ამ ბირთვებიდან არცერთს არ აქვს 32-ბიტიანი მხარდაჭერა.

სამივე ახალი ბირთვი გასული წლის მიკროარქიტექტურული მემკვიდრეა და პირველ რიგში ორიენტირებულია IPC და ეფექტურობის გაზრდაზე.

მხოლოდ 64 ბიტიანი: "მისია შესრულებულია"

ერთ-ერთი ყველაზე დიდი ცვლილება წლევანდელ Total Compute Solution-ში Arm-დან არის გადასვლა მხოლოდ 64-ბიტიანზე. მიუხედავად იმისა, რომ გასული წლის A510R1 მხარს უჭერდა 32-ბიტიან AArch32 შესრულების რეჟიმს, ისევე როგორც A710-მა, რომელიც გასულ წელს TCS22-ით გამოვიდა, წელს Arm-ის ბირთვები მხოლოდ AArch64-ია. ანდროიდზე 32-ბიტიანი აპლიკაციებისთვის საათი იკეცება, განსაკუთრებით მას შემდეგ თავად Google-მა დაავალა, რომ ყველა აპლიკაცია განახლდეს 2019 წლიდან ატვირთულია 64-ბიტიანი ბინარების სახით.

როგორც არმი ამბობს, 64-ბიტიანი გადასვლა ითვლება „მისია შესრულებულად“. ამის მიზეზი ის არის, რომ ჩინური აპლიკაციების ბაზარი არის რა შეაჩერა დანარჩენი ინდუსტრია გარდამავალ პერიოდში, მაგრამ ჩინურ აპლიკაციების მაღაზიებში არსებული აპლიკაციების დიდი უმრავლესობა ახლა 64-ბიტიანია, ძალიან.

დაგვიანების მიზეზი იყო ჰომოგენიზებული აპლიკაციის ეკოსისტემის არარსებობა, რაც იმას ნიშნავს, რომ სხვადასხვა აპლიკაციის მაღაზია დეველოპერების განსხვავებულ სტანდარტებს მოითხოვდა. იმის გამო, რომ Arm მუშაობდა სხვადასხვა აპლიკაციების მაღაზიებთან ჩინეთში, თუმცა, განმეორებით გაფრთხილებებთან ერთად, რომ ცვლილება მოხდებოდა, ეს აპლიკაციების მაღაზიები ხელს უწყობდნენ დეველოპერებსაც გადაერთონ.

როგორც ჩანს, დადგა დრო, რომ ეს გადასვლა მთლიანად განხორციელდეს და კიდევ რამდენიმე თვე იქნება, სანამ არ დავინახავთ ამ Arm ბირთვებს ახალ ჩიპსეტებში.

Arm Cortex-X4: კიდევ უფრო მეტი შესრულება და უკეთესი ეფექტურობა

Arm's X სერიების ბირთვები განსხვავდებოდა მისი A სერიისგან რამდენიმე წლის წინ, ფილოსოფიაში იყო ის, რომ ეს არის ძლიერი ბირთვი, რომელსაც შეუძლია ცოტა მეტი სიმძლავრე გამოიყენოს, როდესაც მას ეს სჭირდება. როგორც წესი, ჩიპსეტების შემქმნელები მაქსიმუმ მხოლოდ ერთ ან ორს შეიცავენ, რადგან ისინი ძალიან შიმშილნი არიან, მიუხედავად მათი შესაძლებლობებისა.

როგორც ზემოთ მოყვანილი გრაფიკიდან ხედავთ, Cortex-X4 არის ყველაზე ძლიერი Arm ბირთვი, მაგრამ ეს გამოთვლითი შესაძლებლობები ენერგომოხმარების ხარჯზე მოდის. Cortex-X4 გასული წლის X3-ის მსგავსია და როგორც Arm ამბობს, შეიძლება იმ სიხშირითაც კი იმუშაოს, როგორც შარშანდელი ბირთვი და გამოიყენოს 40%-მდე ნაკლებ ენერგიაზე. ის არის 10%-ზე ნაკლები ფიზიკური ზომით და ყველაზე ეფექტური Cortex-X ბირთვი, რომელიც ოდესმე აშენდა.

რაც შეეხება იმას, თუ საიდან მოდის ეს IPC გაუმჯობესებები, X4-ს აქვს მრავალი წინა და უკანა ნაწილის გაუმჯობესება. წინა ნაწილის ამ გაუმჯობესებებში დიდი სამუშაო იყო ჩადებული ხელახლა ჩაწერისთვის და ფილიალების პროგნოზების გაუმჯობესებაში, რადგან არასწორი ფილიალების პროგნოზები ძვირია, შესრულების თვალსაზრისით. Arm ასევე გვპირდება, რომ L2 ქეშის ზომა 2 MB იძლევა უფრო მაღალ შესრულებას, არა იმდენად ეტალონებში, არამედ რეალურ სამყაროში გამოყენებაში.

ახალი Cortex-X4 ბირთვი ზრდის არითმეტიკული ლოგიკური ერთეულების (ALUs) რაოდენობას 6-დან 8-მდე, ამატებს დამატებით ფილიალს. ერთეული (სულ 3-ისთვის), ამატებს დამატებით გამრავლების აკუმულატორის ერთეულს და მილსადენებს მცურავი წერტილი და კვადრატული ფესვი ოპერაციები.

რაც შეეხება უკანა მხარეს, ასევე არის მრავალი გაუმჯობესება. Load-store მისამართის გენერაცია გადავიდა სამი ინსტრუქციიდან ოთხზე თითო ციკლზე, რადგან load-store მილი იქნა აღებული და დაყოფილი. ასევე არის გაორმაგებული თარგმანის გვერდითი ბუფერი L1-ში, ბანკის კონფლიქტის გაუმჯობესებასთან ერთად.

ეს ყველაფერი აერთიანებს Arm's Cortex-X4-ის მუშაობის შთამბეჭდავ ამაღლებას. მთლიანობაში, შეგიძლიათ ველით საშუალოდ 15%-იანი მუშაობის გაუმჯობესებას Cortex-X4-ით. სიმძლავრისა და შესრულების მრუდში, რომელსაც Arm-ი იზიარებს, X4 უსწრებს X3-ს, როგორც წარმადობით, ასევე ენერგიის მოხმარებით. სხვა სიტყვებით რომ ვთქვათ, ეს 15% შესრულების გაუმჯობესება მოდის საკმაოდ მნიშვნელოვანი ენერგიის მოხმარებაზე. აღსანიშნავია ისიც, რომ ეს არ არის ვაშლის ვაშლის შედარება; Cortex-X3-ს შარშან მოჰყვა 1MB L2 ქეში, რაც ნიშნავს, რომ თუ მწარმოებელმა დაიცავს იმავე L2 ქეშის ზომას წელს, შეიძლება სულაც არ იყოს 15%-იანი ეფექტურობის ამაღლება.

თუმცა ერთი რამ უდავოა და ის არის, რომ თუ X4-ს მართავთ მაქსიმალური სიჩქარით, ის, სავარაუდოდ, მთავარი ძალა იქნება. ჩვენ შეიძლება დავინახოთ, რომ ზოგიერთი OEM ამ წელს განაგრძობს იმას, რაც გააკეთეს შარშან და გააქროს მრავალი წლევანდელი ჩიპსეტი ყუთიდან. მაგალითად, OnePlus და Oppo ორივე აკეთებს ამას და ენერგოეფექტურობის მიღებით იზრდება ერთდროულად მუშაობისას. როგორც X3-ის ეფექტურობა, სავარაუდოა, რომ ამ კომპანიებს ექნებათ სარგებელი, რომ გააგრძელონ ეს ისე. ჩვენ შეიძლება ვერ დავინახოთ მუშაობის 15%-იანი ამაღლება მთელს დაფაზე, მაგრამ ჩვენ შეგვიძლია დავინახოთ შემდგომი ეფექტურობის გაუმჯობესება მომავალი წლის ჩიპსეტებისთვის.

Arm Cortex-A720: მუშაობის და ენერგიის მოხმარების დაბალანსება

მიუხედავად იმისა, რომ Arm's X სერიის ბირთვები ჩვეულებრივ ნებადართულია ცოტა ველური მუშაობისთვის, ბირთვების სერია, როგორც წესი, მიზნად ისახავს დააბალანსოს ენერგიის მოხმარება შესრულებასთან. Cortex-A720-ით Arm გვპირდება 20%-ით უფრო ეფექტურ ბირთვს, გაზრდილი ეფექტურობით იგივე სიმძლავრით, როგორც A715 გასულ წელს.

რაც შეეხება იმას, თუ საიდან მოდის წლევანდელი A720 გაუმჯობესებები, მათი უმეტესობა წინა მხარესაა. მილსადენები შემცირდა ერთი ციკლით ამოღებული განშტოების არასწორი პროგნოზირების ძრავიდან, სადაც ნათქვამია, რომ ეს ერთჯერადი ციკლის ვარდნა იწვევს კრიტერიუმების 1%-იან ზრდას. კრიტერიუმები, როგორც წესი, იწვევს ფილიალების ყველაზე ნაკლებ არასწორ პროგნოზირებას, რაც იმას ნიშნავს, რომ ეს სავარაუდოდ გააუმჯობესებს რეალურ სამყაროში მთლიან შესრულებას უფრო მნიშვნელოვანი (მაგრამ დიდწილად განუზომელი) რაოდენობით.

მწყობრიდან გამოსულ ბირთვში, ჩვენ ვხედავთ უამრავ სტრუქტურულ გაუმჯობესებას, რაც ხელს უწყობს მუშაობის გაუმჯობესებას ბირთვის მიერ დაკავებულ ფართობზე ან მის ეფექტურობაზე ზემოქმედების გარეშე. დამწყებთათვის, ისევე როგორც X4-ში, მცურავი წერტილი იყოფა და კვადრატული ფესვის ოპერაციები ახლა მილსადენით ხორციელდება. ასევე არის უფრო სწრაფი გადარიცხვები მცურავი წერტილიდან, NEON და SVE2 რიცხვებიდან მთელ რიცხვებამდე და სხვა საერთო გაუმჯობესება დამუშავების დასაჩქარებლად.

Arm-მა გააზიარა ზემოხსენებული გრაფიკი იმის საილუსტრაციოდ, თუ როგორ ადარებს A720 შარშანდელ A715-ს შესრულებასა და ეფექტურობაში, სადაც ISO პროცესი და ISO სიხშირე გამოიყენება SPECint_base2006-ში. ქეშის ზომებიც იგივე რჩება, ასე რომ, ეს არის ვაშლის ვაშლის შედარება.

ელექტროენერგიის მოხმარების თვალსაზრისით, A720 ბევრად შეესაბამება შარშანდელ მოდელს, თუმცა მას აქვს ოდნავ მეტი შესრულება იმავე სიმძლავრის დონეზე. A720-ით, ისევე როგორც X4-თან ერთად, Arm უფრო მეტ ყურადღებას ამახვილებს იმაზე, თუ როგორ ხდება უკეთესი. წარმადობა გასული წლის დენის შეზღუდვებისგან განსხვავებით, ვიდრე ამ ბირთვების სიმძლავრის მუდმივი გაზრდა უნარი შესწევს.

Arm Cortex A520: ეფექტურობის გაორმაგება

რა თქმა უნდა, როდესაც საქმე ეხება Arm-ის ბირთვებს, ეს ყველაფერი არ არის შესრულებაზე. X სერიით ყველაფერს აკეთებს ნედლეული გამოთვლითი სიმძლავრით და A7xx აწონასწორებს გამოთვლით საჭიროებებს და ენერგიის მოხმარებას, A5xx სერია ფოკუსირებულია მხოლოდ ეფექტურ დამუშავებაზე. ეს არის ყველაზე დაბალი სიმძლავრე თითო ფართობზე Arm v9.2 ბირთვი და ეფუძნება იმავე შერწყმული ბირთვის არქიტექტურას, რომელიც ჩვენ ვნახეთ A510-თან ერთად.

რას ნიშნავს ეს შერწყმული ძირითადი არქიტექტურა არის ის, რომ ზოგიერთი რესურსი შეიძლება გაიზიაროს ორ ბირთვს შორის, სადაც ორი ბირთვი შეიძლება იყოს დაჯგუფებულია "კომპლექსად". L2 ქეში, L2 თარგმანის გვერდითი ბუფერი და ვექტორული მონაცემთა ბილიკები გაზიარებულია ამაში კომპლექსი. გასაგებად რომ ვთქვათ, ეს არ ნიშნავს აქვს უნდა დაიყოს ორ ბირთვად და ერთბირთვიანი კომპლექსი შეიძლება შეიკრიბოს მაქსიმალური შესრულებისთვის. სინამდვილეში, Arm-ის TCS2023 ბირთვის ერთ-ერთი განლაგება, რომელიც მათ გვაჩვენეს, მოიცავდა ერთ X4 ბირთვს, ხუთ A720 ბირთვს და სამ A520 ბირთვს, რაც იმას ნიშნავს, რომ მინიმუმ ერთი A520 ბირთვი იზოლირებულია.

A520 არის ეფექტურობის პირველი დიზაინი და, ისევე როგორც სხვა ბირთვები, Arm-ი ძირითადად ამ ეფექტურობის გაუმჯობესებაზეა ორიენტირებული იმავე სიმძლავრის წერტილებში, როგორც წინა თაობა. ეს მოიცავს ფილიალების პროგნოზების გაუმჯობესებას და ასევე შესრულების ზოგიერთი მახასიათებლის მოხსნას ან შემცირებას. შედეგად, ეს შესრულება აღდგენილია უფრო დიდი ეფექტურობით. ასევე საინტერესოა, რომ Arm-მა ამოიღო მესამე ALU, რომელიც იყო A510-ში, დაზოგავს ძალას ლოგიკის გაცემაში და შედეგების გადაგზავნაში.

რეალურ შედეგებში, როგორც ჩანს, A520 არ არის ისეთი დიდი ნახტომი მისი წინამორბედებისგან, როგორც A720 და X4. მისი შესაძლებლობების დიდი ნაწილი დაბალი სიმძლავრის ინტერვალებით ემთხვევა A510-ს ზემოთ მოცემულ გრაფიკზე და მხოლოდ შესრულების ზედა ეშელონებში ვხედავთ ეფექტურობის ზრდას. შესრულებისა და სიმძლავრის განსხვავება ორ ბირთვს შორის დამაიმედებელია, მაგრამ გაურკვეველია, დავინახავთ თუ არა რეალურ სარგებელს რეალურ სამყაროში A520-ს A510-თან შედარებისას. ყოველივე ამის შემდეგ, ძნელია რეალურ სამყაროში შესრულებისა და ეფექტურობის განსხვავებების სწორად გაზომვა ამ ორს შორის.

DSU-120: გამოთვლითი სიკეთის 14 ბირთვამდე

DynamIQ Shared Unit, ან DSU, აერთიანებს ერთ ან მეტ ბირთვს L3 მეხსიერების სისტემასთან, კონტროლის ლოგიკასთან და გარე ინტერფეისებთან, რათა შექმნას მრავალბირთვიანი კლასტერი. ეს არსებითად Arm's ქსოვილია, რომელიც საშუალებას აძლევს ყველა ამ ბირთვს დაუკავშირდეს ერთმანეთთან და გაუზიაროს რესურსები, და როგორც ასე რომ, ეს თავსატეხის საკმაოდ მნიშვნელოვანი ნაწილია ნებისმიერი ჩიპსეტის მწარმოებლისთვის, რომელიც ცდილობს შექმნას ჩიპი Arm's-ის ძირითადი დიზაინით.

DSU-110-ზე დაფუძნებული Arm-მა გააუმჯობესა DSU-120-ში, რაც მოემსახურება მთელ ჩიპს, რომელზეც ის შედის. დამწყებთათვის, ახლა არის 14-მდე ბირთვი თითო კლასტერზე (12-დან) და მხარდაჭერა 32 მბ-მდე L3 ქეშისთვის. ის ასევე მნიშვნელოვნად აუმჯობესებს ეფექტურობას რიგ საკვანძო სფეროებში, მათ შორის ქეშის გამოტოვების შემთხვევაში, და ასევე ამცირებს დენის გაჟონვას.

გარკვეულწილად, Arm's DSU არის TCS23-ის ხერხემალი, რადგან ის ქმნის საფუძველს, თუ როგორ ურთიერთქმედებს თითოეული ეს ბირთვი ერთმანეთთან და აზიარებს მონაცემებს. აქ ნებისმიერი გაუმჯობესება სარგებელს მოუტანს მთელ კლასტერს, მაგრამ, როგორც ჩანს, ცვლილებების უმეტესობა დაკავშირებულია ენერგიის მოხმარებასთან და ეფექტურობასთან.

ეფექტურობა ახალი მიზანია

ინდუსტრია, როგორც ჩანს, გარკვეული პერიოდის განმავლობაში იცვლებოდა, მაგრამ მთავარი პირველი შთაბეჭდილება, რაც ამ ბირთვებიდან მაქვს, არის ის, რომ ეფექტურობა ახლა თამაშის სახელია. როცა გვითხრეს, რამდენად სწრაფია X4 ბირთვი და რამდენად არის ის კომპანიის ყველაზე სწრაფი ბირთვი ოდესმე, მათ ძალიან სწრაფად აღნიშნეს მისი გაშვების ეფექტურობის გაუმჯობესება გასული წლის პიკის შესრულებისას სამაგიეროდ.

მთლიანობაში, მუშაობის ყველა მომატება ემყარებოდა იმით, თუ რამდენად ეფექტური იყო ეს კომპონენტი და მეტ-ნაკლებად, DSU-ის ყველა ცვლილება ეფექტურობასა და დენის გაჟონვაში იყო. შესრულება მნიშვნელოვანია, მაგრამ ნამდვილად იგრძნობა, რომ ინდუსტრია, როგორც მთლიანობაში, ცდილობს მიმდინარეობას გამოთვლითი დონეები უფრო ეფექტურია, ვიდრე მასიურ შესრულებაზე გადასვლა, იზრდება წლიდან წლამდე.

ჩვენ ველით, რომ ეს ბირთვები ჩამოაყალიბებენ MediaTek Dimensity 9400-ის და Qualcomm Snapdragon 8 Gen 3-ის საფუძველს, მაგრამ რა ფორმირებაში რჩება გასარკვევი. როგორც უკვე აღვნიშნეთ, Arm-მა ისაუბრა 1+5+3 ბირთვის განლაგების გამოყენებაზე საკუთარ შიდა ტესტირებაში, მაგრამ ეს არ ნიშნავს იმას, რის გაკეთებასაც თავად ცდილობენ პარტნიორები, როგორიცაა MediaTek და Qualcomm.