Шта је ЦПУ кеш меморија?

click fraud protection

Модерни процесори раде невероватно брзо; могу значајно надмашити системску РАМ меморију. Ова неравнотежа у брзини између ЦПУ-а и меморије довела би до тога да ваш процесор често мирује, чекајући да му се пошаљу подаци како би могао да настави са покретањем процеса. Да би се то спречило, омогућавајући процесорима да наставе да раде брже и брже, користи се кеш процесора.

Како ЦПУ кеш убрзава ЦПУ?

Кеш меморија ЦПУ-а је дизајнирана да буде што је бржа и да затим кешира податке које ЦПУ захтева. Брзина ЦПУ кеш меморије је оптимизована на три начина: кашњење, пропусни опсег и близина. Кеш меморија ЦПУ-а ради са веома малим кашњењем, минимизирајући време потребно да се резултат врати. На пример, Интел и9-9900к има кашњење кеш меморије од 0,8, 2,4 и 11,1 наносекунде за Л1, Л2 и Л3 кеш респективно. Поређења ради, латенција модерне РАМ меморије велике брзине је реда величине 14 наносекунди.

Савет: Нивои кеша ће бити детаљније објашњени касније, али једноставно речено, нижи слојеви кеша су бржи, али су скупљи па имају мањи капацитет. Наносекунда је милијардити део секунде, тако да кашњење од 0,8 секунди значи да је потребно мање од милијардног дела секунде да се добије резултат.

Што се тиче пропусног опсега, кеш процесора нуди значајна побољшања перформанси у односу на традиционално складиште и РАМ. Брзине читања Л1 и Л3 кеш меморије могу достићи 2,3 ТБ/с односно 370 ГБ/с, док је пропусни опсег РАМ-а типично око 40 ГБ/с. Овај повећани пропусни опсег значи да кеш процесора може пренети податке у ЦПУ много брже него РАМ.

Да би се постигле максималне могуће брзине, кеш процесора је заправо уграђен у силицијум саме ЦПУ матрице. Ово минимизира раздаљину коју сви електрични сигнали треба да пређу, а тиме и задржавање латенције што је могуће ниже. На пример, када је Л3 кеш меморија први пут премештена са матичне плоче на ЦПУ матрицу, тадашњи процесор (Пентиум 4 ЕЕ) је могао да постигне побољшање перформанси од 10-20%.

Архитектура ЦПУ кеша

Модерни ЦПУ генерално користе три слоја ЦПУ кеш меморије са ознаком Л1-3, при чему су кешови са нижим бројем ближе језгри ЦПУ-а, бржи и скупљи. Свако појединачно језгро ЦПУ-а у вишејезгарном ЦПУ-у има сопствену Л1 кеш меморију. Обично је подељен на два дела, Л1И и Л1Д. Л1И се користи за кеширање инструкција за ЦПУ док се Л1Д користи за кеширање података на којима те инструкције треба да се изврше.

Свако језгро ЦПУ-а обично такође има сопствену Л2 кеш меморију на модерном ЦПУ-у. Л2 кеш је већи и спорији од Л1 кеш меморије и користи се првенствено за складиштење података који иначе не би стали у Л2 кеш меморију. Имајући наменску Л2 кеш меморију по језгру, избегава се сукоб кеша. Борба за кеширање је место где се различита језгра боре да затраже кеш простор за сопствена радна оптерећења, што може довести до брисања важних података из кеша.

Л3 кеш меморија се обично дели између свих ЦПУ језгара процесора. Опет, Л3 кеш је спорији од Л2 кеш меморије, али је јефтинији и већи. Обезбеђивањем дељеног кеша могуће је смањити количину података који би се дуплирали на нижим нивоима кеша по језгру.

Савет: На пример, у величинама кеша, Интелов и9-9900К има 64КБ Л1 и 256КБ Л2 кеш меморију по језгру (за укупно 512КБ Л1 и 2МБ Л2), такође има 16МБ дељене Л3 кеш меморије.

Како се користи кеш процесора?

Сви нивои кеш меморије ЦПУ-а се користе за убрзавање перформанси процесора кеширањем података из РАМ-а. Када ЦПУ захтева податке, он обично прво претражује своје слојеве кеша у покушају да добије податке што је брже могуће. Ако се подаци пронађу у кешу, онда ЦПУ може да настави са обрадом. Ако подаци нису у кешу, у ономе што се зове промашај кеша, онда ЦПУ мора да провери РАМ, а затим и чврсти диск ако ни података нема. Бржи слојеви се увек прво проверавају за максималне перформансе.

Да би помогао ЦПУ-у да има податке који су му потребни у кешу када му затребају, кеш покушава да унапред испразни који би подаци ЦПУ-у могли бити следећи. На пример, ако је ЦПУ захтевао неке податке за слику коју приказује, кеш може покушати да унапред кешира више података о слици како би се могли убацити у ЦПУ што је брже могуће.