Le processeur a-t-il toujours un cache l3. Effet de la capacité du cache sur les performances du Core i5 de 3e génération

Mémoire cache (Cache)- un tableau de RAM ultra-rapide, qui est un tampon entre le contrôleur de mémoire système et . Ce tampon stocke les blocs de données avec lesquels il travaille actuellement, réduisant ainsi considérablement le nombre d'appels du processeur pour ralentir la mémoire système. Cela augmente considérablement les performances globales du processeur.

Distinguer la mémoire cache des 1er, 2ème et 3ème niveaux (marquée L1, L2 et L3).

Cache de premier niveau (L1)- le plus rapide, mais plus petit en volume que les autres. Le cœur du processeur travaille directement avec lui. Le cache de niveau 1 a la latence la plus faible (temps d'accès).
Cache de deuxième niveau (L2)- la quantité de cette mémoire est bien supérieure à la mémoire cache du premier niveau.
Mémoire cache du troisième niveau (L3)– Mémoire cache plus grande et plus lente que L2.

Dans la version classique, il y avait 2 niveaux de mémoire cache - le 1er et le deuxième niveau. Le 3ème niveau est différent dans l'organisation du cache de 2ème niveau. Si les données n'ont pas été traitées ou si le processeur doit traiter des données urgentes, les données sont déplacées vers le cache de niveau 3 pour libérer le cache L2. Le cache L3 est cependant plus grand et plus lent que L2 (le bus entre L2 et L3 est plus étroit que le bus entre L1 et L2), mais sa vitesse est toujours beaucoup plus rapide que la mémoire système.

Toutes les données sont initialement transférées vers la mémoire cache du 2ème niveau, pour traitement par le processeur central, les données sont partiellement décodées et transférées plus loin vers le noyau.

Dans la mémoire cache de 2e niveau, une chaîne d'instructions est construite à partir des données, et dans la mémoire cache de 1er niveau, les instructions internes du processeur sont "en miroir", qui tiennent compte des caractéristiques du processeur, des registres, etc. Le nombre de commandes internes du CPU n'est pas trop important, donc la taille du cache de 1er niveau n'a pas beaucoup d'importance (dans les processeurs modernes, la mémoire cache L1 de 1er niveau peut être de 64 Ko, 128 Ko pour chacun des cœurs) . Contrairement au cache L1, le cache L2 est d'une grande importance pour le processeur, c'est pourquoi les processeurs dotés du plus grand cache L2 affichent des performances élevées.

Il existe des différences dans l'organisation de la structure de la mémoire cache pour les processeurs. Par exemple, les processeurs AMD sont clairement divisés entre les cœurs de mémoire cache et sont marqués en conséquence - 512x2 ( Athlon 5200 et ci-dessous) ou 1024x2 (pour Athlon 5200 et plus haut). Mais pour les processeurs Intel Core2Duo le cache n'est pas strictement divisé, ce qui signifie que la quantité requise de mémoire cache partagée peut être utilisée pour chacun des cœurs, ce qui convient bien aux systèmes qui ne prennent pas en charge le multicœur. Si vous utilisez tous les cœurs, la mémoire cache est divisée dynamiquement en chacun des cœurs, en fonction de la charge de chacun des cœurs.

Qu'est-ce que le cache du processeur

Effectue approximativement la même fonction que la RAM. Seul le cache est la mémoire intégrée au processeur. La mémoire cache est utilisée par le processeur pour stocker des informations. Il met en mémoire tampon les données les plus fréquemment utilisées, grâce à quoi le temps du prochain accès à celles-ci est considérablement réduit. Si la capacité de RAM sur les nouveaux ordinateurs est de 1 Go, leur cache est d'environ 2 à 8 Mo. Comme vous pouvez le constater, la différence de taille de mémoire est notable. Mais même ce volume est tout à fait suffisant pour assurer les performances normales de l'ensemble du système. Désormais, les processeurs à deux niveaux de mémoire cache sont courants : L1 (premier niveau) et L2 (deuxième). Le cache de premier niveau est beaucoup plus petit que le cache de second niveau, il est généralement d'environ 128 Ko. Il est utilisé pour stocker des instructions. Mais le deuxième niveau est utilisé pour stocker des données, il est donc plus grand. Le cache de second niveau est maintenant partagé par la plupart des processeurs. Mais pas pour tout le monde, par exemple, AMD Athlon 64 X 2 a son propre cache L2 pour chaque cœur. La campagne AMD promet de doter prochainement le processeur AMD Phenom de quatre cœurs et de trois niveaux de cache.

Cache logiciel

Le cache du processeur est souvent confondu avec le cache du logiciel. Ce sont des choses complètement différentes, même si elles remplissent une fonction similaire. Le cache du processeur est une puce intégrée au processeur qui l'aide à traiter rapidement les informations. Un cache logiciel est un dossier ou un fichier sur un disque dur où un programme stocke les informations dont il a besoin. Prenons un exemple : vous avez chargé mon site, l'en-tête du site (l'image tout en haut) et le reste des images ont été enregistrés dans le cache de votre navigateur. Si vous revenez ici, par exemple, demain, les images ne seront plus chargées depuis Internet, mais depuis le cache de votre ordinateur, ce qui vous fera économiser de l'argent. Si vous avez un navigateur Opera, le dossier contenant les images que vous avez téléchargées se trouve dans.

L'un des facteurs importants qui augmentent les performances du processeur est la présence de la mémoire cache, ou plutôt son volume, sa vitesse d'accès et sa répartition par niveaux.

Depuis longtemps, presque tous les processeurs sont équipés de ce type de mémoire, ce qui prouve une fois de plus l'utilité de sa présence. Dans cet article, nous parlerons de la structure, des niveaux et de l'objectif pratique de la mémoire cache, comme un élément très important caractéristiques du processeur.

Qu'est-ce que la mémoire cache et sa structure

La mémoire cache est une mémoire ultra-rapide utilisée par le processeur pour stocker temporairement les données les plus fréquemment utilisées. Voilà comment, brièvement, ce type de mémoire peut être décrit.

La mémoire cache est construite sur des bascules, qui, à leur tour, sont constituées de transistors. Un groupe de transistors prend beaucoup plus de place que les mêmes condensateurs qui composent RAM. Cela entraîne de nombreuses difficultés de production, ainsi que des restrictions de volumes. C'est pourquoi la mémoire cache est une mémoire très chère, tout en ayant des volumes négligeables. Mais à partir d'une telle structure, le principal avantage d'une telle mémoire découle de la vitesse. Les bascules n'ayant pas besoin de régénération, et le temps de retard de la grille sur laquelle elles sont montées étant faible, le temps de basculement de la bascule d'un état à un autre est très rapide. Cela permet à la mémoire cache de fonctionner aux mêmes fréquences que les processeurs modernes.

En outre, un facteur important est l'emplacement de la mémoire cache. Il est situé sur la puce du processeur elle-même, ce qui réduit considérablement le temps d'accès à celle-ci. Auparavant, la mémoire cache de certains niveaux était située à l'extérieur de la puce du processeur, sur une puce SRAM spéciale quelque part sur la carte mère. Maintenant, dans presque tous les processeurs, la mémoire cache est située sur la puce du processeur.


A quoi sert le cache CPU ?

Comme mentionné ci-dessus, le but principal de la mémoire cache est de stocker les données fréquemment utilisées par le processeur. Le cache est un tampon dans lequel les données sont chargées, et malgré sa petite taille (environ 4-16 Mo) dans processeurs modernes, il donne une amélioration significative des performances dans n'importe quelle application.

Pour mieux comprendre le besoin de mémoire cache, imaginons l'organisation de la mémoire d'un ordinateur comme un bureau. La RAM sera une armoire avec des dossiers auxquels le comptable accède périodiquement pour récupérer de gros blocs de données (c'est-à-dire des dossiers). Et la table sera la mémoire cache.

Il y a des éléments qui sont posés sur le bureau du comptable, auxquels il se réfère plusieurs fois dans l'heure. Par exemple, il peut s'agir de numéros de téléphone, de quelques exemples de documents. Ces types d'informations sont directement sur la table, ce qui, à son tour, augmente la vitesse d'accès à celles-ci.

De la même manière, des données peuvent être ajoutées à partir de ces grands blocs de données (dossiers) à la table, pour une utilisation rapide, par exemple, n'importe quel document. Lorsque ce document n'est plus nécessaire, il est replacé dans l'armoire (en RAM), vidant ainsi la table (cache) et libérant cette table pour de nouveaux documents qui seront utilisés dans la période de temps suivante.

Également avec la mémoire cache, s'il y a des données qui sont les plus susceptibles d'être ré-accessibles, alors ces données de la RAM sont chargées dans la mémoire cache. Très souvent, cela se produit avec le chargement conjoint des données les plus susceptibles d'être utilisées après les données actuelles. C'est-à-dire qu'il existe des hypothèses sur ce qui sera utilisé "après". Ce sont les principes simples de fonctionnement.

Niveaux de cache du processeur

Les processeurs modernes sont équipés d'un cache, qui se compose souvent de 2 ou 3 niveaux. Bien sûr, il y a des exceptions, mais c'est souvent le cas.

En général, il peut y avoir de tels niveaux: L1 (premier niveau), L2 (deuxième niveau), L3 (troisième niveau). Maintenant un peu plus sur chacun d'eux :

Cache de premier niveau (L1)- le niveau de mémoire cache le plus rapide qui fonctionne directement avec le cœur du processeur, en raison de cette interaction étroite, ce niveau a le temps d'accès le plus court et fonctionne à des fréquences proches du processeur. C'est un tampon entre le processeur et le cache de second niveau.

Nous considérerons les volumes sur le processeur hautes performances Intel Core i7-3770K. Ce processeur est équipé de 4 x 32 Ko de cache L1 4 x 32 Ko = 128 Ko. (32 Ko par cœur)

Cache de deuxième niveau (L2)- le deuxième niveau est plus grand que le premier, mais par conséquent, il a moins de "caractéristiques de vitesse". En conséquence, il sert de tampon entre les niveaux L1 et L3. Si nous revenons à notre exemple Core i7-3770K, alors ici la quantité de cache L2 est de 4x256 Ko = 1 Mo.

Cache de niveau 3 (L3)- le troisième niveau, encore une fois, plus lent que les deux précédents. Mais c'est toujours beaucoup plus rapide que la RAM. Le cache L3 du i7-3770K est de 8 Mo. Si les deux niveaux précédents sont répartis dans chaque cœur, alors ce niveau est commun à l'ensemble du processeur. L'indicateur est assez solide, mais pas exorbitant. Depuis, par exemple, les processeurs de la série Extreme comme i7-3960X, il est de 15 Mo, et certains nouveaux processeurs Xeon en ont plus de 20.

Quelle est l'importance du cache L3 pour les processeurs AMD ?

En effet, il est logique d'équiper les processeurs multicœurs d'une mémoire dédiée qui sera partagée par tous les cœurs disponibles. Dans ce rôle, un cache L3 rapide peut considérablement accélérer l'accès aux données les plus demandées. Ensuite, les cœurs, s'il y a une telle opportunité, n'auront pas à accéder à la mémoire principale lente (RAM, RAM).

Du moins en théorie. Récemment AMD a annoncé le processeur Athlon II X4, qui est un modèle Phenom II X4 sans cache L3, laissant entendre que ce n'est pas si nécessaire. Nous avons décidé de comparer directement deux processeurs (avec et sans cache L3) pour voir comment le cache affecte les performances.

Cliquez sur l'image pour agrandir.

Comment fonctionne le cache ?

Avant de plonger dans les tests, il est important de comprendre quelques notions de base. Le principe du cache est assez simple. Le cache met en mémoire tampon les données aussi près que possible des cœurs de traitement du processeur afin de réduire les requêtes CPU vers une mémoire plus distante et plus lente. Sur les plates-formes de bureau modernes, la hiérarchie du cache comprend jusqu'à trois niveaux qui précèdent l'accès à la RAM. De plus, les caches du deuxième et, en particulier, du troisième niveau ne servent pas uniquement à la mise en mémoire tampon des données. Leur but est d'éviter une surcharge du bus CPU lorsque les cœurs doivent échanger des informations.

Coups et ratés

L'efficacité de l'architecture de cache est mesurée par le pourcentage de hits. Les demandes de données pouvant être satisfaites par le cache sont considérées comme des accès. Si ce cache ne contient pas les données requises, la demande est transmise plus loin dans le pipeline de mémoire et un échec est compté. Bien sûr, les échecs entraînent plus de temps pour obtenir les informations. En conséquence, des "bulles" (temps d'arrêt) et des retards apparaissent dans le pipeline de calcul. Les coups, en revanche, vous permettent de maintenir des performances maximales.

Ecriture cache, exclusivité, cohérence

Les politiques de remplacement dictent la manière dont l'espace de cache est rendu disponible pour les nouvelles entrées. Étant donné que les données écrites dans le cache doivent éventuellement apparaître dans la mémoire principale, les systèmes peuvent le faire en même temps que l'écriture dans le cache (écriture directe), ou ils peuvent marquer la zone de données comme "sale" (réécriture), et écrire en mémoire lorsqu'il sera expulsé du cache.

Les données de plusieurs niveaux de cache peuvent être stockées de manière exclusive, c'est-à-dire sans redondance. Vous ne trouverez alors pas de lignes de données identiques dans deux hiérarchies de cache différentes. Ou les caches peuvent fonctionner de manière inclusive, c'est-à-dire que les niveaux inférieurs du cache sont garantis pour contenir les données présentes dans les niveaux supérieurs du cache (plus proches du cœur du processeur). AMD Phenom utilise un cache L3 exclusif, tandis qu'Intel suit une stratégie de cache inclusive. Les protocoles de cohérence assurent la cohérence et la mise à jour des données sur les cœurs, les niveaux de cache et même les processeurs.

Taille du cache

Un cache plus grand peut contenir plus de données, mais tend à augmenter la latence. De plus, un gros cache consomme un nombre important de transistors de processeur, il est donc important de trouver un équilibre entre le "budget" des transistors, la taille du die, la consommation électrique et les performances/latences.

Associativité

Les enregistrements dans la RAM peuvent être directement mappés au cache, c'est-à-dire qu'il n'y a qu'une seule position dans le cache pour une copie des données de la RAM, ou ils peuvent être associatifs à n voies, c'est-à-dire qu'il y a n emplacements possibles dans le cache où ces données pourraient être stockées. Une associativité plus élevée (jusqu'à des caches entièrement associatifs) offre la meilleure flexibilité de mise en cache car les données existantes dans le cache n'ont pas besoin d'être écrasées. En d'autres termes, un n-degré élevé d'associativité garantit un taux de succès plus élevé, mais il augmente la latence car il faut plus de temps pour tester toutes ces associations pour un succès. En règle générale, le degré d'association le plus élevé est raisonnable pour le dernier niveau de mise en cache, car la capacité maximale y est disponible, et la recherche de données en dehors de ce cache entraînera un accès lent du processeur à la RAM.

Pour donner quelques exemples, les Core i5 et i7 utilisent 32 Ko de cache L1 avec une associativité à 8 voies pour les données et 32 ​​Ko de cache L1 avec une associativité à 4 voies pour les instructions. Il est compréhensible qu'Intel souhaite que les instructions soient disponibles plus rapidement et que le cache L1 pour les données ait un pourcentage maximum de succès. Le cache L2 d'Intel a une associativité à 8 voies, tandis que le cache L3 d'Intel est encore plus intelligent car il implémente une associativité à 16 voies pour maximiser les hits.

Cependant, AMD poursuit une stratégie différente avec les processeurs Phenom II X4, qui utilisent le cache L1 avec une associativité à 2 voies pour réduire la latence. Pour compenser d'éventuels ratés, la capacité du cache a été doublée : 64 Ko pour les données et 64 Ko pour les instructions. Le cache L2 a une associativité à 8 voies, comme la conception Intel, mais le cache L3 d'AMD fonctionne avec une associativité à 48 voies. Mais la décision de choisir une architecture de cache ou une autre ne peut être jugée sans tenir compte de l'ensemble de l'architecture du processeur. Il est tout à fait naturel que les résultats des tests aient une importance pratique, et notre objectif était simplement un test pratique de toute cette structure complexe de mise en cache à plusieurs niveaux.

Chaque processeur moderne dispose d'un cache dédié qui stocke les instructions et les données du processeur, prêt à l'emploi presque instantanément. Ce niveau est communément appelé le premier niveau de cache, ou L1, et a été introduit pour la première fois avec les processeurs 486DX. Récemment, les processeurs AMD sont devenus la norme avec 64k de cache L1 par cœur (pour les données et les instructions), et Processeurs Intel utiliser 32 Ko de cache L1 par cœur (également pour les données et les instructions)

Le cache de premier niveau est apparu pour la première fois sur les processeurs 486DX, après quoi il est devenu une caractéristique intégrale de tous les processeurs modernes.

Le cache de deuxième niveau (L2) est apparu sur tous les processeurs après la sortie du Pentium III, bien que les premières implémentations de celui-ci sur le package aient été dans le processeur Pentium Pro (mais pas sur une puce). Les processeurs modernes sont équipés de jusqu'à 6 Mo de cache L2 sur puce. En règle générale, ce volume est réparti entre deux cœurs sur un processeur Intel Core 2 Duo, par exemple. Les configurations L2 régulières fournissent 512 Ko ou 1 Mo de cache par cœur. Les processeurs avec un cache L2 plus petit ont tendance à se situer dans la tranche de prix inférieure. Vous trouverez ci-dessous un diagramme des premières implémentations de cache L2.

Le Pentium Pro avait le cache L2 dans le package du processeur. Les générations suivantes de Pentium III et d'Athlon ont implémenté le cache L2 via des puces SRAM séparées, ce qui était très courant à l'époque (1998, 1999).

L'annonce ultérieure de la technologie de processus jusqu'à 180 nm a permis aux fabricants d'intégrer enfin le cache L2 sur la puce du processeur.


Les premiers processeurs double cœur utilisaient simplement des conceptions existantes lorsque deux matrices étaient installées dans un boîtier. AMD a introduit un processeur double cœur sur une matrice monolithique, a ajouté un contrôleur de mémoire et un commutateur, et Intel a simplement assemblé deux matrices monocœur dans un seul boîtier pour son premier processeur double cœur.


Pour la première fois, le cache L2 était partagé entre deux cœurs sur les processeurs Core 2 Duo. AMD est allé plus loin et a construit son premier Phenom quadricœur à partir de zéro, tandis qu'Intel a de nouveau utilisé quelques matrices pour son premier processeur quadricœur, cette fois deux matrices Core 2 double cœur, pour réduire les coûts.

Le cache L3 existe depuis les débuts du processeur Alpha 21165 (96 ko, introduit en 1995) ou de l'IBM Power 4 (256 ko, 2001). Cependant, dans les architectures basées sur x86, le cache L3 est apparu pour la première fois avec les modèles Intel Itanium 2, Pentium 4 Extreme (Gallatin, les deux processeurs en 2003) et Xeon MP (2006).

Les premières implémentations fournissaient juste un autre niveau dans la hiérarchie du cache, bien que les architectures modernes utilisent le cache L3 comme un grand tampon partagé pour l'échange de données entre les cœurs des processeurs multicœurs. Ceci est également souligné par le degré n élevé d'associativité. Il vaut mieux chercher les données un peu plus longtemps dans le cache que de se retrouver dans une situation où plusieurs cœurs utilisent un accès très lent à la RAM principale. AMD a introduit pour la première fois le cache L3 sur un processeur de bureau avec la ligne Phenom déjà mentionnée. Le Phenom X4 65 nm contenait 2 Mo de cache L3 partagé, tandis que le Phenom II X4 45 nm actuel a 6 Mo de cache L3 partagé. Les processeurs Intel Core i7 et i5 utilisent 8 Mo de cache L3.

Les processeurs quadricœurs modernes ont des caches L1 et L2 dédiés pour chaque cœur, ainsi qu'un grand cache L3 partagé par tous les cœurs. Le cache L3 partagé permet également l'échange de données sur lesquelles les cœurs peuvent travailler en parallèle.


Il ne s'agit pas d'argent, il s'agit cache-mémoire des processeurs et pas seulement. Hors volume cache-les commerçants de mémoire ont fait un autre fétiche commercial, notamment avec le cache des processeurs centraux et disques durs(les cartes vidéo l'ont aussi - mais elles ne l'ont pas encore fait). Ainsi, il existe un processeur XXX avec un cache L2 de 1 Mo et exactement le même processeur XYZ avec un cache de 2 Mo. Devinez lequel est le meilleur ? Ah - ne le faites pas tout de suite !

Cache-la mémoire est un tampon où sont ajoutés les éléments qui peuvent et/ou doivent être mis de côté pour plus tard. Le processeur fait le travail et des situations surviennent lorsque des données intermédiaires doivent être stockées quelque part. Eh bien, bien sûr dans le cache! - après tout, c'est des ordres de grandeur plus rapides que la RAM, tk. il se trouve dans la matrice du processeur lui-même et fonctionne généralement à la même fréquence. Et puis, après un certain temps, il récupérera ces données et les traitera à nouveau. En gros, comme un trieur de pommes de terre sur un convoyeur, qui à chaque fois qu'autre chose qu'une pomme de terre (carotte) tombe, la jette dans une boîte. Et quand il est rassasié, il se lève et sort le sienà la pièce suivante. A ce moment, le convoyeur s'arrête et un ralenti est observé. Le volume de la boîte est cache dans cette analogie. Et Combien le sien Avez-vous besoin de 1 Mo ou 12 ? Il est clair que si le sien le volume est petit, ça prendra trop de temps à sortir et ce sera simple, mais à partir d'un certain volume le sien une augmentation supplémentaire ne donnera rien. Eh bien, le trieur aura une boîte pour 1000 kg de carottes - oui, il n'en aura pas autant pour tout le quart de travail, et cela ne le rendra PAS DEUX FOIS PLUS RAPIDE ! Il y a une autre subtilité - un grand cache peut entraîner une augmentation des retards pour y accéder, d'une part, et en même temps, la probabilité d'erreurs dans celui-ci augmente, par exemple, lors de l'overclocking - d'autre part. (à propos de COMMENT dans ce cas pour déterminer la stabilité / instabilité du processeur et découvrir que l'erreur se produit précisément dans le sien cache, testez L1 et L2 - vous pouvez lire ici.) Troisièmement - cache survit à une zone décente du cristal et au budget des transistors du circuit du processeur. C'est la même chose pour cache mémoire du disque dur. Et si l'architecture du processeur est solide, elle nécessitera 1024 Ko de cache ou plus dans de nombreuses applications. Si vous avez un disque dur rapide - 16 Mo ou même 32 Mo est approprié. Mais aucun 64 Mo de cache ne suffira le sien plus rapide s'il s'agit d'une coupe appelée la version verte (Green WD) avec une vitesse de 5900 au lieu des 7200 prescrits, même si cette dernière dispose de 8 Mo. Ensuite, les processeurs Intel et AMD utilisent ce cache(d'une manière générale, AMD est plus performant et leurs processeurs sont souvent à l'aise avec des valeurs plus basses). De plus, Intel cache général, mais pour AMD, c'est personnel pour chaque cœur. Le plus rapide cache L1 y Processeurs AMD est de 64 Ko chacun pour les données et les instructions, soit le double de celui d'Intel. Cache le troisième niveau L3 est généralement présent dans les meilleurs processeurs comme AMD Phenom II 1055T X6 Socket AM3 2.8GHz ou un concurrent Intel Core i7-980X. Tout d'abord, les jeux aiment les grandes quantités de cache. Et cache N'aime PAS beaucoup d'applications professionnelles (voir Ordinateur pour le rendu, le montage vidéo et les applications professionnelles). Plus précisément, les plus exigeants y sont généralement indifférents. Mais ce que vous ne devriez absolument pas faire, c'est de choisir un processeur en fonction de la taille du cache. L'ancien Pentium 4 dans ses dernières manifestations avait 2 Mo de cache à des fréquences de fonctionnement bien au-delà de 3 GHz - comparez le sien performances avec un Celeron E1 *** à double cœur bon marché fonctionnant à des fréquences autour de 2 GHz. Il ne laissera rien au vieil homme. Un exemple plus récent est le E8600 dual-core haute fréquence qui coûte près de 200 $ (apparemment à cause du cache de 6 Mo) et l'Athlon II X4-620 2,6 GHz, qui n'a que 2 Mo. Cela n'empêche pas Athlone de massacrer un concurrent pour un écrou.

Comme vous pouvez le voir sur les graphiques, ni dans les programmes complexes, ni dans les jeux gourmands en processeur, il n'y a aucun cache ne remplacera pas les cœurs supplémentaires. Athlon avec 2 Mo de cache (rouge) surpasse facilement Cor2Duo avec 6 Mo de cache, même à une fréquence inférieure et à près de la moitié du coût. De plus, beaucoup de gens oublient que cache est présent dans les cartes vidéo, car elles sont généralement équipées de processeurs. Un exemple récent est la carte vidéo GTX460, où ils parviennent non seulement à couper le bus et la quantité de mémoire (que l'acheteur devinera) - mais aussi CACHE shaders, respectivement, de 512 Ko à 384 Ko (que l'acheteur ne devinera PAS). Et cela ajoutera également sa contribution négative à la performance. Il sera également intéressant de découvrir la dépendance des performances à la taille du cache. Examinons à quelle vitesse il se développe avec une augmentation de la taille du cache en utilisant l'exemple du même processeur. Comme vous le savez, les processeurs des séries E6***, E4*** et E2*** ne diffèrent que par la taille du cache (respectivement 4, 2 et 1 Mo). Travaillant à la même fréquence de 2400 MHz, ils montrent les résultats suivants.

Comme vous pouvez le voir, les résultats ne sont pas trop différents. Je dirai plus - si un processeur d'une capacité de 6 Mo était impliqué - le résultat augmenterait un peu plus, car. les processeurs arrivent à saturation. Mais pour les modèles avec 512 Ko, la baisse serait perceptible. En d'autres termes, 2 Mo suffisent même dans les jeux. En résumé, nous pouvons conclure que - cache c'est bien quand DEJA beaucoup de tout le reste. Il est naïf et stupide de modifier la vitesse du disque dur ou le nombre de cœurs de processeur par taille de cache pour le même coût, car même la boîte de tri la plus volumineuse ne remplacera pas une autre trieuse.Mais il existe de bons exemples qui disposaient de 1Mo de cache pour deux cœurs (série E2160 et similaires), et la dernière révision 45 nm de la série E5200 a toujours 2 Mo, toutes choses étant égales par ailleurs (et surtout, PRIX). Bien sûr, cela vaut la peine de choisir ce dernier.

mob_info