Hogar Árboles frutales Procesadores, núcleos e hilos. Topología del sistema. Definición de software de topología

Procesadores, núcleos e hilos. Topología del sistema. Definición de software de topología

Pero con la conquista de nuevos picos en la frecuencia, aumentarla se hizo más difícil, ya que esto afectó el aumento del TDP de los procesadores. Por lo tanto, los desarrolladores comenzaron a aumentar el ancho de los procesadores, es decir, agregando núcleos, y surgió el concepto de múltiples núcleos.

Hace literalmente 6 o 7 años, los procesadores multinúcleo eran prácticamente desconocidos. No, procesadores multinúcleo de la misma empresa IBM existía antes, pero la aparición del primer procesador de doble núcleo para computadores de escritorio, tuvo lugar recién en 2005, y este procesador se llamó Pentium D. Además, en 2005, se lanzó un Opteron de doble núcleo de AMD, pero para sistemas de servidor.

En este artículo no profundizaremos en detalles. hechos históricos, pero discutiremos los procesadores multinúcleo modernos como una de las características de la CPU. Y lo más importante es que debemos descubrir qué ofrece este núcleo múltiple en términos de rendimiento para el procesador y para usted y para mí.

Mayor rendimiento gracias al multinúcleo

El principio de aumentar el rendimiento del procesador debido a múltiples núcleos es dividir la ejecución de subprocesos ( varias tareas) para varios núcleos. Para resumir, podemos decir que casi todos los procesos que se ejecutan en su sistema tienen múltiples subprocesos.

Voy a decir de inmediato que Sistema operativo virtualmente puede crear muchos subprocesos por sí mismo y ejecutarlos todos al mismo tiempo, incluso si el procesador es físicamente de un solo núcleo. Este principio implementa la misma multitarea de Windows (por ejemplo, escuchar música y escribir simultáneamente).


Tomemos por ejemplo programa antivirus. Un hilo escaneará la computadora, el otro actualizará la base de datos antivirus (hemos simplificado todo mucho para comprender el concepto general).

Y veamos qué sucederá en dos casos diferentes:

a) Procesador de un solo núcleo. Como tenemos dos subprocesos ejecutándose simultáneamente, necesitamos crear para el usuario (visualmente) esta misma ejecución simultánea. El sistema operativo hace algo inteligente:hay un cambio entre la ejecución de estos dos subprocesos (estos cambios son instantáneos y el tiempo corre en milisegundos). Es decir, el sistema "realizó" la actualización un poco, luego cambió abruptamente a escanear y luego volvió a actualizar. Por lo tanto, para usted y para mí parece que estamos realizando estas dos tareas simultáneamente. ¿Pero qué se pierde? Por supuesto, rendimiento. Así que veamos la segunda opción.

b) Procesador multinúcleo. EN en este caso este cambio no sucederá. El sistema claramente enviará cada hilo a un núcleo separado, lo que como resultado nos permitirá deshacernos del cambio de un hilo a otro que es perjudicial para el rendimiento (idealicemos la situación). Se ejecutan dos subprocesos simultáneamente, este es el principio de múltiples núcleos y subprocesos múltiples. En última instancia, escanearemos y actualizaremos mucho más rápido en un procesador multinúcleo que en un procesador de un solo núcleo. Pero hay un problema: no todos los programas admiten núcleos múltiples. No todos los programas se pueden optimizar de esta manera. Y todo sucede lejos de ser tan ideal como lo describimos. Pero cada día, los desarrolladores crean más y más programas cuyo código está perfectamente optimizado para su ejecución en procesadores multinúcleo.

¿Necesita procesadores multinúcleo? razón cotidiana

En elegir un procesador para una computadora (es decir, cuando piensa en la cantidad de núcleos), debe determinar los principales tipos de tareas que realizará.

Para mejorar sus conocimientos en el campo del hardware informático, puede leer el material sobre zócalos del procesador .

Los procesadores de doble núcleo pueden considerarse el punto de partida, ya que no tiene sentido volver a soluciones de un solo núcleo. Pero los procesadores de doble núcleo son diferentes. Puede que este no sea el Celeron “más” reciente, pero puede que sea un Core i3 en Ivy Bridge, como el Sempron o el Phenom II de AMD. Naturalmente, debido a otros indicadores, su rendimiento será muy diferente, por lo que es necesario considerar todo de manera integral y comparar los núcleos múltiples con otros. características del procesador.

Por ejemplo, Core i3 en Ivy Bridge tiene tecnología Hyper-Treading, que le permite procesar 4 subprocesos simultáneamente (el sistema operativo ve 4 núcleos lógicos, en lugar de 2 físicos). Pero el mismo Celeron no se jacta de ello.

Pero volvamos directamente a las reflexiones relativas a las tareas necesarias. Si necesita una computadora para trabajar en la oficina y navegar por Internet, entonces será suficiente un procesador de doble núcleo.

Cuando se trata de rendimiento en juegos, la mayoría de los juegos requieren 4 núcleos o más para ser cómodos. Pero aquí surge la misma trampa: no todos los juegos tienen código optimizado para procesadores de 4 núcleos, y si lo están, no son tan eficientes como nos gustaría. Pero, básicamente, para los juegos de ahora. solucion optima Se trata precisamente de un procesador de 4 núcleos.


Hoy en día, los mismos procesadores AMD de 8 núcleos son redundantes para juegos, es la cantidad de núcleos lo que es redundante, pero el rendimiento no está a la altura, pero tienen otras ventajas. Estos mismos 8 núcleos serán de gran ayuda en tareas donde trabajo poderoso con carga multihilo de alta calidad. Esto incluye, por ejemplo, la reproducción de vídeo (cálculo) o la informática de servidor. Por lo tanto, dichas tareas requieren 6, 8 o más núcleos. Y pronto los juegos podrán cargarse eficientemente 8 y más núcleos, así que en el futuro todo es muy color de rosa.

No olvide que todavía hay muchas tareas que crean una carga de un solo subproceso. Y vale la pena hacerse la pregunta: ¿necesito esta unidad de 8 núcleos o no?

En resumen, me gustaría señalar una vez más que las ventajas de los núcleos múltiples se manifiestan durante el trabajo computacional multiproceso "pesado". Y si no juega juegos con requisitos altísimos y no realiza tipos específicos de trabajo que requieran una buena potencia informática, entonces simplemente no tiene sentido gastar dinero en costosos procesadores multinúcleo (

* Siempre asuntos actuales, a qué debes prestar atención a la hora de elegir un procesador, para no equivocarte.

Nuestro objetivo en este artículo es describir todos los factores que afectan el rendimiento del procesador y otras características operativas.

Probablemente no sea ningún secreto que el procesador es la unidad informática principal de una computadora. Incluso se podría decir: la parte más importante de la computadora.

Es él quien procesa casi todos los procesos y tareas que ocurren en la computadora.

Ya sea ver vídeos, música, navegar por Internet, escribir y leer en la memoria, procesar vídeos y 3D, juegos. Y mucho más.

Por lo tanto, para elegir C central PAG procesador, debes tratarlo con mucho cuidado. Puede resultar que decidas instalar una tarjeta de video potente y un procesador que no se corresponde con su nivel. En este caso, el procesador no revelará el potencial de la tarjeta de video, lo que ralentizará su funcionamiento. El procesador estará completamente cargado y literalmente hirviendo, y la tarjeta de video esperará su turno, funcionando al 60-70% de sus capacidades.

Por eso, a la hora de elegir un ordenador equilibrado, No costos descuida el procesador a favor de una potente tarjeta de video. La potencia del procesador debe ser suficiente para liberar el potencial de la tarjeta de video; de lo contrario, será dinero desperdiciado.

Intel vs. AMD

*ponernos al día para siempre

Corporación Intel, tiene enorme por recursos humanos y unas finanzas casi inagotables. Muchas innovaciones en la industria de los semiconductores y nuevas tecnologías provienen de esta empresa. Procesadores y desarrollos Intel, en promedio por 1-1,5 años por delante de los logros de los ingenieros AMD. Pero como sabes, por la oportunidad de tener la mayor tecnologías modernas- tienes que pagar.

Política de precios del procesador Intel, se basa tanto en numero de nucleos, cantidad de caché, pero también en "frescura" de la arquitectura, rendimiento por relojvatio,tecnología de proceso de chip. El significado de la memoria caché, "las sutilezas del proceso técnico" y otros. características importantes El procesador se analizará a continuación. Por la posesión de dichas tecnologías, además de un multiplicador de frecuencia gratuito, también tendrás que pagar una cantidad adicional.

Compañía AMD, a diferencia de la empresa Intel, se esfuerza por la disponibilidad de sus procesadores para el consumidor final y por una política de precios competente.

Incluso se podría decir que AMD– « sello del pueblo" En sus etiquetas de precios encontrarás lo que necesitas a un precio muy atractivo. Generalmente un año después de la aparición. nueva tecnología en la compañia Intel, un análogo de la tecnología aparece de AMD. Si no persigue el máximo rendimiento y presta más atención al precio que a la disponibilidad de tecnologías avanzadas, entonces los productos de la empresa AMD- solo para ti.

Política de precios AMD, se basa más en el número de núcleos y muy poco en la cantidad de memoria caché y la presencia de mejoras arquitectónicas. En algunos casos, para tener la oportunidad de tener memoria caché de tercer nivel, tendrás que pagar un poco más ( Fenómeno tiene una memoria caché de 3 niveles, atlón contenido con sólo limitado, nivel 2). Pero a veces AMD mima a sus fans posibilidad de desbloquear procesadores más baratos a otros más caros. Puedes desbloquear los núcleos o la memoria caché. Mejorar atlón antes Fenómeno. Esto es posible gracias a la arquitectura modular y a la falta de algunos modelos más económicos, AMD simplemente desactiva algunos bloques en el chip de otros más caros (software).

Núcleos– permanecen prácticamente sin cambios, solo difiere su número (válido para procesadores 2006-2011 años). Debido a la modularidad de sus procesadores, la empresa hace un excelente trabajo vendiendo chips rechazados que, cuando se apagan algunos bloques, se convierten en un procesador de una línea menos productiva.

La empresa lleva muchos años trabajando en una arquitectura completamente nueva bajo el nombre en clave Excavadora, pero en el momento del lanzamiento en 2011 año, los nuevos procesadores no mostraron el mejor rendimiento. AMD Culpé a los sistemas operativos por no comprender las características arquitectónicas de los núcleos duales y "otros subprocesos múltiples".

Según representantes de la compañía, debes esperar a que lleguen correcciones y parches especiales para experimentar el rendimiento completo de estos procesadores. Sin embargo, al principio 2012 año, los representantes de la compañía pospusieron el lanzamiento de una actualización para soportar la arquitectura Excavadora para el segundo semestre del año.

Frecuencia del procesador, número de núcleos, subprocesos múltiples.

Durante los tiempos pentio 4 y ante él - frecuencia de la CPU, fue el principal factor de rendimiento del procesador al seleccionar un procesador.

Esto no es sorprendente, porque las arquitecturas de procesador se desarrollaron especialmente para lograr altas frecuencias, y esto se reflejó especialmente en el procesador. pentio 4 sobre arquitectura Explosión neta. La alta frecuencia no fue efectiva con la larga tubería que se usó en la arquitectura. Incluso XP Athlon frecuencia 2GHz, en términos de productividad fue mayor que pentio 4 C 2,4 GHz. Y asi fue agua limpia marketing. Después de este error, la empresa Intel me di cuenta de mis errores y volvió al lado del bien Empecé a trabajar no en el componente de frecuencia, sino en el rendimiento por reloj. De la arquitectura Explosión neta Tuve que negarme.

Qué lo mismo para nosotros da multinúcleo?

Procesador de cuatro núcleos con frecuencia. 2,4 GHz, en aplicaciones multiproceso, será teóricamente el equivalente aproximado de un procesador de un solo núcleo con una frecuencia 9,6 GHz o procesador de 2 núcleos con frecuencia 4,8 GHz. Pero eso es sólo En teoria. Prácticamente Sin embargo, dos procesadores de doble núcleo en una placa base de dos zócalos serán más rápidos que un procesador de 4 núcleos a la misma frecuencia operativa. Las limitaciones de velocidad del autobús y la latencia de la memoria pasan factura.

* sujeto a la misma arquitectura y cantidad de memoria caché

Multi-core permite realizar instrucciones y cálculos en partes. Por ejemplo, necesitas realizar tres operaciones aritméticas. Los dos primeros se ejecutan en cada uno de los núcleos del procesador y los resultados se añaden a la memoria caché, donde la siguiente acción se puede realizar con ellos mediante cualquiera de los núcleos libres. El sistema es muy flexible, pero sin una optimización adecuada es posible que no funcione. Por lo tanto, la optimización para múltiples núcleos es muy importante para la arquitectura del procesador en un entorno de sistema operativo.

Aplicaciones que "encantan" y usar subprocesos múltiples: archivadores, reproductores y codificadores de vídeo, antivirus, programas desfragmentadores, editor gráfico , navegadores, Destello.

Además, los "amantes" del subproceso múltiple incluyen sistemas operativos como ventana 7 Y Windows Vista, así como muchos SO basado en kernel linux, que funcionan notablemente más rápido con un procesador multinúcleo.

Mayoría juegos A veces, un procesador de 2 núcleos a alta frecuencia es suficiente. Ahora, sin embargo, todo sale a la luz. más juegos“adaptado” para subprocesos múltiples. Toma al menos estos Salvadera juegos como GTA 4 o Prototipo, en el que en un procesador de 2 núcleos con una frecuencia inferior 2,6 GHz– no te sientes cómodo, la velocidad de fotogramas cae por debajo de 30 fotogramas por segundo. Aunque en este caso lo más probable es que el motivo de este tipo de incidentes sea la optimización “débil” de los juegos, la falta de tiempo o las manos “indirectas” de quienes transfirieron juegos de consolas a ordenador personal.

A la hora de comprar un nuevo procesador para juegos, ahora debes prestar atención a los procesadores con 4 o más núcleos. Pero aún así, no se deben descuidar los procesadores de 2 núcleos de la “categoría superior”. En algunos juegos, estos procesadores a veces se sienten mejor que algunos de varios núcleos.

Memoria caché del procesador.

es un área dedicada del chip del procesador en la que se procesan y almacenan datos intermedios entre los núcleos del procesador, la RAM y otros buses.

Funciona a una velocidad de reloj muy alta (normalmente la misma que la del propio procesador), tiene un rendimiento muy alto y núcleos de procesador trabajar con ella directamente ( L1).

Por ella escasez, el procesador puede estar inactivo en tareas que consumen mucho tiempo, esperando que lleguen nuevos datos a la caché para su procesamiento. También memoria caché sirve para registros de datos repetidos con frecuencia que, si es necesario, se pueden restaurar rápidamente sin cálculos innecesarios, sin obligar al procesador a perder tiempo nuevamente en ellos.

El rendimiento también mejora por el hecho de que la memoria caché está unificada y todos los núcleos pueden utilizar los datos de ella por igual. Esto da características adicionales para optimización multiproceso.

Esta técnica se utiliza ahora para Caché de nivel 3. Para procesadores Intel había procesadores con memoria caché unificada de nivel 2 ( C2D E 7***,mi 8***), gracias a lo cual apareció este método aumentar el rendimiento de subprocesos múltiples.

Al hacer overclocking en el procesador, la memoria caché puede volverse punto débil, evitando que el procesador sea overclockeado más allá de su frecuencia máxima de funcionamiento sin errores. Sin embargo, la ventaja es que funcionará a la misma frecuencia que el procesador overclockeado.

En general, cuanto mayor sea la memoria caché, más más rápido UPC. ¿En qué aplicaciones exactamente?

Todas las aplicaciones que utilizan una gran cantidad de datos, instrucciones y subprocesos de punto flotante hacen un uso intensivo de la memoria caché. La memoria caché es muy popular. archivadores, codificadores de video, antivirus Y editor gráfico etc.

Favorable a un número grande memorias caché son juegos. Especialmente estrategias, simuladores automáticos, juegos de rol, SandBox y todos los juegos donde hay muchos pequeños detalles, partículas, elementos geométricos, flujos de información y efectos físicos.

La memoria caché juega un papel muy importante a la hora de desbloquear el potencial de los sistemas con 2 o más tarjetas de vídeo. Después de todo, una parte de la carga recae en la interacción de los núcleos del procesador, tanto entre ellos como para trabajar con flujos de varios chips de vídeo. Es en este caso que la organización de la memoria caché es importante y una memoria caché grande de nivel 3 resulta muy útil.

La memoria caché siempre está equipada con protección contra posibles errores ( ECC), si se detectan, se corrigen. Esto es muy importante, porque un pequeño error en la memoria caché, cuando se procesa, puede convertirse en un error gigantesco y continuo que colapsará todo el sistema.

Tecnologías propias.

(hiper-hilo, HT)–

La tecnología se utilizó por primera vez en procesadores. pentio 4, pero no siempre funcionó correctamente y, a menudo, ralentizó el procesador más de lo que lo aceleró. La razón fue que el proceso era demasiado largo y el sistema de predicción de sucursales no estaba completamente desarrollado. Utilizado por la empresa Intel, todavía no existen análogos de la tecnología, a menos que la consideres un análogo. lo que implementaron los ingenieros de la empresa AMD en arquitectura Excavadora.

El principio del sistema es que para cada núcleo físico, uno dos hilos de computación, en lugar de uno. Es decir, si tienes un procesador de 4 núcleos con HT (Núcleo i 7), entonces tienes hilos virtuales 8 .

La ganancia de rendimiento se logra debido al hecho de que los datos pueden ingresar al proceso ya en la mitad del mismo, y no necesariamente al principio. Si algunos bloques del procesador capaces de realizar esta acción están inactivos, reciben la tarea para su ejecución. La ganancia de rendimiento no es la misma que la de los núcleos físicos reales, pero sí comparable (~50-75%, dependiendo del tipo de aplicación). Es bastante raro que en algunas aplicaciones, La TH afecta negativamente para el rendimiento. Esto se debe a la mala optimización de las aplicaciones para esta tecnología, la incapacidad de comprender que existen subprocesos “virtuales” y la falta de limitadores para la carga de subprocesos de manera uniforme.

TurboAumentar – una tecnología muy útil que aumenta la frecuencia de funcionamiento de los núcleos de procesador más utilizados, dependiendo de su nivel de carga. Es muy útil cuando la aplicación no sabe cómo utilizar los 4 núcleos y carga solo uno o dos, mientras su frecuencia de funcionamiento aumenta, lo que compensa parcialmente el rendimiento. La empresa tiene un análogo de esta tecnología. AMD, es tecnología Núcleo turbo.

, 3 ¡Ya sé! instrucciones. Diseñado para acelerar el procesador en multimedia informática (vídeo, música, gráficos 2D/3D, etc.), y también acelerar el trabajo de programas como archivadores, programas para trabajar con imágenes y vídeos (con el apoyo de instrucciones de estos programas).

3¡Ya sé! – tecnología bastante antigua AMD, que contiene instrucciones adicionales para procesar contenido multimedia, además de ESS primera versión.

*Específicamente, la capacidad de procesar en secuencia números reales de precisión simple.

La presencia de nueva versión– es una gran ventaja, el procesador comienza a funcionar de manera más eficiente ciertas tareas con la optimización adecuada del software. Procesadores AMD tener puesto nombres similares, pero un poco diferente.

* Ejemplo - SSE 4.1 (Intel) - SSE 4A (AMD).

Además, estos conjuntos de instrucciones no son idénticos. Estos son análogos con ligeras diferencias.

Tranquilo y tranquilo, Paso de velocidad CoolCore encantada Medio Estado (C1E) Yt. d.

Estas tecnologías, con cargas bajas, reducen la frecuencia del procesador reduciendo el multiplicador y el voltaje del núcleo, desactivando parte del caché, etc. Esto permite que el procesador se caliente mucho menos, consuma menos energía y haga menos ruido. Si se necesita energía, el procesador volverá a su estado normal en una fracción de segundo. En la configuración estándar biografías Casi siempre están activados, si se desea, se pueden desactivar para reducir posibles "congelaciones" al cambiar a juegos 3D.

Algunas de estas tecnologías controlan la velocidad de rotación de los ventiladores del sistema. Por ejemplo, si el procesador no necesita una mayor disipación de calor y no está cargado, la velocidad del ventilador del procesador se reduce ( AMD Cool'n'Quiet, paso de velocidad Intel).

Tecnología de virtualización de Intel Y Virtualización AMD.

Estas tecnologías de hardware le permiten utilizar programas especiales ejecutar varios sistemas operativos a la vez, sin ninguna pérdida significativa de rendimiento. Además, se utiliza para Operación adecuada servidores, porque a menudo tienen instalado más de un sistema operativo.

Ejecutar Desactivar Poco YNo ejecutar Poco Tecnología diseñada para proteger una computadora de ataques de virus y errores de software que pueden causar que el sistema falle. desbordamiento del buffer.

Intel 64 , AMD 64 , EM 64 t – esta tecnología permite que el procesador funcione tanto en un sistema operativo con arquitectura de 32 bits como en un sistema operativo con arquitectura de 64 bits. Sistema 64 bits– desde el punto de vista de las prestaciones, para el usuario medio se diferencia en que en este sistema se pueden utilizar más de 3,25GB memoria de acceso aleatorio. En sistemas de 32 bits, utilice b oh No es posible disponer de una mayor cantidad de RAM debido a la cantidad limitada de memoria direccionable*.

La mayoría de las aplicaciones con arquitectura de 32 bits se pueden ejecutar en un sistema con un sistema operativo de 64 bits.

* ¿Qué se puede hacer si allá por 1985 nadie podía siquiera pensar en volúmenes de RAM tan gigantescos, según los estándares de esa época?

Además.

Algunas palabras sobre.

Vale la pena prestar atención a este punto mucha atención. Cuanto más fino es el proceso técnico, menos energía consume el procesador y, como resultado, menos se calienta. Y entre otras cosas, tiene un mayor margen de seguridad para el overclocking.

Cuanto más refinado sea el proceso técnico, más se podrá "envolver" en un chip (y no solo) y aumentar las capacidades del procesador. La disipación de calor y el consumo de energía también se reducen proporcionalmente, debido a menores pérdidas de corriente y una reducción del área central. Se puede notar una tendencia de que con cada nueva generación de la misma arquitectura en un nuevo proceso tecnológico, el consumo de energía también aumenta, pero no es así. Simplemente los fabricantes están avanzando hacia una productividad aún mayor y están yendo más allá de la línea de disipación de calor de la generación anterior de procesadores debido a un aumento en el número de transistores, que no es proporcional a la reducción del proceso técnico.

Integrado en el procesador.

Si no necesita un núcleo de video incorporado, no debería comprar un procesador con él. Solo obtendrá una peor disipación de calor, calentamiento adicional (no siempre), peor potencial de overclocking (no siempre) y dinero pagado de más.

Además, los núcleos que están integrados en el procesador solo sirven para cargar el sistema operativo, navegar por Internet y ver vídeos (y no de ninguna calidad).

Las tendencias del mercado siguen cambiando y la oportunidad de comprar un potente procesador de Intel Sin núcleo de vídeo, se cae cada vez menos. La política de imposición forzada del núcleo de vídeo incorporado apareció con los procesadores. Intel bajo nombre clave Sandy Bridge, cuya principal innovación fue el núcleo integrado en el mismo proceso técnico. El núcleo de vídeo se encuentra juntos con procesador en un chip, y no tan simple como en generaciones anteriores de procesadores Intel. Para quienes no lo utilizan, existen desventajas en forma de un pago excesivo por el procesador, el desplazamiento de la fuente de calor con respecto al centro de la tapa de distribución de calor. Sin embargo, también hay ventajas. Núcleo de video deshabilitado, se puede utilizar para tecnología de codificación de video muy rápida Sincronización rápida junto con un software especial que admite esta tecnología. En el futuro, Intel promete ampliar los horizontes del uso del núcleo de video incorporado para la computación paralela.

Zócalos para procesadores. Vida útil de la plataforma.


Intel tiene políticas duras para sus plataformas. La vida útil de cada uno (las fechas de inicio y finalización de las ventas del procesador) generalmente no supera los 1,5 a 2 años. Además, la empresa cuenta con varias plataformas de desarrollo paralelas.

Compañía AMD, tiene la política opuesta de compatibilidad. En su plataforma en soy 3, todos los procesadores de próxima generación que admitan DDR3. Incluso cuando la plataforma llega soy 3+ y más adelante, nuevos procesadores para soy 3, o los nuevos procesadores serán compatibles con los antiguos placas base, y puede realizar una actualización sencilla para su billetera cambiando solo el procesador (sin cambiar la placa base, la RAM, etc.) y actualizando la placa base. Los únicos matices de incompatibilidad pueden surgir al cambiar el tipo, ya que se requerirá otro controlador de memoria integrado en el procesador. Por lo tanto, la compatibilidad es limitada y no es compatible con todas las placas base. Pero, en general, para un usuario preocupado por su presupuesto o para aquellos que no están acostumbrados a cambiar completamente la plataforma cada 2 años, la elección del fabricante del procesador es clara: esto AMD.

Refrigeración de la CPU.

Viene de serie con procesador CAJA-Un nuevo refrigerador que simplemente hará frente a su tarea. Es una pieza de aluminio con un área de dispersión no muy alta. Los refrigeradores eficientes con tubos de calor y placas adheridos están diseñados para una disipación de calor altamente eficiente. Si no desea escuchar ruido adicional del ventilador, debe comprar un enfriador alternativo más eficiente con tubos de calor o un sistema de enfriamiento líquido de tipo cerrado o abierto. Dichos sistemas de refrigeración también brindarán la posibilidad de overclockear el procesador.

Conclusión.

Todo aspectos importantes Se han revisado los aspectos que afectan el rendimiento y el rendimiento del procesador. Repitamos a qué debes prestar atención:

  • Seleccionar fabricante
  • Arquitectura del procesador
  • Proceso técnico
  • frecuencia de la CPU
  • Número de núcleos de procesador
  • Tamaño y tipo de caché del procesador
  • Soporte tecnológico y de instrucción.
  • Refrigeración de alta calidad

Esperamos este material le ayudará a comprender y decidir la elección del procesador que satisfaga sus expectativas.

Procesadores multinúcleo en tiempo presente No sorprenderás a nadie. Por el contrario, todo el mundo está intentando que su computadora admita tantos núcleos como sea posible y, por lo tanto, funcione más rápido, y esto es correcto.
En lo que respecta a procesadores, durante mucho tiempo sólo hay dos fabricantes en el mercado: Intel y AMD. Y si estos últimos hablan de sus procesadores de 8 y 10 núcleos (lo que significa que hay muchos, por lo que son más potentes), entonces los primeros tienen 2 y 4 núcleos, pero se centran en sus hilos (no es necesario escribir enojado comenta que también hay más núcleos ya que aquí y debajo se describen procesadores para uso doméstico).

Y si observa los gráficos comparativos del rendimiento del procesador, puede ver que un procesador de 4 núcleos (no todos) de Intel superará a un procesador de 8 núcleos de AMD. ¿Por qué esto es tan? Después de todo, 4 es menor que 8, lo que significa que debería ser más débil... Pero si profundizas más (no directamente en los cachés, la frecuencia, el bus, etc.), puedes ver una cosa palabra interesante, que se utiliza a menudo para describir los procesadores Intel: Soporte de hiperprocesamiento.

La tecnología Hyper-Threading (“hipertendencia” en el lenguaje común) fue inventada por Intel y se utiliza sólo en sus procesadores (no en todos). No profundizaré demasiado en sus detalles, si quieres, puedes leer sobre ello en. Esta tecnología le permite dividir cada núcleo en dos y, como resultado, en lugar de uno físico, tenemos dos lógicos (o virtuales) y uno operativo. sistema windows Piensa que hay dos instalados en lugar de uno.

¿Cómo saber cuántos subprocesos hay en el procesador?

Si desea obtener información sobre un procesador específico, la mayoría de las veces en la descripción de las tiendas indican soporte para Hyper-threading, ya sea insertando esta frase o simplemente la abreviatura HT. Si no existe tal descripción, siempre puede utilizar la información más veraz en la página oficial de Intel http://ark.intel.com/ru/search/advanced/?s=t&HyperThreading=true
Recomiendo utilizar sólo esta información porque es la más precisa.

Si desea saberlo mientras ya está en el sistema y exactamente cómo se usan estos mismos subprocesos en su sistema, entonces no hay nada más simple.

Ejecútelo de cualquier forma que le resulte conveniente (la forma más sencilla es la combinación de teclas de acceso rápido Ctrl + Shift + Esc) desde cualquier lugar (incluso mientras lee este artículo) y, si tiene Windows 7, vaya a la pestaña Rendimiento.


Preste atención a la línea superior con la carga del procesador y específicamente al número de "cuadrados". Esa es exactamente la cantidad que habrá: esa es la cantidad de núcleos que habrá, incluidos todos los subprocesos. Más precisamente, aquí se muestran todos los núcleos lógicos/virtuales, y eso es lo que son los subprocesos.

Si tiene Windows 8, 8.1 o 10, entonces no habrá dicha pestaña, pero sí Rendimiento.


Aquí he resaltado dónde debes prestar atención. Por cierto, no en vano hice clic derecho en este gráfico, porque si seleccionas Procesos lógicos, el gráfico cambiará y será similar al de Windows 7, es decir. Habrá 8 “cuadrados” y gráficos de carga para cada núcleo.
Si tienes la imagen opuesta, es decir. No se muestran uno, sino varios gráficos, lo que significa que este elemento está seleccionado en las propiedades del propio gráfico.

Por supuesto, hay varias otras formas de hacer esto y, en este caso, transmisiones.

Por ejemplo, puede llamar a la propiedad del sistema (atajo de teclado Win + R e ingresar información del sistema) y ver allí.

Habiendo entendido la teoría del subproceso múltiple, veamos un ejemplo práctico: el Pentium 4. Ya en la etapa de desarrollo de este procesador, los ingenieros de Intel continuaron trabajando para aumentar su rendimiento sin realizar cambios en interfaz de software. Se consideraron cinco métodos más simples:
1. Aumente la frecuencia del reloj.
2. Colocar dos procesadores en un chip.
3. Introducción de nuevos bloques funcionales.
1. Extensión del transportador.
2. Uso de subprocesos múltiples.
La forma más obvia de mejorar el rendimiento es aumentar la velocidad del reloj sin cambiar otros parámetros. Como regla general, cada modelo de procesador posterior tiene una velocidad de reloj ligeramente mayor que el anterior. Desafortunadamente, al aumentar la velocidad del reloj en línea recta, los desarrolladores se enfrentan a dos problemas: un mayor consumo de energía (que es importante para las computadoras portátiles y otros dispositivos informáticos que funcionan con baterías) y el sobrecalentamiento (que requiere la creación de disipadores de calor más eficientes).
El segundo método, colocar dos procesadores en un chip, es relativamente sencillo, pero implica duplicar el área ocupada por el chip. Si cada procesador tiene su propia memoria caché, el número de chips de una oblea se reduce a la mitad, pero eso también significa que los costes de producción se duplican. Si ambos procesadores comparten memoria caché, se puede evitar un aumento significativo en el área ocupada, pero en este caso surge otro problema: la cantidad de memoria caché por procesador se reduce a la mitad y esto inevitablemente afecta el rendimiento. Además, si es profesional aplicaciones de servidor son capaces de utilizar plenamente los recursos de varios procesadores, luego en convencional programas de escritorio el paralelismo interno se desarrolla en mucha menor medida.
La introducción de nuevos bloques funcionales tampoco es difícil, pero es importante mantener el equilibrio. ¿Cuál es el punto de tener una docena de bloques ALU si el chip no puede enviar comandos a la tubería a una velocidad que le permita cargar todos estos bloques?
Un transportador con un mayor número de etapas, capaz de dividir las tareas en segmentos más pequeños y procesarlas en cortos períodos de tiempo, por un lado, aumenta la productividad, por otro, mejora Consecuencias negativas predicción incorrecta de bifurcaciones, errores de caché, interrupciones y otros eventos que interrumpen el flujo normal de procesamiento de instrucciones en el procesador. Además, para aprovechar plenamente las capacidades de la tubería extendida, es necesario aumentar la frecuencia del reloj y esto, como sabemos, conduce a un mayor consumo de energía y disipación de calor.
Finalmente, puede implementar subprocesos múltiples. La ventaja de esta tecnología es la introducción de un subproceso de software adicional que permite utilizar recursos de hardware que de otro modo estarían inactivos. De acuerdo a los resultados investigación experimental Los desarrolladores de Intel han descubierto que aumentar el área del chip en un 5 % al implementar subprocesos múltiples para muchas aplicaciones da un aumento de rendimiento del 25 %. El primer procesador Intel que admitió subprocesos múltiples fue el Xeon de 2002. Posteriormente, a partir de 3,06 GHz, se introdujo el multiproceso en la línea Pentium 4. Intel llama a la implementación de multiproceso en el Pentium 4 hiperproceso.
El principio básico del hyperthreading es la ejecución simultánea de dos subprocesos de programa (o procesos; el procesador no distingue procesos de subprocesos de programa). El sistema operativo trata el procesador Hyperthreaded Pentium 4 como un complejo de doble procesador con cachés y memoria principal compartidas. El sistema operativo realiza la programación para cada subproceso del programa por separado. De esta forma, se pueden ejecutar dos aplicaciones al mismo tiempo. P.ej, programa de correo puede enviar o recibir mensajes en fondo mientras el usuario interactúa con aplicación interactiva- es decir, el demonio y el programa de usuario se ejecutan simultáneamente, como si el sistema tuviera dos procesadores disponibles.
Los programas de aplicación que se pueden ejecutar como múltiples subprocesos pueden utilizar ambos "procesadores virtuales". Por ejemplo, los programas de edición de vídeo suelen permitir a los usuarios aplicar filtros a todos los fotogramas. Estos filtros ajustan el brillo, el contraste, balance de color y otras propiedades del marco. En tal situación, el programa puede asignar un procesador virtual para procesar cuadros pares y otro para procesar cuadros impares. En este caso, los dos procesadores funcionarán de forma totalmente independiente el uno del otro.
Debido a que los subprocesos de software acceden a los mismos recursos de hardware, es necesaria la coordinación entre estos subprocesos. En el contexto del hyperthreading, Intel ha identificado cuatro estrategias útiles para gestionar el uso compartido de recursos: duplicación de recursos y uso compartido completo, umbral y completo de recursos. Veamos estas estrategias.
Comencemos con la duplicación de recursos. Como es sabido, algunos recursos se duplican con el fin de organizar los flujos de programas. Por ejemplo, dado que cada hilo de programa requiere control individual, se necesita un segundo contador de programa. Además, es necesario introducir una segunda tabla que asigne registros arquitectónicos (EAX, EBX, etc.) a registros físicos; De manera similar, el controlador de interrupciones está duplicado, ya que las interrupciones se manejan individualmente para cada subproceso.
La siguiente es una técnica para la partición dura de recursos (compartición de recursos particionados) entre subprocesos de programa. Por ejemplo, si el procesador tiene una cola entre dos etapas funcionales de la canalización, entonces la mitad de las ranuras se pueden asignar al subproceso 1 y la otra mitad al subproceso 2. El intercambio de recursos es fácil de implementar, no genera desequilibrio y garantiza completa independencia hilos de programa entre sí. Al compartir completamente todos los recursos, un procesador se convierte efectivamente en dos. Por otro lado, puede darse una situación en la que un hilo de programa no utilice recursos que podrían ser útiles para un segundo hilo, pero para los cuales no tiene derechos de acceso. Como resultado, los recursos que de otro modo podrían utilizarse están inactivos.
Lo opuesto a compartir intensamente es compartir todos los recursos. En este esquema, cualquier subproceso del programa puede acceder a los recursos necesarios y se les presta servicio en el orden en que se reciben las solicitudes de acceso. Considere una situación en la que un hilo rápido, que consiste principalmente en operaciones de suma y resta, coexiste con un hilo lento que implementa operaciones de multiplicación y división. Si las instrucciones se llaman desde la memoria más rápido que las operaciones de multiplicación y división, la cantidad de instrucciones llamadas dentro del subproceso lento y en cola en la canalización aumentará gradualmente. Con el tiempo, estos comandos llenarán la cola, lo que provocará que el flujo rápido se detenga debido a la falta de espacio. El intercambio completo de recursos resuelve el problema del gasto subóptimo recursos compartidos, pero crea un desequilibrio en su consumo: un flujo puede ralentizar o detener otro.
El esquema intermedio se implementa en el marco del umbral de compartición de recursos. Según este esquema, cualquier hilo de programa puede obtener dinámicamente una determinada cantidad (limitada) de recursos. Cuando se aplica a recursos replicados, este enfoque proporciona flexibilidad sin la amenaza de que uno de los subprocesos del programa sufra un tiempo de inactividad debido a la imposibilidad de obtener recursos. Si, por ejemplo, prohíbe que cada hilo ocupe más de 3/4 de la cola de comandos, el mayor consumo de recursos del hilo lento no interferirá con la ejecución del rápido.
El modelo Hyperthreading de Pentium 4 combina diferentes estrategias de intercambio de recursos. Así, se intenta solucionar todos los problemas asociados a cada estrategia. La duplicación ocurre en recursos a los que ambos subprocesos necesitan acceder continuamente (específicamente, el contador del programa, la tabla de mapas de registros y el controlador de interrupciones). Duplicar estos recursos aumenta el área del chip solo en un 5%; está de acuerdo, un precio muy razonable para subprocesos múltiples. Los recursos que están disponibles en cantidades tales que es prácticamente improbable que sean capturados por un solo subproceso (por ejemplo, líneas de caché) se asignan dinámicamente. El acceso a los recursos que controlan el funcionamiento de la canalización (en particular, a sus numerosas colas) se divide: a cada subproceso del programa se le asigna la mitad de las ranuras. El proceso principal de la arquitectura Netburst implementada en el Pentium 4 se muestra en la Fig. 8,7; Las áreas blanca y gris en esta ilustración indican el mecanismo para distribuir recursos entre los subprocesos del programa blanco y gris.
Como puede ver, todas las colas en esta ilustración están divididas: a cada subproceso del programa se le asigna la mitad de las ranuras. Ningún hilo del programa puede restringir el trabajo del otro. También se divide el bloque de distribución y sustitución. Los recursos del programador se asignan dinámicamente, pero en función de algún umbral, de modo que ningún subproceso pueda ocupar todos los espacios de la cola. Para todas las demás etapas del transportador hay una separación completa.
Sin embargo, con el subproceso múltiple no todo es tan sencillo. Incluso una técnica tan progresiva tiene desventajas. La partición rígida de recursos no está asociada con costos importantes, pero la partición dinámica, especialmente teniendo en cuenta los umbrales, requiere monitorear el consumo de recursos en tiempo de ejecución. Además, en algunos casos, los programas se ejecutan mucho mejor sin subprocesos múltiples que con él. Por ejemplo, supongamos que si tiene dos subprocesos de programa, cada uno de ellos requiere 3/4 del caché para funcionar correctamente. Si se ejecutaran alternativamente, cada uno mostraría una eficiencia razonable con una pequeña cantidad de errores de caché (que se sabe que están asociados con una sobrecarga adicional). En el caso de la ejecución paralela, cada uno tendría significativamente más errores de caché y el resultado final sería peor que sin subprocesos múltiples.
Puede encontrar información adicional sobre el mecanismo de subprocesos múltiples de RepPit 4 en.

Nuevo en el sitio

>

Más popular