jueves, 29 de septiembre de 2011

AMD Fusion, la microarquitectura que cambiará las reglas -AMD Trinity, sucesor de AMD Llano primer trimestre 2012


El lanzamiento de la plataforma Fusion es, sin lugar a dudas, el más importante para la firma de Sunnyvale desde la presentación en 2003 de los primeros Athlon 64. Sin embargo, no es en absoluto una maniobra improvisada.

En realidad, las primeras APUs (Accelerated Processing Unit), o unidades de procesamiento acelerado, empezaron a «cocinarse» hace la friolera de cinco años, poco después de la adquisición de ATI. El objetivo de los directivos de AMD cuando pergeñaron esta operación no fue únicamente entrar por la puerta grande en el mercado de los procesadores gráficos, sino también utilizar el extenso bagaje de los ingenieros de ATI para poner a punto una familia de microprocesadores revolucionaria.
Por esta razón, pocas semanas después de la compra de esta última compañía, los técnicos de ambas empresas comenzaron a trabajar juntos. Y el resultado de este esfuerzo conjunto, que ha perdurado a lo largo de casi cinco años, es la plataforma Fusion.

Un lanzamiento a lo grande

Las primeras APUs de AMD llegaron al mercado a principios de este año, coincidiendo con la celebración de la última edición del CES, en Las Vegas. Esos primeros chips han sido fabricados utilizando fotolitografía de 40 nm y pertenecen a las series E y C de la plataforma Fusion. La primera responde a las necesidades de los portátiles del segmento de entrada y de los equipos Todo en Uno, y tiene un TDP (índice de disipación térmica) de 18 vatios.
Por otra parte, los chips de la serie C resultan idóneos para los netbooks y los Mini-PCs gracias a su reducido TDP, de tan solo 9 vatios. Pero ambas familias comparten la incorporación de una lógica gráfica que ofrece un rendimiento muy superior al de los procesadores gráficos integrados disponibles hasta la fecha, y, sobre todo, lo que en AMD llaman «autonomía para todo el día», que no es otra cosa que la capacidad de los chips de esta plataforma de facilitar la fabricación de equipos capaces de alcanzar o, incluso, superar las 8 horas de disponibilidad continua con Windows 7 en modo de inactividad.
En cualquier caso, es evidente que las series C y E no han sido diseñadas para abastecer a todas las plataformas de ordenadores disponibles en el mercado. El as que AMD acaba de arrojar sobre la mesa es, precisamente, la serie A perteneciente a la plataforma Fusion, conocida por el nombre en código Llano.



Estos microprocesadores están siendo fabricados por GlobalFoundries, una compañía fruto de la escisión en 2009 de la división de fabricación de semiconductores de AMD, utilizando tecnología de integración de 32 nm, y los primeros equipos que los incorporan llegarán a las tiendas a lo largo del mes de junio. Los chips pertenecientes a la serie A han sido diseñados para gobernar PCs de sobremesa y ordenadores portátiles de alto rendimiento, por lo que competirán con los microprocesadores Core i3 e i5 de Intel, y también con algunos Core i7.
Es evidente que el futuro a corto plazo de AMD está ligado al éxito de la plataforma Fusion, por lo que no es de extrañar que la presentación mundial de los nuevos procesadores se haya llevado a cabo en la isla YAS de Abu Dhabi (Emiratos Árabes Unidos), un marco excepcional al que solo fueron invitados un puñado de medios de comunicación especializados entre los que se encontraba PC Actual, la única revista española presente en el evento.

APU = CPU + GPU + Northbridge

 

Una APU, o unidad de procesamiento acelerado, es un microprocesador que aglutina la lógica de la CPU, la GPU y el northbridge. La reunión de estos tres elementos en un único circuito integrado fabricado con la técnica de fotolitografía masiva más sofisticada disponible actualmente permite ahorrar mucho espacio y, sobre todo, reducir drásticamente el consumo. Esto significa que el TDP de una APU es muy inferior a la suma de los TDPs de los tres chips a los que equivale. Además, dado que aglutina la funcionalidad de tres unidades diferentes en una única pieza de silicio, su coste es menor que el de la adición de estas por separado.
Los procesadores pertenecientes a la nueva serie A incorporan un máximo de 4 núcleos x86 de propósito general acompañados, cada uno de ellos, por una caché de nivel 2 de 1 Mbyte. Aunque más adelante profundizaremos con cierto detalle en las novedades introducidas en la microarquitectura, nos viene bien tener presente que esta implementación ofrece un incremento apreciable en el número de instrucciones por ciclo de reloj (IPC), que AMD cuantifica en algo más del 6% si lo comparamos con la anterior generación de núcleos x86. Además, la tecnología Turbo Core adecua independientemente el TDP y la frecuencia de reloj de cada uno de ellos a la carga de trabajo para reducir sensiblemente su consumo.


La solución que han puesto a punto los ingenieros de AMD es muy similar a la diseñada por los técnicos de Intel, por lo que evalúa en tiempo real el trabajo para someter a cada uno de los núcleos a la carga apropiada. De esta forma, si uno o más núcleos permanecen inac­tivos, los activos pueden trabajar a una frecuencia superior a la nominal siempre que el TDP total del microprocesador no supere el índice máximo.
No obstante, el balanceo de la carga no se lleva a cabo monitorizando únicamente los núcleos de la CPU, sino también la GPU. Esto significa que en un escenario en el que el procesador gráfico permanece ocioso o relativamente poco cargado, la CPU puede incrementar su frecuencia de reloj y, así, beneficiarse de la «porción» del TDP global que no está siendo utilizada para materializar los gráficos.

Para que todo esto funcione correctamente y el índice de disipación térmica del procesador se mantenga siempre por debajo del umbral que garantiza su correcto funcionamiento, los ingenieros de AMD han recurrido a un monitor que suma de forma instantánea el TDP de los núcleos de la CPU y el de la GPU para, después, enviar esta información a un gestor conocido como administrador del estado-P. Este, a su vez, modula la frecuencia de reloj de cada núcleo para adaptar su consumo a la carga de trabajo impuesta en un instante determinado.
Este esquema de funcionamiento no parece, a priori, muy diferente al implementado en otras soluciones de Intel y también de la propia AMD, sin embargo, difiere de estas en un apartado esencial: el módulo de gestión avanzada de la energía (APM o Advanced Power Management) evalúa la temperatura y la corriente en el dominio digital. De esta forma, el escalado de la frecuencia de reloj se lleva a cabo con más precisión y la injerencia del entorno y las interacciones entre núcleos es menor, lo que permite optimizar la siempre crucial relación rendimiento/vatio.
El consumo de las APUs de la serie A para ordenadores portátiles oscila entre 35 y 45 vatios, mientras que el de las destinadas a los PCs de sobremesa fluctúa entre 65 y 100 vatios. Por otra parte, la frecuencia de reloj de los núcleos de propósito general parte desde los 1,4 GHz de los modelos más económicos hasta los 2,9 GHz de los chips tope de gama. En cambio, el rango de velocidades de la lógica gráfica integrada es más comedido, pues oscila entre 400 y 600 MHz en todas las versiones de estos chips.

DirectX 11, 400 núcleos Radeon y mucho más

El bagaje acumulado por los ingenieros que proceden de ATI y que han intervenido en el diseño de la lógica gráfica de los chips Llano es un capital fundamental para AMD. A diferencia del motor gráfico implementado en los procesadores Sandy Bridge de Intel, las soluciones de la plataforma Fusion son totalmente compatibles con la API DirectX 11 y, por tanto, a priori pueden enfrentarse a la ejecución del motor gráfico de cualquier juego de última generación.
El objetivo de los ingenieros de AMD ha sido ofrecer con estos chips un rendimiento gráfico equiparable al de una tarjeta dedicada de gama de entrada o, incluso, media. Esta productividad es más que suficiente para la mayor parte de los usuarios, pero también resulta muy atractiva para los jugones, pues pueden sumar a su PC de sobremesa equipado con una APU de la serie A una tarjeta gráfica Radeon HD dedicada y disfrutar de un subsistema gráfico dual constituido por la GPU de esta última y la lógica gráfica de su CPU.

El rendimiento de la nueva APU de AMD en las operaciones que requieren un esfuerzo de cálculo intensivo es bueno, pero donde realmente destaca es en la prueba Multi-Media de SiSoft Sandra 2011
Las APUs pertenecientes a la serie A pueden incorporar tres versiones distintas de un mismo motor gráfico. Las principales diferencias existentes entre la plataforma A8, el tope de gama, la A6 y la A4, se manifiestan en el número de núcleos Radeon, unidades SIMD, unidades de texturas y ROPs (unidades de renderizado).
El motor gráfico de los chips A8 incorpora 400 núcleos Radeon (stream processors), 5 unidades SIMD, 20 unidades de texturas, 32 unidades de renderizado asociadas al cálculo de la profundidad (búfer Z) y a la matriz de renderizado (stencil buffer) y 8 unidades de renderizado para el color.
Además, la frecuencia de reloj de la GPU asciende a 444 MHz y la tasa de transferencia de la memoria alcanza los 1,6 Gbps. Es fácil percatarse de que estas especificaciones son más ambiciosas que las de las lógicas gráficas integradas que hemos disfrutado hasta ahora.

Las APUs de AMD son totalmente compatibles con DirectX 11
 
El nombre en código del nuevo motor gráfico es Sumo, que no es otra cosa que un derivado de Redwood debidamente actualizado. Al igual que las demás unidades funcionales de los chips que conforman la serie A, en su fabricación se utiliza fotolitografía de 32 nm. Las principales diferencias existentes entre este diseño y Redwood atañen a la interfaz que facilita la comunicación entre la memoria y el northbridge, así como al decodificador unificado de vídeo (UVD), que en Llano es de tercera generación.
Por otra parte, como hemos adelantado, esta lógica gráfica es totalmente compatible con DirectX 11 y, por tanto, permite la teselación y la utilización de DirectCompute y el Shader Model 5. También satisface los requisitos estipulados por OpenGL 4.1.
Pero, sin duda, lo que más llamará la atención de los jugones son los modos de alta calidad que posibilitan la eliminación de los bordes dentados (antialiasing) y el filtrado de texturas. El primero de estos algoritmos alcanza las 24 muestras en las modalidades MSAA, SSAA y MLAA, mientras que el filtrado anisotrópico de texturas independiente del ángulo puede emplear hasta 16 muestras.
Las mejoras introducidas por los ingenieros de AMD en el decodificador de vídeo tienen como objetivo mejorar la capacidad de la CPU al reproducir y codificar vídeo en alta definición en cualquiera de los formatos que empleamos actualmente (H.264, MPEG-2, VC-1 y MPEG-4 parte 2), lo que hace posible abordar estos procesos sin penalizar el rendimiento de las demás unidades funcionales del sistema.

Primera toma de contacto

Antes de entrar en materia nos gustaría agradecer a los responsables de AMD en España que nos hayan permitido trabajar a nuestras anchas con una de las primeras, si no la única, plataformas de pruebas Fusion Serie A disponibles. No obstante, no se trata de un equipo comercial como los que están a punto de llegar a las tiendas, sino de un portátil ensamblado por la propia AMD utilizando un chasis de «marca blanca».
En cualquier caso, lo realmente importante es que su configuración es muy similar a la de los equipos que muy pronto podremos adquirir en el mercado. Incorpora una APU AMD A8-3500M a 1,5 GHz con 4 núcleos (capaz de trabajar a un máximo de 2,4 GHz), lógica gráfica Radeon HD 6620G a 444 MHz y un TDP de 35 vatios; 4 Gby­tes DDR3-1333, pantalla LCD LED de 14" (1.366 x 768 puntos), un disco duro Hitachi SATA300 de 250 Gbytes a 7.200 rpm, una regrabadora de Blu-ray Disc y Windows 7 Home Premium 64 Bits.

Las APUs de mayor rendimiento incorporan 4 núcleos acompañados por 1 Mbyte de caché L2
 
El principal reto al que nos hemos enfrentado es la dificultad de comparar el rendimiento del portátil de AMD con el de otros equipos similares. Un portátil es una plataforma cerrada que apenas deja margen a la hora de manipular el hardware. Además, los ordenadores que hemos comparado poseen configuraciones heterogéneas, por lo que el análisis no puede llevarse a cabo aislando los componentes que queremos estudiar, que normalmente es lo que hacemos.
Aun así, los gráficos que ilustran este informe recogen buena parte de las propuestas que podemos encontrar en el mercado, por lo que nos permiten entrever con claridad qué nos ofrece la plataforma de AMD.

La APU que incorpora el equipo que hemos utilizado pertenece a la serie A8, el tope de gama, por lo que debe medirse con los microprocesadores Core i5 e i7 de Intel. La capacidad de cálculo del chip de AMD es muy notable, de hecho, aunque en el gráfico de SiSoft Sandra 2011 podéis ver que ha sido superado por las tres propuestas de Intel, es necesario tener presente que la frecuencia de reloj de estas últimas es claramente superior.
Aun así, a igual velocidad es muy probable que los Core i5 e i7 se lleven el gato al agua. No obstante, nos ha sorprendido gratamente el fantástico rendimiento que el A8-3500M ha arrojado en las pruebas multimedia, en las que ha superado con claridad al Core i5 a pesar de que la frecuencia de trabajo nominal de este último es 900 MHz mayor.

Por otra parte, la productividad de la APU de AMD en las pruebas gráficas es tremenda. los técnicos de la compañía nos garantizaron que su rendimiento es equiparable al ofrecido por una tarjeta gráfica dedicada de gama media, e, incluso, media/alta.

. En el exigente 3DMark 11 Professional, bajo DirectX 11, ha batido con claridad a un portátil con Intel Core i7 2630QM y una GPU GeForce GT 540M de NVIDIA. Y en 3DMark06, que sigue siendo una prueba de referencia para sopesar la productividad de cualquier máquina en DirectX 9, ha barrido a todos los portátiles que hemos analizado en nuestra última comparativa.
La diferencia de rendimiento entre la APU de AMD y la lógica gráfica Intel GMA HD es abrumadora, pero lo más importante es que, incluso, ha aventajado a equipos que incorporan GPUs muy potentes, como las GeForce GT 310M y 330M de NVIDIA o la Radeon HD 5450 de la propia AMD.

Las claves de las APUs de AMD

  • Disipan menos calor y consumen menos que las combinaciones de CPU y GPU dedicada (TDP <= 45 vatios en portátiles y <=100 vatios en PCs de sobremesa)
  • El rendimiento de la lógica gráfica integrada es equiparable al de una tarjeta gráfica dedicada
  • Su autonomía, al menos en teoría, es superior a la ofrecida por los portátiles que incorporan una GPU dedicada
  • La lógica gráfica es compatible con DirectX 11 y permite la reproducción de contenidos Blu-ray 3D y juegos 3D
  • La integración de la GPU en el interior del procesador es total, por lo que tiene acceso directo a los recursos hardware del chip
  • Los jugones pueden combinar la potencia gráfica de la APU y de una tarjeta gráfica Radeon HD dedicada de una forma simple
  • Los modos de eliminación de los bordes dentados (antialiasing) y filtrado de texturas de las APUs garantizan unos gráficos de gran calidad
  • Compatibilidad con USB 3.0
  • La asistencia por hardware al proceso de reproducción de vídeo en HD asegura imágenes de calidad
 AMD Trinity, sucesor de AMD Llano primer trimestre 2012

Deacuerdo a una filtración AMD plantea renovar su familia llano , con los nuevos AMD Trinity que llegarán a comiensos del año 2012 .como una nueva arquitectura, sucesora de AMD Llano con núcleos Piledriver, derivados de los Bulldozer, mismo núcleo que estará integrado en la línea AMD FX de alto rendimiento.

La plataforma en sí será conocida como Comal y coexistirá con la plataforma Sabine, la actual línea de APUs Llano combinada con chipsets A70M y A60M. Comal continuará utilizando los mismos chipsets y el mismo socket, aunque las nuevas APUs mejorarán la gráfica integrada -nombre en clave Londres-. Aparte de eso hay muy pocos detalles a excepción del TDP que parece mantenerse frente a las APUs actuales.

A lo largo de 2012 aterrizarán Wichita y Krishna, ambos forman parte de la plataforma Deccan. Ambas SKUs dispondrán de núcleos Bobcat, los mismos que las CPUs Zacate y Ontario, junto con la misma nueva gráfica de Trinity -London-. AMD ha desarrollado un nuevo chipset para esta plataforma, llamado Yuba, que ofrece 2 puertos SATA 6 Gbps, 2 USB 3.0, 10 USB 2.0, 4 PCIe x1 y soporte SDHC. Yuba reemplazará al chipset básico A50M. La plataforma Deccan estará disponible para el segundo trimestre de 2012.


0 comentarios:

Publicar un comentario