Noticias

Arm anuncia los primeros núcleos Armv9, incluida la central eléctrica Cortex-X2







Arm presentó sus primeros núcleos Armv9: Cortex-X2 (16% más rápido que -X1), Cortex-A710 (10% más rápido que -A78) y Cortex-A510 (35% más rápido que -A55), todos al menos el doble Vale la pena el poder de IA de sus predecesores.

Luego del anuncio de la Inmueble armv9 En marzo, Arm desarrolló rápidamente los primeros tres diseños de IP principales basados ​​en él: el buque insignia, el Cortex-X2 personalizable, así como el Cortex-A710 “conspicuo” y el Cortex-A510 “pequeño”. Arm omitió los esquemas de nombres Cortex-A79 y -A56-59 para resaltar posiblemente el nuevo eclosión con Armv9. Arm incluso anunció un sucesor de bus DSU-110 L3 para DynamIQ, que habilita 8 MB L3 para los diseños Armv9, así como una GPU de variedad inscripción para Mali-G710 (ver más debajo).

Armv9 presenta el sucesor SVE2 (Scalable Vector Extensions) del SVE de corta duración orientado a HPC y el ampliamente utilizado NEON, que permite un mejor soporte para el enseñanza automotriz (ML) y operaciones similares a DSP. SVE2 ofrece un conjunto de instrucciones más amplio que SVE con funciones SIMD escalables de 128 bits a 2048 bits. Entre otras cosas, esto permite una migración más practicable de código compatible con SVE2 desde procesadores IoT de variedad pérdida a chips de centro de datos y al contrario. Intel tiene poco similar con su tecnología Advanced Vector Extensions (AVX) y RISC-V tiene eso RV64GCV Extensión.



Una configuración típica de Armv9 SoC en comparación con Armv8 (izquierda)
Fuente: Arm
(Click para ampliar la imagen)

Armv9 perfeccionamiento significativamente la seguridad a través de una bloque informática sensible que introduce entornos de ejecución seguros y en contenedores llamados reinos. Las áreas están representadas por el código de Realm Manager que tiene un 10 por ciento del tamaño de un hipervisor y permite que el software pruebe la confianza de formas que los hipervisores no pueden. Otras nuevas características de seguridad son las MTE (extensiones de etiquetado de memoria), que se pueden utilizar para identificar desbordamientos de búfer y otras posibles debilidades de diseño.

Como AnandTechCortex-X2 y Cortex-A510 son las primeras microarquitecturas Cortex-A exclusivas de Arch64, lo que significa que no pueden ejecutar código AArch32. Curiosamente, el Cortex-A710 admitirá AArch32, al menos hasta 2023, lo que debería proporcionar un mejor soporte heredado para el mercado chino de aplicaciones de Android.

AnandTech incluso señala que Cortex-X2 y Cortex-A710 ofrecen mejoras de rendimiento más pequeñas con respecto a generaciones anteriores en comparación con otras versiones de Arm Cortex-A lanzadas recientemente. Se cree que esto se debe a la carestia de centrarse en la nueva bloque Armv9 antiguamente de que es probable que las optimizaciones se intensifiquen en la próxima procreación.

Corteza-X2

El diseño Cortex-X2 sigue al Cortex-X1 del año pasado, que apareció en el diseño de 5nm hecho por Qualcomm. Snapdragon 888 y Exynos 2100 de Samsung LSI. El Cortex-X1 2100 ofrece un rendimiento sereno un 22 por ciento más rápido que el Cortex-A78, y el Cortex-X2 es al menos un 16 por ciento más rápido en universal que el Cortex-X1, según Arm.



Diagrama conceptual armv9
Fuente: Arm
(Click para ampliar la imagen)

La fila Cortex-X es una desviación del habitual acto de permanencia Arm Cortex-A entre el rendimiento, el rendimiento y las consideraciones de espacio. En cambio, Arm se ha centrado casi por completo en el rendimiento, especialmente en cargas de trabajo de un solo subproceso. Esta es una de las razones por las que Snapdragon 888 y Exynos 2100 solo usan el X1 en un solo núcleo, con frecuencia de 2,84 GHz y 2,9 GHz, respectivamente.

La fila Cortex-X incluso está rompiendo la norma en el sentido de que Arm está vivo para personalizar la bloque para los principales licenciatarios de semiconductores. Esto está muy remotamente de la desenvolvimiento que otorga RISC-V, pero es un paso en la dirección correcta.

Un núcleo Cortex X2 de 3.3 GHz permite un 30 por ciento de mejoras de rendimiento de un solo subproceso sobre el núcleo único X1 en los teléfonos inteligentes basados ​​en Snapdragon 888 y Exynos 2100, según Arm. Un X2 de 3.5 GHz ofrece un rendimiento de un solo subproceso un 40 por ciento más rápido en comparación con un Intel Core i5-1135G7 de cuatro núcleos de la comunidad Tiger Lake de undécima procreación, según la compañía.

Según AnandTech, Cortex-X2 ofrece una precisión de predicción de rama mejorada y reduce la largo de la tubería de 11 ciclos a 10 para mejorar la latencia. El ROB (Reorder Buffer) fuera de servicio aumenta en un 30 por ciento a 288 entradas.

En el backend, el Cortex-X2 aumenta las ventanas y los tamaños de estructura de la memoria de carga en un 33 por ciento. El X2 incluso presenta todas las mejoras de Armv9 relacionadas con SVE2, seguridad y otras mejoras

Corteza-A710

A diferencia del Cortex-A2, el Cortex-A710 y el Cortex-A510 aún encuentran un permanencia entre el rendimiento y el consumo de energía según lo demanda el mercado celular. Se dice que el Cortex-A710 ofrece un 10 por ciento más de «rendimiento de elevación con la misma envolvente de rendimiento» que el Cortex-A78, que se utiliza para los núcleos de rango medio del Snapdragon 888. AnandTech sugiere que la comparación es injusta ya que Arm compara un diseño de gusto -A710 con un diseño de gusto L3 de 8 MB facultado por el nuevo bus DSU-110 (ver más debajo) para diseños de gusto L3 de 4 MB.

– PUBLICIDAD –



Arm incluso afirma usar hasta un 30 por ciento menos de energía que el Cortex-A78. Si admisiblemente este es un gran brinco, AnandTech señala que está remotamente de ponerse al día con el escaso consumo del Apple M1.

En el front-end, el Cortex-A710 ofrece las mismas mejoras en la predicción de rama y la escalón de despacho que en el -X2. Incluso hay cambios en el diseño del prefetcher para una mejor optimización sobre el DSU-110.

Corteza-A510

Al igual que el Cortex-A55, el Cortex-A510 está diseñado para realizar tareas con bajo consumo de energía en un SoC de múltiples núcleos. Conveniente a las mejoras de rendimiento, las cargas de trabajo en las CPU «pequeñas» pueden funcionar durante más tiempo antiguamente de cambiar a las CPU «grandes». «, dice Arm. Esto, a su vez,» aumenta la eficiencia universal en el clúster de CPU «.

El Cortex-A510 ofrece una perfeccionamiento significativa del rendimiento del 35 por ciento con respecto al Cortex-A55, aunque Arm vuelve a comparar un -A510 con 8 MB L3 con un -A55 con 4 MB. Se dice que la eficiencia energética perfeccionamiento hasta en un 20 por ciento, y el aumento de ML es tres veces veterano que el de Cortex-X2 y -A710. Arm le dijo a AnandTech que el Cortex-A510 era aproximadamente equivalente a Corteza-A73que han favorecido SBC como ese Odroid-N2 a través de un Amlogic S922X.

Si admisiblemente el Cortex-A510 mantiene el flujo de ejecución correcto del Cortex-A55, es un diseño de «hoja limpia» que rompe con Cortex-A55 de otras formas por otra parte de tener lugar a Armv9. Por un flanco, fue diseñado por el equipo de Arm en Cambridge, Reino Unido, en división de la empresa de Austin, Texas, que recientemente construyó núcleos Cortex-A.

Al igual que el Cortex-A710, el -A510 toma prestadas las mejoras de predicción de rama y captación previa del X2. El nuevo diseño en orden de 3 anchos del Cortex-A510 presenta una nueva microarquitectura con un núcleo fusionado para mejorar la eficiencia del espacio. Con el núcleo fusionado, los fabricantes pueden diseñar SoC con un difícil de hasta dos pares de núcleos que comparten gusto L2 y canalizaciones SVE2.

DSU-110 y Mali-G710

Gracias a la pelotón DSU-110 L3 DynamIQ compartida recientemente anunciada, el Cortex-X2 se puede implementar en configuraciones de hasta ocho núcleos X2 en un solo clúster. El bus DSU-110 es la continuación de Arm’s DynamIQ Lectura de su esquema multinúcleo Big.Little.



Escalabilidad DSU-110
Fuente: Arm
(Click para ampliar la imagen)

Con el DSU-110, el Cortex-X2 puede confesar una gusto L3 de hasta 16 MB, aunque 8 MB es la norma para el primer división de SoC habilitados para X2. La tecnología ofrece hasta 5 veces el ufano de lado L3 y es escalable a través de Cortex-X2, -A710 y -A510. El DSU-110 incluso perfeccionamiento el ufano de lado de un solo núcleo, según AnandTech. Su referencia analiza en profundidad la topología de transporte bidireccional de doble anillo del DSU-110, cada uno con 4 paradas de anillo y admite hasta 8 segmentos de gusto.

Finalmente, Arm anunció una GPU Mali G710 que ofrece una perfeccionamiento del rendimiento del 20 por ciento para las experiencias de procesamiento intensivo, dijo Arm. Según Arm, la GPU debería ofrecer un aumento de ML del 35 por ciento para tareas como la perfeccionamiento de la imagen para los nuevos modos de cámara y video. Incluso hay un maniquí Mali G610 corto. Con la adquisición en curso de Arm por parte de Nvidia, uno se pregunta si las GPU de Mali desaparecerán o serán Nvidificadas.

Información Adicional

No se mostró información de disponibilidad para los procesadores basados ​​en los nuevos Armv9 Cortex-X2, Cortex-A710 y Cortex-A510 IP. Consulte Arm’s para obtener más información. anuncio y Página del producto.

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba