En Computex 2024, AMD (NASDAQ: AMD) mostró el creciente impulso de la familia de aceleradores AMD Instinct™ durante el discurso de apertura de la presidenta y directora ejecutiva, Dra. Lisa Su. AMD presentó una hoja de ruta ampliada de varios años para el acelerador AMD Instinct que brindará una cadencia anual de capacidades de memoria y rendimiento de IA líderes en cada generación.
La hoja de ruta actualizada comienza con el nuevo acelerador AMD Instinct MI325X, que estará disponible en el cuarto trimestre de 2024. Después de eso, se espera que la serie AMD Instinct MI350, impulsada por la nueva arquitectura AMD CDNA™ 4, esté disponible en 2025, con lo que alcanzará una Aumento de 35 veces en el rendimiento de inferencia de IA en comparación con AMD Instinct MI300 Series con arquitectura AMD CDNA 3 1 . Se espera que llegue en 2026, la serie AMD Instinct MI400 se basa en la arquitectura AMD CDNA “Next”.
«Los aceleradores AMD Instinct MI300X continúan su fuerte adopción por parte de numerosos socios y clientes, incluidos Microsoft Azure, Meta, Dell Technologies, HPE, Lenovo y otros, un resultado directo del rendimiento excepcional y la propuesta de valor del acelerador AMD Instinct MI300X», dijo Brad McCredie, vicepresidente corporativo, Computación acelerada del centro de datos, AMD. «Con nuestra cadencia anual actualizada de productos, somos implacables en nuestro ritmo de innovación, brindando las capacidades de liderazgo y el rendimiento que la industria de la IA y nuestros clientes esperan para impulsar la próxima evolución de la capacitación e inferencia de IA en los centros de datos».
El ecosistema de software AMD AI madura
La pila de software abierto AMD ROCm™ 6 continúa madurando, lo que permite que los aceleradores AMD Instinct MI300X impulsen un rendimiento impresionante para algunos de los LLM más populares. En un servidor que utiliza ocho aceleradores AMD Instinct MI300X y ROCm 6 con Meta Llama-3 70B, los clientes pueden obtener un rendimiento de inferencia y generación de tokens 1,3 veces mejor en comparación con la competencia 2 . En un único acelerador AMD Instinct MI300X con ROCm 6, los clientes pueden obtener un mejor rendimiento de inferencia y rendimiento de generación de tokens en comparación con la competencia en 1,2 veces en Mistral-7B 3 . AMD también destacó que Hugging Face, el repositorio más grande y popular de modelos de IA, ahora está probando 700.000 de sus modelos más populares cada noche para garantizar que funcionen de inmediato con los aceleradores AMD Instinct MI300X. Además, AMD continúa su trabajo preliminar en marcos de IA populares como PyTorch, TensorFlow y JAX.
AMD presenta una vista previa de nuevos aceleradores y revela una hoja de ruta de cadencia anual
Durante la conferencia magistral, AMD reveló una cadencia anual actualizada para la hoja de ruta del acelerador AMD Instinct para satisfacer la creciente demanda de más computación de IA. Esto ayudará a garantizar que los aceleradores AMD Instinct impulsen el desarrollo de modelos de IA de vanguardia de próxima generación. La hoja de ruta anual actualizada de AMD Instinct destacó:
- El nuevo acelerador AMD Instinct MI325X, que traerá 288 GB de memoria HBM3E y 6 terabytes por segundo de ancho de banda de memoria, utilizará el mismo diseño de servidor de placa base universal estándar de la industria utilizado por la serie AMD Instinct MI300 y estará disponible de forma generalizada en el cuarto trimestre de 2024. tendrá una capacidad de memoria y un ancho de banda líderes en la industria, 2 veces y 1,3 veces mejores que la competencia respectivamente 4 y 1,3 veces mejor 5 en rendimiento informático que la competencia.
- El primer producto de la serie AMD Instinct MI350, el acelerador AMD Instinct MI350X, se basa en la arquitectura AMD CDNA 4 y se espera que esté disponible en 2025. Utilizará el mismo diseño de servidor de placa base universal estándar de la industria que otros aceleradores de la serie MI300 y Se construirá utilizando tecnología avanzada de proceso de 3 nm, admitirá los tipos de datos AI FP4 y FP6 y tendrá hasta 288 GB de memoria HBM3E.
- Se espera que la arquitectura AMD CDNA “Next”, que impulsará los aceleradores AMD Instinct MI400 Series, esté disponible en 2026 y proporcione las últimas características y capacidades que ayudarán a desbloquear rendimiento y eficiencia adicionales para la inferencia y el entrenamiento de IA a gran escala.
Finalmente, AMD destacó que la demanda de aceleradores AMD Instinct MI300X continúa creciendo con numerosos socios y clientes que utilizan los aceleradores para impulsar sus exigentes cargas de trabajo de IA, que incluyen:
- Microsoft Azure utilizando los aceleradores para los servicios Azure OpenAI y las nuevas máquinas virtuales Azure ND MI300X V5 .
- Dell Technologies utiliza aceleradores MI300X en PowerEdge XE9680 para cargas de trabajo de IA empresarial .
- Supermicro brinda múltiples soluciones con aceleradores AMD Instinct .
- Lenovo impulsa la innovación en IA híbrida con el ThinkSystem SR685a V3
- HPE los está utilizando para acelerar las cargas de trabajo de IA en HPE Cray XD675 .