
AMD acelera Instinct MI355X 75 veces en DeepSeek V4 Pro con ROCm | TugaTech
- TugaTech»Hardware»Noticias de Hardware
Iniciar sesiónRegistrarse|
- Foro
*Portal
- Anfitrión
- Procurador
- Miembros
- Registrarse
- Iniciar sesión
Últimos assuntos
- »Garmin lanza actualización para smartwatches premium con 38 nuevas correcciones
Hoy a(s) 10:25 porDJPRMF
- »Los nuevos chips Qualcomm Dragonwing transforman enrutadores en centros multimedia con IA
Hoy a(s) 10:23 porDJPRMF
- »Preço dos combustíveis volta a subir mas o gobernador trava o impacto
Hoy à(s) 10:18 porDJPRMF
- »Spotify invierte en la gestión de contenidos artificiales y arrisca afastar usuarios
Hoy à(s) 10:16 porDJPRMF
- »Estudo da NASA revela a melhor tática para intercetar comunicações alienígenas
Hoy a(s) 10:11 porDJPRMF
- »Los creadores del NotebookLM encerraron la aplicación Huxe frente a la presión de las grandes tecnologías
Hoy a(s) 10:09 porDJPRMF
- »Record Club es una nueva red para organizar e registrar todo lo que ouves
Hoy a(s) 9:17 porDJPRMF
- »Atalho no Windows junta todas las definiciones y accesorios numa única janela
Hoy a(s) 9:05 porDJPRMF
- »Nueva actualización de HyperOS 3 corrige falhas irritantes en los telemóveis de Xiaomi
Hoy a(s) 8:58 porDJPRMF
- »Trabajadores de Microsoft y Meta disparam os custos da IA com consumo extremo
Hoy a(s) 8:56 porDJPRMF
- »Novo Tails 7.8 refuerza la seguridad y lo hace con Thunderbird
Ontem à(s) 22:10 porDJPRMF
- »El nuevo navegador Vivaldi 8.0 transforma el diseño y ignora la inteligencia artificial
Ontem à(s) 21:53 porDJPRMF
- »Infomaniak transfiere derechos para fundação para proteger la privacidade e independencia
Ontem à(s) 21:52 porDJPRMF
- »Stability AI lanza Stable Audio 3.0 para reproducir música cada seis minutos
Ontem à(s) 21:51 porDJPRMF
- »Nitrux 6.1.0 actualizado con el nuevo kernel Linux y optimizaciones de desarrollo
Ontem à(s) 21:50 porDJPRMF
- »Google AI Studio chega aos telemóveis com versión Android y pre-registro no iOS
Ontem à(s) 21:49 porDJPRMF
- »Conceito para o Explorador de Ficheiros resolver limitaciones de Windows 11
Ontem à(s) 21:48 porDJPRMF
- »Stellantis y Qualcomm reforçam parceria para criar carros con procesadores Snapdragon
Ontem à(s) 21:44 porDJPRMF
- »Rádio Popular alvo de alegado ataque com exposição de dados de clientes
Ontem à(s) 20:37 porDJPRMF
- »Producción de pantallas OLED para el nuevo MacBook Pro arranca desde junio
Ontem à(s) 19:49 porDJPRMF Siga-nos Siga en Google NotíciasInscreva-se na newsletterApoie com um café TugaTech»Hardware»Noticias de hardware»AMD Acelera Instinct MI355X en 75 horas en DeepSeek V4 Pro con ROCm
AMD Acelera Instinct MI355X en 75 horas en DeepSeek V4 Pro con ROCm
Publicado el 05/12/2026 La inteligencia artificial generativa continúa a consolidarse como una gran revolución tecnológica de esta década, partilhando el mesmo patamar de impacto que la propia creación de Internet. Se o mercado global asiste a una verdadeira corrida ao ouro com inversiones avultadas no setor, el año de 2026 está a marcar o ponto em que o hardware atinge novos limites de eficiencia. En segundo lugar, revelamos el análisis de SemiAnalysis en la red social X, un equipo de ingenieros de AMD que siguió una fe en apenas 14 días: optimizamos la plataforma de software ROCm para que el acelerador Instinct MI355X registre un salto de desempenho de 75 veces en la ejecución del modelo DeepSeek V4 Pro. Enquanto muitas organizações ainda procuram rentabilizar as suas infraestruturas de IA, as fabricantes de silício continuam a capitalizar com a enorme procura. NVIDIA mantiene el liderazgo destacado en las recetas mundiales, pero AMD muestra ahora que la optimización del software puede generar distancia en el procesamiento de dos modelos de código abierto más avanzados en el mercado.
El Salto Exponencial en Dos Semanas
El progreso registrado en el equipo de AMD sigue una línea de evolución sorprendente para el procesamiento de grandes modelos de lenguaje. El 25 de abril de 2026, el acelerador MI355X presentaba dificultades evidentes para correr DeepSeek V4 Pro, ficandose por unos modestos 80 tokens por segundo en cada GPU. Sin embargo, el escenario cambió radicalmente en el inicio de mayo. No el día 2, una gran optimización elevó el registro para más de 500 tokens por segundo, ultrapasando a la fasquia dos 600 tokens logo dos días después. El culminar este esfuerzo concentrado chegou el 8 de mayo, con el hardware atingir a la marca dos 1.500 tokens por segundo por GPU. De acuerdo con los datos divididos, a chave para esta optimización profunda esteve na combinación estratégica de operaciones mHC y na fusão de transformações _Hadamard RoPE_. Este abordaje técnico permite reducir sustancialmente la sobrecarga del procesador central y maximizar la longitud de la banda de la memoria HBM integrada en el acelerador.
El dominio de NVIDIA y la respuesta del silicio chino
…

