Novedades en Hot Chips: Inferencia, redes e innovación en IA a toda escala impulsadas por NVIDIA

La carrera por la supremacía en la inteligencia artificial se intensifica, y la optimización de la inferencia –el proceso por el cual las redes neuronales aplican lo aprendido para tomar decisiones– se ha convertido en el nuevo campo de batalla. La próxima semana, en la conferencia Hot Chips, que se celebrará en la Universidad de Stanford del 24 al 26 de agosto, los arquitectos de procesadores y sistemas de la industria y la academia se reunirán para discutir los últimos avances en este ámbito crucial. El mercado de la computación para centros de datos, valorado en más de un billón de dólares, depende cada vez más de la capacidad de procesar datos de manera eficiente y rápida, impulsando la demanda de soluciones innovadoras en hardware y software.

Según la investigación publicada por el blog de NVIDIA, la conferencia Hot Chips se perfila como un escaparate de las tecnologías que permitirán construir las “fábricas de IA” del futuro, con un enfoque particular en el razonamiento, la inferencia y las redes de alto rendimiento.

NVIDIA, junto con gigantes tecnológicos como Google y Microsoft, liderará una sesión tutorial el domingo 24 de agosto, dedicada al diseño de arquitecturas a escala de rack para centros de datos. Esta sesión abordará los desafíos de interconectar miles de procesadores y aceleradores para maximizar el rendimiento y la eficiencia energética. La creciente complejidad de los modelos de IA, como los grandes modelos de lenguaje (LLM), exige arquitecturas de red cada vez más sofisticadas para evitar cuellos de botella en la comunicación de datos. De hecho, el gasto global en infraestructura de IA se proyecta que alcance los 300.000 millones de dólares para 2026, según datos de IDC.

La empresa presentará cuatro sesiones y un tutorial que detallan cómo sus tecnologías de networking, incluyendo la tarjeta de red ConnectX-8 SuperNIC, optimizan el razonamiento de la IA a escala de rack y centro de datos. Idan Burstein, arquitecto principal de adaptadores de red y sistemas en chip de NVIDIA, profundizará en las capacidades de esta tecnología. Paralelamente, Marc Blackstein, director senior de arquitectura, mostrará los avances en renderizado neuronal y los saltos masivos en inferencia impulsados por la arquitectura Blackwell de NVIDIA, incluyendo la GPU GeForce RTX 5090, que prometen capacidades gráficas y de simulación de última generación. El renderizado neuronal, una técnica que utiliza IA para generar imágenes realistas, está ganando terreno en industrias como el entretenimiento, la arquitectura y la ingeniería.

Otro punto clave de la conferencia será la presentación de Gilad Shainer, vicepresidente senior de networking de NVIDIA, sobre los interruptores ópticos coempaquetados (CPO) con fotónica de silicio integrada. Esta tecnología, que utiliza fibra óptica en lugar de cables de cobre para transmitir información, ofrece velocidades de transmisión más altas y un menor consumo de energía, lo que la convierte en una solución ideal para las fábricas de IA a escala de gigavatio. Shainer también destacará NVIDIA Spectrum-XGS Ethernet, una tecnología que unifica centros de datos distribuidos en supercomputadoras de IA. La adopción de CPO está experimentando un crecimiento significativo, con un mercado global proyectado de más de 10.000 millones de dólares para 2028, según estimaciones de LightCounting Market Research.

Finalmente, Andi Skende, ingeniero distinguido senior de NVIDIA, presentará el chip GB10 Superchip, el motor que impulsa la computadora de escritorio DGX Spark. La conferencia también explorará cómo NVIDIA CUDA, la plataforma de computación paralela más utilizada en el mundo, permite a los desarrolladores implementar y ejecutar modelos de IA en una amplia gama de dispositivos, desde sistemas a escala de rack como el GB200 NVL72 hasta PC y estaciones de trabajo. La compatibilidad con formatos de baja precisión como NVFP4, que optimizan la inferencia de LLM, será otro tema destacado. La democratización del acceso a la IA, facilitada por plataformas como CUDA, está impulsando la innovación en una amplia gama de industrias, desde la atención médica hasta las finanzas.