NVIDIA está teniendo problemas para suplir GPUs a empresas de IA
Empresas como Astria que desarrollando tecnologías de IA, necesitan GPUs para entrenar software que aprende patrones en fotos y otros medios. Las GPUs también gestionan el aprovechamiento de esas lecciones para generar contenidos en respuesta a las indicaciones del usuario. Cada vez piden más y aún no hemos salido del todo de la escasez de componentes, y ni el líder del mercado que Nvidia, que representa entre el 60% y el 70% de la oferta mundial de chips de IA para servidores, puede terminar de suplir sus demandas.
Ayer anunciaron que en el segundo trimestre del año fiscal vendieron la cifra récord de 10.300 millones de dólares en GPU para centros de datos. Se espera que el gasto mundial en chips centrados en IA alcance los 53.000 millones de dólares este año y se duplique en los próximos cuatro. Pero La continua escasez obliga a innovar para mantener el acceso a los recursos que necesitan.
No hay suficientes chips para IA
Algunas emrpesas están haciendo un fondo común para asegurarse de no dejar a los usuarios en la estacada. Por parte de los proveedores de computación en nube son muy conscientes de que sus clientes tienen problemas de capacidad. El tiempo necesario para adquirir e instalar nuevas GPU en sus centros de datos ha retrasado a los gigantes de la nube, y las modalidades específicas de mayor demanda también añaden tensión.
El entrenamiento de los programas de IA generativa funciona mejor cuando las GPU están físicamente agrupadas, a veces en conglomerados de 10.000 chips a la vez. El cliente típico de IA generativa de AWS accede a cientos de GPU. Y dado su popularidad, ha habido problemas debido a un desabastecimiento anteriormente propiciado por la fiebre de las criptomonedas.
Por ello, están siendo considerados los servicios en la nuve, pero está lejos de ser perfecto. Google Cloud no ha sido capaz de satisfacer la demanda de su equivalente de GPU propia, conocida como TPU. La unidad de nube Azure de Microsoft ha ofrecido reembolsos a los clientes que no utilicen las GPU que reservaron.