El entrenamiento de grandes modelos de IA enfrenta un obstáculo, la escasez de potencia computacional provoca dificultades en la industria y respuestas.

robot
Generación de resúmenes en curso

Detrás de la escasez de potencia computacional: los dilemas y respuestas del entrenamiento de grandes modelos

El entrenamiento de grandes modelos está en auge, pero la escasez de GPUs de alta gama se ha convertido en un gran desafío para la industria. A pesar de que los precios siguen aumentando, el alquiler mensual de una GPU de primera clase ya alcanza entre 50,000 y 70,000 yuanes, pero aún así es difícil conseguir una. Esta situación de demanda superior a la oferta es difícil de aliviar a corto plazo, y las grandes empresas están calculando cuántas "mercancías" tienen en sus manos.

Sin embargo, el umbral de entrenamiento de modelos grandes no es tan simple como solo obtener GPU. Tomando como ejemplo un gran modelo meteorológico, su costo de entrenamiento supera los 2 millones de yuanes. Para los modelos grandes generales, es difícil continuar sin una inversión de miles de millones de fondos. Algunos emprendedores describen la competencia actual en el campo de los modelos grandes como "quemar dinero"; si no hay un sólido apoyo financiero, es difícil mantenerse.

Frente a esta dificultad, las empresas también están buscando activamente estrategias de respuesta. Algunos métodos incluyen: utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento; mejorar la capacidad de infraestructura para lograr un funcionamiento estable durante largos períodos; optimizar la programación de la Potencia computacional para aumentar la tasa de utilización; adoptar arquitecturas de supercomputación en lugar de arquitecturas de computación en la nube, entre otros. Además, algunas empresas eligen utilizar plataformas nacionales para el entrenamiento y la inferencia de grandes modelos, para sustituir los escasos GPU importados.

De hecho, la potencia computacional se está convirtiendo en un nuevo modelo de servicio. El servicio de potencia computacional se basa en una potencia computacional diversificada y, a través de una red de potencia computacional, tiene como objetivo proporcionar potencia computacional efectiva. No solo incluye potencia computacional, sino que también abarca el empaquetado unificado de recursos como almacenamiento y redes. En esta cadena de suministro, las empresas upstream suministran recursos básicos de potencia computacional, las empresas midstream se encargan de la producción y suministro de potencia computacional, y downstream son los usuarios industriales que dependen de los servicios de potencia computacional para agregar valor.

Con la normalización de la demanda de computación de alto rendimiento por parte de los modelos grandes, el servicio de potencia computacional está desarrollándose rápidamente como una cadena industrial y un modelo de negocio único. A pesar de que actualmente persisten problemas como la escasez de GPU de alta gama y altos costos, a largo plazo, la prestación de servicios de potencia computacional es una tendencia confirmada. Los proveedores de servicios de potencia computacional necesitan prepararse con antelación para los cambios del mercado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
TooScaredToSellvip
· hace23h
Sin poder, corre rápido, quemando efectivo.
Ver originalesResponder0
CompoundPersonalityvip
· hace23h
Me fui a minar con GPU. Adiós.
Ver originalesResponder0
RektButSmilingvip
· hace23h
El jugador de la explosión de tarjetas ha vuelto a aparecer.
Ver originalesResponder0
NeverPresentvip
· hace23h
Es increíble lo exagerado que está el precio de esta GPU.
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)