Para gigantes de la IA, a veces más pequeño es mejor

Tiempo de lectura: 3 minutos
Por Maria Lopez
- en
Modelos de IA más pequeños y optimizados con fondo de signos de dólar.

Las grandes empresas tecnológicas y las startups ahora se están centrando en modelos de IA más pequeños y eficientes según el WSJ. Al principio, su objetivo era construir modelos muy grandes como el GPT-4 de OpenAI, que usan billones de parámetros y cuestan más de 100 millones de dólares para crear. Sin embargo, ahora están trabajando en modelos más pequeños y económicos con menos parámetros.

Microsoft ofrece su familia de modelos pequeños Phi, que son solo una centésima parte del tamaño del modelo gratuito que utiliza ChatGPT de OpenAI. Estos modelos son menos costosos de entrenar y ejecutar, pero aún así tienen un buen rendimiento.

Los modelos de IA pequeños utilizan datos limitados y están diseñados para tareas específicas, lo que les permite:

  • Rentable
  • Respuesta más rápida
  • Especializado

El Director Comercial de Microsoft, Yusuf Mehdi, comentó que mantener grandes modelos de inteligencia artificial será demasiado costoso a largo plazo.

Los modelos más pequeños pueden ejecutarse en dispositivos, lo que elimina la necesidad de supercomputadoras en la nube costosas. Apple busca utilizar la inteligencia artificial en los teléfonos para hacerlos más rápidos y seguros. Otras empresas tecnológicas están siguiendo la misma tendencia.

Beneficios de Costos y Rendimiento

Microsoft inicialmente invirtió considerablemente en IA generativa, pero descubrió que los modelos grandes eran más costosos de lo previsto. Modelos más pequeños como Phi requieren menos datos y poder de procesamiento, lo que los hace más económicos. Este año, Google y startups como Mistral, Anthropic y Cohere también han lanzado modelos más pequeños.

El uso de modelos más pequeños puede reducir significativamente los costos. Yoav Shoham, cofundador de AI21 Labs, mencionó que estos modelos pueden responder preguntas a una sexta parte del coste de los modelos más grandes. Los modelos más pequeños funcionan bien cuando se personalizan en conjuntos de datos específicos, como documentos legales o comunicaciones internas, ofreciendo casi la misma calidad a un costo inferior.

Puntos clave sobre los modelos más pequeños:

  • Menor uso de datos
  • Costos de entrenamiento reducidos
  • Eficiente para tareas específicas

Experian ha reemplazado sus chatbots de IA que utilizaban modelos grandes por otros más pequeños. Ali Khan, el Director de Datos, mencionó que los modelos más pequeños funcionaban igual de bien y ahorraban mucho dinero. Además, estos modelos pequeños tienen menos probabilidades de dar respuestas incorrectas, lo que los hace más eficientes.

Las tendencias actuales están definiendo lo que vendrá a continuación.

El avance de los grandes modelos de IA se ha desacelerado, lo que brinda una oportunidad para que los modelos más pequeños mejoren. Desde que OpenAI lanzó GPT-4, no ha habido grandes adelantos en los modelos grandes. La escasez de nuevos datos de alta calidad para el entrenamiento ha provocado esta disminución en el ritmo de progreso.

Microsoft ahora se está centrando en hacer que la inteligencia artificial sea más eficiente. Sébastien Bubeck, el líder del proyecto Phi model en Microsoft, afirmó que poner el foco en la eficiencia es crucial en este momento.

En resumen:

  • Progreso lento en modelos grandes
  • Mayor enfoque en la eficiencia
  • Modelos pequeños que realizan tareas específicas de manera eficiente

Aunque las empresas están avanzando en una nueva dirección, todavía utilizan modelos grandes. Apple y Microsoft están incorporando la tecnología de OpenAI en sus productos, pero esto representa solo una pequeña parte de lo que ofrecen en términos de inteligencia artificial. Apple también mencionó de manera breve sus actualizaciones de IA durante una reciente presentación.

El cambio hacia modelos de IA más pequeños y especializados indica una transición de crear grandes demostraciones llamativas a hacer la inteligencia artificial útil y asequible para las empresas. Ahora el enfoque está en aplicaciones prácticas, facilitando el acceso a la IA y haciéndola eficiente para tareas diarias.

Inteligencia Artificial: Últimas noticias

Compartir este artículo

Comentarios (0)

Publicar un comentario
NewsWorld

NewsWorld.app es un sitio de noticias premium gratuito. Proporcionamos noticias independientes y de alta calidad sin cobrar por artículo y sin un modelo de suscripción. NewsWorld cree que las noticias generales, de negocios, económicas, tecnológicas y de entretenimiento deberían ser accesibles a un alto nivel de forma gratuita. Además, NewsWorld es increíblemente rápido y utiliza tecnología avanzada para presentar artículos de noticias en un formato altamente legible y atractivo para el consumidor.


© 2024 NewsWorld™. Todos los derechos reservados.