El futuro de la IA generativa en la empresa podría ser modelos de lenguaje más pequeños y enfocados

El futuro de la IA generativa en la empresa podría ser modelos de lenguaje más pequeños y enfocados

Las asombrosas habilidades de ChatGPT de OpenAI no sería posible sin excelentes modelos de lenguaje. Estos modelos se entrenan en miles de millones, si no billones, de texto de muestra. La idea detrás de ChatGPT es comprender el idioma tan bien que pueda anticipar plausiblemente qué palabra viene en una fracción de segundo. Se necesita mucha capacitación, recursos informáticos y conocimientos de desarrollador para llegar allí.

Pero quizás el futuro de estos modelos esté más enfocado que el enfoque de hervir el océano que hemos visto de OpenAI y otros, que quieren poder responder todas las preguntas bajo el sol. ¿Qué pasaría si cada industria o incluso cada negocio tuviera su propio modelo formado para comprender la jerga, el lenguaje y el enfoque de la entidad individual? Quizás entonces obtendríamos menos respuestas completamente inventadas porque las respuestas provendrán de un universo más limitado de palabras y frases.

En un futuro impulsado por la IA, los propios datos de cada empresa podrían ser su activo más valioso. Si es una compañía de seguros, tiene un léxico completamente diferente al de un hospital, una compañía automotriz o una firma de abogados, y cuando combina eso con los datos de sus clientes y todo el contenido organizacional, tiene un modelo de lenguaje. Aunque puede que no sea grande, como en el sentido del modelo de lenguaje realmente grande, sería justo el modelo que necesitas, un modelo creado para uno y no para las masas.

LEER  Los precios promedio de las viviendas de Airbnb han aumentado, por lo que ahora se está reenfocando en las habitaciones para brindarles a los usuarios alternativas más asequibles.

También requerirá un conjunto de herramientas para recopilar, agregar y actualizar continuamente el conjunto de datos empresariales de una manera que lo haga inmanejable para estos pequeños modelos de lenguaje grande (sLLM).

Construir estos modelos podría representar un desafío. Es probable que aprovechen algo como el código abierto o los LLM existentes de una empresa privada y luego los perfeccionen en datos de la industria o de la empresa para ajustarlos aún más, todo en un entorno más seguro que la variedad genérica de LLM.

Esto representa una gran oportunidad para la comunidad de startups, y vemos que muchas empresas se adelantan a esta idea.

Más contenidos sobre empresas en América Latina

Deja una respuesta