¿Qué es Auto-GPT y por qué es importante?
La búsqueda de Silicon Valley para automatizar todo es implacable, lo que explica su última obsesión: GPT automático.
Esencialmente, Auto-GPT utiliza la versatilidad de los últimos modelos de IA de OpenAI para interactuar con el software y los servicios en línea, lo que le permite realizar tareas «autónomas» como X e Y. Pero a medida que aprendemos con grandes patrones de lenguaje, esta capacidad parece ser tan amplia como un océano pero tan profundo como un charco.
Auto-GPT, que es posible que hayas visto explotar últimamente en las redes sociales, es una aplicación de código abierto creada por el desarrollador de juegos de Toran, Bruce Richards. que utiliza los modelos de generación de texto de OpenAI, principalmente GPT-3.5 y GPT-4, para actuar de forma «autónoma».
No hay magia en esta autonomía. Auto-GPT simplemente maneja los seguimientos desde un aviso inicial hasta los modelos de OpenAI, preguntándoles y respondiéndoles hasta que se complete una tarea.
Auto-GPT, básicamente, es GPT-3.5 y GPT-4 combinados con un bot complementario que les dice a GPT-3.5 y GPT-4 qué hacer. Un usuario le dice a Auto-GPT cuál es su objetivo y el bot, a su vez, usa GPT-3.5 y GPT-4 y múltiples programas para realizar todos los pasos necesarios para lograr su objetivo.
Lo que hace que Auto-GPT sea razonablemente capaz es su capacidad para interactuar con aplicaciones, software y servicios en línea y locales, como navegadores web y procesadores de texto. Por ejemplo, si recibe un aviso como «ayúdeme a hacer crecer mi negocio de flores», es posible que Auto-GPT desarrollar una estrategia publicitaria algo plausible y crear un sitio web básico.
Como Joe Koen, un desarrollador de software que experimentó con Auto-GPT, explicó a TechCrunch por correo electrónico, Auto-GPT esencialmente automatiza proyectos de varios pasos que habrían requerido ir y venir con un chatbot orientado al modelo de IA como, por ejemplo, ChatGPT de OpenAI. .
«Auto-GPT define un agente que se comunica con la API de OpenAI», dijo Koen. «El propósito de este agente es ejecutar una variedad de comandos que genera la IA en respuesta a las solicitudes del agente. Se le solicita al usuario que ingrese para especificar el rol y los objetivos de la IA antes de que el agente comience a ejecutar comandos. »
En una terminal, los usuarios describen el nombre, la función y el propósito del agente Auto-GPT y especifican hasta cinco formas de lograr ese objetivo. Por ejemplo:
- Apellido: Smartphone-GPT
- Role: Una IA diseñada para encontrar el mejor smartphone
- Objetivo: Encuentra los mejores smartphones del mercado
- Objetivo 1: Realice estudios de mercado para diferentes teléfonos inteligentes en el mercado actual
- Objetivo 2: Obtenga los cinco mejores teléfonos inteligentes y enumere sus ventajas y desventajas
Detrás de escena, Auto-GPT se basa en funciones como la administración de memoria para realizar tareas, así como GPT-4 y GPT-3.5 para la generación de texto, el almacenamiento de archivos y el resumen.
Auto-GPT también se puede conectar a sintetizadores de voz, como ElevenLabs’para que pueda «hacer» llamadas telefónicas, por ejemplo.
Auto-GPT está disponible públicamente en GitHub, pero requiere configuración y conocimientos para ponerse en marcha. Para usarlo, Auto-GPT debe estar instalado en un entorno de desarrollo como Docker, y debe estar registrado con una clave API de OpenAI, lo que requiere una cuenta paga de OpenAI.
Podría valer la pena, aunque el jurado está deliberando sobre eso. Los primeros usuarios utilizaron Auto-GPT para asumir el tipo de tareas mundanas que es mejor delegar en un bot. Por ejemplo, Auto-GPT puede manejar cosas como depurar código y escribir un correo electrónico o cosas más avanzadas como crear un plan de negocios para un nuevo inicio.
«Si Auto-GPT encuentra obstáculos o no puede completar la tarea, desarrollará nuevas indicaciones para ayudarlo a navegar la situación y determinar los próximos pasos apropiados», dijo Adnan Masood, el arquitecto jefe de UST, una empresa de consultoría tecnológica. TechCrunch en un correo electrónico. «Los grandes modelos de lenguaje sobresalen en la generación de respuestas similares a las humanas, pero dependen de las indicaciones y las interacciones del usuario para ofrecer los resultados deseados. Por el contrario, Auto-GPT aprovecha las capacidades avanzadas de la API de ‘OpenAI para operar de forma independiente sin la intervención del usuario’.
En las últimas semanas, han aparecido nuevas aplicaciones para hacer que Auto-GPT sea aún más fácil de usar, como AgenteGPT y GodMode, que proporciona una interfaz simple donde los usuarios pueden escribir lo que quieren lograr directamente en una página del navegador. Tenga en cuenta que, al igual que Agent-GPT, ambos requieren una clave API de OpenAI para desbloquear todas sus capacidades.
Sin embargo, como cualquier herramienta poderosa, Auto-GPT tiene sus limitaciones y riesgos.
Según el propósito proporcionado por la herramienta, Auto-GPT puede comportarse de maneras muy… inesperadas. un reddit usuario afirma que, dado un presupuesto de $100 para gastar en una instancia de servidor, Auto-GPT creó una página wiki sobre chats, explotó una falla en la instancia para obtener acceso de nivel de administrador y se hizo cargo del entorno de Python en el que se estaba ejecutando, y luego se «mató» a sí mismo.
También está ChaosGPT, una versión modificada de Auto-GPT cargada con objetivos como «destruir a la humanidad» y «establecer la dominación mundial». Como era de esperar, ChaosGPT no estuvo cerca de provocar el apocalipsis de los robots, pero lo hizo. tuiteó bastante poco halagador para la humanidad.
Sin embargo, los fallos imprevistos que pueden surgir en escenarios perfectamente normales son posiblemente más peligrosos que el Auto-GPT que intenta «destruir a la humanidad». Debido a que se basa en los modelos de lenguaje de OpenAI, modelos que, como todos los modelos de lenguaje, están sujetos a imprecisiones, puede cometer errores.
No es el único problema. Después de completar con éxito una tarea, Auto-GPT generalmente no recuerda cómo ejecutarla para su uso posterior, e incluso cuando lo hace, a menudo no recuerda usar el programa. Auto-GPT también tiene dificultades para desglosar de manera efectiva las tareas complejas en subtareas más simples y tiene dificultades para comprender cómo se superponen los diferentes objetivos.
«Auto-GPT ejemplifica el poder y los riesgos desconocidos de la IA generativa», dijo Clara Shih, directora ejecutiva de Service Cloud de Salesforce y entusiasta de Auto-GPT, por correo electrónico. “Para las empresas, es particularmente importante incluir un enfoque humano en el ciclo al desarrollar y utilizar tecnologías de IA generativa como Auto-GPT”.