Los desarrolladores buscan formas creativas de crear asistentes de bots conversacionales impulsados por IA
Desde que OpenAI presentó ChatGPT el año pasado, ha sido casi imposible pasar un día sin que una empresa o un desarrollador lance una herramienta impulsada por IA. Ahora, con el lanzamiento de nuevos modelos como GPT-4 de OpenAI y Claude de Anthropic, cada vez más creadores de aplicaciones están probando herramientas que son más accesibles y útiles para las personas.
Algunas aplicaciones ofrecen una experiencia móvil o de escritorio nativa que permite a las personas hablar con bots de chat impulsados por IA fuera del navegador web. Su idea principal es ganar dinero desbloqueando el acceso ilimitado a estos bots y brindando información rápida a los usuarios.
Sin embargo, algunos desarrolladores quieren ir más allá y están trabajando para integrar mejor sus aplicaciones en el sistema. Ya ha habido algunos intentos de hacer que estas aplicaciones sean compatibles con Siri a través de accesos directos. Así, los usuarios pueden hacer preguntas a ChatGPT (o cualquier otro modelo) a través de voz o incluso de texto. Esto les da una ventaja en los casos en que Siri no puede entender la consulta de un usuario, simplemente pueden usar el teclado para escribir una pregunta para el bot impulsado por IA.
un ejemplo es Cortocircuitouna aplicación desarrollada por Joe Fabisevitch, un ex empleado de Twitter convertido en desarrollador independiente. La aplicación te permite chatear con un bot llamado Shorty. Viene con indicaciones sugeridas para planes de entrenamiento, planes de comidas, escribir canciones divertidas y descubrir datos divertidos sobre un tema. También te permite usar el comando «Hey Siri, Hey Shorty» para hacer preguntas por voz.
Fabisevich dijo que las herramientas lo ayudaron a escribir una descripción de la tienda de aplicaciones, intercambiar ideas sobre sugerencias de optimización de la tienda de aplicaciones y escribir el código de compra en la aplicación. Agregó que el equipo de desarrollo detrás de Short Circuit está explorando formas de integrar la aplicación con todo tipo de automatización mediante atajos.
la gente en MacStories fue más allá al desarrollar un atajo llamado S-GPTque está integrado en muchas partes de macOS e iOS.
La herramienta puede resumir una página web compartida a través de la hoja para compartir de Safari; puede ayudar con la gestión del tiempo para comprender qué días tiene una agenda ocupada; verifique el texto en su portapapeles en busca de errores gramaticales; y ofrece abrir enlaces de la respuesta de ChatGPT en varias pestañas de Safari.
Pero la característica que más se destaca por ser divertida es que puede pedirle a S-GPT que cree una lista de reproducción basada en un aviso. Por ejemplo, cuando pides «Hazme una lista de reproducción con 15 canciones de rock de principios de la década de 2000», esa lista se guardará en Apple Music. Herramientas como PlaylistAI han lanzado funciones como generar listas de reproducción a través de indicaciones para Spotify. Pero el esfuerzo de S-GPT parece más integrado dado que usa Apple Music.
Federico Viticci de MacStories menciona que también puede ingresar consultas complejas como «Créeme una lista de reproducción con 25 dulces canciones de indie rock lanzadas entre 2000 y 2010 y ordénelas por año de publicación, desde la más antigua hasta la más reciente».
Los desarrolladores también afirman que S-GPT es mejor que Siri cuando se trata de conversaciones de ida y vuelta. De hecho, la herramienta lo invita a hacer preguntas de seguimiento si lo desea. Tener un aviso visual ayuda en algunos casos, ya que Siri a menudo tiende a olvidar el contexto de la conversación.
Los desarrolladores S-GPT y Short Circuit mencionan que Siri a menudo solo lee textos largos de una fuente como Wikipedia, lo que puede ser engorroso. Argumentan que es más fácil leer un texto un poco más largo en la pantalla.
Los modelos con tecnología GPT son más útiles que Siri en los casos en que necesitan generar texto, resumir texto y presentar más información sobre el tema de múltiples fuentes. Fabisevich dijo por correo electrónico que el mejor beneficio de estos grandes modelos de lenguaje es cómo reducen el «ciclo de pasar por múltiples búsquedas en Google».
Dijo que los usuarios de Short Circuit han encontrado casos de uso que van desde la planificación de comidas hasta la búsqueda de más información sobre un ave mientras observan aves, problemas de codificación y generación de guiones.
Sin embargo, cuando se trata de conocer datos como las condiciones meteorológicas de mañana o el marcador del último partido, Siri (o cualquier asistente equivalente) siempre es superior. Fabisevich dijo que es por eso que hay un botón de verificación de hechos en la aplicación, que lo lleva a la página de resultados de búsqueda de Google con la respuesta como consulta.
«Todavía no confío en los resultados que me da ChatGPT y me encuentro verificando información que parece poco intuitiva o sospechosa. A veces mi intuición es incorrecta y ChatGPT tiene razón, pero ese escepticismo es lo que me llevó a crear una función de verificación de hechos en Cortocircuito. Aunque GPT-4 es mejor con las alucinaciones, sigo pensando que las alucinaciones van a ser un gran problema para los grandes modelos de lenguaje”, dijo.
Incluso Bing de Microsoft Y Bardo de Google suelen fallar cuando se les pregunta sobre hechos actuales o hechos históricos. Entonces, en este sentido, los asistentes de inteligencia artificial de la generación actual en los teléfonos son menos propensos a difundir información errónea, ya que simplemente lo dirigirían a una búsqueda en la web si no conocen un tema. Los chatbots de IA también carecen de velocidad porque tienen que consultar un servidor (como OpenAI) para obtener respuestas a una consulta.
Esta primera ola de bots impulsados por GPT no está tratando exactamente de reemplazar a Siri. Pero intentan ponértelo fácil a la hora de pedir sugerencias o ideas. Además de las mencionadas, herramientas como CualquierGPT Y MacGPT facilite el acceso a ChatGPT en Mac, pero no ofrezca cosas como la integración de comandos de voz.
Dado que Google y Apple organizarán sus conferencias anuales para desarrolladores en los próximos meses, será interesante ver cómo actualizan sus asistentes. Según los informes, varios equipos de Apple, incluido el equipo de Siri, han experimentado con modelos de lenguaje grandes.
Al mismo tiempo, los desarrolladores esperan tener acceso a más automatización a nivel de sistema para usar estos grandes modelos de lenguaje. Un análisis reciente de varias empresas sugiere que las descargas de los consumidores y el gasto en aplicaciones impulsadas por IA se han disparado en los últimos meses. Por lo tanto, a los desarrolladores les gustaría aprovechar esta ola de IA generativa.