Miles de autores firman una carta instando a los fabricantes de IA a dejar de robar libros

Si le pide a GPT-4 que haga un pasaje al estilo de Carmen Machado, Margaret Atwood o Alexander Chee, hará un buen trabajo, y por una buena razón: probablemente absorbió todos sus trabajos en el proceso de capacitación y ahora usa su ingenio por el suyo propio. Pero estos autores, y miles de otros, no están satisfechos con este hecho.

En una carta abierta firmada por más de 8.500 autores Ficción, no ficción y poesía, las compañías de tecnología detrás de grandes modelos de lenguaje como ChatGPT, Bard, LLaMa y más están siendo reprendidas por usar su escritura sin permiso ni compensación.

“Estas tecnologías imitan y regurgitan nuestro lenguaje, nuestras historias, nuestro estilo y nuestras ideas. Millones de libros, artículos, ensayos y poesía con derechos de autor proporcionan el «alimento» para los sistemas de IA, comidas interminables por las que no ha habido factura», leemos en la carta.

Aunque sus sistemas demuestran ser capaces de citar e imitar a los autores en cuestión, los desarrolladores de IA no han abordado sustancialmente la procedencia de estos trabajos. ¿Están capacitados en muestras tomadas de bibliotecas y revistas? ¿Tomaron prestados todos los libros de la biblioteca? ¿O tal vez solo descargaron uno de los muchos archivos ilegales, como Libgen?

Una cosa es segura: no acudieron a los editores para obtener la licencia, sin duda el método preferido y posiblemente el único legal y ético. Como escriben los autores:

No solo la reciente decisión de la Corte Suprema en Warhol v. Goldsmith deja claro que la comercialización intensa de su uso va en contra del uso justo, pero ningún tribunal excusaría la copia de obras de origen ilegal como uso justo. Debido a la integración de nuestros escritos en sus sistemas, la IA generativa amenaza con dañar nuestra profesión al inundar el mercado con libros mediocres escritos a máquina, historias y periodismo basado en nuestro trabajo.

De hecho, hemos visto que esto suceda antes. Recientemente, se han publicado varios trabajos generados por IA de muy baja calidad. escalando las listas de los más vendidos de YA en Amazon; los editores están inundados de obras generadas; y todos los días este sitio web (y en breve, esta publicación) se recupera para que el contenido se reutilice como un amigo para SEO.

Estos actores maliciosos utilizan las herramientas, las API y los agentes desarrollados por OpenAI y Meta, que a su vez pueden considerarse actores maliciosos en este contexto. Después de todo, ¿quién más robaría a sabiendas millones de obras para impulsar un nuevo producto comercial? (Bueno, Google, claro, pero la indexación de búsqueda es significativamente diferente de la ingesta de IA, y Google Books al menos tenía la excusa de que se suponía que era un índice dedicado).

Con menos autores capaces de vivir de la escritura debido a las complejidades y los estrechos márgenes de la publicación a gran escala, la carta abierta advierte que esta es una situación insostenible para ellos, especialmente para los nuevos autores, “especialmente los escritores jóvenes y las voces de países subrepresentados”. comunidades ”

La carta pide a las empresas que hagan lo siguiente:

1. Obtenga permiso para usar nuestro material protegido por derechos de autor en sus programas generativos de IA.

2. Compensar a los autores de manera justa por el uso pasado y actual de nuestro trabajo en sus programas de IA generativa.

3. Compensar de manera justa a los escritores por el uso de nuestras obras en la producción de IA, ya sea que las publicaciones violen o no la ley aplicable.

No se hacen amenazas legales – como CEO de The Author’s Guild (y signataria) Mary Rasenberger dice NPR«Las demandas son una gran cantidad de dinero. Realmente toman mucho tiempo. Y AI ahora está lastimando a los perpetradores.

¿Qué empresa será la primera en decir «sí, construimos nuestra IA sobre obras robadas y lo sentimos, y vamos a pagar por ello»? Es una incógnita, pero parece haber pocos incentivos para hacerlo. La mayoría de las personas no saben o no les preocupa que los LLM se crean por medios ilícitos y, de hecho, pueden contener y regurgitar obras con derechos de autor. Es más fácil ver el problema (muy similar) cuando se trata de una imagen generada que replica el estilo distintivo de un artista, y hay algo de retrospectiva involucrada.

Pero el daño más sutil de usar todos los libros de George Saunders o Diana Gabaldon como «alimento» para su IA puede no incitar a tantas personas a la acción, incluso si muchos autores están dispuestos a luchar.

Más contenidos sobre empresas en América Latina