Un enfoque práctico para el contenido creativo y la formación en IA

La inteligencia artificial está acelerando el progreso de manera profunda, transformando todo, desde nuestras rutinas diarias hasta los límites del descubrimiento científico y la creatividad. Pero a medida que los avances en IA se aceleran, ¿cómo deberíamos promover un enfoque equilibrado en el uso de contenido creativo en el entrenamiento de modelos de IA? Esto va más allá de las cuestiones legales para abordar el futuro de la innovación en IA y la creatividad humana.
Cada nueva tecnología para la creación o transmisión de conocimiento y arte, desde la imprenta hasta Internet y la televisión por cable, ha planteado preguntas sobre cómo crear y compartir valor. En el caso de la IA, los desarrolladores pueden tomar diversas medidas para apoyar a las industrias creativas y ayudar a construir un ecosistema de IA próspero que beneficie a todos. ¿Qué enfoques tienen sentido para los resultados de los modelos de IA, el entrenamiento de esos modelos y las nuevas formas en que la IA puede crear valor compartido?
Evaluación de los resultados de la IA
Ya sea que las palabras se creen con un bolígrafo, una máquina de escribir o IA, o que las obras de arte se creen con un pincel, gráficos de computadora o IA, la pregunta es si una nueva obra infringe los derechos de autor de una anterior. Este juicio puede ser complejo, dependiendo de factores como la similitud de la nueva obra con la anterior, la naturaleza de las dos obras y si la nueva compite en el mercado por la original. Herramientas como los filtros de salida pueden ayudar a restringir resultados sustancialmente similares, incluso mientras los propios modelos aprenden a realizar evaluaciones más matizadas de estos factores.
Además, la información sobre la procedencia del contenido, como las marcas de agua o los metadatos, pueden reducir el riesgo de engaño sobre la autoría de un material en particular. Por ejemplo, Google fue pionero en la herramienta SynthID, líder en la industria, y se unió al comité directivo de la Coalición para la Procedencia y Autenticidad del Contenido (C2PA). Este tipo de iniciativas pueden ayudar a los consumidores a realizar evaluaciones informadas sobre el contenido que ven.
Entrenar modelos de IA de forma responsable
Si bien entrenar modelos de IA fundamentales con el contenido disponible en la web abierta es un uso justo transformador bajo la ley de derechos de autor de EE. UU., y muchos otros países tienen excepciones de minería de texto y datos que promueven de manera similar nuevos usos de la información, las buenas prácticas pueden ayudar a construir la aceptación de los nuevos usos de la IA del contenido existente.
Es importante adquirir contenido de manera responsable y legal, como dar a los sitios web la capacidad de optar por no permitir que el contenido o la información de sus sitios se utilicen para el entrenamiento de la IA. Los estándares de la industria existentes que rigen el rastreo web son una forma importante de lograr esto. Estos estándares son simples y escalables, y se basan en protocolos robot.txt legibles por máquina establecidos desde hace mucho tiempo y ampliamente utilizados en la web para controlar cómo los rastreadores web acceden a su contenido. Y ahora, miles de editores web también están utilizando el Protocolo extendido de Google y protocolos similares específicos de IA ofrecidos por otras empresas. Los desarrolladores de IA deben permanecer abiertos a la evolución de esos estándares a medida que el ecosistema progresa, y deben tomar medidas razonables para evitar entrenar indebidamente modelos de IA de propósito general de maneras que eludan esos estándares o medidas técnicas similares como muros de pago.
Cuando se trata de evitar el uso de las voces e imágenes de individuos, los marcos legislativos pueden basarse en los sistemas existentes de "notificación y eliminación" para los derechos de autor, incluyendo salvaguardias adecuadas para prevenir el abuso. Las nuevas herramientas también pueden ayudar a los creadores a aprovechar el potencial creativo de la IA, mientras les permiten mantener el control sobre su voz e imagen.
Compartiendo valor, ampliando oportunidades
La IA tiene el potencial de beneficiar a todos, y la colaboración entre los desarrolladores de IA y los editores de contenido puede expandir el mercado y generar nuevos ingresos para las industrias creativas.
Los desarrolladores de IA buscan compartir el valor de los resultados enviando tráfico relacionado a los proveedores de contenido. Y el ecosistema está trabajando en conjunto para encontrar nuevas formas de crear valor a partir de las aplicaciones de IA emergentes. Por ejemplo, puede haber oportunidades de asociaciones comerciales cuando los servicios de IA “fundamentan” las respuestas en datos de sitios web.
Los desarrolladores de IA y los editores de contenido también están trabajando juntos en nuevos acuerdos de contenido para el uso de datos especializados o no públicos con fines de capacitación. Los desarrolladores de IA están aprendiendo cada vez más a evaluar la utilidad del contenido individual para diferentes aplicaciones de IA. Por nuestra parte, Google ya ha firmado acuerdos con varios editores para obtener amplios derechos de datos y continuamos explorando nuevas oportunidades.
Los desarrolladores de IA están trabajando activamente con los medios y las industrias creativas para diseñar nuevas herramientas generativas de IA que agreguen valor a estas industrias. Por ejemplo, Pinpoint, una herramienta de IA para periodistas, ayuda a los reporteros a buscar en archivos de texto, audio, imágenes y videos para ver patrones en los datos, identificar nuevos ángulos o encontrar una cita en un archivo de video o audio.
La IA es una oportunidad compartida, con el potencial de expandir los ámbitos de la ciencia, el comercio y la creatividad. Estamos comprometidos a trabajar con todos los actores del ecosistema para crear un marco común donde tanto los derechos de los creadores como la innovación puedan prosperar.