Uma abordagem prática para conteúdo criativo e treinamento de IA

A inteligência artificial está acelerando o progresso de maneiras profundas, transformando desde nossas rotinas diárias até as fronteiras da descoberta científica e da criatividade. Mas, à medida que os avanços em IA se intensificam, como promover uma abordagem equilibrada para o uso de conteúdo criativo no treinamento de modelos de IA? Essa discussão vai além de questões legais e toca o futuro da inovação em IA e da criatividade humana.
Toda nova tecnologia para criação ou transmissão de conhecimento e arte — da imprensa à internet e à TV a cabo — levanta questões sobre como criar e compartilhar valor. No caso da IA, desenvolvedores podem adotar diversas medidas para apoiar as indústrias criativas e ajudar a construir um ecossistema de IA próspero que beneficie a todos. Quais são as abordagens mais adequadas para os resultados gerados por modelos de IA, o treinamento desses modelos e as novas formas pelas quais a IA pode gerar valor compartilhado?
Avaliando os resultados da IA
Seja com caneta, máquina de escrever ou IA, ou com pincel, gráficos de computador ou IA, a questão é se uma nova obra infringe os direitos autorais de uma obra anterior. Esse julgamento pode ser complexo, dependendo de fatores como o grau de semelhança entre as obras, a natureza de cada uma e se a nova compete com a original no mercado. Ferramentas como filtros de saída podem ajudar a restringir resultados substancialmente semelhantes, ao mesmo tempo que os próprios modelos aprendem a fazer avaliações mais sutis desses fatores.
Informações sobre a origem do conteúdo, como marcas d’água ou metadados, também podem reduzir o risco de engano sobre quem é o autor de determinado material. Por exemplo, o Google desenvolveu a ferramenta SynthID, referência no setor, e participa do comitê gestor da Coalition for Content Provenance and Authenticity (C2PA). Esforços como esses ajudam os consumidores a fazer avaliações mais informadas sobre o conteúdo que acessam.
Treinando modelos de IA de forma responsável
Embora o treinamento de modelos fundamentais de IA com conteúdo disponível na web aberta seja considerado uma forma transformadora de uso justo, segundo a legislação dos EUA, e muitos outros países contem com exceções para mineração de texto e dados que também incentivam novos usos da informação, boas práticas podem ajudar a aumentar a aceitação do uso de conteúdo existente por modelos de IA.
É importante adquirir conteúdo de forma responsável e legal, por exemplo, oferecendo aos sites a possibilidade de optar por não permitir que seu conteúdo seja usado no treinamento de IA. Os padrões já existentes para rastreamento da web são uma maneira eficaz de garantir isso. Esses padrões são simples, escaláveis e baseiam-se em protocolos de exclusão por robôs (robot.txt), amplamente usados na internet para controlar o acesso de rastreadores ao conteúdo. Atualmente, milhares de publicadores também utilizam o protocolo Google-Extended e outros protocolos específicos para IA oferecidos por diferentes empresas. Os desenvolvedores de IA devem permanecer abertos à evolução desses padrões e tomar medidas razoáveis para evitar o uso indevido de conteúdo por modelos de uso geral de IA, especialmente de formas que contornem esses padrões ou outras medidas técnicas, como paywalls.
Em relação ao uso de vozes e imagens de pessoas, marcos legais podem se apoiar em sistemas já existentes de “notificação e remoção” de conteúdo protegido por direitos autorais, incluindo salvaguardas adequadas para prevenir abusos. Novas ferramentas também permitem que criadores aproveitem o potencial criativo da IA, mantendo o controle sobre sua voz e imagem.
Compartilhando valor e ampliando oportunidades
A IA tem o potencial de beneficiar a todos, e a colaboração entre desenvolvedores de IA e produtores de conteúdo pode expandir o mercado e gerar novas fontes de receita para as indústrias criativas.
Desenvolvedores de IA estão buscando formas de compartilhar o valor gerado pelos resultados, como direcionando tráfego relacionado aos provedores de conteúdo. O ecossistema também está se unindo para encontrar novas formas de criar valor a partir de aplicações emergentes de IA. Por exemplo, pode haver oportunidades de parcerias comerciais quando serviços de IA “fundamentam” suas respostas em informações de sites da web.
Desenvolvedores de IA e produtores de conteúdo também estão colaborando em novos acordos para uso de dados especializados ou não públicos em treinamentos. Os desenvolvedores estão cada vez mais aprendendo a avaliar a utilidade de conteúdos específicos para diferentes aplicações. No nosso caso, o Google já firmou acordos com vários publicadores para uso amplo de dados e continua explorando novas oportunidades.
Desenvolvedores de IA estão trabalhando ativamente com as indústrias da mídia e criativa no desenvolvimento de novas ferramentas generativas que agreguem valor a esses setores. Por exemplo, o Pinpoint, uma ferramenta de IA para jornalistas, ajuda repórteres a buscar em arquivos de texto, áudio, imagem e vídeo para identificar padrões, encontrar novos ângulos ou localizar uma citação em um arquivo audiovisual.
A IA representa uma oportunidade compartilhada, com potencial para expandir os limites da ciência, do comércio e da criatividade. Estamos comprometidos a trabalhar com todos os atores do ecossistema para construir um modelo comum em que os direitos dos criadores e a inovação prosperem juntos.