Pergunte ao especialista: o que é IA generativa?
Recentemente, expandimos o acesso ao Bard (disponível apenas em inglês, em 180 países e territórios), um experimento inicial que permite que você colabore com a inteligência artificial generativa. O Bard é alimentado por um grande modelo de linguagem, que é um tipo de modelo de aprendizado de máquina que se tornou conhecido por sua capacidade de gerar uma linguagem que parece natural. É por isso que você costuma ver descrito, alternativamente, como “IA generativa”. Como acontece com qualquer nova tecnologia, é normal que as pessoas tenham muitas perguntas – como "o que é exatamente a IA generativa".
Para falar sobre as dúvidas mais comuns a respeito da IA generativa, grandes modelos de linguagem, aprendizado de máquina e muito mais, conversamos com Douglas Eck, diretor sênior de pesquisa do Google. Doug não está apenas trabalhando na vanguarda da IA, mas também tem experiência em literatura e pesquisa musical. Essa combinação de técnica e criatividade o coloca em uma posição especial para explicar como a IA generativa funciona e o que isso pode significar para o futuro da tecnologia e da criatividade. Segue aqui o que ele disse.
Antes de mergulharmos na IA generativa, temos que falar sobre IA de forma mais ampla. É um daqueles termos intrigantes, mas muitas vezes meio nebulosos. O que exatamente é IA?
IA é um termo amplo frequentemente usado para descrever todos os tipos de sistemas avançados de computador. Prefiro falar mais especificamente sobre “aprendizado de máquina”. A maior parte do que vemos na IA hoje é, na verdade, aprendizado de máquina, ou seja: dotar sistemas de computador com a capacidade de aprender a partir de exemplos.
Chamamos as máquinas programadas para aprender a partir de exemplos de “redes neurais”. Uma das principais maneiras de aprender é recebendo muitos exemplos, como saber o que está aparecendo em uma imagem – chamamos isso de classificação. Se quisermos ensinar uma rede a reconhecer um elefante, isso envolveria um humano apresentando à rede vários exemplos de como um elefante se parece e marcando essas fotos de acordo com as descrições. É assim que o modelo aprende a distinguir entre um elefante e outros detalhes em uma imagem.
Os modelos de linguagem são um outro tipo de rede neural.
Como funcionam os modelos de linguagem?
Os modelos de linguagem basicamente prevêem qual palavra vem a seguir em uma sequência de palavras. Treinamos esses modelos com grandes volumes de texto para que eles entendam melhor qual palavra provavelmente virá a seguir. Uma maneira – mas não a única – de melhorar um modelo de linguagem é dando-lhe mais "leitura", ou treinando o modelo com mais dados, como aprendemos com os materiais que estudamos. Se você começasse a digitar a frase “Mary chutou uma…”, um modelo de linguagem treinado com dados suficientes poderia prever “Mary chutou uma bola ”. Sem treinamento suficiente, ele pode sugerir apenas um “objeto redondo” ou somente sua cor “amarela”. Quanto mais dados envolvidos no treinamento do modelo de linguagem, mais nuances são adquiridas e maiores são as chances de saber exatamente o que é mais provável que Mary tenha chutado.
Nos últimos anos, houve grandes avanços em como obter um melhor desempenho em modelos de linguagem, desde dimensionar o tamanho até reduzir a quantidade de dados necessários para determinadas tarefas.
Os modelos de linguagem já estão por aí ajudando as pessoas - você os vê aparecendo em recursos como o Smart Compose e o Smart Reply no Gmail, por exemplo. E os modelos de linguagem também abastecem o Bard.
Entendi. Bem, acabamos de definir IA e modelos de linguagem. E a IA generativa?
Um modelo generativo pode pegar o que aprendeu a partir dos exemplos mostrados e criar algo totalmente novo com base nessas informações. Daí a palavra “generativo”! Grandes modelos de linguagem (em Inglês: Large language models ou LLMs) são um tipo de IA generativa, pois geram novas combinações de texto por meio de uma linguagem que soa natural. E podemos até construir modelos de linguagem para gerar outros tipos de resultados, como novas imagens, áudio e até vídeo, como no Imagen, AudioLM e Phenaki.
Isso levanta uma grande questão que muitas pessoas têm: o que a IA generativa significa para os campos criativos e a criatividade em geral?
Eu acho que há um enorme potencial para o campo criativo – pense na remoção de parte do trabalho repetitivo em tarefas mundanas, como na criação de rascunhos, e não na invasão da sua criatividade inata. Como pesquisador de música, eu penso na IA generativa da mesma forma que alguém poderia ter pensado, décadas atrás, sobre a chegada da bateria eletrônica. A bateria eletrônica gerou um ritmo que era diferente de como os bateristas humanos soavam e isso abasteceu gêneros musicais inteiramente novos.
Como muitas músicas dos anos 80.
Isso, ou como o hip-hop evoluiu no Bronx com o uso da bateria eletrônica. Todo esse gênero foi avançado por esse novo desenvolvimento de tecnologia de back-end na música. A bateria eletrônica não substituiu os bateristas, apenas adicionou uma outra camada.
Claramente, há oportunidades nisso. Mas quais são os possíveis desafios?
Criei dois filhos e me formei em literatura antes de entrar para a ciência da computação, por isso eu me faço perguntas reais sobre como os educadores medem o sucesso em um mundo onde a IA generativa pode escrever uma boa redação de oitava ou nona série.
Se você pensar no passado, quando a calculadora gráfica surgiu, como os professores deveriam saber se seus alunos faziam os cálculos sozinhos? A educação avançou ao entender quais ferramentas os alunos tinham à sua disposição e exigindo que os alunos “mostrassem seu trabalho” de novas maneiras.
As empresas – incluindo a nossa – têm a responsabilidade de pensar no que esses modelos serão bons e em como garantir que isso seja uma evolução, em vez de uma disrupção.
Estou feliz que você mencionou a responsabilidade. Você pode falar sobre como o Google aborda o desenvolvimento do aprendizado de máquina?
Estamos e temos dedicado nosso tempo para fazer isso com atenção. Se construímos um produto, queremos ter certeza de que ele pode ser útil e evitar danos. Em 2018, estivemos entre as primeiras empresas a desenvolver e publicar os Princípios de IA e a implementar uma estrutura de governança interna para seguí-los. Nosso trabalho de IA hoje envolve o grupo responsável por IA no Google e muitos outros grupos focados em evitar preconceitos, toxicidade e outros danos durante o desenvolvimento de tecnologias emergentes.
Eu ouvi você dizer que esses grandes saltos técnicos já estão aparecendo de maneiras pequenas e úteis. Mas quão grande seria o salto da IA generativa para a sociedade?
Agora, sabemos que as máquinas podem resolver problemas simples, como a classificação de imagens e a geração de documentos. Mas acho que estamos preparados para capacidades ainda mais ambiciosas, como resolver problemas com raciocínio complexo. Hoje, a IA generativa pode ajudá-lo a escrever uma carta de formulário. Amanhã, pode reformular seus fluxos de trabalho e processos criativos e, desse modo, liberar você para resolver desafios completamente novos e com um novo estado de espírito. Por meio da colaboração e da experimentação ao longo do tempo, descobriremos ainda mais benefícios da IA generativa.