Google I/O 2023: tornando a IA mais útil para todos
Nota do editor: abaixo estão trechos da palestra de abertura do CEO Sundar Pichai durante o Google I/O 2023.
Há sete anos, somos uma empresa que prioriza IA e agora estamos em um ponto de inflexão emocionante. Temos a oportunidade de tornar a IA ainda mais útil para as pessoas, para as empresas, para as comunidades e para todos.
Há algum tempo, aplicamos IA para tornar nossos produtos radicalmente mais úteis. Com IA generativa, estamos dando o próximo passo. Com uma abordagem ousada e responsável, estamos reinventando todos os nossos principais produtos, incluindo a Busca.
IA em nossos produtos
“Ajude-me a escrever” no Gmail
Há bons exemplos de como a IA generativa está nos ajudando a desenvolver nossos produtos, a começar pelo Gmail. Em 2017, lançamos o Smart Reply, com respostas curtas que você pode selecionar com apenas um clique. Em seguida, veio o Smart Compose, que oferece sugestões de escrita enquanto você digitava. O Smart Compose levou a recursos de escrita mais avançados alimentados por IA. Esses recursos foram usados no Workspace mais de 180 bilhões de vezes apenas no ano passado. E agora, com um modelo generativo muito mais potente, estamos dando o próximo passo no Gmail com "Ajude-me a escrever".
Digamos que você tenha recebido um e-mail informando que seu voo foi cancelado. A companhia aérea enviou um voucher, mas o que você realmente quer é um reembolso total. Você pode responder e usar o "Ajude-me a escrever".
Basta digitar o comando do que você deseja - um e-mail solicitando um reembolso total - clicar em criar e um rascunho completo aparecerá. Como você pode ver, ele extraiu convenientemente os detalhes do voo do e-mail anterior. E parece bem próximo do que você deseja enviar. Talvez você queira refiná-lo ainda mais. Nesse caso, um e-mail mais elaborado pode aumentar as chances de conseguir o reembolso. O “Ajude-me a escrever” começará a ser lançado como parte de nossas atualizações do Workspace. Assim como com o Smart Compose, você verá que o recurso vai ficar melhor com o tempo.
Nova visualização imersiva para rotas no Maps
Desde os primeiros dias do Street View, a IA juntou bilhões de imagens panorâmicas para que as pessoas pudessem explorar o mundo a partir de seus dispositivos. No I/O do ano passado, apresentamos o Immersive View, que usa IA para criar uma representação de alta fidelidade de um local, para que você possa ter a experiência de visitá-lo antes de sair de casa.
Agora, estamos expandindo essa mesma tecnologia para fazer o que o Maps faz de melhor: ajudar você a chegar aonde deseja. O Google Maps fornece 20 bilhões de quilômetros de direções, todos os dias - são muitas viagens. Imagine se você pudesse ver toda a sua viagem com antecedência. Agora você pode caminhar, andar de bicicleta ou dirigir usando a Visualização imersiva para rotas.
Digamos que você esteja na cidade de Nova York e quer dar um passeio de bicicleta. O Maps pode dar algumas opções próximas a você. O que fica parece à beira-mar parece cênico, mas você quer ter uma ideia disso primeiro. Ao clicar em “Visualização Imersiva para rotas”, você terá acesso a uma maneira totalmente nova de ver sua jornada. Você pode aumentar o zoom para obter uma visão panorâmica incrível do passeio.
Há mais informações disponíveis também. Você pode verificar a qualidade do ar, o tráfego e o clima e como eles vão mudando com o tempo.
O Immersive View para rotas começará a ser lançado nos próximos meses e será lançado em 15 cidades até o final do ano, incluindo Londres, Nova York, Tóquio e São Francisco.
Um passeio de bicicleta pela cidade de Nova York no novo Immersive View para rotas
Uma nova experiência do Magic Editor em Fotos
Outro produto aprimorado pela IA é o Google Fotos. Nós apresentamos o Google Fotos no I/O de 2015 e foi um dos nossos primeiros produtos embarcados com inteligência artificial. Avanços em aprendizado de máquina tornaram possível pesquisar em suas fotos coisas como pessoas, pôr do sol ou cachoeiras.
Claro, queremos que você faça mais do que apenas pesquisar fotos – também queremos ajudá-lo a torná-las melhores. Na verdade, todo mês, 1,7 bilhão de imagens são editadas no Google Fotos. Os avanços da IA nos permitem criar maneiras ainda mais poderosas de fazer isso. Por exemplo, o Magic Eraser, lançado primeiro no Pixel, usa fotografia computacional alimentada por IA para remover elementos indesejados da imagem. Neste ano, usando uma combinação de compreensão semântica e IA generativa, você pode fazer muito mais com uma nova experiência chamada Magic Editor.
Segue um exemplo: Esta é uma ótima foto, mas como pai, você provavelmente quer que seu filho seja o centro de tudo. E parece que os balões foram cortados nesta imagem. Então você pode ir em frente e reposicionar o aniversariante. O Magic Editor recria automaticamente partes do banco e balões que não foram capturados na foto original. E como toque final, você pode melhorar o céu. Isso também altera a iluminação no restante da foto para que a edição pareça consistente. É realmente mágico. Estamos ansiosos para lançar o Magic Editor no Google Fotos ainda este ano.
Tornando a IA mais útil para todos
Do Gmail ao Fotos e Maps, esses são apenas alguns exemplos de como a IA pode ajudar você em momentos importantes. E há muito mais que podemos fazer para oferecer todo o potencial da IA nos produtos que você conhece e adora.
Hoje, temos 15 produtos que atendem a mais de meio bilhão de pessoas e empresas. E seis desses produtos atendem a mais de dois bilhões de usuários cada. Isso nos dá muitas oportunidades de cumprir nossa missão — organizar as informações do mundo e torná-las universalmente acessíveis e úteis.
É uma missão atemporal que parece mais relevante a cada ano que passa. E olhando para o futuro, tornar a IA útil para todos é a maneira mais profunda de avançarmos em nossa missão. Estamos fazendo isso de quatro maneiras importantes:
- Primeiro, melhorando seu conhecimento e aprendizado e aprofundando sua compreensão do mundo.
- Em segundo lugar, aumentando a criatividade e a produtividade, para que você possa se expressar e fazer as coisas.
- Em terceiro lugar, permitindo que desenvolvedores e empresas criem seus próprios produtos e serviços transformadores.
- E, finalmente, construindo e implementando IA de forma responsável, para que todos possam se beneficiar igualmente.
PaLM 2 e Gemini
Estamos muito entusiasmados com as oportunidades que temos pela frente. Nossa capacidade de tornar a IA útil para todos depende do avanço contínuo de nossos modelos básicos. Então, quero reservar um momento para compartilhar a nossa abordagem.
No ano passado, você nos ouviu falar sobre PaLM, o que levou a muitas melhorias em nossos produtos. Hoje, estamos prontos para anunciar nosso mais recente modelo PaLM em produção: PaLM 2.
O PaLM 2 se baseia em nossa pesquisa e em nossa infraestrutura mais recente. É altamente capaz em uma ampla gama de tarefas e fácil de implantar. Estamos anunciando mais de 25 produtos e recursos desenvolvidos pelo PaLM 2 hoje.
Os modelos PaLM 2 oferecem excelentes recursos básicos em uma ampla variedade de tamanhos. Nós os chamamos carinhosamente de Gecko, Otter, Bison e Unicorn. O Gecko é tão leve que pode funcionar em dispositivos móveis... rápido o suficiente para ótimos aplicativos interativos no dispositivo, mesmo quando offline. Os modelos PaLM 2 são mais fortes em lógica e raciocínio graças ao amplo treinamento em tópicos científicos e matemáticos. Ele também é treinado em texto multilíngue – abrangendo mais de 100 idiomas – para entender e gerar resultados diferenciados.
Combinado com recursos potentes de programação, o PaLM 2 também pode ajudar os desenvolvedores que colaboram em todo o mundo. Digamos que você esteja trabalhando com um colega em Seul e fazendo o debug de um código. Você pode pedir para corrigir um bug e ajudar seu colega de equipe adicionando comentários em coreano ao código. Ele primeiro reconhece que o código é recursivo e, em seguida, sugere uma correção. Isso explica raciocínio por trás da correção e adiciona comentários em coreano como você pediu.
Embora o PaLM 2 seja altamente capaz, ele realmente se destaca quando ajustado ao conhecimento específico do domínio. Lançamos recentemente o Sec-PaLM, ajustado para casos de uso de segurança. Ele usa IA para detectar melhor os scripts maliciosos e pode ajudar os especialistas em segurança a entender e resolver as ameaças.
Outro exemplo é o Med-PaLM 2. Neste caso, focado em conhecimento médico. Ele alcançou uma redução de 9x no raciocínio impreciso quando comparado ao modelo, aproximando-se do desempenho de especialistas clínicos que responderam ao mesmo conjunto de perguntas. Na verdade, o Med-PaLM 2 foi o primeiro modelo de linguagem a funcionar no nível “expert” em questões de estilo de exame de licenciamento médico e atualmente é a tecnologia mais de ponta nessa frente.
Também estamos trabalhando para adicionar recursos ao Med-PaLM 2, para que ele possa sintetizar informações de imagens médicas, como filmes simples e mamografias. Você pode imaginar um assistente de IA que ajuda os radiologistas a interpretar imagens e comunicar os resultados. Estes são alguns exemplos de uso do PaLM 2 em domínios especializados. Mal podemos esperar para vê-lo sendo usado em mais possibilidades. E é por isso que tenho o prazer de anunciar que o PaLM 2 agora está disponível em pré-visualização.
O PaLM 2 é o passo mais recente em nossa jornada de uma década para levar a IA de maneira responsável a bilhões de pessoas. Ele se baseia no progresso feito por duas equipes de pesquisa de classe mundial, o Brain Team e o DeepMind.
Olhando para trás, para os avanços decisivos da IA na última década, essas equipes contribuíram para um número significativo deles: AlphaGo, Transformers, modelos de sequência a sequência e assim por diante. Tudo isso ajudou a preparar o terreno para o ponto de inflexão em que estamos hoje.
Recentemente, reunimos essas duas equipes em uma única unidade, o Google DeepMind. Utilizando os recursos computacionais do Google, eles estão focados em construir sistemas mais capazes, com segurança e responsabilidade.
Isso inclui nosso modelo de fundação de próxima geração, Gemini, que ainda está em treinamento. O Gemini foi criado desde o início para ser multimodal, altamente eficiente em integrações de ferramentas e API e construído para permitir inovações futuras, como memória e planejamento. Embora ainda seja cedo, já estamos vendo recursos multimodais impressionantes não vistos em modelos anteriores.
Uma vez ajustado e rigorosamente testado quanto à segurança, o Gemini estará disponível em vários tamanhos e capacidades, assim como o PaLM 2.
Responsabilidade da IA: Ferramentas para identificar o conteúdo gerado
À medida que investimos em modelos mais capazes, também estamos investindo profundamente na responsabilidade da IA. Isso inclui ter as ferramentas para identificar o conteúdo gerado sinteticamente sempre que você o encontrar.
Duas abordagens importantes são marcas d'água e metadados. A marca d'água incorpora informações diretamente no conteúdo de maneiras que são mantidas mesmo por meio de edição de imagem modesta. Avançando, estamos construindo nossos modelos para incluir marcas d'água desde o início.
Se você olhar para uma imagem sintética, é impressionante como ela parece real, então você pode imaginar o quão importante isso será no futuro. Os metadados permitem que os criadores de conteúdo associem contexto adicional aos arquivos originais, fornecendo mais informações sempre que você encontrar uma imagem. Garantiremos que todas as nossas imagens geradas por IA tenham esses metadados. Leia mais sobre nossa abordagem ousada e responsável.
Atualizações para Bard e Workspace
À medida que os modelos de AI ficam melhores e mais capazes, uma das oportunidades mais empolgantes é disponibilizá-los para que as pessoas se envolvam diretamente.
Essa é a oportunidade que temos com Bard, nosso experimento de IA conversacional. Estamos trazendo evoluções rápidas para o Bard, que oferece agora suporte a uma ampla gama de recursos de programação e está mais inteligente em questões de raciocínio e matemática. E, a partir de hoje, está rodando totalmente com PaLM 2. Leia mais sobre as últimas atualizações do Bard.
Também estamos trazendo novos recursos para o Google Workspace. Além de "Ajude-me a escrever" no Documentos e no Gmail, o Duet AI no Google Workspace fornece ferramentas para gerar imagens a partir de descrições de texto no Apresentações e no Meet, criar planos personalizados no Planilhas e muito mais. Leia mais sobre as últimas atualizações do Workspace.
Apresentando o Labs e nossa nova experiência generativa na Busca
Como a IA continua a melhorar rapidamente, estamos focados em fornecer recursos úteis para nossos usuários. A partir de hoje, vamos oferecer a você uma nova maneira de visualizar algumas das experiências no Workspace e em outros produtos. Chama-se Labs . Eu digo novo, mas o Google tem um longo histórico de uso do Labs como uma forma de permitir acesso antecipado e obter feedback.
Ao lado dos recursos do Workspace, uma das primeiras experiências que poderá ser testada no Labs envolve um dos principais produtos, a Busca do Google. A razão pela qual começamos a investir profundamente em IA há muitos anos é porque vimos a oportunidade de melhorar a Busca. A cada avanço, nós a tornamos mais útil e intuitiva.
As melhorias na compreensão do idioma nos permitem fazer perguntas com mais naturalidade e alcançar o conteúdo mais relevante da web. Os avanços na visão computacional também introduziram novas formas de pesquisar visualmente. Agora, mesmo que você não tenha palavras para descrever o que está procurando, pode pesquisar qualquer coisa que encontrar com o Google Lens. Atualmente, o Lens é usado para mais de 12 bilhões de pesquisas visuais por mês — um aumento de 4x em apenas dois anos. O Lens com a busca multimodal levou ao multisearch, que permite pesquisar usando uma imagem e um texto.
À medida que olhamos para o futuro, nosso profundo entendimento sobre as informações combinada com os recursos exclusivos da IA generativa pode transformar novamente o funcionamento da Busca, revelando perguntas totalmente novas que a nossa ferramenta de pesquisa pode responder e criando experiências cada vez mais úteis que conectam você à riqueza da Web.
É claro que a aplicação de IA generativa à pesquisa ainda está em seus primórdios. Pessoas de todo o mundo confiam na Busca em momentos importantes. Por isso, sabemos o quanto é importante fazer isso do jeito certo e continuar conquistando a confiança de todos. Isso é o que nos norteia.
Estamos abordando a inovação com responsabilidade, buscando o mais alto nível de qualidade da informação, como sempre fizemos desde o início. É por isso que estamos trazendo nossa nova experiência generativa na Busca para você primeiro no Labs.
Tornando mais fácil para os outros inovarem
Até agora, compartilhamos como a IA pode ajudar a desbloquear a criatividade, a produtividade e o conhecimento. Como você pode ver, a IA não é apenas um facilitador poderoso, mas também um elemento de transformação. Todas as empresas e organizações estão pensando em como conduzir essa transformação. É por isso que estamos focados em tornar fácil e escalável para outros inovarem com IA.
Isso significa fornecer a infraestrutura de computação mais avançada, incluindo TPUs e GPUs de última geração, e expandir o acesso aos modelos de base mais recentes do Google que foram rigorosamente testados em nossos próprios produtos. Também estamos trabalhando para fornecer as melhores ferramentas para que os clientes possam treinar, ajustar e executar seus próprios modelos – com segurança, proteção e privacidade de nível empresarial. Leia mais do CEO do Google Cloud, Thomas Kurian.
Impulsionando o progresso com o Android
Como você ouviu hoje, nossa abordagem arrojada e responsável da IA pode liberar a criatividade e o potencial das pessoas. Também queremos garantir que essa ajuda chegue ao maior número possível de pessoas. Fazemos isso por meio de nossas plataformas de computação, como o Android, e hoje compartilhamos como os avanços em AI podem tornar seu telefone ainda mais pessoal, incluindo Magic Compose, Cinematic Wallpapers e Generative AI Wallpapers.
Apresentamos os novos dispositivos Pixel para seu bolso e sua casa
Também estamos apresentando o Pixel 7a, o Pixel Fold e o Pixel Tablet para um ecossistema completo de dispositivos com IA desenvolvidos pelo Google. O Pixel 7a está disponível para compra a partir de hoje, e as pré-vendas estão abertas para Pixel Fold e Pixel Tablet.
Construindo o futuro juntos
Por fim, tenho refletido sobre as grandes mudanças tecnológicas das quais todos nós participamos. A mudança com IA é tão grande quanto possível, e é por isso que é tão importante que tornemos a IA útil para todos.
Estamos abordando isso com energia e uma sensação de entusiasmo. E estamos fazendo isso com responsabilidade de uma forma que reforça o profundo compromisso que temos em querer fazer da maneira correta.
Nenhuma empresa pode fazer isso sozinha. Nossa comunidade de desenvolvedores será chave para desbloquear as enormes oportunidades adiante. Estamos ansiosos para trabalhar juntos e construir juntos.