Apresentando o PaLM2
Quando você olha para os maiores avanços em Inteligência Artificial (IA) na última década, o Google tem estado na vanguarda de muitos deles. Nosso trabalho inovador em modelos de base foi o ponto de partida para a indústria e para muitos produtos baseados em IA que bilhões de pessoas usam todos os dias. À medida que continuamos avançando responsavelmente nessas tecnologias, há um grande potencial para usos transformacionais em áreas tão abrangentes quanto a saúde e a criatividade humana.
Ao longo da última década de desenvolvimento de IA, aprendemos que não só o que é possível quando você amplia as redes neurais — na verdade, já vimos capacidades surpreendentes e maravilhosas emergirem de modelos de tamanho maior- como também aprendemos, por meio de nossa pesquisa, que não é tão simples quanto “quanto maior, melhor” e que a criatividade na pesquisa é fundamental para a construção de ótimos modelos. Avanços mais recentes em como arquitetamos e treinamos modelos nos ensinaram como desbloquear a multimodalidade, a importância de ter feedback humano no circuito e como construir modelos de forma eficiente. Essas são peças fundamentais para continuar na nossa jornada de pesquisa sobre IA enquanto também construímos modelos que podem trazer benefícios reais para as pessoas em suas vidas.
Conhecendo o PaLM 2
Com base nesse trabalho, hoje estamos apresentando o PaLM 2, nosso modelo de linguagem de próxima geração. O PaLM 2 é um modelo de linguagem de última geração com recursos multilíngues, de raciocínio e de codificação:
- Multilinguagem: PaLM 2 foi fortemente treinado em texto multilíngue, abrangendo mais de 100 idiomas. Isso melhorou significativamente sua capacidade de entender, gerar e traduzir texto com nuances - incluindo expressões idiomáticas, poemas e enigmas - em uma ampla variedade de idiomas, um problema difícil de resolver. O PaLM 2 também é capaz de ser aprovado em exames avançados de proficiência linguística no nível de “maestria”.
- Raciocínio: o amplo conjunto de dados do PaLM 2 inclui artigos científicos e páginas web que contêm expressões matemáticas. Como resultado, demonstra capacidades aprimoradas em lógica, raciocínio e matemática.
- Codificação: PaLM 2 foi pré-treinado em uma grande quantidade de conjuntos de dados de código-fonte disponíveis publicamente. Isso significa que ele se destaca em linguagens de programação populares, como Python e JavaScript, mas também pode gerar código especializado em linguagens como Prolog, Fortran e Verilog.
Uma família versátil de modelos
Além de ser mais capaz, o PaLM 2 também é mais rápido e mais eficiente do que os modelos anteriores — e vem em uma variedade de tamanhos, o que facilita a implantação em uma ampla variedade de casos de uso. Estaremos disponibilizando o PaLM 2 em quatro tamanhos, do menor ao maior: Gecko, Otter, Bison e Unicorn. O Gecko é tão leve que pode funcionar em dispositivos móveis e é rápido o suficiente para aplicativos interativos que rodam no dispositivo, mesmo quando offline. Essa versatilidade significa que o PaLM 2 pode ser ajustado para oferecer suporte a produtos em suas diversas versões, para alcançar mais usuários.
Mais de 25 produtos e recursos do Google
Hoje no I/O, anunciamos mais de 25 novos produtos e recursos com tecnologia PaLM 2. Isso significa que o PaLM 2 está trazendo o que há de mais avançado em recursos de IA diretamente para nossos produtos e para as pessoas — incluindo consumidores, desenvolvedores e empresas de todos os portes em todo o mundo. Aqui estão alguns exemplos:
- Os recursos multilíngues aprimorados do PaLM 2 estão nos permitindo expandir o Bard para novos idiomas, a partir de hoje. Além disso, está alimentando nossa para escrever código anunciada recentemente.
- Workspace: as tecnologias que te ajudam a escrever no Gmail, no Google Docs e a se organizar no Google Sheets estão aproveitando os recursos do PaLM 2.
- Med-PaLM 2 : treinados por nossas equipes de pesquisa em saúde com conhecimento médico, pode responder a perguntas e resumir percepções de uma variedade de textos médicos densos. Ele entrega resultados de ponta em termos de conhecimento médico e foi o primeiro grande modelo de linguagem a ser executado como “especialista” no Exame de Licenciamento Médico dos EUA. Agora estamos adicionando recursos multimodais para sintetizar informações como raios-x e mamografias. O Med-PaLM 2 será aberto a um pequeno grupo de clientes do Google Cloud para feedback no final deste ano para identificar casos de uso seguros e úteis.
- Sec-PaLM é uma versão especializada do PaLM 2 treinada em casos de uso de segurança, com um alto potencial para aplicações em segurança cibernética. Disponível por meio do Google Cloud, ele usa IA para ajudar a analisar e explicar o comportamento de códigos potencialmente maliciosos e detectar melhor possíveis ameaças a pessoas e organizações, de forma rápida.
- Desde março, temos aberto acesso a API do PaLM com um pequeno grupo de desenvolvedores. A partir de hoje, os desenvolvedores podem se inscrever para usar o modelo PaLM 2 ou os clientes podem usar o modelo no Vertex AI com privacidade, segurança e governança de nível empresarial. O PaLM 2 também está por trás do Duet AI para Google Cloud, pensado para ajudar os usuários a aprender, criar e operar mais rápido do que nunca.
Avançando o futuro da IA
O PaLM 2 mostra o impacto concreto que os modelos altamente capazes, de diversos tamanhos e velocidades, podem ter para todos. No entanto, assim como estamos comprometidos em lançar soluções de IA úteis e responsáveis hoje, também estamos trabalhando para criar os melhores modelos de base para o Google.
Nossas equipes de pesquisa Brain e DeepMind alcançaram muitos marcos decisivos em IA na última década e estamos reunindo essas duas equipes em uma única unidade para continuar a acelerar nosso progresso. O Google DeepMind , apoiado pelos recursos computacionais do Google, não apenas trará novos recursos incríveis para os produtos que você usa todos os dias, mas também abrirá o caminho para a próxima geração de modelos de IA.
Já estamos trabalhando no Gemini - nosso próximo modelo criado para ser multimodal, altamente eficiente em integrações de ferramentas e APIs e construído para permitir inovações futuras, como memória e planejamento. O Gemini ainda está em treinamento, mas já está mostrando capacidades multimodais nunca antes vistas em modelos anteriores. Uma vez ajustado e rigorosamente testado quanto à segurança, o Gemini estará disponível em vários tamanhos e capacidades, assim como o PaLM 2, para garantir que possa ser implantado em diferentes produtos, aplicativos e dispositivos para o benefício de todos.