Gemini: agora disponível para organizações e desenvolvedores

Ao longo de 2023, anunciamos novidades incríveis de inteligência artificial para os nossos clientes, desenvolvedores e usuários, incluindo: Hipercomputador de IA para treinar e servir modelos de IA generativa; Suporte de IA generativa no Vertex , nossa plataforma de IA voltada para empresas; Duet AI no Google Workspace e Duet AI para Google Cloud.

Lançamos ainda uma série de recursos em nossa infraestrutura otimizada para IA, com avanços notáveis ​​em GPUs, TPUs, software e compiladores de ML, gerenciamento de carga de trabalho e outros. Outras inovações também chegaram no Vertex AI, além de um conjunto totalmente novo de recursos com agentes Duet AI no Google Workspace e no Google Cloud Platform.

Temos visto um crescimento significativo de desenvolvedores e usuários. Por exemplo, entre o segundo e o terceiro trimestre deste ano, o número de projetos ativos de geração de IA no Vertex AI cresceu mais de 7 vezes.

Marcas líderes como Forbes , Formula E e Spotify estão usando o Vertex AI para construir seus próprios agentes, e Anthropic , AI21 Labs e Cohere estão treinando seus modelos. A amplitude e a criatividade dos aplicativos que os clientes estão desenvolvendo são de tirar o fôlego. Enquanto a Fox Sports está criando conteúdo mais envolvente, a Six Flags está desenvolvendo um concierge digital e a Priceline uma versão voltada para viagens, ao passo que a Estée Lauder está construindo um gestor digital de marca.

Hoje, estamos apresentando uma série de novos recursos importantes em nosso portfólio de IA com suporte do Gemini, nosso modelo de IA mais hábil e avançado até agora. Ele foi construído desde o início para ser multimodal, o que significa que pode generalizar e compreender perfeitamente, além de operar e combinar diferentes tipos de informação, incluindo texto, código, áudio, imagem e vídeo, da mesma forma que os humanos veem, ouvem, leem e falam sobre muitos tipos diferentes de informação, simultaneamente.

Um portfólio unificado para inteligência artificial

A partir de hoje, Gemini faz parte de um portfólio de IA verticalmente integrado e otimizado que consiste em várias componentes importantes, e que foram projetadas para funcionarem juntas:

  • Infraestrutura de IA super escalável: o Google Cloud oferece às empresas infraestrutura otimizada para IA, a mesma usada pelo Google para treinar modelos. Oferecemos essa infraestrutura como um serviço em nossas regiões de nuvem, para execução em seus data centers com o Google Distributed Cloud e edge computing. Toda a nossa infraestrutura de IA foi construída para aumentar a eficiência e a produtividade em treinamento, além de ajustes e serviços.
  • Modelos de classe mundial: continuamos a fornecer uma variedade de modelos de IA com diferentes habilidades. No final de 2022, lançamos nosso Pathways Language Model (PaLM), rapidamente seguido pelo PaLM 2, e agora estamos lançando o Gemini Pro. Também apresentamos modelos específicos, como Med-PaLM e Sec-PaLM.
  • Vertex AI – Plataforma líder de IA empresarial para desenvolvedores: para ajudar os desenvolvedores a criar agentes e integrar a geração de IA em seus aplicativos, aprimoramos rapidamente o Vertex AI, nossa plataforma de desenvolvimento de IA. Ele ajuda os clientes a descobrir, personalizar, aumentar, implantar e gerenciar agentes criados usando a API Gemini, além de uma lista selecionada de mais de 130 modelos de IA de código aberto e de terceiros que atendem aos rígidos padrões de segurança e qualidade empresarial do Google.
    O Vertex AI aproveita a governança de dados e os controles de privacidade integrados do Google Cloud e também fornece ferramentas para ajudar os desenvolvedores a usar modelos de maneira responsável e segura. O Vertex AI também fornece o Search and Conversation, ferramentas que usam uma abordagem low code para desenvolver agentes sofisticados de pesquisa e conversação que podem funcionar em vários canais.
  • Duet AI – Agentes de IA assistencial para Workspace e Google Cloud: O Duet AI é o nosso colaborador com tecnologia de IA que fornece assistência aos usuários quando eles usam o Google Workspace e o Google Cloud. No Google Workspace, por exemplo, ele ajuda os usuários a escrever, criar imagens, analisar planilhas, redigir e resumir e-mails e mensagens de bate-papo, além de resumir reuniões. Já no Google Cloud, o Duet AI ajuda os usuários a codificar, implantar, dimensionar e monitorar aplicativos, bem como identificar e acelerar a resolução de ameaças à segurança cibernética.

Hoje, temos o prazer de anunciar novidades em cada uma destas áreas:

Reforçando nossa infraestrutura de ponta

À medida que os modelos de IA generativa cresceram em tamanho e complexidade, também aumentaram seus requisitos para treinamento, ajuste e inferência. Como resultado, a demanda por infraestruturas de IA de alto desempenho, altamente escaláveis ​​e econômicas para treinar e fornecer modelos está aumentando exponencialmente.

Isso não se aplica apenas aos nossos clientes, mas também ao Google. As TPUs têm sido a base para treinar e fornecer produtos com tecnologia de IA, como YouTube, Gmail, Google Maps, Google Play e Android. O Gemini, por exemplo, foi treinado usando TPUs.

Na semana passada, anunciamos o Cloud TPU v5p, nosso acelerador de IA mais poderoso, escalável e flexível até o momento. A TPU v5p é 4 vezes mais escalável que a TPU v4 em termos de total de FLOPs (do inglês Floating-point Operations Per Second) disponíveis por pod. No início deste ano, anunciamos a disponibilidade geral do Cloud TPU v5e. Com melhorias de desempenho de inferência de 2,7X por dólar em um benchmark do setor em relação à TPU v4 da geração anterior, é a nossa TPU mais econômica até o momento.

Também anunciamos nosso AI Hypercomputer, uma arquitetura inovadora de supercomputador que emprega um sistema integrado de hardware com desempenho otimizado, software aberto, estruturas líderes de ML e modelos de consumo flexíveis. O AI Hypercomputer possui uma grande variedade de opções de aceleradores, incluindo várias classes de TPUs de 5ª geração e GPUs NVIDIA.

Disponibilizando nossos modelos mais recentes e inovadores

Gemini também é o nosso modelo mais flexível até agora, capaz de funcionar de forma eficiente em tudo, desde data centers até dispositivos móveis. O Gemini Ultra é o nosso maior e mais capaz modelo para tarefas altamente complexas, enquanto o Gemini Pro é o nosso melhor modelo para escalabilidade em uma ampla variedade de tarefas, e o Gemini Nano é o mais eficiente para tarefas on-device. Seus recursos de última geração melhorarão, significativamente, a forma como os desenvolvedores e empresas constroem e escalam com IA.

Hoje, também apresentamos uma versão atualizada do nosso modelo de imagem, o Imagen 2, nossa mais avançada tecnologia de conversão de texto em imagem que oferece realismo, renderização de texto e recursos de geração de logotipo para que você possa criar facilmente imagens com sobreposições de texto e gerar logotipos.

Além disso, com base em nossos esforços relacionados a modelos específicos de domínio com o Med-PaLM, temos o prazer de anunciar a disponibilidade geral do MedLM, nosso conjunto de modelos ajustados para fins médicos, que está disponível no Vertex AI trazendo aos clientes o poder dos modelos de base do Google ajustados à experiência médica.

Turbinando o Vertex AI com o Gemini

Hoje, anunciamos que o Gemini já está disponível no Vertex AI no modo preview. Ele capacita os desenvolvedores a criar agentes novos e diferenciados que que podem processar informações entre texto, linguagem código, áudio, imagens e vídeo. O Vertex AI ajuda você a implantar e gerenciar agentes na produção, avaliar automaticamente a qualidade e a confiabilidade das respostas dos agentes, bem como monitorá-las e gerenciá-las.

O Vertex AI oferece suporte abrangente ao Gemini, com a capacidade de descobrir, personalizar, aumentar, gerenciar e implantar agentes criados com base no Gemini API, incluindo:

  • Várias maneiras de personalizar agentes desenvolvidos com o Gemini, usando seus próprios dados, incluindo engenharia de prompt, ajuste fino baseado em adaptador, como Low-Rank Adaptation (LoRA), Aprendizagem por Reforço com Feedback Humano (RLHF, na sigla em inglês) e destilação.
  • Ferramentas de aumento que permitem que os agentes usem incorporações para recuperar, compreender e agir com base em informações do mundo real com blocos de construção de Retrieval Augmented Generation (RAG) configuráveis. O Vertex AI também oferece extensões para realizar ações em nome dos usuários em aplicativos de terceiros.
  • Base para melhorar a qualidade das respostas do Gemini e de outros modelos de IA, comparando os resultados com fontes de alta qualidade de dados corporativos e da web.
  • Um amplo conjunto de controles que ajudam você a ser seguro e responsável ao usar modelos de IA generativa, incluindo o Gemini.

Além do suporte do Gemini no Vertex AI, hoje anunciamos:

  • Automatic Side by Side (Auto SxS), uma ferramenta automatizada para comparar modelos. O Auto SxS é mais rápido e econômico do que a avaliação manual de modelos, além de ser personalizável em várias especificações de tarefas para lidar com novos casos de uso de IA generativa.
  • No final deste mês, o Gemini também estará disponível no Vertex AI Search.

Ampliando os recursos do Duet AI

Com o Duet AI, temos o compromisso de ajudar nossos clientes a aumentar a produtividade, obter vantagens competitivas e, em última análise, melhorar seus resultados financeiros. Hoje, o Duet AI para desenvolvedores e o Duet AI no Security Operations estão disponíveis para o público geral e iremos incorporar o Gemini em nosso portfólio do Duet AI nas próximas semanas.

O Duet AI para Developers ajuda os usuários a codificar mais rapidamente com preenchimento de código de IA, geração de código e chat em vários ambientes de desenvolvimento integrados (IDEs). Ele agiliza tarefas e processos repetitivos do desenvolvedor com atalhos para tarefas comuns, incluindo geração de testes de unidade e explicação de código, acelera a solução e a correção de problemas, além de ajudar a reduzir a alternância de contexto. O Duet AI também agiliza o aprendizado baseado em habilidades, proporcionando aos usuários a capacidade de fazer perguntas usando chat em linguagem natural.

Hoje, também anunciamos que mais de 25 parceiros de assistência de código e base de conhecimento contribuirão com conjuntos de dados específicos para suas plataformas, de maneira que os usuários do Duet AI para Desenvolvedores possam receber assistência de IA com base nos modelos de codificação e dados dos parceiros, documentação de produtos, melhores práticas e outros recursos empresariais úteis.

O Duet AI em Operações de Segurança, plataforma unificada de operações de segurança do Google Cloud, permite que as organizações se protejam de uma maneira mais eficaz contra ataques cibernéticos. Com ele, as equipes de segurança conseguem aprimorar suas habilidades e ajudar a acelerar a detecção, investigação e resposta a ameaças usando o poder da IA generativa. Com o Duet AI no Chronicle, os usuários podem pesquisar grandes quantidades de dados em segundos, realizando consultas personalizadas e geradas a partir de linguagem natural. Ele também ajuda a reduzir revisões manuais demoradas, revelar rapidamente contextos críticos aproveitando resumos automáticos de dados e alertas de casos, assim como a melhorar o tempo de resposta usando recomendações para as próximas etapas apoiando, assim, a correção de incidentes.

O Google conta com a tecnologia Duet AI em diversas frentes, desde a infraestrutura e modelos base até a integração de nível superior e a experiência do usuário. Estamos orgulhosos de que nossos engenheiros e pesquisadores colaborem de forma única para levar nossos mais recentes avanços em tecnologia de IA aos clientes com uma experiência de produto consistente e unificada. No início do próximo ano, planejamos expandir ainda mais o Duet AI em nosso portfólio, incluindo o Duet AI no BigQuery, Looker, nossos produtos de banco de dados, Apigee e muito mais.

Impulsionando a próxima geração de soluções de IA

Além desses novos recursos em nossa AI Technology Stack verticalmente integrada , temos preços competitivos que tornam o Gemini acessível a mais organizações e estamos expandindo nossa indenização para ajudar a protegê-lo contra questões de direitos autorais.

O lançamento do Gemini, combinado ao nosso portfólio de infraestrutura de IA super escalável e ao Vertex AI e Duet AI, oferece uma nuvem abrangente e poderosa para desenvolvedores e clientes corporativos. Com essas inovações, o Google Cloud está impulsionando a próxima geração de agentes alimentados por IA em todos os setores, capacitando as organizações a criar, usar e adotar com sucesso a geração de IA para impulsionar suas transformações digitais.


Bruno Costa

Bruno Costa

Diretor de Infra & Dados da Qi Network.