Ao longo de 2023, anunciamos novidades incríveis de inteligência artificial para os nossos clientes, desenvolvedores e usuários, incluindo: Hipercomputador de IA para treinar e servir modelos de IA generativa; Suporte de IA generativa no Vertex , nossa plataforma de IA voltada para empresas; Duet AI no Google Workspace e Duet AI para Google Cloud.
Lançamos ainda uma série de recursos em nossa infraestrutura otimizada para IA, com avanços notáveis em GPUs, TPUs, software e compiladores de ML, gerenciamento de carga de trabalho e outros. Outras inovações também chegaram no Vertex AI, além de um conjunto totalmente novo de recursos com agentes Duet AI no Google Workspace e no Google Cloud Platform.
Temos visto um crescimento significativo de desenvolvedores e usuários. Por exemplo, entre o segundo e o terceiro trimestre deste ano, o número de projetos ativos de geração de IA no Vertex AI cresceu mais de 7 vezes.
Marcas líderes como Forbes , Formula E e Spotify estão usando o Vertex AI para construir seus próprios agentes, e Anthropic , AI21 Labs e Cohere estão treinando seus modelos. A amplitude e a criatividade dos aplicativos que os clientes estão desenvolvendo são de tirar o fôlego. Enquanto a Fox Sports está criando conteúdo mais envolvente, a Six Flags está desenvolvendo um concierge digital e a Priceline uma versão voltada para viagens, ao passo que a Estée Lauder está construindo um gestor digital de marca.
Hoje, estamos apresentando uma série de novos recursos importantes em nosso portfólio de IA com suporte do Gemini, nosso modelo de IA mais hábil e avançado até agora. Ele foi construído desde o início para ser multimodal, o que significa que pode generalizar e compreender perfeitamente, além de operar e combinar diferentes tipos de informação, incluindo texto, código, áudio, imagem e vídeo, da mesma forma que os humanos veem, ouvem, leem e falam sobre muitos tipos diferentes de informação, simultaneamente.
A partir de hoje, Gemini faz parte de um portfólio de IA verticalmente integrado e otimizado que consiste em várias componentes importantes, e que foram projetadas para funcionarem juntas:
Hoje, temos o prazer de anunciar novidades em cada uma destas áreas:
À medida que os modelos de IA generativa cresceram em tamanho e complexidade, também aumentaram seus requisitos para treinamento, ajuste e inferência. Como resultado, a demanda por infraestruturas de IA de alto desempenho, altamente escaláveis e econômicas para treinar e fornecer modelos está aumentando exponencialmente.
Isso não se aplica apenas aos nossos clientes, mas também ao Google. As TPUs têm sido a base para treinar e fornecer produtos com tecnologia de IA, como YouTube, Gmail, Google Maps, Google Play e Android. O Gemini, por exemplo, foi treinado usando TPUs.
Na semana passada, anunciamos o Cloud TPU v5p, nosso acelerador de IA mais poderoso, escalável e flexível até o momento. A TPU v5p é 4 vezes mais escalável que a TPU v4 em termos de total de FLOPs (do inglês Floating-point Operations Per Second) disponíveis por pod. No início deste ano, anunciamos a disponibilidade geral do Cloud TPU v5e. Com melhorias de desempenho de inferência de 2,7X por dólar em um benchmark do setor em relação à TPU v4 da geração anterior, é a nossa TPU mais econômica até o momento.
Também anunciamos nosso AI Hypercomputer, uma arquitetura inovadora de supercomputador que emprega um sistema integrado de hardware com desempenho otimizado, software aberto, estruturas líderes de ML e modelos de consumo flexíveis. O AI Hypercomputer possui uma grande variedade de opções de aceleradores, incluindo várias classes de TPUs de 5ª geração e GPUs NVIDIA.
O Gemini também é o nosso modelo mais flexível até agora, capaz de funcionar de forma eficiente em tudo, desde data centers até dispositivos móveis. O Gemini Ultra é o nosso maior e mais capaz modelo para tarefas altamente complexas, enquanto o Gemini Pro é o nosso melhor modelo para escalabilidade em uma ampla variedade de tarefas, e o Gemini Nano é o mais eficiente para tarefas on-device. Seus recursos de última geração melhorarão, significativamente, a forma como os desenvolvedores e empresas constroem e escalam com IA.
Hoje, também apresentamos uma versão atualizada do nosso modelo de imagem, o Imagen 2, nossa mais avançada tecnologia de conversão de texto em imagem que oferece realismo, renderização de texto e recursos de geração de logotipo para que você possa criar facilmente imagens com sobreposições de texto e gerar logotipos.
Além disso, com base em nossos esforços relacionados a modelos específicos de domínio com o Med-PaLM, temos o prazer de anunciar a disponibilidade geral do MedLM, nosso conjunto de modelos ajustados para fins médicos, que está disponível no Vertex AI trazendo aos clientes o poder dos modelos de base do Google ajustados à experiência médica.
Hoje, anunciamos que o Gemini já está disponível no Vertex AI no modo preview. Ele capacita os desenvolvedores a criar agentes novos e diferenciados que que podem processar informações entre texto, linguagem código, áudio, imagens e vídeo. O Vertex AI ajuda você a implantar e gerenciar agentes na produção, avaliar automaticamente a qualidade e a confiabilidade das respostas dos agentes, bem como monitorá-las e gerenciá-las.
O Vertex AI oferece suporte abrangente ao Gemini, com a capacidade de descobrir, personalizar, aumentar, gerenciar e implantar agentes criados com base no Gemini API, incluindo:
Além do suporte do Gemini no Vertex AI, hoje anunciamos:
Com o Duet AI, temos o compromisso de ajudar nossos clientes a aumentar a produtividade, obter vantagens competitivas e, em última análise, melhorar seus resultados financeiros. Hoje, o Duet AI para desenvolvedores e o Duet AI no Security Operations estão disponíveis para o público geral e iremos incorporar o Gemini em nosso portfólio do Duet AI nas próximas semanas.
O Duet AI para Developers ajuda os usuários a codificar mais rapidamente com preenchimento de código de IA, geração de código e chat em vários ambientes de desenvolvimento integrados (IDEs). Ele agiliza tarefas e processos repetitivos do desenvolvedor com atalhos para tarefas comuns, incluindo geração de testes de unidade e explicação de código, acelera a solução e a correção de problemas, além de ajudar a reduzir a alternância de contexto. O Duet AI também agiliza o aprendizado baseado em habilidades, proporcionando aos usuários a capacidade de fazer perguntas usando chat em linguagem natural.
Hoje, também anunciamos que mais de 25 parceiros de assistência de código e base de conhecimento contribuirão com conjuntos de dados específicos para suas plataformas, de maneira que os usuários do Duet AI para Desenvolvedores possam receber assistência de IA com base nos modelos de codificação e dados dos parceiros, documentação de produtos, melhores práticas e outros recursos empresariais úteis.
O Duet AI em Operações de Segurança, plataforma unificada de operações de segurança do Google Cloud, permite que as organizações se protejam de uma maneira mais eficaz contra ataques cibernéticos. Com ele, as equipes de segurança conseguem aprimorar suas habilidades e ajudar a acelerar a detecção, investigação e resposta a ameaças usando o poder da IA generativa. Com o Duet AI no Chronicle, os usuários podem pesquisar grandes quantidades de dados em segundos, realizando consultas personalizadas e geradas a partir de linguagem natural. Ele também ajuda a reduzir revisões manuais demoradas, revelar rapidamente contextos críticos aproveitando resumos automáticos de dados e alertas de casos, assim como a melhorar o tempo de resposta usando recomendações para as próximas etapas apoiando, assim, a correção de incidentes.
O Google conta com a tecnologia Duet AI em diversas frentes, desde a infraestrutura e modelos base até a integração de nível superior e a experiência do usuário. Estamos orgulhosos de que nossos engenheiros e pesquisadores colaborem de forma única para levar nossos mais recentes avanços em tecnologia de IA aos clientes com uma experiência de produto consistente e unificada. No início do próximo ano, planejamos expandir ainda mais o Duet AI em nosso portfólio, incluindo o Duet AI no BigQuery, Looker, nossos produtos de banco de dados, Apigee e muito mais.
Além desses novos recursos em nossa AI Technology Stack verticalmente integrada , temos preços competitivos que tornam o Gemini acessível a mais organizações e estamos expandindo nossa indenização para ajudar a protegê-lo contra questões de direitos autorais.
O lançamento do Gemini, combinado ao nosso portfólio de infraestrutura de IA super escalável e ao Vertex AI e Duet AI, oferece uma nuvem abrangente e poderosa para desenvolvedores e clientes corporativos. Com essas inovações, o Google Cloud está impulsionando a próxima geração de agentes alimentados por IA em todos os setores, capacitando as organizações a criar, usar e adotar com sucesso a geração de IA para impulsionar suas transformações digitais.