Nesta terça feira (14), aconteceu a conferência anual Google I/O com uma série de inovações, Este encontro é amplamente reconhecido por suas revelações de avanços em software, hardware e, cada vez mais, em inteligência artificial.
Vamos ao resumo dos destaques em IA.
Novidades na IA Gemini
Lançamento do Gemini 1.5 Pro
Durante o evento, Sundar Pichai, CEO da Google, apresentou o Gemini 1.5 Pro, uma evolução do modelo de inteligência artificial da empresa. Este modelo promete transformar a maneira como a IA é aplicada, oferecendo capacidade para processar até 1 milhão de tokens, com perspectivas de expansão para 2 milhões.
O Gemini 1.5 Pro é capaz de entender e manipular uma variedade de dados, incluindo texto, imagens, vídeo e código, o que o torna uma ferramenta extremamente versátil para desenvolvedores e criadores de conteúdo em diversas áreas.
Gemini Flash: Velocidade e eficiência
O Google Apresentou também o Gemini Flash, modelo menos complexo e mais rápido do Gemini.
Comparativo entre Gemini Pro e Gemini Flash
Característica | Gemini 1.5 Pro | Gemini Flash |
---|---|---|
Finalidade | Tarefas complexas com alta qualidade | Tarefas rápidas onde a velocidade é crucial |
Latência | Maior, adequada para qualidade e profundidade | Menor, otimizada para rapidez |
Capacidades | Alta capacidade de processamento, ideal para análises profundas | Menor capacidade, foco na eficiência e rapidez |
Uso recomendado | Problemas complexos que requerem respostas detalhadas | Tarefas que necessitam de respostas imediatas e menos complexas |
Janela de contexto | Suporta até 2 milhão de tokens | Suporta até 1 milhão de tokens |
Multimodalidade | Suporta múltiplos modos de entrada como texto, imagem, áudio e vídeo | Semelhante ao Pro, mas otimizado para tarefas menos complexas |
Preço por 1 milhão de tokens | $3.50 (com descontos para uso maior) até 128 mil tokens, $7 depois | A partir de $0.35, tornando-o acessível para usos frequentes e em grande escala |
Lançamento do Gemma 2
Gemma 2, é a próxima geração de modelos Gemma. Ele estará disponível em novos tamanhos para uma ampla gama de casos de uso de desenvolvedores de IA e conta com uma arquitetura totalmente nova projetada para desempenho e eficiência inovadores.
O Gemma 2 de 27 bilhões de parâmetros entrega desempenho comparável ao Llama 3 70B com menos da metade do tamanho. Ele cabe em menos da metade da computação de modelos comparáveis, tornando a implantação mais acessível e econômica. Também fornecerá recursos robustos de ajuste fino em várias plataformas e ferramentas.
Integração com Google Workspace e Google Photos
A integração do Gemini com plataformas como Google Workspace e Google Photos foi outro destaque importante do evento. No Google Photos, os usuários podem agora fazer perguntas complexas sobre suas fotos, como detalhes sobre o aprendizado de habilidades específicas por crianças, com o sistema sendo capaz de buscar e sumarizar informações relevantes rapidamente.
No ambiente do Google Workspace, o Gemini oferece funcionalidades como a capacidade de resumir e-mails e destacar informações chave, melhorando significativamente a eficiência na gestão de comunicações e informações.
Projeto Astra
Assim como na demonstração de ontem da OpenAI lançando o gpt-4o, o Google está buscando uma interação mais natural entre a pessoa e o chatbot. Veja no vídeo demonstrativo disponibilizado pelo Google.
Google Veo
Lançamento da IA generativa de vídeo do Google, assim como o Sora da OpenAI, o usuário poderá escrever um prompt que será gerado um vídeo automaticamente.
Imagen 3
O Imagen 3, uma ferramenta avançada de geração de imagens baseada em IA, permite aos criadores transformar descrições textuais simples em imagens detalhadas e visualmente atraentes, da mesma forma que poderá ser gerado vídeos a partir de prompt com o Veo, o Imagen 3 gerará imagens. Podemos dizer que é um competidor do Sora da OpenAI.
Integração da IA no mecanismo de busca
O Google já está começando a disponibilizar a integração da IA no seu mecanismo de busca. Começando pelos Estados Unidos, porém, nos próximos meses liberando para outros países. Para quem já quiser ir testando como que funcionará essa integração, basta acessar o Search Labs e ativar a versão experimental de resumos gerados por IA.