Publicado em Deixe um comentário

GOOGLE LANÇA GEMINI, O MODELO MULTIMODAL MAIS AVANÇADO

O Google, um gigante no campo da inteligência artificial, recentemente introduziu o Gemini, seu mais recente avanço na área. Este modelo de IA, desenvolvido pelo renomado laboratório de inteligência artificial DeepMind, é considerado um marco na história da tecnologia. O Gemini se destaca por ser um modelo multimodal, integrando habilidades em texto, imagem, áudio, vídeo e programação, um feito notável no campo da IA.

O modelo representa um salto significativo na forma como as máquinas compreendem e interagem com o mundo ao nosso redor, superando outros modelos existentes.

O Google já integrou o Gemini ao Bard, seu chatbot, ampliando assim as capacidades deste último e reforçando a competição com a OpenAI e seu produto, o ChatGPT. Comentários da empresa sugerem que essa integração marca a maior melhoria do Bard desde seu lançamento.

O Gemini será gradualmente implementado em outros produtos e serviços do Google, como Ads, Chrome e Duet AI, em três variantes: Gemini Ultra, para tarefas de alta complexidade; Gemini Pro, para uma gama mais ampla de tarefas; e Gemini Nano, otimizado para eficiência em dispositivos menores.

Uma característica notável do Gemini é seu poder computacional, que é cinco vezes maior que o do GPT-4. Ele é o primeiro modelo a superar especialistas humanos em Massive Multitask Language Understanding, um benchmark chave para avaliar a capacidade de resolução de problemas de modelos de IA. O Gemini Ultra, por exemplo, alcançou 30 de 32 pontos em testes acadêmicos.

A inovação fundamental do Gemini reside em sua abordagem nativa multimodal. Diferente de modelos anteriores que eram treinados separadamente em diferentes modalidades antes de serem combinados, o Gemini foi concebido desde o início para lidar com múltiplas formas de informação simultaneamente, permitindo-lhe compreender e raciocinar com mais eficácia.

Além disso, a Google utilizou chips personalizados para desenvolver o Gemini, o que traz vantagens únicas em termos de desempenho.

Para desenvolvedores e clientes corporativos, o Gemini Pro estará disponível via API no Google AI Studio ou Vertex AI a partir de 13 de dezembro. O Google AI Studio é uma ferramenta gratuita para desenvolvimento e prototipagem de aplicativos, enquanto o Vertex AI oferece personalização do Gemini com controle total sobre os dados.

Finalmente, o Google anunciou o lançamento do Bard Advanced, uma nova experiência de IA avançada, para o início de 2024. Este anúncio reitera o compromisso da empresa em liderar a vanguarda da inovação em IA.