Google Anuncia novas funcionalidades do Gemini

Um dia após o anúncio da nova versão do ChatGPT, que irá interagir com o uso de imagem e áudio, o Google revelou que pretende utilizar funcionalidades de mídia em seu APP de IA o Gemini.

Projeto Astra

Na última terça-feira durante o evento Google I/O que ocorreu na Califórnia, foi revelado o “Projeto Astra” IA que irá interagir com o usuário pelo meio de imagem e vídeos exibidos pela câmera do smartphone em tempo real, vale lembrar que essa IA também fará o uso de textos.

Segundo o CEO da Google, essa funcionalidade irá expandir o modo em que as pessoas poderão realizar perguntas e receber respostas. A empresa também bateu o martelo referente a inclusão da IA generativa nas buscas, algo que deve acontecer até o final de 2024.

O Astra irá “enxergar”

Em um vídeo de demonstração é possível ver a interação onde o Astra irá “enxergar” o que o usuário apontar para a câmera, e dizer o que é o objeto, até mesmo responder perguntas sobre, como por exemplo poderá até identificar um bairro somente apontando a câmera para a janela, veja o vídeo de demonstração abaixo:


Vídeo de apresentação (Vídeo: reprodução/youtube)


É notável que o vídeo foi gravado sem edições, e que além de objetos, localizar o óculos da usuária, e identificar o bairro, o Gemini foi capaz de identificar um código de programação e dizer a funcionalidade das linhas do código.

Quando poderá ser acessado?

É importante lembrar que quando se trata de uma IA, nem todos os avanços ficam disponíveis para todo o mundo, e alguns deles depende de fatores como a versão do dispositivo, se compatível com a atualização. E claro, que deve considerar que as atualizações são feitas na estrutura do APP, ou seja, não é algo que irá aparecer como uma nova função para adicionar, mas sim irá aparecer, conforme o usuário aceita e atualiza o aplicativo.

Conheça quatro IAs que podem axilar o seu dia a dia

Em um mundo onde as Inteligências Artificiais estão se tornando cada vez mais presentes no dia a dia da população informatizada, essas plataformas têm auxiliado as pessoas de maneiras que até pouco tempo atrás não poderiam ser imaginadas, evoluindo para atender a um público cada vez mais amplo.

Abaixo, selecionamos algumas das plataformas de Inteligência Artificial que podem auxiliar na produtividade, abrangendo desde a criação de textos até a geração de imagens complexas, cada uma com suas peculiaridades e vantagens:

ChatGPT

Esta é a opção mais conhecida do mercado, reconhecida pela sua eficiência, e já ultrapassou a marca de um milhão de usuários ativos desde o seu lançamento. Mesmo oferecendo uma versão gratuita poderosa, a OpenAI lançou uma versão Pro do seu produto, atualmente alimentada pelo modelo de linguagem GPT-4.

Microsoft CoPilot

A Microsoft também entrou nesse segmento com sua própria plataforma de IA. Inicialmente, o CoPilot foi lançado como uma nova versão do seu mecanismo de busca. A abordagem da Microsoft é um pouco diferente, já que sua IA tenta passar a sensação de ser mais do que um chatbot, sendo uma ferramenta de produtividade integrada às suas plataformas, como o Windows e o Microsoft 365.


OpenAI e Microsoft tem parceria estratégica (Foto: reprodução/X/@OpenAI)

Google Bard

Inicialmente surpreendida pela chegada e rápida ascensão do ChatGPT, a gigante da tecnologia lançou o Bard, que inicialmente parecia uma imitação do ChatGPT. No entanto, isso mudou rapidamente com as constantes atualizações em seu sistema, principalmente após a introdução do Gemini Pro, que liberou ainda mais o potencial do sistema de IA da Google. Nos próximos meses, espera-se o lançamento do Gemini Ultra.

Llama2 (Meta)

A Meta também entrou na jogada com sua própria IA não muito tempo depois de suas principais rivais. A empresa segue uma abordagem um pouco diferente, pois, em vez de ter uma plataforma própria, ela licencia códigos e dados de treinamento disponíveis, permitindo que qualquer pessoa crie seus próprios chatbots.