Gemini e ChatGPT são plataformas concorrentes no mercado de inteligência artificial (IA) generativa. Lançado em 2022 pela OpenAI, o ChatGPT foi o grande responsável por popularizar os chatbots, conseguindo conquistar uma base sólida de usuários ativos. A partir de então, muitas outras ferramentas semelhantes foram lançadas, todas correndo atrás de conquistar usuários interessados em IA. Dentre estas, o Gemini Google vem se destacando por sua variedade de modelos, capacidade de raciocínio, respostas precisas e possibilidade de fazer pesquisas em tempo real no navegador. Para tentar entender qual chatbot é melhor entre o Gemini e o ChatGPT, o TechTudo elaborou um comparativo detalhado que avaliou diferentes características, como interface, recursos, extensões, entre outros. Confira!
Interface
A interface de um chatbot é o ambiente que conecta o usuário com o modelo de linguagem. Por isso, é importante que seja bastante limpa, intuitiva e fácil de usar, para que qualquer usuário consiga aproveitar os benefícios da IA. A do ChatGPT é bem simples, com um campo de mensagens que conta com um botão para anexar arquivos e algumas sugestões rápidas de prompts abaixo. No canto esquerdo, é possível encontrar um botão para abrir uma nova conversa e outro que aciona o menu lateral. Neste menu, é possível acessar o histórico de conversas e os GPTs. Ao clicar na foto, que fica no canto superior direito, o usuário pode acessar as configurações da conta e personalizar o ChatGPT.
A interface do Gemini Google é bastante similar, com um campo de mensagens que conta com botão para anexar imagens e outro para enviar um comando de voz. No canto esquerdo, também é possível encontrar um menu suspenso que pode ser acionado ao clicar no símbolo que parece três linhas horizontais. Nesta área, o usuário encontra o histórico de conversas, o gerenciador de Gems, configurações, histórico de atividades e a seção de ajuda.
Recursos
De modo geral, o ChatGPT e o Gemini conseguem fazer as mesmas coisas, incluindo escrever textos em diferentes estilos, gerar imagens, criar ou corrigir códigos em diferentes linguagens de programação, fazer traduções em diversos idiomas, pesquisar na internet, entre muitas outras coisas. Quando foram lançados, os chatbots tinham recursos mais discrepantes. Na época, usuários gratuitos do ChatGPT só tinham acesso aos modelos mais antigos da empresa, que possuíam uma restrição de aprendizado que havia parado em 2021, por exemplo.
Com o avanço dos modelos, ambas as plataformas conseguem buscar informações em tempo real na internet e conversar sobre assuntos da atualidade. Contudo, o Gemini consegue tirar proveito da tecnologia do buscador do Google, sendo uma melhor ferramenta para fazer pesquisas na web. Inclusive, ao criar um texto na plataforma, o usuário pode clicar no símbolo do Google abaixo da resposta para fazer uma checagem em tempo real do conteúdo. Nesse mesmo menu, é possível usar ferramentas rápidas para refinar as respostas, sem precisar escrever comandos adicionais.
O ChatGPT se destaca por causa dos GPTs, ferramentas criadas por usuários para deixar o modelo ainda mais potente. Com eles, é possível aprimorar qualquer função do chatbot, como, por exemplo, deixá-lo ainda mais inteligente ao reescrever um texto, desenvolver um código ou gerar uma imagem. Para competir, o Gemini lançou o Gem, mas estas ferramentas ainda são exclusivas para assinantes. Vale ressaltar, ainda, o lançamento do Canvas do ChatGPT, que permitirá uma maior colaboração entre usuário e IA. Este recurso está sendo disponibilizado para assinantes, mas deve ser liberado para todos os usuários no futuro.
Respostas
Tanto o ChatGPT quanto o Gemini conseguem entregar respostas bastante concretas sobre a maioria dos assuntos. Contudo, o ChatGPT tende a priorizar as informações de sua base de dados, enquanto o Gemini costuma buscar as informações da internet. Para evitar que isso gere respostas erradas ou desinformação sobre assuntos relevantes, o Gemini ainda conta com bloqueios de segurança. Ao serem questionados sobre a atual eleição dos Estados Unidos, por exemplo, o ChatGPT apresentou uma resposta falando sobre a data do pleito, os principais candidatos e uma breve explicação sobre como funciona o processo eleitoral no país.
Já o Gemini se recusou a responder, informando que não pode ajudar com “respostas sobre eleições e personalidades políticas. Embora nunca partilhe deliberadamente algo que seja incorreto, posso cometer erros”. Por outro lado, o chatbot do Google leva vantagem ao apresentar imagens retiradas da internet nas respostas. É possível pedir inspirações para decoração de uma festa, tipos de corte de cabelo e praticamente qualquer coisa que pode ser buscada no Google. Já o ChatGPT ainda não apresenta imagens que não foram geradas pela ferramenta.
Modelos de linguagem
A OpenAI conta com uma grande variedade de modelos de linguagem, que podem ser acessados pelo ChatGPT ou por suas APIs. Atualmente, usuários gratuitos têm acesso limitado ao modelo mais avançado da empresa, o GPT-4o, que é mais rápido e capaz de realizar tarefas mais complexas. Ao atingir esse limite, é possível usar o GPT-4o Mini, versão com melhor custo-benefício. Já o Dall-E 3 é o responsável por gerar imagens a partir de comandos de texto. Para os assinantes, a OpenAI oferece os modelos o1-preview e o1-mini, modelos treinados para conseguir realizar raciocínios ainda mais complexos.
O Google também oferece uma boa variedade de modelos. Usuários gratuitos podem acessar o Gemini 1.5 Flash, que promete ser mais rápido, leve e com melhor custo-benefício. Já os assinantes do plano Advanced têm acesso ao Gemini 1.5 Pro, que performa melhor em uma grande variedade de tarefas. A empresa oferece ainda o Gemini Nano, ideal para ser usado em aplicativos móveis, e o modelo mais avançado, o Ultra, que é ideal para tarefas mais complexas. O modelo responsável pela geração de imagens é o Imagen 3.
Extensões
Um dos principais benefícios de ser assinante do Gemini Advanced é, além de ter acesso a um modelo mais avançado, poder usar a inteligência artificial em vários aplicativos Google, incluindo Gmail, Docs, Apresentações e Meets. Com isso, é possível usar o Gemini para ajudar a redigir e-mails diretamente na plataforma ou usá-lo como assistente ao criar um conteúdo ou apresentação. Por enquanto, o ChatGPT ainda não consegue ter essa interação mais direta com outros aplicativos. Contudo, os modelos da OpenAI são os mais procurados por desenvolvedores que querem usar inteligência artificial em seus aplicativos por meio de uma API.
Geração de imagens
Tanto o ChatGPT quanto o Gemini são capazes de gerar imagens em diferentes estilos a partir de comandos de texto. Após um comparativo mais detalhado sobre a geração de imagens, foi possível concluir que o Dall-E 3, do ChatGPT, consegue criar imagens mais detalhadas, com melhor iluminação e também tem menos bloqueios de segurança, sendo possível gerar imagens de pessoas. Ainda assim, usuários gratuitos estão restritos a criar apenas duas imagens por dia.
Já o Imagen 3 cria imagens mais realistas, que podem até ser confundidas com fotos, porém com bem menos detalhes. O Google também implementou vários bloqueios para impedir que o Gemini gere imagens controversas. No início deste ano, a empresa chegou a suspender o recurso depois que o modelo apresentou respostas consideradas ofensivas e preconceituosas. Após ser aprimorado, o Imagen 3 agora pode ser usado por usuários gratuitos e pagos, mas ainda com algumas limitações. Por enquanto, o modelo se recusa a criar imagens de pessoas, afirmando que usuários Advanced terão acesso ao recurso em breve.
Processar dados
Além de permitir entradas a partir de comandos de textos ou de voz, o ChatGPT também consegue analisar imagens e arquivos em diversos formatos, incluindo PDF, Docx e TXT. Assim, não é necessário copiar e colar o texto de um documento para que seja processado pelo ChatGPT. Após anexar o arquivo, é possível pedir para que o modelo extraia dados, faça resumos, destaque os principais pontos, traduza para outros idiomas, entre outras coisas. Este recurso é limitado para usuários gratuitos, sendo bloqueado por um período quando o limite do GPT-4o é atingido. Já a versão gratuita do Gemini, no momento, só consegue processar imagens, não permitindo anexar documentos.
Planos pagos
O ChatGPT oferece três planos pagos que variam conforme a necessidade de uso. O ChatGPT Plus custa US$ 20 —R$ 113,57, na cotação atual — e oferece acesso aos modelos o1-preview, OpenAI o1-mini, GPT-4o, GPT-4o mini e GPT-4, maior limite de interação com o GPT‑4o e, consequentemente, maior capacidade de análise de dados, carregamento de arquivos, navegação na Web e geração de imagens.
A assinatura permite ainda a criação de GPTs personalizados e acesso ao modo de voz avançado. Também é possível fazer uma assinatura no plano Team, que custa US$ 25 (R$ 141,96) e oferece todos os benefícios do Plus e recursos adicionais de compartilhamento e gerenciamento das equipes. Para empresas maiores, a OpenAI oferece o plano Enterprise, que precisa de uma cotação especial com a equipe de vendas.
Para o usuário comum, o Gemini conta com o plano Advanced, que é gratuito no primeiro mês e depois custa R$ 96,99 mensais. O plano dá acesso aos modelos mais avançados, acesso prioritário a novos recursos, integração com aplicativos Google, armazenamento de 2TB no Drive e benefícios do Google One Premium. Nos planos empresariais, que integra o Gemini ao Google Workspace, é possível contratar o serviço a partir de R$ 28 por usuário no plano anual, mas o preço pode variar segundo as necessidades da empresa.
Gemini vs ChatGPT: qual é melhor?
O ChatGPT e o Gemini são duas plataformas com inteligência artificial generativa capazes de realizar tarefas complexas de maneira satisfatória. Para o usuário comum, que apenas precisa de um assistente virtual para auxiliá-lo no estudo, trabalho ou funções do cotidiano, qualquer um dos chatbots é adequado. Ambos são capazes de escrever textos, traduzir conteúdos, gerar imagens, responder perguntas, entre outras coisas. Ao mesmo tempo, tanto o ChatGPT quanto o Gemini são capazes de falhar, produzindo alucinações e dando informações equivocadas.
Contudo, cada ferramenta se destaca em uma área específica. O Gemini é muito eficiente em pesquisar na internet, citar as fontes usadas e checar as respostas produzidas em tempo real. Já o ChatGPT permite que o usuário faça o upload de documentos para serem analisados pela IA e conta com menos bloqueios de segurança, sendo capaz de responder perguntas sobre política e outros assuntos considerados delicados. Por tudo isso, é possível dizer que não existe uma inteligência artificial melhor entre o ChatGPT e o Gemini Google, apenas o mais adequado às necessidades do usuário. Sendo assim, é importante testar as duas ferramentas para saber qual é a melhor opção para seu tipo de uso.
Com informações de Forbes, E Week, Android Authority, Zapier, Cnet.