Melhor do que o Nano Banana? Testamos o novo editor de imagens do ChatGPT

A OpenAI, empresa responsável pelo ChatGPT, acaba de lançar uma versão aprimorada do ChatGPT Imagens, agora impulsionada pelo modelo GPT Image 1.5, que promete edições mais precisas, maior respeito às instruções do usuário e uma geração de imagens até quatro vezes mais rápida do que a anterior. A proposta é transformar o ChatGPT em um verdadeiro estúdio criativo integrado, capaz de realizar desde ajustes práticos do dia a dia até transformações visuais elaboradas, sem exigir conhecimentos técnicos ou engenharia de prompts. Enquanto o Nano Banana prioriza velocidade e respostas quase instantâneas, mesmo que com limitações técnicas em tarefas mais delicadas. Já o ChatGPT aposta em um processamento mais cuidadoso, focado em precisão, fidelidade ao prompt e preservação de detalhes visuais. O resultado é um contraste claro: de um lado, uma ferramenta ágil e funcional para edições rápidas; do outro, uma solução mais lenta, mas capaz de entregar imagens com acabamento superior e maior controle criativo. Para entender se a promessa da OpenAI se sustenta na prática, o TechTudo testou a novidade em diferentes cenários e comparou seus resultados com a ferramenta concorrente. Nano Banana vs ChatGPT: qual é melhor para editar imagens em 2025? Canal do TechTudo no WhatsApp: acompanhe as principais notícias, tutoriais e reviews Melhor do que o Nano Banana? Testamos o novo editor de imagens do ChatGPT Shutterstock Como criar imagens com inteligência artificial? Saiba Mais no Fórum do TechTudo Como funciona o editor do ChatGPT? O novo editor de imagens do ChatGPT foi pensado para operar de forma integrada à experiência já conhecida do chatbot. O acesso acontece por um espaço dedicado a imagens na barra lateral, disponível tanto na versão web quanto nos aplicativos móveis, onde o usuário pode enviar fotos, escolher estilos pré-definidos ou simplesmente descrever, em texto, a alteração desejada. Todo o fluxo é guiado por prompts em linguagem natural, dispensando menus complexos ou conhecimento técnico avançado para permitir edições, ajustes ou criações dentro da própria conversa com o ChatGPT. O ChatGPT atualizou sua ferramenta de criação de imagens e promete superar concorrentes Reprodução/Gabriel Pereira Entre as principais ferramentas disponíveis estão a remoção automática de fundo, edição localizada de elementos específicos da imagem, correções visuais (como ajustes de iluminação, textura e ruído) e a geração de variações a partir de uma mesma foto ou ideia. Também é possível combinar imagens diferentes em uma única cena, aplicar estilos artísticos ou reinterpretar uma imagem com base em um conceito descrito pelo usuário, mantendo consistência visual e identidade dos personagens retratados. Por trás dessas funções, o recurso é alimentado por modelos de visão generativa de última geração, reunidos no GPT Image 1.5. A tecnologia permite compreender o conteúdo da imagem, o contexto do prompt e a relação entre objetos, pessoas e cenários, realizando alterações pontuais sem comprometer a composição original. O resultado é um editor que une geração e edição em um único ambiente, com respostas rápidas e alto nível de controle criativo diretamente pelo ChatGPT. Resultados dos testes Para avaliar o desempenho do novo editor de imagens do ChatGPT realizamos uma série de testes comparativos focados nos principais cenários de uso desse tipo de ferramenta. A ideia foi observar não apenas a qualidade final das imagens, mas também o nível de precisão nas edições, a fidelidade às instruções em texto e o impacto dessas mudanças na naturalidade do resultado. Os testes foram organizados por categorias e refletem tarefas comuns tanto para usuários casuais quanto para quem cria conteúdo com frequência. A análise foi dividida em quatro frentes: remoção de fundo, correções visuais (como ajustes de pele, sombras e ruídos), edição criativa e geração de imagens a partir de prompts e, por fim, velocidade e experiência do usuário. Em cada etapa, observamos como a ferramenta se comporta em situações reais, quais são seus principais acertos e limitações e como ela se posiciona frente a soluções concorrentes no mercado. Remoção de Fundo É possível solicitar edições em imagens através de linguagem natural Reprodução/Gabriel Pereira No primeiro teste, utilizamos o prompt “Remova o fundo da imagem em questão, porém preserve os elementos centrais da imagem” para avaliar a eficiência do ChatGPT em uma tarefa básica, mas bastante comum em editores de imagem. O processo de geração foi mais lento do que o esperado, o que indica que a ferramenta prioriza qualidade em vez de velocidade nesse tipo de operação. Resultado gerado pelo ChatGPT inserido em um fundo cinza Reprodução/Gabriel Pereira Apesar da demora, o resultado foi positivo. O ChatGPT entregou uma imagem com recorte preciso e fundo totalmente transparente, gerando um PNG real, e não apenas uma simulação visual de transparência. Os elementos centrais foram preservados com fidelidade, sem bordas artificiais ou perdas perceptíveis de detalhe, o que reforça o potencial da ferramenta para usos práticos no dia a dia. No mesmo cenário de teste, o Nano Banana apresentou um desempenho mais ágil no tempo de processamento, entregando o resultado em poucos segundos. No entanto, a velocidade veio acompanhada de um corte menos refinado, com perda de detalhes nas bordas dos elementos centrais da imagem. Mesma solicitação realizada para o Nano Banana, do Gemini Reprodução/Gabriel Pereira Além disso, o resultado não foi um PNG verdadeiro. Apesar da aparência inicial sugerir fundo transparente, a imagem ainda continha um fundo branco aplicado, o que limita a reutilização do arquivo em diferentes contextos e reduz sua eficiência para trabalhos que exigem transparência real. Imagem gerada pelo Gemini em cima de um fundo cinza Reprodução/Gabriel Pereira Correções (pele, sombras, ruídos) No teste seguinte, utilizamos o prompt “Remova o reflexo da foto a seguir e dê foco às expressões do homem. Não altere nada em seu rosto ou na iluminação, apenas remova os reflexos do vidro”. De novo, o ChatGPT apresentou um tempo de processamento mais elevado, reforçando o padrão observado no teste anterior. Apesar do tempo elevado na resposta, o ChatGPT forneceu um resultado consistente Reprodução/Gabriel Pereira Em contrapartida, a imagem veio consistente. O reflexo do vidro foi removido com sucesso, sem interferir nas expressões faciais, nos traços do rosto ou na iluminação original da cena. A edição manteve a naturalidade da imagem, sem artefatos visuais evidentes, o que indica um bom controle em ajustes localizados mais delicados. No mesmo teste, o Nano Banana respondeu de forma mais rápida, mas não conseguiu executar a tarefa conforme solicitado. Mesmo após duas tentativas com o mesmo prompt, o reflexo no vidro permaneceu visível na imagem final. O Nano Banana do Gemini não conseguiu realizar o teste, mesmo com duas tentativas Reprodução/Gabriel Pereira O resultado indica uma limitação da ferramenta em edições mais específicas e localizadas, em especial quando a alteração exige compreensão do contexto visual sem comprometer elementos sensíveis, como rosto, expressões e iluminação. Edição Criativa e Geração Para o último teste, utilizamos o prompt “Faça uma edição criativa na seguinte imagem, insira elementos lúdicos ou cinematográfico, porém não altere a aparência ou expressão da mulher”. O objetivo foi avaliar a capacidade das ferramentas em interpretações criativas, mantendo restrições claras sobre identidade e expressão facial. Imagem lúdica fornecida pelo ChatGPT Reprodução/Gabriel Pereira O ChatGPT inseriu elementos criativos e reinterpretou o cenário de forma ousada, alterando o sentido original da imagem sem comprometer a aparência ou a expressão da mulher retratada. O resultado apresentou um tom mais lúdico e cinematográfico, demonstrando maior liberdade criativa aliada a um bom entendimento das limitações impostas pelo prompt. No teste de edição criativa, o Nano Banana novamente se destacou pela rapidez na geração do resultado. A ferramenta aplicou efeitos visuais e ajustes estéticos de forma quase imediata, entregando uma imagem visualmente mais polida. O Gemini forneceu um resultado mais rápido, porém mais simples Reprodução/Gabriel Pereira Por outro lado, a abordagem foi mais conservadora. Embora tenha preservado as características originais da imagem e respeitado a aparência da mulher retratada, o Nano Banana atuou mais como um recurso de embelezamento do que como uma reinvenção criativa, com menor impacto estilístico em comparação a imagem gerada pelo ChatGPT. Velocidade e Experiência do Usuário Em termos de velocidade, o Gemini (Nano Banana) leva vantagem sobre o ChatGPT ao entregar resultados de forma quase imediata. Mesmo quando a qualidade não é perfeita, a ferramenta demonstra consistência ao tentar manter coerência com o comando fornecido pelo usuário, o que favorece fluxos de trabalho mais ágeis e exploratórios. Já o ChatGPT apresenta um ritmo mais lento, podendo levar minutos para concluir uma geração ou edição, especialmente em tarefas mais complexas. Em contrapartida, esse tempo adicional se reflete em imagens mais bem trabalhadas, com maior atenção a detalhes, precisão nos recortes e melhor preservação de elementos sensíveis, o que o coloca à frente em qualidade quando comparado ao Nano Banana. Na experiência de uso, as duas soluções são intuitivas e acessíveis, mesmo para quem não tem familiaridade com edição de imagens. A principal diferença está no fluxo de acesso às funções: no Nano Banana, é necessário selecionar previamente a opção de geração de imagens dentro do menu de prompts antes de enviar o comando, o que adiciona um passo extra ao processo. No ChatGPT, a interação é direta, o que permite que o usuário descreva o que deseja em linguagem natural, sem configurações adicionais. Isso contribui para uma experiência mais fluida e integrada ao uso cotidiano do chatbot. Com informações de OpenAI Veja também: Você sabe diferenciar um vídeo real ou feito com IA? Testamos o público! Você sabe diferenciar um vídeo real ou feito com IA? Testamos o público!