A OpenAI lançou uma atualização significativa para o ChatGPT: introduziu capacidades nativas de geração de imagens, impulsionadas pelo avançado modelo GPT-4o. Esta é a primeira grande melhoria em mais de um ano, permitindo que os utilizadores criem e editem imagens diretamente da interface do chatbot.

O GPT-4o oferece a possibilidade de gerar e modificar imagens de forma fluída. Ao contrário das versões anteriores, este modelo requer um tempo de processamento ligeiramente superior para garantir visuais mais detalhados e precisos.

Entre as novidades está a funcionalidade de "inpainting", que permite aos utilizadores ajustarem elementos dentro das imagens, alterarem fundos e editarem componentes específicos, incluindo representações de pessoas num ambiente de conversa.

Esta funcionalidade está atualmente disponível para subscritores do plano Pro, que custa 200 dólares por mês, com previsão de alargamento aos utilizadores do plano Plus e da versão gratuita num futuro próximo. Os programadores que utilizam os serviços da OpenAI através da API também terão acesso a esta ferramenta.

Melhor renderização de texto em imagens

Um dos grandes destaques do GPT-4o é a sua capacidade de gerar texto dentro de imagens com uma precisão superior à do seu antecessor, o DALL-E 3. Tradicionalmente, os modelos multimodais enfrentam dificuldades em incorporar texto em elementos visuais, mas a abordagem autorregressiva do novo modelo ajuda a manter a estrutura e a legibilidade do conteúdo.

Esta melhoria torna-o ideal para criar conteúdos visuais complexos, como infográficos, sinalética e cenas detalhadas com múltiplos objetos, podendo processar até 20 elementos sem comprometer a precisão.

A OpenAI treinou o GPT-4o com um dataset que combina informação disponível publicamente e conteúdos proprietários adquiridos através de parcerias, como a Shutterstock. No entanto, a empresa mantém discrição quanto aos detalhes específicos do processo de treino, o que cita preocupações relacionadas com propriedade intelectual.

Para mitigar questões éticas, a OpenAI disponibiliza um formulário para artistas que pretendam excluir as suas obras de futuros modelos de IA e respeita sites que bloqueiam ferramentas de recolha de dados automatizadas.

Ao contrário de algumas alternativas concorrentes, a OpenAI implementa medidas para evitar que o conteúdo gerado por IA imite o estilo de artistas vivos. Além disso, embora as imagens criadas pelo GPT-4o não apresentem marcas de água visíveis, estas incluem metadados (C2PA) para garantir a rastreabilidade e autenticidade do conteúdo.

