TikTok tem agora um sistema de IA para converter texto em imagens na sua app
Os sistemas de IA para converter texto em imagem estão a crescer cada vez mais em qualidade e popularidade, e o que melhor prova isso é o seu aparecimento na aplicação mais usada do mundo - o TikTok.
O efeito "AI Greenscreen", inserido diretamente na aplicação, mostra que a conversão de texto em imagem se está a tornar famosa.
A plataforma de vídeo acrescentou recentemente um novo efeito chamado "AI Greenscreen" que permite aos utilizadores inserir texto que o software irá gerar como uma imagem. Esta imagem pode ser usada como fundo de um vídeo - uma ferramenta potencialmente muito útil para os criadores de conteúdo.
Este efeito é bastante básico em comparação com alguns modelos de texto-imagem de última geração como o Google Imagen, DALL-E 2 da OpenAI, ou o Midjourney. O efeito do TikTok cria apenas imagens bastante abstratas; como "astronauta no oceano", "Mergulho no oceano roxo" ou "carro na lua". Outros modelos, por comparação, podem produzir tanto imagens foto realistas como ilustrações complexas e coerentes que parecem ter sido desenhadas ou pintadas por humanos.
Efeito do TikTok pensado a 100%
Contudo, as limitações deste efeito do TikTok podem muito bem ser intencionais. Em primeiro lugar, efeitos mais avançados requerem um maior poder computacional, o que seria dispendioso e exigiria recursos intensivos para a empresa implementar.
Em segundo lugar, o TikTok tem mais de mil milhões de utilizadores, e dar a todos estes indivíduos o poder de criar imagens foto realistas de qualquer coisa que possam imaginar produziria, quase certamente, alguns resultados preocupantes.
Por exemplo, um pedido envolvendo nudez - "modelo nua na praia" ou "nudez na praia" - produz imagens que, caso o efeito não tivesse tantas limitações, poderiam ser um tanto quanto inapropriadas para alguns utilizadores.
A popularidade que esta tecnologia está a ganhar
O que é notável no surgimento do "IA Greenscreen" do TikTok é que mostra a rapidez com que esta tecnologia se está a generalizar. O último ciclo de desenvolvimento para texto-imagem começou em 2021 com o lançamento original do DALL-E pela OpenAI.
Menos de dois anos mais tarde a tecnologia já está nas mãos de milhões através do TikTok.
Leia também...
Este artigo tem mais de um ano