ELODIN: Naming Concepts in Embedding Spaces
visão computacional, computação gráfica, inteligência artificial, inversão textual, texto-para-imagem, computação criativa
Apesar dos avanços recentes, o campo de geração de imagens a partir de texto ainda sofre de falta de controle refinado. Usando apenas texto, continua sendo um desafio lidar com questões como coerência e contaminação de conceitos. Propomos um método para melhorar o controle, gerando conceitos que podem ser reutilizados em várias imagens e, consequentemente, expandindo a linguagem natural com novas palavras que podem ser combinados como a paleta de um pintor. Ao contrário das contribuições anteriores, nosso método não replica visuais já presentes em dados de entrada. Em alguns casos, pode gerar conceitos visuais genéricos apenas a partir de texto e aplicá-los a diversas imagens. Realizamos um conjunto de experimentos que demonstram a melhoria do nosso método em relação ao uso direto de texto para geração de imagens.