Como usar o Dollify [like a pro]
Olhando as miniaturas, a gente tem impressão de que as imagens são fotos, mas a companhia jura de pé junto que todas elas foram geradas pelo drawing bot, como o algoritmo vem sendo chamado. “Se você busca no Bing por um pássaro, receberá fotos de um pássaro. Mas, aqui, as imagens foram criadas pelo computador, pixel por pixel, desde o zero”, diz Xiaodong He, um dos pesquisadores do projeto. Tudo o que o bot precisa é de uma breve descrição do que vai ser desenhado, por exemplo, “vacas pastando no campo” ou algo mais abstrato (na nossa percepção), como “um ônibus de dois andares flutuando”. O objeto é desenhado com fundo ou entorno complementado com elementos definidos pelo próprio bot, ou seja, que não estão na descrição. É como se o algoritmo tivesse imaginação. Mas ele não tem, não no sentido estrito da palavra. Os desenhos são gerados com base no banco de imagens usado no treinamento. É por isso que, na ausência de objetos referenciados na descrição ou com uma base de referência fraca, o bot pode acabar criando imagens bizarras, daquelas que, se feitas por uma pessoa, talvez fariam você perguntar quem é o fornecedor dela.
A base do drawing bot é o CaptionBot, projeto de inteligência artificial criado anteriormente que gera descrições de imagens, e o SeeingAI, sistema que é capaz de narrar ou responder a perguntas sobre imagens (ele é útil para deficientes visuais, por exemplo). Quando um desenho é criado, uma parte do bot analisa o resultado para verificar se ele corresponde com a descrição passada com auxílio de um modelo matemático que simula a atenção humana: se você sabe que a imagem tem que ter um pássaro, vai procurar um pássaro nela; o algoritmo faz a mesma coisa, ou seja, lê a descrição e tenta identificar os elementos associados às palavras. Ainda que os resultados atuais tenham inconsistências, eles impressionam, sinalizando que, com ajustes e mais treinos, as imagens criadas poderão se aproximar da perfeição, possibilitando que o algoritmo seja usado em softwares de edição de imagens ou criação de animações. Com informações: TechCrunch.