Você já posou para selfies e retratos em grupo só para descobrir que seu rosto ficou borrado porque você não conseguia parar de rir de uma piada idiota que um amigo seu acabou de fazer? Sim, e é bastante desanimador ver os resultados. Para resolver esse problema, pesquisadores do Instituto de Inteligência Artificial Inception, do Instituto de Tecnologia de Pequim e da Universidade Stony Brook criaram uma IA que pode ajudar a desfigurar rostos humanos em imagens.
Os pesquisadores publicaram suas descobertas em um artigo intitulado “Human-Aware Motion Deblurring”. Eles afirmam que sua metodologia funciona melhor do que os métodos existentes de remoção de manchas.
O primeiro e o segundo plano de uma imagem sofrem diferentes tipos de degradação de imagem devido a vários fatores, incluindo movimento relativo entre a câmera e os objetos, distância e plano da imagem.
No artigo, os pesquisadores propõem um modelo de desfibramento com consciência humana com base em uma "arquitetura de codificador-decodificador de ramificação tripla" que é capaz de corrigir o desfoque de movimento entre assuntos em primeiro plano (rostos humanos) e o plano de fundo.
Na arquitetura do codificador-decodificador de ramificação tripla, o As duas primeiras ramificações são responsáveis por tornar os humanos mais nítidos no primeiro plano e nos detalhes do plano de fundo enquanto a terceira ramificação funde as informações de remoção de manchas das outras duas ramificações.
Como parte da pesquisa, os cientistas criaram um conjunto de dados que chamam de HIDE (Humanaware Image DEblurring). O conjunto de dados HIDE consiste em 8.422 pares de imagens extraídas de uma câmera de alta velocidade. Cada par contém uma imagem borrada e sua imagem nítida correspondente.
Seu modelo foi treinado em uma GPU Nvidia Titan X usando o conjunto de dados HIDE e um conjunto de dados que consiste em imagens desfocadas e nítidas de vídeos de câmera GoPro Hero 720p a 240 fps, perfazendo um total de 10.742 imagens. Os pesquisadores mencionam que o conjunto de dados GoPro foi usado apenas para treinar o decodificador de fundo, pois tinha muito poucos pedestres.
Você pode aprender mais sobre o sistema no artigo de pesquisa aqui e você pode baixar o conjunto de dados HIDE aqui. Então, o que você acha dessa metodologia proposta? Conte-nos nos comentários.