Zoom e Enhance | Google Brain Super Resolution Tech fazem da TV Trope uma realidade

Parte da sopa de letras do Google, Google Brain, teve um avanço na nitidez das imagens pixelizadas. O centro de pesquisa de aprendizagem profunda da empresa criou um novo software que pode criar uma imagem detalhada a partir de uma fonte extremamente pixelizada.

Daily followers of SLR Lounge pode reconhecer que relatamos no Google RAISR no mês passado e isto pode parecer um pouco familiar. No entanto, o software do Google Brain é muito mais poderoso. Enquanto a RAISR pode melhorar e ampliar uma foto reconhecível, o software do Google Brain pode pegar numa fonte 8×8 (com a combinação inteligente de duas redes neurais) pode criar algo que se assemelha à imagem original.

É impossível criar mais detalhes do que os da imagem original; então como é que o Google Brain o faz? A imagem é primeiramente executada através de uma rede de condicionamento, onde o software tenta mapear a fonte 8×8 contra outras imagens de alta resolução que foram reduzidas para 8×8. Em segundo lugar, a rede anterior usa uma implementação do PixelCNN (um modelo generativo de imagens com uma probabilidade traçável) para tentar adicionar detalhes realistas de alta resolução à fonte 8×8. Em essência, são necessárias referências de tamanho reduzido e as utiliza para aumentar a escala da fonte 8×8.

Várias técnicas diferentes de super-resolução. As três colunas mais à direita são o método Google Brain.

Um exemplo fornecido por Ars Technica:

Se houver um pixel marrom em direção ao topo da imagem, a rede anterior pode identificar isso como uma sobrancelha: assim, quando a imagem é escalada, ela pode preencher as lacunas com uma coleção de pixels marrons em forma de sobrancelha.

No mundo real testando a técnica de super-resolução do Google Brain foi razoavelmente bem sucedida enganando observadores humanos em 10% do tempo quando mostrava rostos de celebridades gerados por computador e em 28% quando mostrava imagens de quartos (50% seria uma pontuação perfeita). Como referência, zero por cento foram enganados ao usar técnicas de amostragem bicúbica existentes.

O tropo comum típico do drama criminal mostra quando a filmagem pixelada é “ampliada e melhorada” é uma piada que os escritores têm parado desde então, mas está se tornando uma realidade. Se você gostaria de saber mais sobre a tecnologia por trás da ‘Pixel Recursive Super Resolution’, Google Lançou um artigo aqui.