Zoom y mejora | La tecnología de superresolución de Google Brain hace realidad el tropo de la televisión

Parte de la sopa Alphabet de Google, Google Brain, tuvo un gran avance en la nitidez de las imágenes pixeladas. El centro de investigación de aprendizaje profundo de la compañía ideó un nuevo software que puede crear una imagen detallada a partir de una fuente extremadamente pixelada.

Los seguidores diarios de SLR Lounge pueden reconocer que informamos sobre Google RAISR el mes pasado y esto puede parecer un poco familiar. Sin embargo, el software de Google Brain es mucho más potente. Mientras que RAISR puede mejorar y ampliar una foto reconocible, el software de Google Brain puede tomar una fuente de 8×8 (con la inteligente combinación de dos redes neuronales) puede crear algo que se parezca a la imagen original.

Es imposible crear más detalles de los que hay en la imagen de origen; entonces, ¿cómo lo hace Google Brain? En primer lugar, la imagen pasa por una red de condicionamiento, en la que el software intenta comparar la fuente de 8×8 con otras imágenes de alta resolución que han sido reducidas a 8×8. En segundo lugar, la red previa utiliza una implementación de PixelCNN (un modelo generativo de imágenes con una probabilidad manejable) para intentar añadir detalles realistas de alta resolución a la fuente de 8×8. En esencia, toma referencias reducidas y las utiliza para aumentar la escala de la fuente de 8×8.

Diversas técnicas de superresolución. Las tres columnas de la derecha corresponden al método de Google Brain.

Un ejemplo proporcionado por Ars Technica:

Si hay un píxel marrón hacia la parte superior de la imagen, la red previa podría identificarlo como una ceja: así, cuando la imagen se amplía, podría rellenar los huecos con una colección de píxeles marrones en forma de ceja.

En las pruebas del mundo real, la técnica de superresolución de Google Brain consiguió engañar a los observadores humanos el 10 por ciento de las veces cuando se les mostraron rostros de famosos generados por ordenador y el 28 por ciento cuando se les mostraron imágenes de dormitorios (el 50 por ciento sería una puntuación perfecta). Como referencia, el cero por ciento fue engañado cuando se utilizaron las técnicas existentes de muestreo bicúbico.

El tropo común típico de los programas de drama criminal cuando las imágenes pixeladas son «ampliadas y mejoradas» es una broma que los escritores han dejado de hacer, pero se está convirtiendo en una realidad. Si quieres saber más sobre la tecnología que hay detrás de la «Superresolución Recursiva de Píxeles», Google publicó un artículo aquí.