Parte della zuppa Alphabet di Google, Google Brain, ha avuto una svolta nel rendere più nitide le immagini pixelate. Il centro di ricerca di deep learning dell’azienda ha ideato un nuovo software che può creare un’immagine dettagliata da una fonte estremamente pixelata.
I seguaci quotidiani di SLR Lounge potrebbero riconoscere che abbiamo riferito su Google RAISR il mese scorso e questo può sembrare un po’ familiare. Tuttavia, il software di Google Brain è molto più potente. Mentre RAISR può migliorare e ingrandire una foto riconoscibile, il software di Google Brain può prendere una fonte 8×8 (con la combinazione intelligente di due reti neurali) può creare qualcosa che assomiglia all’immagine originale.
È impossibile creare più dettagli di quelli presenti nell’immagine sorgente; quindi come fa Google Brain? L’immagine viene prima eseguita attraverso una rete di condizionamento, dove il software cerca di mappare la fonte 8×8 contro altre immagini ad alta risoluzione che sono state ridimensionate a 8×8. In secondo luogo, la rete prioritaria utilizza un’implementazione della PixelCNN (un modello generativo di immagini con una verosimiglianza trattabile) per cercare di aggiungere dettagli realistici ad alta risoluzione alla fonte 8×8. In sostanza, prende i riferimenti ridimensionati e li usa per ingrandire la sorgente 8×8.
Un esempio fornito da Ars Technica:
Se c’è un pixel marrone verso la parte superiore dell’immagine, la rete prioritaria potrebbe identificarlo come un sopracciglio: così, quando l’immagine viene scalata, potrebbe riempire gli spazi vuoti con un insieme di pixel marroni a forma di sopracciglio.
Nei test del mondo reale la tecnica di super-risoluzione di Google Brain ha avuto un discreto successo ingannando gli osservatori umani il 10 per cento del tempo quando ha mostrato volti di celebrità generati dal computer e il 28 per cento quando ha mostrato immagini di camere da letto (il 50 per cento sarebbe un punteggio perfetto). Come riferimento, lo zero per cento è stato ingannato quando si usavano tecniche esistenti di campionamento bicubico.
Il tropo comune tipico degli show di fiction criminale quando le riprese pixelate sono “zoomate e migliorate” è uno scherzo che gli scrittori hanno smesso, ma sta diventando una realtà. Se volete saperne di più sulla tecnologia dietro la “Pixel Recursive Super Resolution”, Google ha rilasciato un documento qui.