Zoom and Enhance | Google Brain Super Resolution Tech make TV Trope a Reality

október 11, 2021

A Google Alphabet levesének része, a Google Brain áttörést ért el a pixeles képek élesítésében. A vállalat mélytanulási kutatóközpontja egy új szoftvert dolgozott ki, amely rendkívül pixeles forrásból is képes részletes képet létrehozni.

A SLR Lounge napi követői felismerhetik, hogy a múlt hónapban beszámoltunk a Google RAISR-ről, és ez kicsit ismerős lehet. A Google Brain szoftvere azonban ennél sokkal erősebb. Míg a RAISR egy felismerhető fotót képes feljavítani és felnagyítani, addig a Google Brain szoftvere egy 8×8-as forrásból (két neurális hálózat okos kombinációjával) képes olyasmit létrehozni, ami hasonlít az eredeti képre.

A forrásképnél több részletet nem lehet létrehozni; hogyan csinálja tehát a Google Brain? A képet először egy kondicionáló hálózaton futtatják át, ahol a szoftver megpróbálja a 8×8-as forrást más, 8×8-asra kicsinyített, nagy felbontású képekkel összevetni. Másodszor, az előzetes hálózat a PixelCNN egy implementációját használja (a képek generatív modellje, amely egy követhető valószínűséggel rendelkezik), hogy megpróbáljon reális, nagy felbontású részleteket hozzáadni a 8×8-as forráshoz. Lényegében lekicsinyített referenciákat vesz, és azokat használja fel a 8×8-as forrás felskálázására.

Változatos különböző szuperfelbontási technikák. A jobb szélső három oszlop a Google Brain módszere.

Az Ars Technica által megadott példa:

Ha a kép teteje felé van egy barna pixel, akkor az előzetes hálózat ezt szemöldökként azonosíthatja: így a kép felskálázásakor a hézagokat barna pixelek szemöldök alakú gyűjteményével töltheti ki.

A Google Brain szuperfelbontási technikája a valós világbeli tesztek során meglehetősen sikeresen megtévesztette az emberi megfigyelőket az esetek 10 százalékában, amikor számítógépen generált hírességek arcát mutatták, és 28 százalékában, amikor hálószobák képeit mutatták (az 50 százalék tökéletes eredmény lenne). Referenciaként nulla százalékot sikerült becsapni, amikor a meglévő bikubikus mintavételi technikákat használták.”

A bűnügyi drámasorozatokra jellemző gyakori trópus, amikor a pixeles felvételeket “nagyítják és feljavítják”, egy vicc, amit az írók azóta abbahagytak, de kezd valósággá válni. Ha többet szeretnél megtudni a “Pixel Recursive Super Resolution” mögött álló technológiáról, a Google itt tett közzé egy tanulmányt.

Savage Rose

Zoom and Enhance | Google Brain Super Resolution Tech make TV Trope a Reality

Vélemény, hozzászólás? Kilépés a válaszból