Zoom și îmbunătățire | Google Brain Super Resolution Tech face din trocul TV o realitate

O parte din supa Alphabet a Google, Google Brain, a făcut o descoperire în ceea ce privește accentuarea imaginilor pixelate. Centrul de cercetare în domeniul învățării profunde al companiei a conceput un nou software care poate crea o imagine detaliată dintr-o sursă extrem de pixelată.

Susținătorii zilnici ai SLR Lounge ar putea recunoaște că am raportat despre Google RAISR luna trecută și acest lucru poate părea puțin familiar. Cu toate acestea, software-ul Google Brain este mult mai puternic. În timp ce RAISR poate îmbunătăți și mări o fotografie recognoscibilă, software-ul de la Google Brain poate lua o sursă 8×8 (cu ajutorul combinației inteligente a două rețele neuronale) poate crea ceva care seamănă cu imaginea originală.

Este imposibil să creezi mai multe detalii decât există în imaginea sursă; atunci cum face Google Brain acest lucru? Imaginea este mai întâi rulată printr-o rețea de condiționare, unde software-ul încearcă să cartografieze sursa 8×8 față de alte imagini de înaltă rezoluție care au fost reduse la 8×8. În al doilea rând, rețeaua anterioară utilizează o implementare a PixelCNN (un model generativ al imaginilor cu o probabilitate ușor de înțeles) pentru a încerca să adauge detalii realiste de înaltă rezoluție la sursa 8×8. În esență, aceasta ia referințe reduse și le folosește pentru a mări dimensiunea sursei 8×8.

Diferite tehnici diferite de suprarezoluție. Cele trei coloane din dreapta reprezintă metoda Google Brain.

Un exemplu oferit de Ars Technica:

Dacă există un pixel maro spre partea de sus a imaginii, rețeaua anterioară ar putea să îl identifice ca fiind o sprânceană: astfel, atunci când imaginea este mărită, ar putea umple golurile cu o colecție de pixeli maro în formă de sprânceană.

În testele din lumea reală, tehnica de super-rezoluție a Google Brain a avut un succes rezonabil, păcălind observatorii umani în 10 la sută din cazuri când li s-au arătat fețe de celebrități generate pe calculator și în 28 la sută când li s-au arătat imagini de dormitoare (50 la sută ar fi un scor perfect). Ca referință, zero la sută au fost păcăliți atunci când au fost folosite tehnicile existente de eșantionare bicubică.

Tropul comun tipic emisiunilor de teatru polițist când imaginile pixelate sunt „mărite și îmbunătățite” este o glumă pe care scenariștii au încetat-o de atunci, dar care devine o realitate. Dacă doriți să aflați mai multe despre tehnologia din spatele „Pixel Recursive Super Resolution”, Google a publicat un articol aici.

.