Questa rete neurale può rendere nuovamente perfette le immagini sfocate

Introduzione Alle Reti Neurali 01: Cos'è una Rete Neurale?

Introduzione Alle Reti Neurali 01: Cos'è una Rete Neurale?
Anonim

Non c'è niente di peggio che aprire un'immagine sul tuo computer solo per scoprire che è così sgranata che non puoi nemmeno iniziare a capirlo.

Alcune persone potrebbero dire di avere una macchina fotografica migliore. Queste persone sono cattive. Ma gli informatici - le persone buone e disponibili - stanno dicendo di usare una rete neurale, un sistema di computer progettato per imitare il pensiero del cervello umano.

Tre scienziati informatici della Oxford University e l'Istituto Skolkovo di Scienza e Tecnologia di Mosca, specializzato in computer vision, hanno sviluppato una rete neurale in grado di trasformare quella foto inutilmente sfogliata di broccoletti di avocado in un'immagine che è perfettamente compatibile con Instagram. Lo chiamano Deep Image Prior.

Le reti neurali sono modellate vagamente per assomigliare a un cervello umano. Sono costituiti da migliaia di nodi che usano per prendere decisioni e giudizi sui dati che vengono presentati a loro. Proprio come i bambini piccoli, iniziano senza sapere nulla ma dopo un paio di migliaia di sessioni di allenamento possono diventare rapidamente migliori degli umani nelle attività quotidiane.

Molte reti neurali vengono addestrate alimentando loro grandi dataset, il che fornisce loro un enorme pool di informazioni da cui attingere quando si tratta di prendere una decisione.

Deep Image Prior ha un approccio diverso. Funziona tutto da solo quella singola immagine originale, non avendo bisogno di alcun addestramento precedente prima che possa trasformare la tua immagine schifosa e corrotta in uno scatto ad alta risoluzione.

I tre scienziati informatici hanno usato una rete di generatori per ridisegnare l'immagine sfocata migliaia di volte finché non diventa così brava da creare immagini migliori dell'originale. Usa l'input esistente come contesto per riempire le parti mancanti o danneggiate. Alcuni risultati erano persino migliori di quelli ottenuti da reti neurali pre-addestrate.

"Il tipo di rete riempie le regioni danneggiate con trame da vicino", ha detto Dmitry Ulyanov, coautore della ricerca in un post reddit.

Ha ammesso che ci sono alcuni casi in cui la rete fallirebbe, come la complessità di ricostruire l'occhio umano: "L'ovvio caso di fallimento sarebbe qualsiasi cosa relativa alla reintegrazione semantica, ad es. rinominare una regione in cui ti aspetti di essere un occhio: il nostro metodo non conosce la semantica del volto e riempirà la regione corrotta con alcune trame ".

Oltre a ripristinare le foto, Deep Image Prior è stato anche in grado di rimuovere con successo il testo posizionato sulle immagini. Il che solleva la preoccupazione che questo modello possa essere utilizzato per rimuovere filigrane o altre informazioni sul copyright dalle immagini online. Una possibilità del mondo reale che forse è stata trascurata durante questa ricerca.

Questo esperimento dimostra che non è necessario accedere a un set di dati colossale per creare una rete neurale funzionante. Oltre a tutto ciò che potrebbe fare per la tua cartella di foto, questo potrebbe essere il contributo più duraturo di questo progetto.