Questa rete neurale di AI da Nvidia crea immagini finte fotorealistiche

$config[ads_kvadrat] not found

QUESTA FOTO BLOCCA GLI SMARTPHONE ANDROID - Spiegato!

QUESTA FOTO BLOCCA GLI SMARTPHONE ANDROID - Spiegato!
Anonim

A prima vista, la foto in alto sembra una normale foto di una strada qualunque, presa da una dash cam o da qualcuno abbastanza sciocco da vagare per la strada per scattare una foto di una scena così banale.

Ma guarda un po 'più vicino. Si noti come il segnale del traffico è leggermente deformato, o come alcune delle auto sembrano sfocate? C'è qualcosa di sbagliato qui. Questa non è affatto una fotografia. È un'immagine creata interamente da un A.I.

Gli informatici della società tecnologica Nvidia e della University of California, Berkeley, hanno scritto un documento di ricerca, disponibile in preprint su arXiv, che spiega come sono riusciti a ottenere una rete neurale per generare immagini di strada realistiche e ritratti umani. Hanno anche incluso un'interfaccia utente che ti consente di modificare le immagini come preferisci aggiungendo fogliame extra o addirittura cambiando il tempo.

"Il gioco sta crescendo rapidamente, perché le persone adorano interagire tra loro in ambienti virtuali", racconta Ming-Yu Liu, uno scienziato senior di Nvidia. Inverso in una email "Tuttavia, costruire mondi virtuali è costoso con la tecnologia di oggi, perché richiede agli artisti di modellare e simulare esplicitamente la trama e l'illuminazione per il mondo che stanno costruendo. Con la traduzione da immagine ad immagine, possiamo invece provare il mondo reale per creare mondi virtuali."

Le reti neurali sono computer modellati per funzionare come un cervello umano acquisendo informazioni, applicandole e imparando dai risultati. Questa ricerca ha utilizzato tipi speciali di reti neurali introdotte da Ian Goodfellow nel 2014, chiamate reti generative avversarie - o GAN - che generalmente consistono in due reti, il generatore e il discriminatore.

Il generatore riceve le foto e inizia a creare immagini sintetiche simili a quelle fornite. Poi mostra un mix delle immagini che è stata data e dei falsi al discriminatore, il cui compito è distinguerli. Mentre questo processo procede, il generatore diventa più bravo a imitare le immagini originali e il discriminatore diventa più bravo a distinguere i falsi. I risultati sono alcune immagini piuttosto convincenti e totalmente false.

Questa ricerca si basa sul modello GAN tradizionale aggiungendo il generatore e le reti di discriminatori in poche sottoreti, consentendo l'output di immagini ad alta risoluzione. Le reti neurali sono anche in grado di prendere in una mappa semantica - o un modello di come dovrebbe essere la foto - e riempire le trame in modo autonomo. Gli utenti possono persino entrare nel progetto e cambiare le cose se vogliono aggiungere edifici anziché alberi in una vista stradale o allargare gli occhi in un ritratto.

Il documento confronta i suoi risultati con esperimenti simili fatti usando questo metodo, il più notevole è pix2pix. Lo studio Nvidia e UC Berkeley è in grado di generare immagini con dettagli minuscoli e precisi come targhe leggibili, mentre pix2pix genera immagini che sembrano quasi acquerelli.

Mentre questo strumento potrebbe essere usato per guadagnare qualche reddit redditizio con un paio di foto stravaganti, gli autori vedono un enorme potenziale nell'utilizzare questo approccio per generare una grafica realistica con un semplice progetto.

Centinaia di ore di lavoro meticoloso per generare mondi virtuali da utilizzare in Google Maps, film e videogiochi. Liu dice che questo modello potrebbe servire come un modo per ottenere indolore la maggior parte del disegno fatto e poi entrare e modificare i dettagli più tardi.

"Invece di rendere il mondo modellandolo esplicitamente, possiamo costruire il mondo implicitamente utilizzando la traduzione da immagine ad immagine per tradurre tra un semplice modello del mondo che non contiene alcuna trama o illuminazione, e un output fotorealistico. Questa capacità dovrebbe rendere molto più economico costruire mondi virtuali ", dice Inverso.

Per il prossimo passo in questa ricerca, il team spera di esplorare la traduzione video-video, che userebbe le reti neurali per creare video realistici. Un obiettivo che Lui dice ha sfidato i ricercatori sul campo.

Ora sai come si possono creare facilmente immagini false. Non fidarti di tutto ciò che vedi sulle immagini di Google.

$config[ads_kvadrat] not found