Nell’ambito della Graphics Technology Conference (GTC) di questa settimana, Nvidia ha mostrato un nuovo approccio al cosiddetto “inverse rendering” – il processo di ricostruzione di scene 3D partendo da un poche immagini 2D di partenza. L’inverse rendering sfrutta l’intelligenza artificiale per rilevare con approssimazione il comportamento della luce nell’ambiente reale; con un nuovo l’approccio studiato dal team di Nvidia Research, tutto il procedimento può avvenire quasi all’istante.
Il metodo – spiega Nvidia – può essere applicato a un’ampia gamma di casi d’uso: può ad esempio essere sfruttato per creare avatar o scene per mondi virtuali, per catturare dettagli di partecipanti a una videoconferenza e dei loro ambienti in 3D, o per ricostruire scene per mappe digitali in 3D.
I metodi tradizionali per creare scene 3D, possono richiedere ore o anche giorni, in base alla complessità e alla risoluzione degli elementi da visualizzare; la tecnologia denominata neural radiance fields (NeRF) sfrutta l’IA per velocizzare il processo. NeRF sfrutta le reti neurali per rappresentare ed effettuare il rendering di realistiche scene in 3D, in base ad un insieme di input da scene 2D, addestrando le reti neurali a riempire gli spazi vuoti prevedendo il colore della luce che si irradia in qualsiasi direzione da qualsiasi punto nello spazio 3D.
I primi modelli NeRF hanno dimostrato la possibilità di ottenere rendering di qualità in pochi minuti ma richiedevano ore per l’addestramento. I ricercatori di Nvidia hanno sviluppato una tecnologia che chiamano “Instant NeRF”, combinando l’addestramento veloce di reti neurali con il rendering rapido, ottenendo quella che definiscono la più veloce tecnica NeRF attualmente disponibile, con velocità fino a 1000x rispetto a quanto possibile in precedenza.
Per ottenere questi risultati, Nvidia ha sfruttato un nuovo metodo di codifica in input denominato “multi-resolution hash grid encoding”, ottimizzato per funzionare efficientemente sulle GPU Nvidia.
Secondo Nvidia, l’Instant NeRF potrebbe essere importante per il 3D con le fotocamere, alla stregua di come la compressione JPEG lo è stata nella fotografia 2D, incrementando notevolmente la velocità, la facilità d’uso e la portata del 3D capturing e la possibilità di condividere questo tipo di immagini.
Per tutti gli articoli di macitynet che parlano di Intelligenza Artificiale fate riferimento a questo indirizzo.