Siete pronti a fare un salto nel futuro della tecnologia? Google DeepMind ha appena svelato un aggiornamento che sembra uscito da un film di fantascienza: Genie 3. Se il suo predecessore era già una cosa pazzesca, questo nuovo “world model” promette di farci sognare, creando simulazioni interattive in tempo reale con una coerenza visiva che sfida ogni limite.
Addio Memoria da Pesciolino Rosso, Benvenuta Coerenza Visiva
Vi ricordate le limitazioni di Genie 2? La sua memoria era una roba da 10 secondi, come un chatbot che ha superato la sua finestra di contesto: se un elemento usciva dall’inquadratura, quando tornava era completamente diverso. Dimenticatevi tutto. Genie 3 spinge l’asticella molto più in alto, offrendo una coerenza visiva che dura per diversi minuti. Il team di DeepMind lo definisce un grande passo in avanti, anche se il sogno (per ora lontano) è arrivare a coerenza di ore.
Un Mondo Imperfetto ma Pieno di Promesse
Nonostante l’enorme potenziale, siamo ancora in una fase di ricerca. Il “mondo” di Genie 3 non è perfetto e non può riprodurre luoghi reali, ma crea ogni volta un’ambientazione unica e non-deterministica. Di conseguenza, è soggetto a quelle che noi nerd chiamiamo “allucinazioni AI”. A volte la locomozione umana è un po’ strana (con persone che camminano all’indietro), e il testo è un vero e proprio pasticcio se non lo si inserisce esplicitamente nel prompt.
Attualmente, l’interazione degli “agenti AI” all’interno di questi mondi è ancora limitata al semplice movimento. Non possono ancora ragionare a un livello tale da modificare la simulazione, anche se DeepMind sta lavorando per far interagire più agenti tra loro. Forse un’anteprima di un vero e proprio mondo virtuale con NPC intelligenti che potremo vedere in Genie 4?
Un Potere Immenso, ma Ancora Fuori dalla Nostra Portata
Genie 3 è in grado di renderizzare un video interattivo in un tempo incredibilmente breve, ma questo richiede una potenza di calcolo spaventosa. Google non ha fornito dettagli precisi, ma il fatto che per ora non sia accessibile al pubblico la dice lunga. L’accesso, per il momento, è riservato solo a un gruppo selezionato di esperti e ricercatori che aiuteranno a perfezionare il modello.
Ma la speranza è che in futuro, la tecnologia alla base dei modelli Genie possa essere aperta a tutti, democratizzando la creazione di mondi e storie interattive. In attesa di quel giorno, non possiamo che restare incollati allo schermo, sognando le infinite possibilità che questa tecnologia aprirà per il mondo dell’animazione, dei videogiochi e della narrativa.
L’articolo Genie 3 di Google DeepMind: L’IA che Crea Mondi Interattivi proviene da CorriereNerd.it.
Aggiungi un commento