Skip to main content

Microsoft ha confermato che questa settimana uscirà GPT-4, la nuova versione del modello su cui si basa ChatGPT e la chat di Bing.

Gran parte delle novità tecniche saranno riservate fino al lancio ufficiale, anche se hanno già avanzato un dettaglio chiave: GPT-4 sarà multimodale.

Cosa significa per un modello linguistico essere multimodale?

Vuol dire che permetterà all’intelligenza di tradurre il testo in altre tipologie di media, interpretare sia testo che immagini. La versione precedente, che dà vita a ChatGPT, è solo in grado di produrre testi.

Con GPT-4, quindi, sarebbe possibile generare testo, immagini, video e persino musica. Non solo, ma significa anche che potremmo rispondere allo stesso modo, permettendo la creazione di video a partire dal testo che inseriremo nella chat. Questo ha il potenziale per essere rivoluzionario.

Sebbene esistano già strumenti per creare immagini dal testo, creare video è più complesso e richiede una maggiore potenza di elaborazione. Un altro vantaggio di GPT-4 come linguaggio multimodale è che sarà in grado di gestire l’input e l’output di dati in diverse lingue: quindi potremo inoltrare una richiesta in italiano, ma ricevere la risposta in inglese.

E senza dubbio l’anno della IA e nessuno vuole rimanerne fuori…

Noi non vediamo l’ora di provare il nuovo GPT-4 per raccontarvi in prima persona le novità.

Lascia un commento