Il nuovo GPT 4 di OpenAI è un'intelligenza artificiale in grado di comprendere le immagini

 Il nuovo GPT 4 di OpenAI è un'intelligenza artificiale in grado di comprendere le immagini

Michael Schultz

GPT 4 è l'ultima release di OpenAI, il laboratorio tecnologico responsabile del popolare strumento text-to-image Dall-E e dell'ancor più popolare applicazione di linguaggio naturale ChatGPT. Ed è interessante!

Ciò che distingue GPT4 è l'intelligenza artificiale multimodale, in grado di analizzare sia le richieste di testo che quelle di immagini, per produrre risultati solo scritti, ma anche il miglior software del laboratorio in termini di capacità e stabilità.

Guarda anche: L'elenco completo delle prove gratuite di foto stock (aggiornamento 2023)

Se siete incuriositi, continuate a leggere per maggiori informazioni!

E se volete tutti i dettagli sul GPT4, chi può accedervi e come, leggete il mio articolo dedicato su Aisecrets.com!

Cos'è il GPT 4: IA che interpreta linguaggio e immagini

L'ultimo modello di intelligenza artificiale di OpenAI accetta richieste - input o istruzioni dell'utente - scritte o visive (come foto, screenshot, diagrammi, ecc.) ma produce risultati solo testuali.

Oltre a comprendere le istruzioni scritte, il GPT 4 è in grado di identificare e analizzare gli elementi di un'immagine e di utilizzare questa interpretazione per eseguire diversi compiti.

Secondo OpenAI, questo software ha ottenuto i migliori risultati di sempre durante i suoi test. Pur precisando che non sostituisce gli esseri umani negli scenari del mondo reale, OpenAI sostiene che raggiunge risultati di livello umano in diversi ambienti professionali e accademici.

Cosa si costruisce con GPT 4: applicazioni che assistono l'uomo

L'azienda sottolinea che questo sviluppo non mira a sostituire gli esseri umani nel loro lavoro o nelle loro capacità, ma piuttosto ad aiutarli, sia per migliorare i flussi di lavoro che per assisterli nelle aree in cui ne hanno bisogno.

Guarda anche: Primi passi nella videografia d'archivio

Ad esempio, abbiamo appreso che il nuovo chatbot Bing di Microsoft utilizza il GPT 4 e che un'applicazione di assistenza per ipovedenti chiamata Be My Eyes ha sviluppato un nuovo Volontario Virtuale in grado di analizzare le immagini fornite dagli utenti e di rispondere alle domande o di produrre altri risultati pertinenti, come ad esempio dire loro cosa c'è nel loro frigorifero e cosa possono cucinare con esso.

Nel complesso, si tratta di una nuova tecnologia molto interessante e di un nuovo passo verso il deep learning applicato alla vita quotidiana.

Michael Schultz

Michael Schultz è un rinomato fotografo con oltre un decennio di esperienza nel settore della fotografia stock. Con un occhio attento ai dettagli e una passione per catturare l'essenza di ogni scatto, si è guadagnato la reputazione di esperto di foto d'archivio, fotografie d'archivio e immagini royalty-free. Il lavoro di Schultz è stato presentato in varie pubblicazioni e siti Web e ha lavorato con numerosi clienti in tutto il mondo. È noto per le sue immagini di alta qualità che catturano la bellezza unica di ogni soggetto, dai paesaggi e paesaggi urbani a persone e animali. Il suo blog sulla fotografia stock è un tesoro di informazioni sia per i fotografi alle prime armi che per i professionisti che cercano di migliorare il loro gioco e ottenere il massimo dal settore della fotografia stock.