Il nuovo GPT 4 di OpenAI è un'intelligenza artificiale in grado di comprendere le immagini

Sommario


GPT 4 è l'ultima release di OpenAI, il laboratorio tecnologico responsabile del popolare strumento text-to-image Dall-E e dell'ancor più popolare applicazione di linguaggio naturale ChatGPT. Ed è interessante!
Ciò che distingue GPT4 è l'intelligenza artificiale multimodale, in grado di analizzare sia le richieste di testo che quelle di immagini, per produrre risultati solo scritti, ma anche il miglior software del laboratorio in termini di capacità e stabilità.
Guarda anche: L'elenco completo delle prove gratuite di foto stock (aggiornamento 2023)Se siete incuriositi, continuate a leggere per maggiori informazioni!
E se volete tutti i dettagli sul GPT4, chi può accedervi e come, leggete il mio articolo dedicato su Aisecrets.com!
Cos'è il GPT 4: IA che interpreta linguaggio e immagini
L'ultimo modello di intelligenza artificiale di OpenAI accetta richieste - input o istruzioni dell'utente - scritte o visive (come foto, screenshot, diagrammi, ecc.) ma produce risultati solo testuali.
Oltre a comprendere le istruzioni scritte, il GPT 4 è in grado di identificare e analizzare gli elementi di un'immagine e di utilizzare questa interpretazione per eseguire diversi compiti.
Secondo OpenAI, questo software ha ottenuto i migliori risultati di sempre durante i suoi test. Pur precisando che non sostituisce gli esseri umani negli scenari del mondo reale, OpenAI sostiene che raggiunge risultati di livello umano in diversi ambienti professionali e accademici.
Cosa si costruisce con GPT 4: applicazioni che assistono l'uomo
L'azienda sottolinea che questo sviluppo non mira a sostituire gli esseri umani nel loro lavoro o nelle loro capacità, ma piuttosto ad aiutarli, sia per migliorare i flussi di lavoro che per assisterli nelle aree in cui ne hanno bisogno.
Guarda anche: Primi passi nella videografia d'archivioAd esempio, abbiamo appreso che il nuovo chatbot Bing di Microsoft utilizza il GPT 4 e che un'applicazione di assistenza per ipovedenti chiamata Be My Eyes ha sviluppato un nuovo Volontario Virtuale in grado di analizzare le immagini fornite dagli utenti e di rispondere alle domande o di produrre altri risultati pertinenti, come ad esempio dire loro cosa c'è nel loro frigorifero e cosa possono cucinare con esso.
Nel complesso, si tratta di una nuova tecnologia molto interessante e di un nuovo passo verso il deep learning applicato alla vita quotidiana.