OpenAI's nye GPT 4 er AI, der kan forstå billeder

02-08-202302-08-2023 Michael Schultz

Indholdsfortegnelse

GPT 4 er den seneste udgivelse fra OpenAI, det tekniske laboratorium, der står bag det populære tekst-til-billede-værktøj Dall-E og det endnu mere populære naturlige sprogprogram ChatGPT. Og det er en interessant en af slagsen!

Det, der gør GPT4 anderledes, er, at det er multimodal AI, som kan analysere både tekst- og billedbeskeder for at producere resultater, der kun er skrevet. Men det er også laboratoriets hidtil bedste software, hvad angår kapacitet og stabilitet.

Er du nysgerrig, så læs videre for mere information!

Og hvis du vil have alle detaljerne om GPT4, hvem der kan få adgang til det, og hvordan, så læs min dedikerede artikel på Aisecrets.com!

Hvad er GPT 4: AI, der fortolker sprog og billeder?

OpenAI's seneste AI-model accepterer prompts - brugerinput eller instruktioner - skriftlige eller visuelle (såsom fotos, skærmbilleder, diagrammer osv.), men producerer kun tekstresultater.

Se også: Shutterstock-statistik 2023: Omsætning, abonnenter og mere

Udover at forstå skriftlige instruktioner kan GPT 4 identificere og analysere et billedes elementer og bruge denne fortolkning til at udføre forskellige opgaver.

Se også: Shutterstock vs Getty Images - sammenligning af eksperter

Og den kan gøre det med meget større præcision end nogensinde før. Ifølge OpenAI har denne software givet de bedste resultater nogensinde under deres tests. Selvom de gør det klart, at den ikke erstatter mennesker i virkelige scenarier, hævder de, at den opnår resultater på menneskeligt niveau i forskellige professionelle og akademiske miljøer.

Hvad bliver bygget med GPT 4: Apps, der hjælper mennesker

Virksomheden fokuserer på, at denne udvikling ikke er rettet mod at erstatte mennesker i deres job eller deres evner, men snarere at hjælpe dem, hvad enten det er for at forbedre arbejdsgange eller hjælpe dem på områder, hvor de har brug for det.

For eksempel har vi hørt, at Microsofts nye Bing-chatbot bruger GPT 4, og at en hjælpeapp til synshandicappede ved navn Be My Eyes har udviklet en ny Virtual Volunteer, der kan analysere billeder fra brugerne og besvare spørgsmål eller producere andre relevante resultater ud fra dem - såsom at fortælle dem, hvad der er i deres køleskab, og hvad de kan lave af mad med det.

Alt i alt er det en meget interessant ny teknologi og et nyt skridt inden for deep learning anvendt i hverdagen.

Michael Schultz

Michael Schultz er en anerkendt fotograf med mere end ti års erfaring i stockfotograferingsbranchen. Med et skarpt øje for detaljer og en passion for at fange essensen af hvert eneste billede, har han fået et ry som ekspert i stockfotos, stockfotografering og royaltyfri billeder. Schultz' arbejde har været omtalt i forskellige publikationer og websteder, og han har arbejdet med adskillige kunder over hele kloden. Han er kendt for sine billeder af høj kvalitet, der fanger den unikke skønhed i hvert motiv, fra landskaber og bybilleder til mennesker og dyr. Hans blog om stockfotografering er en skattekiste af information for både nybegyndere og professionelle fotografer, der ønsker at forbedre deres spil og få mest muligt ud af stockfotograferingsindustrien.