OpenAI:s nya GPT 4 är AI som kan förstå bilder

02-08-202302-08-2023 Michael Schultz

Innehållsförteckning

GPT 4 är den senaste versionen från OpenAI, labbteknikföretaget som ansvarar för det populära text-till-bild-verktyget Dall-E och den ännu mer populära applikationen för naturligt språk ChatGPT. Och det är en intressant version!

Se även: Idéer för viralt innehåll: 6 hemligheter bakom virala inlägg avslöjas

Det som gör GPT4 annorlunda är att det är en multimodal AI, som kan analysera både text- och bildmeddelanden för att producera resultat som endast är skrivna. Men det är också labbets hittills bästa programvara när det gäller kapacitet och stabilitet.

Är du nyfiken? Läs då vidare för mer information!

Och om du vill ha alla detaljer om GPT4, vem som kan få tillgång till det och hur, läs min dedikerade artikel på Aisecrets.com!

Vad är GPT 4: AI som tolkar språk och bilder

OpenAI:s senaste AI-modell tar emot uppmaningar - användarinput eller instruktioner - i skriftlig eller visuell form (t.ex. foton, skärmdumpar, diagram etc.) men ger endast textresultat.

Förutom att förstå skriftliga instruktioner kan GPT 4 identifiera och analysera en bilds element och använda den tolkningen för att utföra olika uppgifter.

Se även: De 60 mest nedladdade bilderna 2018 från de bästa jämförda bildbyråerna

Och den kan göra det med mycket större precision än någonsin tidigare. Enligt OpenAI har denna programvara gett de bästa resultaten någonsin under deras tester. Även om de klargör att den inte ersätter människor i verkliga scenarier, hävdar de att den når resultat på mänsklig nivå i olika yrkesmässiga och akademiska miljöer.

Vad byggs med GPT 4: Appar som hjälper människor

Företaget fokuserar på det faktum att denna utveckling inte syftar till att ersätta människor i deras jobb eller deras förmågor utan snarare att hjälpa dem, vare sig det är för att förbättra arbetsflöden eller hjälpa dem inom områden där de behöver det.

Vi fick till exempel veta att Microsofts nya Bing-chattbot använder GPT 4 och att en hjälpapp för synskadade vid namn Be My Eyes har utvecklat en ny virtuell volontär som kan analysera bilder från användare och svara på frågor eller producera andra relevanta resultat från dem - som att berätta för dem vad som finns i deras kylskåp och vad de kan laga till med det.

Sammantaget är det en mycket intressant ny teknik och ett nytt steg mot djupinlärning som tillämpas i vardagen.

Michael Schultz

Michael Schultz är en känd fotograf med över ett decenniums erfarenhet inom bildbranschen. Med ett skarpt öga för detaljer och en passion för att fånga essensen av varje bild, har han skaffat sig ett rykte som expert på bildbanksfoton, bildbanksfotografier och royaltyfria bilder. Schultz arbete har presenterats i olika publikationer och webbplatser, och han har arbetat med många kunder över hela världen. Han är känd för sina högkvalitativa bilder som fångar den unika skönheten i varje motiv, från landskap och stadsbilder till människor och djur. Hans blogg om bildbanksfotografering är en skattkammare av information för både nybörjare och professionella fotografer som vill förbättra sitt spel och få ut det mesta av bildbranschen.