Imatges generades amb intel·ligència artificial: la propera gran cosa als mitjans d'emmagatzematge

 Imatges generades amb intel·ligència artificial: la propera gran cosa als mitjans d'emmagatzematge

Michael Schultz

Allà on fa un temps la gran novetat eren les fotos de 360 °, la realitat virtual i les imatges en 3D, el 2023 es tracta d'imatges generades per IA: imatges creades íntegrament per programari d'intel·ligència artificial.

La tecnologia visual més recent permet a qualsevol persona crear fotos increïblement realistes que no s'han fet amb una càmera o pintures tècnicament impecables que no han estat pintades per ningú, sinó que han estat generades per ordinador a partir de descripcions de text.

Com a gènere d'imatges completament nou, l'art generat per la intel·ligència artificial està guanyant força a la indústria dels mitjans de valors, plantejant nous reptes i obrint buits per omplir noves eines de programari.

Genera imatges d'IA ara!

Avui farem una ullada a quin és l'estat de les coses en el camp de les fotos d'IA i les obres d'art generades per IA. És emocionant!

    Les imatges generades per IA són un format de mitjans totalment nou

    La novetat de les imatges generades per IA és que introdueixen un concepte completament nou en la creació visual : suport sintètic, també conegut com generació d'imatges.

    Les imatges sintètiques són aquelles creades no a partir d'una càmera ni a partir d'un programa d'il·lustració/pintura digital tripulat, sinó a partir d'un programari intel·ligent de creació de text a imatge.

    En lloc de capturar o dibuixar una imatge, esteu introduint una breu descripció d'una visió i l'IA està creant una representació visual d'aquesta visió des de l'indicador de text, des de zero.

    vAIsual, empresa pionera en aquest camprelacionats amb ells. No obstant això, no hi ha molta informació sobre dades biomètriques i dades de copyright de les imatges utilitzades per entrenar el programari. Legalment parlant, a hores d'ara, les imatges de DALL-E no estan completament esborrades per a un ús legal, cosa que és imprescindible quan s'utilitzen visuals comercialment.

    Dret d'autor: qui és el propietari de què

    I, per últim, però no menys important, hi ha el problema que la majoria de les imatges que s'utilitzen per entrenar algorismes d'IA són el resultat del treball d'altres artistes i molt probablement tenen drets d'autor. . Hi ha una sèrie de preguntes obertes sobre si podeu crear art amb un generador d'imatges d'IA i els drets d'autor com a propis, atès que tècnicament està fet a partir de fragments d'imatges d'altres artistes. Per no parlar dels problemes que sorgeixen de tenir programari d'IA entrenat amb contingut protegit per drets d'autor que no estava específicament autoritzat per a aquest ús.

    L'estat de les imatges generades per IA a la indústria de la fotografia d'arxiu

    Les nostres observacions sobre aspectes legals també són les realitzades per grans agències fotogràfiques com Getty Images i Shutterstock, que van prohibir l'enviament d'imatges d'IA a les seves plataformes a causa de problemes de drets d'autor no resolts o poc clars. Tanmateix, Shutterstock va anunciar més tard que acceptarien imatges generades amb IA, però només les creades amb la seva eina nativa Shutterstock Generate.

    Adobe Stock va ser un dels primers serveis principals que es va obrir per als enviaments d'imatges generades amb IA, tot i que ambdirectrius de presentació molt detallades i estrictes per garantir la qualitat legal i tècnica.

    Dreamstime és un altre jugador a l'hora d'acollir contingut generat per IA a la seva biblioteca. I, més recentment, PantherMedia també ha començat a acceptar enviaments d'imatges d'IA.

    Eines emergents per a la policia de fotos d'IA

    En relació amb la privadesa de les dades biomètriques, un altre camp tecnològic que sembla que s'està desenvolupant és el de la policia d'imatges d'IA: eines que poden identificar les fotos com a IA generades.

    Aquí les imatges de la gent també són el focus principal. En un món on gairebé totes les plataformes, xarxes socials i més enllà, exigeixen una imatge de perfil d'usuari, podria ser una necessitat poder identificar les fotos de persones falses a partir de les de la vida real, com sona la ciència-ficció.

    I algunes d'aquestes eines ja estan disponibles. V7 Labs va llançar recentment una extensió de Chrome basada en IA que identifica les imatges de persones generades per IA (pretinades a marcar perfils falsos en línia). Afirma que té una precisió del 99,2%. No obstant això, agafaríem aquest número amb un gra de sal, perquè el vam provar amb vAIsual mitjançant imatges de persones amb Smarterpix AI... i no en va captar cap.

    A part de la precisió d'aquesta eina específica, és innegable que amb la perspectiva de la difusió de les imatges de persones amb IA, serà important poder diferenciar-les de les fotos de persones reals en determinats contextos. Si voleu utilitzar una persona d'IA com a vostreperfil d'avatar del videojoc, que pot ser inofensiu. Però si algú està utilitzant una foto d'IA en un perfil de LinkedIn fals per estafar a la gent, aleshores és un problema.

    Un altre aspecte important de la policia fotogràfica és el que afecta els creadors de contingut –fotògrafs, il·lustradors i artistes visuals– el treball dels quals s'inclou en conjunts de dades de formació per a programari d'IA.

    Com que no tots els generadors d'imatges d'IA revelen els conjunts de dades que van utilitzar, i encara que ho facin, no sempre han demanat permís a tots els propietaris dels drets d'autor per als milions o milers de milions d'imatges que s'hi inclouen, amb eines. per identificar si el vostre treball s'ha utilitzat per entrenar eines d'IA o no, pot ser útil.

    Spawning.ai és una empresa que vol abordar aquest problema i, per això, han posat a la seva disposició una funció anomenada He estat entrenat?, on podeu introduir text o una imatge per comprovar amb un base de dades de 5,8 milions d'imatges que s'han utilitzat per entrenar eines fotogràfiques d'IA. Si hi trobeu la vostra foto, podeu estar segur que s'ha utilitzat en l'entrenament d'IA.

    Preguntes freqüents sobre imatges generades amb IA

    Com a camp emergent, les imatges generades amb IA encara són desconegudes en molts aspectes. Aquí abordarem ràpidament les preguntes més freqüents sobre les fotos generades amb IA.

    Què són les fotos generades? Què són les imatges d'IA?

    Els termes fotos generades i imatges d'IA són pràcticament intercanviables avui dia. Generatles fotos fan referència a la fotografia que es genera, no captada per una càmera. Les imatges d'IA són imatges generades mitjançant un programari d'intel·ligència artificial. Bàsicament, les imatges digitals es creen a partir d'un missatge de text.

    La IA pot generar imatges?

    Sí. Fa uns anys hauríem de dir que no (o millor dit, encara no), però la tecnologia d'IA actual és capaç de crear imatges amb resultats molt impressionants, a partir d'instruccions de text i una base de dades visual.

    Què és un generador d'art d'IA?

    Un generador d'art d'IA és una eina de programari que crea art visual i digital (pintures, il·lustracions, etc.) mitjançant la tecnologia d'IA. Aquestes eines us permeten crear art visual tècnicament excel·lent, fins i tot si no sou un artista.

    Puc vendre art generat amb IA?

    Amb precaució, sí. El marc legal perquè les imatges generades amb IA es puguin llicenciar encara està en procés, però tal com explica aquest article hi ha diverses empreses pioneres en aquest aspecte, especialment pel que fa a fotografies de persones amb IA i gestió de dades biomètriques, d'una manera que permet vendre IA. imatges generades de manera segura.

    Les fotos generades amb IA només poden avançar

    I això és el que passa amb les imatges generades amb IA ara mateix. És força significatiu si ens ho preguntes.

    En resum, vAIsual i altres empreses innovadores estan fent possible crear imatges de tot, incloses les persones, des de l'aire. Getty Images –ipotencialment tota la indústria de la fotografia d'estoc– ja estan actualitzant les seves formes legals i polítiques de seguretat de dades per cobrir les dades biomètriques en relació amb la formació en programari d'IA. I altres desenvolupadors estan proposant eines per distingir una foto generada amb IA d'una de "tradicional".

    I el camp només està en els seus inicis! Hem d'esperar a veure què més ens vindrà. Esteu tan emocionats com nosaltres?

    No has trobat el que t'agrada saber sobre AI Image Generation? Pregunteu aquí!

    carregant...

    Necessito més informació sobre les imatges generades amb IA

    Tinc una pregunta sobre Imatges generades amb IA en general

    No sé si les imatges generades amb IA són adequades per a mi

    Una altra cosa...

    que està excel·lent en les imatges generades per IA, anomena aquesta tecnologia una "càmera algorítmica" i és una descripció molt precisa.

    Nota: aquesta tecnologia no s'ha de barrejar amb la tecnologia de similitud visual d'IA, que ofereix, per exemple, grans eines de cerca inversa d'imatges. Els models generatius d'IA no comparen ni coincideixen imatges entre si, sinó que creen imatges noves.

    Les imatges generades per IA són potencialment il·limitades

    El valor bàsic de les fotos amb IA està en el potencial que ofereix als creatius. Podríeu crear una pintura a l'oli perfecta, fins i tot si no sabeu com agafar un pinzell. Podríeu crear imatges realistes de les piràmides de Gizeh, fins i tot si no heu sortit mai de la vostra petita ciutat dels EUA.

    Més eines d'IA per a creatius visuals

    A més d'aquesta aplicació d'art d'IA, hi ha un nombre creixent d'eines fotogràfiques d'IA que poden canviar realment el vostre procés creatiu.

    VanceAI, per exemple, és una plataforma plena de funcions basades en intel·ligència artificial que són de gran ajuda en el disseny gràfic: millora d'imatges, retoc de retrats, eliminació de fons, dibuixos animats automàtics i molt més es pot fer amb el seu programari. És una oferta força completa.

    I la plataforma de recursos creatius Picsart també s'endinsa en el camp de la IA, ja que recentment han llançat el seu propi generador d'imatges d'IA, creat dins de la seva aplicació d'edició d'imatges, que us permet generar imatges a partir d'indicacions de text iediteu-los encara més utilitzant funcions d'edició de fotos impulsades per IA. Molt guai.

    Ara també hi ha diversos generadors d'imatges d'IA gratuïts disponibles en línia.

    DALL-E d'OpenAI

    Sabem que us preguntareu quan esmentarem DALL-E, el generador d'imatges d'IA del consorci OpenAI d'Elon Musk que us permet generar imatges a partir de descripcions de text. Una eina que recentment ha agafat més rellevància en aquest espai, ja que s'ha obert al públic (mitjançant invitació) i amb plens drets d'ús comercial.

    Com els altres pioners que esmentem aquí, OpenAI va desenvolupar DALL-E com a sistema de generació d'imatges, basat en la seva tecnologia CLIP patentada, que utilitzava una xarxa neuronal per extreure descripcions exhaustives de les imatges. El DALL E original tenia una eficàcia relativa per generar imatges a partir de text (combinant objectes en imatges d'estil collage, per exemple), però era de baixa qualitat en termes de recompte de píxels.

    DALL-E 2 –la darrera versió del programari– pot generar imatges molt precises i de major qualitat, a partir de descripcions utilitzant llenguatge natural. Ja siguin fotorealistes, il·lustracions o d'estil de pintura, el programari pot generar tot tipus d'imatges boges i divertides, com un astronauta muntant a cavall, un bol de sopa que és un portal a una nova dimensió, etc. També pot fer edicions a les imatges utilitzant només instruccions escrites, així com generar variacions a partir d'una imatge original.

    Percarregant el vídeo, accepteu la política de privadesa de YouTube. Més informació

    Carrega el vídeo

    Desbloquegeu sempre YouTube

    Vegeu també: Quant costa Getty Images? Pista: no tant com penses!

    En aquest moment, l'eina va incorporar un milió d'usuaris de la seva llista d'espera i els ofereix una assignació de crèdits gratuïts per generar, editar o crear variacions d'imatges, així com la possibilitat de comprar més crèdits si cal. El valor fonamental, però, està en el fet que totes les imatges creades amb DALL-E inclouen drets d'ús complets, inclosos els drets per reimprimir, vendre i comercialitzar el contingut. En termes senzills, permet als usuaris guanyar diners amb les seves imatges generades.

    Llegiu aquí per obtenir més informació sobre DALL-E i com convertir-se en usuari.

    Per descomptat, aquest no és l'únic jugador en el camp dels generadors d'imatges d'IA. Diverses altres aplicacions són igual de populars entre els artistes ara mateix, com Stable Diffusion i Midjourney, que també se centren en la generació d'imatges d'IA i la creació d'imatges a partir de descripcions de text.

    Vegeu també: Fotografia d'estoc de moda: Imatges perfectament elegants per a empreses

    En un desenvolupament més recent (i emocionant!), Shutterstock va llançar un nou generador d'imatges d'IA amb la marca Shutterstock Generate a principis de 2023. Aquesta eina és el resultat d'una associació entre l'agència i OpenAI que aporta la funcionalitat Dall-E a la plataforma de l'agència.

    Generar és un generador de text a imatge basat en el model Dall-E però entrenat exclusivament amb contingut Shutterstock, queafegeix transparència a tot el procés en termes de legalitats. Les imatges generades amb aquesta aplicació tenen llicència de Shutterstock quan les descarregueu i es poden editar completament amb filtres preestablerts i tot el conjunt d'eines de Shutterstock Creative Flow. A més, l'agència va crear un Fons de col·laboradors que compensa els seus artistes per utilitzar el seu treball i metadades en conjunts de dades de formació i les imatges resultants generades per IA.

    Podeu llegir-ne tot a la nostra cobertura completa de Shutterstock Generate.

    Adobe Firefly: models generatius d'IA que s'integren a Photoshop i Adobe Express

    Durant la conferència d'Adobe Max 2022, Adobe va anunciar que el seu model generatiu d'IA propietari aviat arribaria a dos dels seus productes d'edició d'imatges més populars , Photoshop i Adobe Express.

    Aquest anunci es va fer realitat a principis de 2023 amb l'arribada d'Adobe Firefly, una família d'aplicacions que generen IA que s'integraran a les eines esmentades anteriorment i a diverses altres eines de l'ecosistema Adobe.

    La funció inicial que ja està disponible a la seva pròpia pàgina web és un generador i editor d'imatges d'IA que utilitza la tecnologia de text a imatge per permetre als usuaris generar les seves pròpies imatges personalitzades i editar-les encara més, tot a partir d'indicacions de text.

    Les properes actualitzacions inclouran aplicacions per a la generació de models 3D d'IA, la generació d'esbós a vectors i l'edició de vídeos, entre d'altres.

    AI People és l'autèntic canvi de joc en IAArt

    Cap imatge està fora dels límits per al contingut generat amb IA, i això inclou la fotografia d'estil de vida (també coneguda com a fotos de persones), el gènere de fotografia d'estoc més prolífic de tots.

    Ja veieu, tot i que les fotos de persones reals són un best-seller de tots els temps, també són molt més difícils de crear. Cal tenir models –professionals o no–, i llançaments de models. Llicenciar fotos de persones també implica respectar les clàusules d'ús sensibles. I fins i tot llavors, cap llançament de model no és rígid, i encara es pot fer un mal ús d'imatges.

    Introdueix fotos de persones amb IA. Aquestes són, simplement, fotos de persones falses: fotos realistes de persones que no són reals i que no existeixen al món.

    vAIsual: un pioner en fotografies de persones falses i legalment netes

    vAIsual, una empresa especialitzada en suports de valors sintètics amb llicència, creació de les llegendes dels mitjans de comunicació Michael Osterrieder i Nico Menijes, juntament amb els veterans del sector empresarial Mark Milstein i Istvan Novak, està realment avançat, ja que a principis d'any van llançar la seva col·lecció de cares generades per IA: genereu imatges i fotografies al cap de persones que no són reals. Ho aconsegueixen utilitzant GAN (xarxa adversa generativa) i tecnologia de text a imatge, i les seves pròpies dades d'entrenament.

    No només això, sinó que també van publicar els seus conjunts de dades perquè generis les teves pròpies imatges de cares falses d'alta qualitat. Això soluciona no només elproblema de contractació de models, però també us ofereix un control total sobre com es veuen les cares noves de les vostres imatges (edat, gènere, ètnia, expressió emocional, pentinat, tot segons les vostres especificacions). Per no parlar, accelera els temps de producció.

    I les cares realistes i igualment valuoses de persones falses eliminen la necessitat de llançaments de models, les preocupacions sobre l'ús sensible i les limitacions sobre com es poden utilitzar aquestes imatges. .

    A més, vAIsual s'ha associat amb l'agència PantherMedia per portar la seva biblioteca única de fotografies de persones legalment segures i amb intel·ligència artificial a Smarterpix, el lloc de fotos gratuït de PantherMedia, i ja estan treballant a tota velocitat per fer-ne un cos sencer. Les fotos de persones amb intel·ligència artificial passen.

    Més persones d'IA i serveis de generador de cares falses

    vAIsual no és l'única empresa que s'adona del valor de les fotos de persones falses. Hi ha uns quants altres jugadors que desenvolupen serveis similars.

    Les fotos generades, per exemple, van començar amb imatges sintètiques, després van afegir una col·lecció de cares falses i més tard van incloure un generador de cares on podeu crear la vostra "cara falsa" personalitzada. Ara mateix, tenen Generated Humans, un conjunt de dades complet amb més de 100.000 fotos de persones falses de cos sencer llestes per utilitzar.

    Actualitzacions d'antecedents legals a les fotos d'emmagatzematge d'IA

    Un desenvolupament interessant a la indústria pel que fa a les imatges generades per IA és com està canviant l'aspecte legal de la llicència d'imatges per cobrir i regularFotos amb IA.

    Dades biomètriques: autoritzacions i protecció

    La IA s'ha d'entrenar en una xarxa neuronal abans que pugui convertir correctament l'entrada de text en imatges. La manera com la majoria de les empreses entrenen algorismes d'aprenentatge automàtic és mitjançant fotos de la vida real, incloses les d'imatges existents d'humans, més concretament les seves característiques facials, el que s'anomenen dades biomètriques.

    Això planteja el problema de la seguretat de les dades biomètriques , que ha tingut una rellevància creixent des que les primeres imatges generades amb intel·ligència artificial van arribar als mitjans de comunicació, penseu en Deepfake i les preocupacions que van expressar diverses celebritats. sobre programari que creava motlles realistes i animats de les seves cares que es podrien utilitzar de qualsevol manera. Tot i que no és tan famós, moltes altres persones han plantejat la seva objecció a que les seves característiques facials s'utilitzin per entrenar programari d'IA, sense el seu consentiment.

    Un cop més, hem d'esmentar l'enfocament innovador de vAIsual. Es presenten com els "nois de dades netes", i realment ho són: les imatges de la gent d'IA es creen a partir de xarxes neuronals entrenades amb els seus propis retrats de fotografia interna. A més, tots els models de la vida real que apareixen en aquests retrats van signar formularis d'alliberament biomètrics, i vAIsual té tots els drets d'autor de les imatges sintètiques que produeixen. Això vol dir tant els seus conjunts de dades –que podeu llicenciar– com les imatges generades per IA creades amb ells,estan legalment nets i amb llicència segura.

    No massa enrere, el nom familiar a la fotografia d'estoc Getty Images també ha fet passos cap al futur actualitzant recentment el seu model per incloure IA, aprenentatge automàtic i dades biomètriques. Amb el seu nou formulari Enhanced Model Release –desenvolupat amb l'aportació de la DMLA–, la potència de fotografies d'estoc pretén oferir privadesa de dades per als models pel que fa a l'ús de la seva semblança per entrenar algorismes d'aprenentatge automàtic utilitzats per a la creació de fotografies amb IA. Tot i que el marc legal per a la protecció de dades biomètriques encara està en procés, el fet que una agència important com aquesta ja estigui adaptant les seves formes legals per incloure-la és molt il·lustrador que aquí és on s'està avançant la indústria.

    La recent obertura de DALL-E amb plens drets d'ús comercial del contingut generat a la seva plataforma és un altre punt interessant pel que fa al marc legal. La política de continguts i les mesures de seguretat del programari han fet molt per protegir-se, el seu contingut i els drets de tothom, amb protocols que impedeixen els intents de crear fotos de personatges públics (com ara famosos) i persones de la vida real, o de generar contingut considerat nociu. sobre conceptes com violència, contingut per a adults, política, conspiracions, etc.–. De fet, des del principi, el seu sistema simplement va eliminar les "etiquetes" i el contingut relacionat amb celebritats per assegurar-se que el programari no creés contingut.

    Michael Schultz

    Michael Schultz és un reconegut fotògraf amb més d'una dècada d'experiència en la indústria de la fotografia d'estoc. Amb un gran ull pels detalls i una passió per capturar l'essència de cada fotografia, s'ha guanyat una reputació com a expert en fotografies d'arxiu, fotografies d'arxiu i imatges lliures de drets d'autor. El treball de Schultz ha aparegut en diverses publicacions i llocs web, i ha treballat amb nombrosos clients a tot el món. És conegut per les seves imatges d'alta qualitat que capturen la bellesa única de cada tema, des de paisatges i paisatges urbans fins a persones i animals. El seu bloc sobre fotografia d'estoc és un tresor d'informació per a fotògrafs novells i professionals que busquen millorar el seu joc i treure el màxim profit de la indústria de la fotografia d'estoc.